Você está na página 1de 11

Análisis Estadístico

Objetivo.
En el siguiente trabajo se pretendió analizar estadísticamente una
serie de variables relacionadas con el uso de servicios públicos,
especialmente acueducto, alcantarillado y telefonía por algunos
colombianos de diferentes estratos socioeconómicos en cada
departamento.

Natalia Bravo Ocampo-0000156253


Juan Carlos Ramírez Martínez- 0000147321.
Camilo Andrés Ruiz Julio- 0000087796.
1. VALOR TOTAL FACTURADO

La variable del valor total facturado Corresponde al valor total facturado en pesos que se asignó al suscriptor en
determinado tiempo por la utilización de los servicios de Telefonía, Acueducto y Alcantarillado. Este indicador se toma
como una variable cuantitativa continua a la cual se le realizo un extenuó análisis estadístico que se presentara a
continuación.

INTERVALOS Xi ni fi Ni Fi fi% Fi %
2002,00 102268601033,60 51134301517,80 388 0,948655257 388 0,948655257 95% 95%
102268601033,60 204537200065,20 153402900549,40 16 0,039119804 404 0,987775061 4% 99%
204537200065,20 306805799096,80 255671499581,00 0 0 404 0,987775061 0% 99%
306805799096,80 409074398128,40 357940098612,60 3 0,007334963 407 0,995110024 1% 100%
409074398128,40 511342997160,00 460208697644,20 2 0,004889976 409 1 0% 100%
409 1 100%

Tabla 1. Valor facturado asignado a los suscriptores.

En la tabla anterior, se analizaron los datos correspondientes al precio total a pagar por una serie de suscriptores a nivel
nacional. Inicialmente, estos datos se agruparon en una serie de intervalos en los cuales se incluye el rango de los precios
de las facturas echas, obteniendo como resultado relevante y como se puede apreciar en la tabla 1 que el mayor número
de facturaciones se encuentra en el rango de $ 2002,00 a los $ 102268601033,60 mientras que en el rango de precios de
las facturas establecido entre $204537200065,2 0 a los 306805799096,80 no se hizo ninguna facturación.

1.1. Análisis Exploratorio.


A continuación, se expresarán en determinadas tablas las medidas de tendencia central, medidas de variabilidad,
estadístico de posición y estadísticos de simetría y apuntamiento para datos tanto agrupados como no agrupado. Esto se
hizo con el fin de conocer algunos parámetros importantes de la muestra para su posterior análisis
Datos Desagrupados
Datos Agrupados
Medidas de tendencia central
Media 19542455175,23 Medidas de tendencia central
Mediana 1054188430,00 Media 59385802173,16
Moda #N/A Mediana 53901879584,38
Moda 52210813086,55
Medidas de Variabilidad
Rango 511342995158,00 Medidas de Variabilidad
Desviación Media 0,0316162109375 Rango 511342995158,00
Varianza 0,0000024499627 Desviación Media 15655658945
Desviación Estandar 0,0015652356789 Varianza 1,8498E+21
Coeficiente de Variación 8,00941E-14 Desviación Estandar 43009275326
Coeficiente de Variación 0,724234981
Estadisticos de Posición
Q1 103 47500954,00 Estadisticos de Posición
Q2 205 1054188430,00 Q1 103 47500954,00
Q3 307 13400383306,00 Q2 205 1054188430,00
Q3 307 13400383306,00
Estadistico de Simetria y Apuntamineto
Simetria Q3-Q2 12346194876,00 Estadistico de Simetria y Apuntamineto
Simetria Q2-Q1 1006687476,00 Simetria Q3-Q2 12346194876,00
Mediana + S 1054188430,0016 Simetria Q2-Q1 1006687476,00
Mediana - S 1054188429,9984 Mediana + S 96911154910,2070
Limite inferior -19981822574 Mediana - S 10892604258,54670
Limite superior 33429706834 Limite inferior -19981822574,00
Curtosis 40,52446075 Limite superior 33429706834,00

Tabla 2. Medidas para datos no agrupado Tabla 3, Medidas para datos agrupados

En las dos tablas anteriores se representa una serie de datos agrupados y no agrupados donde se halló una serie de
medidas que nos indican diferentes eh importantes características de la muestra que se analizó, como por ejemplo la
media, que nos indica el promedio de precios en las facturas echas a los suscriptores, la mediana que nos establece un
valor medio del total de observaciones realizadas, la moda que nos indica la observación que más se repitió y otras serie
de medidas como la varianza y desviación estándar que nos muestran que tanto varían los datos unos de otro. Finalmente,
también encontramos algunas medidas de simetría y apuntamiento que nos ayudan a deducir que tan simétrica o no es
el conjunto de datos estudiado.

1.2.Gráficos
En este espacio se analizarán una serie de gráficos que se obtuvieron a partir de la muestra que ayudaran a dar una visión
más clara para realizar el análisis de la variable trabajada.

Grafico 1. Diagrama de Frecuencia Acumulada..

En este grafico inicialmente se están esquematizando el número de facturaciones para cada cliente de los servicios de
telefonía, alcantarillado y acueducto respecto al promedio de dinero que deben cancelar. Inicialmente se puede observar
que 388 de las facturaciones totales están dentro de los $ 51134301517,80 y así sucesivamente se van acumulando el
número de facturaciones mientras que el promedio de dinero a cancelar por estas también va en aumento. Esto se debe
en un principio a que se está acumulando a las facturaciones del segundo intervalo las primeras y así sucesivamente
hasta llegar al total de las facturaciones lo cual nos indica también el valor promedio de la facturación total realizada
por las empresas prestadoras del servicio.

Grafico 2. Diagrama de Tortas

En el diagrama de tortas se evidencia como es la distribución del promedio de los precios para las facturaciones totales
realizadas por la empresa, donde se puede evidenciar claramente que un 95 % de las facturaciones totales se encuentra
en los $ 51134301517,80, siendo este el precio promedio con el cual se generan la mayoría de facturaciones. Además,
también se puede evidenciar que hay un promedio de precios con el cual no se generaron facturaciones ya que el
porcentaje de facturaciones en dicho intervalo es cero tal como se puede apreciar en la gráfica.
Grafica 3. Diagrama de Línea.

Con el grafico anterior se pueden analizar los datos de cierta manera que es fácil identificar como se encuentran dispersos
el número de facturaciones y la tendencia que representa. Se aprecia claramente que el dato con mayor tendencia es el
valor de los $ 51134301517,80 el cual nos indica el promedio de dinero a facturar más representativo que cancelaran
los suscriptores. Además, también se aprecia el decrecimiento en el número de facturaciones una vez el valor en pesos
facturado se hace mayor, lo que nos permite establecer con certeza que serán muy pocas los suscriptores que deban
cancelar valores muy altos por el uso del servicio.

Grafico 4. Box-plot.

1.3.Conclusión
Como conclusión final de la variable estudiada se logró probar que esta efectivamente no es una variable simétrica y
por el contario presenta una asimetría negativa, todo esto se puede evidenciar en el análisis que se realizó anteriormente,
pues se observa que en cada uno de los gráficos descritos el mayor número de facturaciones predominaron en un cierto
intervalo correspondiente al dinero establecido a cancelar. Finalmente, fue posible ver la correlación negativa que existe
en la variable ya que como se aprecia en la gráfica 3 a medida que el número de facturaciones disminuye el precio de
estas va en incremento cada vez más.
6. CONTRIBUCIONES
Esta variable se interpreta el valor en pesos que fueron donados por el suscriptor al cancelar sus facturas de servicios.
En un principio la variable se califica como una variable cuantitativa continua y se lleva a cabo un análisis estadístico
que se observa a continuación.

INTERVALOS Xi ni fi Ni Fi fi% Fi %
-2805181,00 3040440938,60 1518817878,80 399 0,975550122 399 0,975550122 98% 98%
3040440938,60 6083687058,20 4562063998,40 5 0,012224939 404 0,987775061 1% 99%
6083687058,20 9126933177,80 7605310118,00 2 0,004889976 406 0,992665037 0% 99%
9126933177,80 12170179297,40 10648556237,60 0 0 406 0,992665037 0% 99%
12170179297,40 15213425417,00 13691802357,20 3 0,007334963 409 1 1% 100%
409 1 100%

Tabla 16. Contribuciones de los suscriptores a la empresa.

En la tabla 17 se ven algunos resultados que se obtuvieron del análisis en distribuciones de frecuencia del valor de las
contribuciones que se reportaron en la base de datos. Principalmente, los valores de las contribuciones se organizaron
en una serie de intervalos con el fin de establecer un mejor análisis, en esta organización por intervalos se determinaron
ciertos parámetros que se encuentran en la tabla y se discutirán más adelante con la ayuda de representaciones gráficas.
6.1. Análisis Exploratorio.
En este análisis, se tomó toda la cantidad de contribuciones realizadas por los usuarios y se establecieron una serie de
medidas tanto para datos agrupados como no agrupados que permiten reconocer algunos parámetros importantes de la
muestra y que serán de gran ayuda en el posterior análisis.
Datos De sagrupados Datos Agrupados

Me didas de te nde ncia ce ntral Medidas de tendencia central


Media 273764052,79 Media 1675072569,54
Mediana 0,00 Mediana 1556953795,09
Moda 0,00 Moda 1528411971,23

Me didas de Variabilidad Medidas de Variabilidad


Rango 15216230598,00 Rango 15216230598,00
Desviación Media 0,00
Desviación Media 304868565,3
Varianza 0,00
Varianza 1,35686E+18
Desviación Estandar 0,00
Desviación Estandar 1164843833
Coeficiente de Variación 0,00
Coeficiente de Variación 0,695399026

Estadisticos de Posición
Estadisticos de Posición
Q1 103 0,00
Q1 103 0,00
Q2 205 0,00
Q3 307 310025,00
Q2 205 0,00
Q3 307 310025,00
Estadistico de Sime tria y Apuntamine to
Simetria Q3-Q2 310025,00 Estadistico de Simetria y Apuntamineto
Simetria Q2-Q1 0,00 Simetria Q3-Q2 310025,00
Mediana + S 0,00 Simetria Q2-Q1 0,00
Mediana - S 0,00 Mediana + S 2721797628,0825
Limite inferior -465037,50 Mediana - S 392109962,08891
Limite superior 775062,50 Limite inferior -465037,50
Curtosis 70,3775218 Limite superior 775062,50
Tabla 17. Medidas para datos no Agrupados Tabla 18. Medida para datos Agrupados

En las tablas anteriores se realizaron diferentes medidas a los valores facturados de las contribuciones tanto para datos
agrupados como no agrupados que permiten establecer parámetros importantes acerca de la muestra para su posterior
interpretación y análisis.
6.2. Gráficos
En esta parte del análisis se establecerán una serie de gráficos y su interpretación determinando así algunas
características importantes de la muestra.

Grafico 21. Diagrama de Tortas.

En el diagrama anterior se puede notar como es la distribución del promedio en los valores facturados debido a las
contribuciones hechas por los usuarios, un punto importante que se observa se debe a que alrededor del 98% de las
facturaciones por contribución se encuentran en el rango $15188178778,80 que es el promedio de contribución que han
dado los usuarios frecuentemente. También, en general este dato indica el valor que se espera facturar por contribuciones
de los usuarios a nivel nacional. Posteriormente, también se encuentra que hay rangos de valores por facturación debido
a las contribuciones en los que no se realiza ninguna contribución y otros donde es muy bajo el número de
contribuciones.

Grafico 22. Diagrama de Línea

Respecto al grafico anterior se obtuvieron resultados con los cuales se pudo identificar como es que la variable presenta
una correlación negativa porque una vez el número de contribuciones disminuye, recíprocamente el valor de las
facturaciones por contribución se eleva considerablemente. Además, se evalúa a simple vista que hay un valor de
facturación con una formidable ventaja en el número de contribuciones establecidas en este precio respecto a los demás,
demostrando de esta manera que la mayoría de las contribuciones brindadas por los usuarios en determinado momento
no excedieron el valor de los $15188178778,80.
Grafico 23. Diagrama de Frecuencia Acumulada.

En un principio se ordenaron el número de contribuciones de menor a mayor debido a que se está trabajando con una
frecuencia acumulada, en este caso a la acumulada absoluta donde se aprecia que en un inicio son 399 el número de
contribuciones, y así sucesivamente sigue el aumento hasta obtener el total de las contribuciones y el valor promedio
total facturado gracias a dichas contribuciones. Posteriormente, se analizan estas distribuciones obteniéndose una
conclusión general donde se puede afirmar que más del 50 % de las contribuciones totales que se realizaron están en un
cierto valor promedio de dinero que será donado a las empresas en cierto periodo de tiempo.

Grafica 24. Diagrama de Cajas.

6.3. Conclusión
Para esta variable se pudo observar gracias a ciertas medidas realizadas como mediadas de Centralidad que en efecto
las personas no aportaban en absoluto un peso para contribuir con la empresa puesto que uno de los datos más reiterados
en el total de las contribuciones fue cero siendo este la moda de los datos estudiados. Además, también cabe destacar
que la variable presento una asimetría negativa pues se evidencia en el histograma que las frecuencias más altas se
encuentran al lado derecho de la mediana. Finalmente, de esta variable se aprecia que en general el valor contribuido
por los clientes no es muy alto e inclusive un gran porcentaje de ellos no dio un aporte voluntario.
7. VALOR FACTURADO POR UNIDAD DE CONSUMO.

La variable aquí presentada especifica el costo de las facturaciones por unidad de consumo ya sea en los
servicios de Alcantarillado, Aseo o telefonía. La variable se clasifica dentro de las variables cuantitativas
continuas y una vez establecida su clasificación se lleva a cabo el análisis estadístico correspondiente que se
presenta a continuación.

INTERVALOS Xi ni fi Ni Fi fi% Fi %
0,00000000000000 124,90315789473700 62,45157894736840 1 0,00245098 1 0,00245098 0% 0%
124,90315789473700 249,80631578947400 187,35473684210500 2 0,004901961 3 0,007352941 0% 1%
249,80631578947400 374,70947368421000 312,25789473684200 163 0,399509804 166 0,406862745 40% 41%
374,7094736842100 499,61263157894700 437,16105263157900 241 0,590686275 407 0,99754902 59% 100%
499,6126315789470 624,51578947368400 562,06421052631600 1 0,00245098 408 1 0% 100%
408 1 100%
Tabla 19. Costo Promedio Facturado.

En la tabla 3 se observa inicialmente una serie de resultados que de una manera u otra contribuirán al análisis pertinente
de la variable. Como punto de partida, los valores del costo por unidad de consumo se organizaron en una serie de
intervalos, en esta organización por intervalos se analizan ciertas características encontradas en la tabla de frecuencia y
servirán para la elaboración de algunas representaciones graficas que se observarán más adelante y un buen número de
medidas estadísticas que fundamentarán el análisis de la variable.
7.1. Análisis Exploratorio.

Datos Desagrupados Datos Agrupados

Medidas de tendencia central Medidas de tendencia central


Media 382,11281095087700 Media 385,42420536635700
Mediana 388,04380652432000 Mediana 394,40374754313200
Moda No Hay moda Moda 405,34609731876900

Medidas de Variabilidad Medidas de Variabilidad


Rango 624,51578947368400 Rango 624,51578947368400
Desviación Media 0,00000000008174 Desviación Media 61,98637351018840
Varianza 0,00000000000000 Varianza 4243,24126306008000
Desviación Estandar 0,00000000000405
Desviación Estandar 65,14016628056830
Coeficiente de Variación 0,00000000000001
Coeficiente de Variación 0,16900901752823

Estadisticos de Posición
Estadisticos de Posición
Q1 103 354,92281376069500
Q1 103 354,92281376069500
Q2 205 388,04380652432000
Q2 205 388,04380652432000
Q3 307 408,06517877329500
Q3 307 408,06517877329500
Estadistico de Simetria y Apuntamineto
Simetria Q3-Q2 20,02137224897520 Estadistico de Simetria y Apuntamineto
Simetria Q2-Q1 33,12099276362510 Simetria Q3-Q2 20,02137224897520
Mediana + S 388,04380652432400 Simetria Q2-Q1 33,12099276362510
Mediana - S 388,04380652431600 Mediana + S 459,54391382370000
Limite inferior 275,20926624179500 Mediana - S 329,26358126256300
Limite superior 487,77872629219600 Limite inferior 275,20926624179500
Curtosis 12,09723269 Limite superior 487,77872629219600
Tabla 20. Medidas para datos no Agrupados. Tabla 21. Medidas para datos Agrupados.

En las dos tablas anteriores se realizó un análisis importante con diversas medidas para muestreos estadísticos que
permiten establecer ciertas hipótesis acerca de la variable estudiada como por ejemplo que esta presenta una
distribución de frecuencias muy apuntada fuera de lo normal por lo que recibe el termino de variable leptocúrtica,
y así otras medidas importantes para analizar la variable.
7.2. Gráficos.

Grafico 25. Diagrama de Línea.

El grafico anterior se establece la tendencia que representan los valores de las facturas realizadas por unidad de
consumo, identificándose que el promedio de valor facturado $437,1610522631 es el valor que más se frecuenta y
nos representa el costo del consumo de servicios por determinado tiempo. Además, de la gráfica anterior también
se puede deducir que el mayor número facturaciones por consumo se encuentra en el rango de los
$312,257894736 y $437,1610522631 que son los promedios de dinero que más se cancelarían o cancelaron por
los usuarios en cierto tiempo por el consumo de los servicios de acueducto alcantarillado y Telefonía.

Grafico 26. Diagrama de Frecuencia Acumulada.

En este grafico se puede aprecia el acumulado de las facturaciones respecto al valor facturado por consumo en
determinado tiempo por el uso de Acueducto, alcantarillado y Telefonía de ciertos usuarios. Al analizar este grafico se
evidencia que en una primera instancia que el número de facturaciones u observaciones tienden a acumularse en los tres
últimos intervalos lo que nos indica que no hay una simetría en la distribución y por el contario hay una inclinación
hacia la derecha de esta.
Grafico 27 . Diagrama de Tortas.

El diagrama de tortas está representando la cantidad de facturaciones elaboradas expresadas en porcentaje con un
promedio de valor facturado por unidad de consumo, donde se ve explícitamente que el valor promedio de las
facturaciones con mayor frecuencia establece un 59 % del total de las facturas realizadas por la empresa durante un
periodo de muestreo en el cual se reportaron estos datos. Además, se puede apreciar que también existe otro valor de
facturación con un considerable número de facturaciones expresado en porcentaje, que al sumarse con el valor anterior
ya mencionado representan casi el total de los datos, lo que indica que esos dos valores promedios son el precio que más
se debió cancelar por los usuarios en determinado tiempo.

Grafico 28. Box-plot.

7.3.Conclusión.

Como conclusión final, se estableció que la variable para este caso el valor facturado por unidad de consumo, es una
variable no simétrica negativa pues en los gráficos como el diagrama de frecuencia acomunada y el de línea se observa
que los valores promedios facturados se encuentran con una cierta tendencia a elevarse hacia la derecha después de la
mediana, lo cual puede inducirse que la variable presenta una asimetría negativa. Además, también pudo observar que
más del 50 % de las facturas echas están en el promedio de valor facturado correspondiente a $437,1610522631 lo cual
quiere decir que los usuarios en promedio cancelaran este valor por unidad de consumo para los tres servicios, acueducto,
alcantarillado y teléfono según el periodo en el cual se tomaron los datos del consumo.

Você também pode gostar