Você está na página 1de 6

Ejercicio de Anlisis de Datos 2

Ernesto Anaguano

Desigualdades educativas entre colegios pblicos y privados a nivel provincial en la


prueba Ser Bachiller de los aos 2015-2016

En el presente ejercicio de anlisis de datos se va a presentar algunas aproximaciones


descriptivas, a partir de la base de datos de la prueba Ser Bachiller del ao lectivo 2015-
2016, y tambin se va a dejar planteado un modelo de regresin mltiple con algunas
variables de dicha base de datos, pero tambin con algunos datos de la Encuesta Nacional
de Empleo, Desempleo y Subempleo y de la Encuesta de Condiciones de Vida del ao
2016. A continuacin, en un primer momento, se describir las variables ms
representativas de la base de datos Ser Bachiller y se mostrar algunos datos descriptivos
(media, moda, mediana, etc) de las distintas modalidades de colegios por sostenimiento
(fiscal, particular, fiscomisional y municipal), por rea (urbano/rural) y por regin (costa y
sierra), lo cual nos permitir delimitar y seleccionar la poblacin ms representativa para el
trabajo final; en un segundo momento, se enunciar la pregunta cuantitativa y la hiptesis
cuantitativa que guiarn el trabajo final; en un tercer momento, se presentar un cuadro de
variables que permitir hacer un modelo de anlisis de regresin mltiple con las variables
ms significativas de la base de datos Ser Bachiller, as como de las encuestas de
condiciones de vida y de empleo, desempleo y subempleo; y, finalmente, se darn algunas
conclusiones con respecto al trabajo final.

Base de datos Ser Bachiller

El Ser Bachiller es una prueba de seleccin mltiple en la que se evala los cuatro
conocimientos bsicos: matemtica, lengua y literatura, ciencias naturales y estudios
sociales. Esta prueba se la empez a tomar desde el ao 2012 y es un requisito de
graduacin para todos los estudiantes del tercer ao de Bachillerato. En la pgina web del
INEVAL slo se encuentran las bases de datos de tres aos lectivos (2014-2015, 2015-
2016, 2016-2017). Para la presente investigacin vamos a tomar la base de datos del ao
lectivo 2015-2016.
La base de datos cuenta con las siguientes variables: nombre de la institucin, rgimen
(costa/sierra), provincia, cantn, parroquia, rea (urbano/rural), sostenimiento
(fiscal/particular/fiscomisional/municipal), promedio global, matemtica, lengua y
literatura, ciencias naturales y estudios sociales. A continuacin se va a realizar un anlisis
descriptivo de los resultados a nivel nacional. El nmero total de establecimientos que
rindieron la prueba Ser Bachiller el ao lectivo 201-2016 fue de 3179, donde la nota ms
alta es de 998 y la nota ms baja es de 521. La media, moda, media y desviacin estndar
son las siguientes:

No. Colegios 3179


Nota max. 998
Nota min. 521
Rango 477
Media 766.3989931
Mediana 757
Moda 734
Des. Est. 100.6063582
Varianza 10121.63931
Base de datos Ser Bachiller (2015-2016): Elaboracin propia.

Como se puede apreciar el promedio, o la media, de las calificaciones es de 766,4; la


calificacin que ms se repite, o moda, es 734; la mediana, o, de mayor a menor la nota que
se encuentra en la mitad de la poblacin es 757. El rango, o la distancia entre la nota ms
alta (998) y la nota ms baja (521), es de 477 puntos. Este ltimo dato es de enorme
relevancia porque da cuenta de la brecha en las calificaciones entre los colegios; sin
embargo, estas brechas son ms claras cuando se las analiza por sostenimiento. En el
siguiente cuadro presentamos el nmero de establecimientos y promedio de calificaciones
segn su sostenimiento:

No. Promedio Promedio Promedio


No. Instituciones Promedio Promedio Lengua y Ciencias Estudios
SOSTENIMIENTO Instituciones porcentaje global Matemtica Literatura Naturales Sociales
FISCAL 1712 54 728 681 729 702 800
FISCOMISIONAL 321 10 764 731 763 732 830
MUNICIPAL 37 1 797 756 788 781 859
PARTICULAR 1109 35 825 787 814 815 884
Total general 3179 100 766 724 763 745 833
Base de datos Ser Bachiller (2015-2016): Elaboracin propia.
Como se puede observar, la distancia, o brecha, ms evidente es la que existe entre colegios
fiscales y particulares, tanto en el promedio global como en los promedios por materias: en
el promedio global lo separan 103 puntos; en matemticas 106 puntos; en lenguaje y
literatura 85 puntos; en ciencias naturales 112 puntos; y en ciencias sociales 84 puntos. Si
bien existen brechas relevantes en relacin con los colegios municipales y fiscomisionales,
para el presente estudio no son relevantes pues representan apenas el 11%; mientras que los
colegios fiscales y particulares representan el 89% de la poblacin total. De all que se
decide escoger solamente la poblacin fiscal y particular como una variable relevante para
el anlisis de correlacin.

Otra variable relevante para el anlisis de correlacin es el rea, pues sta define la
localizacin de los colegios en relacin con la calificacin de la prueba ser bachiller. A
continuacin presentamos algunos cifras relevantes.

No. Promedio Promedio Promedio


No. Instituciones Promedio Promedio Lengua y Ciencias Estudios
REA Instituciones porcentaje global Matemtica Literatura Naturales Sociales
RURAL 969 30 739 694 737 713 811
URBANA 2210 70 778 737 774 759 843
Total general 3179 100 766 724 763 745 833
Base de datos Ser Bachiller (2015-2016): Elaboracin propia.

Aunque las brechas se acortan, esta no deja de ser relevante, pues se puede notar que se
mantiene la desigualdad histrica entre colegios de sectores urbanos y rurales. En el
promedio general la brecha son 39 puntos; en matemtica 43 puntos; en lengua y literatura
37 puntos; en ciencias naturales 46 puntos; y, en estudios sociales 32 puntos. Esta variable
rea (urbano/rural) es indispensable para pensarla en relacin con la variable
sostenimiento (fiscal/privado).

Existe, finalmente, una variable en la base de datos que tambin es pertinente de analizar,
pues sta da cuenta de la relacin entre el promedio y la regin del pas (costa/sierra). A
continuacin, se presentan algunos resultados.

No. Promedio Promedio Promedio


Cuenta de Porcentaje Promedio Promedio Lengua y Estudios Ciencias
REGIMEN Institucin institucin global Matemtica Literatura Sociales Naturales
COSTA 1580 50 756 717 754 823 728
COSTA - SIERRA 104 3 748 702 748 815 725
SIERRA 1495 47 778 733 773 844 765
Total general 3179 100 766 724 763 833 745
Base de datos Ser Bachiller (2015-2016): Elaboracin propia.

Como se observa las brechas disminuyen an ms en relacin con las variables anteriores:
las brechas con el promedio global son 22 puntos; en matemtica 16 puntos; en lengua y
literatura 19 puntos; en estudios sociales 21 puntos; y, en ciencias naturales 37 puntos (es
bastante relevante esta ltima en comparacin con el resto de promedios). Aunque dentro
de la variable aparece un indicador que seala costa-sierra a la vez, sta la descartamos
pues su poblacin es bastante irrelevante ya que apenas alcanza el 3%.

Finalmente, de la base de datos Ser Bachiller se han podido tomas tres variables
independientes (sostenimiento, rea y rgimen) que nos permiten dar cuenta de la variable
dependiente (nota promedio por provincia). Para que el modelo de regresin se complete se
han de sumar dos o tres variables independientes ms que se va tomar de la encuesta
nacional de empleo, desempleo y subempleo, as como de la encuesta de condiciones de
vida. Las variables que se pueden tomar son los ndices de pobreza por provincia, as como
de alfabetizacin, ingreso, etc.

Pregunta e hiptesis

Para el presente trabajo se ha plateado la siguiente pregunta de investigacin: Influyen en


los resultados de las pruebas Ser Bachiller las condiciones materiales de cada institucin,
as como la condicin geogrfica y econmica en cada provincia? Tenemos la hiptesis de
que los resultados de las pruebas en cada provincia dependen sobre todo de las condiciones
que el tipo de colegio brinde a los estudiantes, teniendo en este caso mayor ventaja los que
estudian en los colegios privados de la sierra a nivel urbano. Creemos tambin que los
mejores promedios se encuentran en las provincias que existe menor ndice de pobreza,
analfabetismo y desempleo, as como mayor ndice de ingresos.

Cuadro de variables

Para el modelo de regresin mltiple que pretende explicar la correlacin y los ndices de
covariancia en el xito y fracaso de las pruebas ser bachiller, se tiene las siguientes
variables explicativas: sostenimiento, rea, regin, ndice de analfabetismo, ndice de
pobreza, ndice de desempleo (por el momento esas son las variables que tenemos). Las tres
primeras variables son ficticias o dummy, por lo que se le asignar a cada categora un 1 o
un 0 de la siguiente manera:

Sostenimiento: 1 fiscal; 0 particular.

rea: 1 urbano; 0 rural.

Regin: 1 costa; 0 sierra.

El resto de variables son ordinales, por lo que no presentan cambios. Nuestro cuadro de
variables de momento queda de la siguiente manera:

No. PROMEDIO SOSTENIMIENTO REA REGION POBREZA ANALFABETISMO DESEMPLEO


PROVINCIA (Y) (X) (X) (X) (X) (X) (X)
1 AZUAY 773
2 BOLIVAR 779
3 CAAR 780
4 CARCHI 795
5 CHIMBORAZO 749
6 COTOPAXI 834
7 EL ORO 784
8 ESMERALDAS 697
9 GALAPAGOS 782
10 GUAYAS 766
11 IMBABURA 819
12 LOJA 773
13 LOS RIOS 775
14 MANABI 737
15 MORONA SANTIAGO 674
16 NAPO 668
17 ORELLANA 677
18 PASTAZA 670
19 PICHINCHA 811
20 SANTA ELENA 761
21 SANTO DOMINGO 736
22 SUCUMBIOS 683
23 TUNGURAHUA 807
24 ZAMORA CHINCHIPE 740
25 ZONA NO
DELIMITADA 772
Total general 766
Conclusiones

En el presente trabajo se ha podido delimitar de mejor manera nuestra poblacin y las


variables para el anlisis de correlacin. Estos elementos de anlisis a la vez nos han
permitido elaborar una pregunta capaz de cuantificarse a travs del modelo propuesto de
correlacin, as como aproximarnos a una hiptesis, las cuales permitirn guiar el proceso
de anlisis.

Es preciso aclarar que este trabajo sigue estando en proceso de construccin y delimitacin,
por lo que quedan varias dudas con respecto a la elaboracin del modelo de correlacin
mltiple, pues se estn mezclando dos tipos de variables: dummy y ordinales; por lo que no
sabemos hasta qu punto el modelo puede funcionar. Otra duda dentro del modelo tambin
es la seleccin de la poblacin, pues en un primer momento de la investigacin se consider
tomar como muestra el promedio de cada colegio, luego se plante solo considerar a los
promedios por provincia, por lo que no debemos dejar de mencionar que la elaboracin de
este modelo puedo tener algn sesgo.

Finalmente, se espera que este modelo nos pueda servir para realizar un anlisis
longitudinal, lo cual nos permitir comparar los resultados de esta prueba (Ser Bachiller
2015-2016), con los de la prueba del ao lectivo 2014-2015 y 2016-2017. Esto nos
permitir, por un lado, dar cuenta de la evolucin de los colegios fiscales y privados, pero
tambin, por otro lado, nos permitir visibilizar las provincias que necesitan ms atencin
con respecto a polticas publicas centradas en el mejoramiento de la calidad educativa, as
como los factores que se asocian con el rendimiento escolar, de lo cual, en ltima instancia,
depende el xito o el fracaso de los estudiantes que cursan el ltimo ao de bachillerato.

Você também pode gostar