2878

LOS DISEOS ESTADSTICOS EN LAS
INVESTIGACIONES EDUCATIVAS
Curso 75
Autores:
Dr. C. Omar Prez Jacinto

Profesor Titular
Universidad de Ciencias Pedaggicas Rubn Martnez Villena
omar@ucpvillena.rimed.cu
Dr. C. Toms Crespo Borges
Universidad de Ciencias Pedaggicas Flix Varela
Dr. C. Ibrahim Arnaez

Universidad de Ciencias Pedaggicas Manuel Ascunce
Dr. C. Ral Hernndez
Universidad de Ciencias Pedaggicas Ral Gmez Garca

Edicin: Dr. Cs. Gilberto Garca Batista
Correccin: Lic. Jos Luis Leyva Labrada.
Diseo y composicin: MSc. Nelson Piero Alonso
sobre la presente edicin, sello editor Educacin Cubana. Ministerio

de Educacin, 2011.
ISBN 978-959-18-0674-1
Sello Editor EDUCACIN CUBANA

Direccin de Ciencia y Tcnica
Avenida 3ra # 1408 esquina a 16.
Miramar, Playa. Ciudad de La Habana. Cuba.
Telfono: (53-7) 202-2259
Indice
Introduccin / 1
1. Los modelos estadsticos en las investigaciones educativas / 2
1.1. Naturaleza de los elementos de las poblaciones en las
investigaciones educativas / 3
1.2. Los requisitos de las escalas de medicin en las investigaciones
educativas / 5
1.3. Las tcnicas no paramtricas en las investigaciones educativas /
10
2. Finalidad de las indagaciones empricas en las investigaciones
educativas / 12
2.1. Criterios de seleccin de las pruebas estadsticas de valoracin /
13
2.2.Algoritmo de seleccin para cada caso / 14
3. Procedimiento algortmico para valorar hiptesis / 17
3.1.Ejemplos didcticos de pruebas de hiptesis para valorar la
caracterizacin de un grupo o colectivo / 20
3.2.Ejemplos didcticos de pruebas de hiptesis para comparar
grupos o colectivos / 25
3.3.Ejemplos didcticos de pruebas de hiptesis para valorar la
significacin en el cambio de un indicador en un grupo o
colectivo. / 33
3.4.Ejemplos didcticos de pruebas de hiptesis para comparar
estrategias interventivas / 40
3.5.Ejemplos didcticos de pruebas de hiptesis para determinar la
relacin entre dos o ms indicadores del proceso / 49
4. Referencias bibliogrficas / 58
5. Bibliografa / 58
RESUMEN.
A partir del enfoque dialctico como marco terico referencial, el curso
est destinado a los investigadores de las ciencias de la educacin que
realizan su actividad en los micro escenarios escolares y presenta un
valioso instrumento de orientacin en la elaboracin de los diseos
estadsticos, que les permitir planificar y utilizar racionalmente sus
mtodos para sintetizar y valorar los resultados de las indagaciones
empricas que tienen lugar en la construccin del conocimiento del
objeto de las investigaciones educativas en su actividad profesional.
De acuerdo con su funcin orientadora y operacional se presentan los
presupuestos bsicos para el diseo de los modelos estadsticos en las
investigaciones educativas y se discuten los criterios de seleccin de
las pruebas estadsticas, con las que pueden valorarse los resultados
de las indagaciones empricas ms frecuentes en su campo de accin;
acordes con la distinguibilidad y dinamismo de los sujetos
constituyentes de sus poblaciones y los requisitos de medida con los
que se pueden calificar sus indicadores.
Adems, incluye un ejemplo didctico de cada una de las pruebas de
hiptesis imprescindibles para enfrentar la valoracin de los resultados
de las indagaciones empricas ms frecuentes en su campo de accin y
que por la factibilidad de aplicacin les son ms accesibles a los
profesionales que, por su perfil de formacin, no tengan profundos
conocimientos de los mtodos estadsticos.
Introduccin
En las investigaciones educativas los mtodos estadsticos se
constituyen, esencialmente, en una herramienta auxiliar para sintetizar y
valorar los resultados obtenidos mediante las indagaciones empricas
que tienen lugar en el proceso lgico de la construccin del
conocimiento del objeto; aunque es puede ser utilizada en diferentes
etapas del proceso, es muy comn distinguirla en las etapas:
De exploracin de la realidad educativa, para la determinacin del
estado inicial del fenmeno o proceso investigado.
De validacin de la propuesta en la prctica educativa.
En ambos casos es importante comenzar por sintetizar los resultados
relacionados con los indicadores del fenmeno o proceso que est
siendo estudiado; de ello se encarga la Estadstica Descriptiva,
relacionada con la organizacin de los datos, el procesamiento de la
informacin y la determinacin de las medidas de tendencia central y
las medidas de dispersin que sintetizan los resultados obtenidos. Sin
embargo, ello no basta para emitir conclusiones con cierto rango de
fiabilidad, aspecto del que se encarga la Estadstica Inferencial; a una
parte de la cual, se dedica este curso.
La Estadstica Inferencial, a su vez, se interesa por dos tipos de
problemas: la estimacin de los parmetros de la poblacin y las
pruebas de hiptesis. En ambos casos, es necesario cumplir con
determinados requisitos que exige su aplicacin, de otra manera, las
generalizaciones o conclusiones que de ellas se deriven, carecern de
validez por su bajo grado de objetividad.
Para la estimacin de los parmetros de la poblacin a partir de una
muestra, es imprescindible cumplir con el requisito de que la misma sea
representativa de la poblacin especfica de donde se extrajo. Aunque
existen diferentes procedimientos para lograrlo, todos tienen como
presupuesto esencial que cada elemento de la poblacin tenga la
misma posibilidad de estar incluido en la muestra.
Se trata de un procedimiento de seleccin de la muestra, en el cual se
minimice la intencionalidad del investigador; aunque, en dependencia
de los fines de la investigacin, se podrn establecer ciertos
compromisos de representatividad por estratos o conglomerados.
1
El problema de la determinacin de los parmetros de la poblacin a
partir de una muestra, tiene una importancia extraordinaria en
investigaciones educativas que se desarrollan en los macroescenarios
donde, tanto la poblacin como la muestra, estn constituidas por un
elevado nmero de elementos de los que se podrn obtener
regularidades de inters general.
Por tal razn, es poco comn que se puedan desarrollar en
microescenarios, como es el caso de grupos o colectivos con un
nmero reducido de elementos, que por dems, generalmente se
trabajan con muestras intencionales.
El otro problema del que se encarga la Estadstica Inferencial es
determinar, a partir de la aplicacin de pruebas de validacin, en qu
medida son aceptables ciertas hiptesis empricas que de alguna
manera sustentan la estructura terica que se debe conformar, para dar
explicacin y solucin al problema que se plantea.
Teniendo en cuenta que las pruebas de hiptesis sostienen una
importante aplicacin en las investigaciones educativas que se
desarrollan en los microescenarios, donde realizan sus investigaciones
los docentes de todas las educaciones, en el presente curso se
presentan algunos presupuestos en el diseo de los modelos
estadsticos que permita enfrentar los problemas de la realidad
educativa con una slida base cientfica.
1. LOS MODELOS ESTADSTICOS EN LAS INVESTIGACIONES

EDUCATIVAS
Cuando los docentes se disponen a utilizar las pruebas de hiptesis,
deben tener muy presente desde la planificacin misma de su
investigacin, que cada modelo estadstico se sustenta en un conjunto
de supuestos que imponen las singularidades del objeto a investigar y
que las conclusiones que pudieran derivarse de su aplicacin, sern
vlidas slo si el modelo estadstico cumple con las exigencias que
estas establecen.
Cada caso tendr exigencias muy singulares, sin embargo, de manera
general se debe comenzar por establecer los supuestos de acuerdo
con:
2
La naturaleza de los elementos de las poblaciones.
Los requisitos de la escala de medicin para la calificacin de los
indicadores.
La finalidad de la indagacin emprica.
1.1. Naturaleza de los elementos de las poblaciones en las

investigaciones educativas
Intuitivamente es razonable que se distinga una diferencia marcada
entre los supuestos relacionados con la naturaleza de los elementos de
las poblaciones de los procesos educativos y los que se derivan de la
naturaleza de los que regularmente estn constituidos los sistemas de
los procesos naturales y tecnolgicos.
Mientras que en el conocimiento de la naturaleza se produce una
relacin sujeto-objeto (S-O), entre el investigador y el fenmeno
investigado, en el conocimiento de la vida social se introduce un factor
nuevo dentro de la relacin S-O: el objeto lo constituyen los procesos
sociales, donde participan las personas, con sus motivaciones,
actitudes, necesidades, formas de vivir y de relacionarse. Son entonces
los sujetos humanos los que representan objetos de indagacin, y
podramos preguntarnos: es legtimo y justo considerarlos como
objetos? (1)
En los procesos naturales y tecnolgicos los elementos de las
poblaciones generalmente se consideran indistinguibles y de
respuestas estereotipadas, derivadas de una relacin causal
determinista.
Un elemento de la poblacin no se distingue del resto en sus
manifestaciones siempre que se encuentren en las mismas condiciones
y, adems, cualquier elemento de la poblacin responder de igual
manera, siempre que se encuentre en condiciones similares.
Estos supuestos acerca de las caractersticas de los elementos de las
poblaciones de los procesos naturales y tecnolgicos determinan
registros del estado de los indicadores que conllevan a distribuciones
normales de probabilidad en la ocurrencia de los sucesos, con un valor
central donde se concentra la mayor parte de los mismos y extremos
con muy poca probabilidad de ocurrencia. Para ello es imprescindible
3
que la medicin del estado de un indicador en uno cualquiera de los
elementos del sistema, se realice con absoluta independencia de la
medicin del estado del indicador en cualquier otro elemento.
En estos sistemas denominados ergdicos por el carcter indistinguible
de sus elementos constituyentes y las respuestas asociadas a
relaciones causales deterministas, el valor central que caracteriza los
registros del estado de un indicador en todos los elementos de la
poblacin en un momento cualquiera del proceso, coincide
aproximadamente con el valor central que describe los registros del
mismo indicador en diferentes estados del proceso para un mismo
elemento. En estos casos las muestras se deben seleccionar
probabilsticamente, para lo cual la eleccin de un elemento cualquiera
de la poblacin para incluirlo en la muestra, no podr afectar la
posibilidad de incluir a cualquier otro elemento de la misma.
Contrariamente, las poblaciones de las investigaciones de los procesos
educativos generalmente estn constituidas por sujetos, cuyas
caractersticas de distinguibilidad, diversidad y dinamismo, no se
pueden desestimar, pues determinan respuestas no asociadas a una
relacin causal determinista. Cada sujeto puede responder de manera
diferente al resto de los elementos aunque est insertado en el mismo
contexto y sometido a las mismas acciones externas; pero adems, un
mismo sujeto puede responder de maneras diversas en diferentes
momentos, an y cuando se reproduzca la misma situacin.
Estas caractersticas de los elementos de las poblaciones de las
investigaciones de los procesos educativos, determinan que las
calificaciones del estado del indicador en los sujetos generalmente nos
ofrezcan registros de calificaciones distribuidos libremente, lo cual
implica que se deban aplicar pruebas estadsticas de valoracin, cuyas
declaraciones de probabilidad sean independientes de la forma de la
distribucin de la poblacin de donde se extrajo la muestra.
En estos sistemas no ergdicos, el valor central que caracteriza los
registros del estado de un indicador en todos los sujetos del grupo o
colectivo en un momento determinado del proceso, es poco probable
que coincida con el valor central que describe los registros del estado
del mismo indicador en diferentes momentos del proceso en la
evolucin de uno cualquiera de los sujetos de la poblacin. Ello, unido a
que los docentes en sus investigaciones de los procesos educativos,
4
generalmente trabajan con muestras intencionales pequeas, determina
que se deban aplicar pruebas de valoracin de resultados con las que
puedan obtenerse declaraciones exactas de probabilidad.
Aunque por razones prcticas se establezcan determinados criterios de
tipificacin en las pruebas estadsticas de valoracin de resultados,
para compararlos con distribuciones tericas de probabilidad, es poco
comn que conduzcan a la distribucin terica normal de
probabilidades; salvo que, sobre la base de estrictos supuestos
adicionales, se logre una aproximacin con arreglo de continuidad.
Si la concepcin de partida del investigador matiza la interpretacin de
los modelos, incluyendo los estadsticos en las investigaciones
educativas por qu, desde el diseo mismo del modelo, no se
establecen los supuestos acerca de la diversidad y dinamismo de los
sujetos constituyentes de sus poblaciones?; esto lo conducira a
pruebas estadsticas de valoracin que se comparan con otras
distribuciones tericas de probabilidad, acordes con los supuestos
establecidos y no se necesitara interpretaciones adicionales que
dependen de su concepcin de partida.
En el diseo de los modelos estadsticos para sintetizar y valorar los
resultados de las indagaciones empricas en los procesos educativos,
deben respetarse estos supuestos exigidos por las caractersticas de
los elementos constituyentes de sus poblaciones; de no ser as, las
conclusiones que pudieran derivarse de su aplicacin, no sern del todo
objetivas, a menos que se establezcan supuestos y aproximaciones
adicionales.
1.2. Los requisitos de las escalas de medicin en las investigaciones
educativas.
Tambin en la calificacin de los indicadores de los procesos
educativos, el investigador debe tener muy presente que para hacer las
operaciones de clculo, deben respetarse ciertas reglas que difieren de
acuerdo con los requisitos del escalamiento que haya podido lograrse
en correspondencia con la especificidad de dichos indicadores.
La mayora de los atributos que constituyen el campo de accin de los
procesos educativos, como el rendimiento acadmico, el coeficiente de
inteligencia, la creatividad, las habilidades, las motivaciones, los
intereses, por citar algunos; slo pueden ser transformados
5
operacionalmente en indicadores medidos en escalas que no guardan
isomorfismo con ninguna de las estructuras numricas, reservadas
esencialmente a la medicin de magnitudes que sustentan un conjunto
de supuestos adicionales, como los que con frecuencia aparecen en los
procesos naturales y tecnolgicos, a menos que sean estandarizados
utilizando complejas tcnicas.
An as es muy frecuente que los docentes en la calificacin de sus
indicadores, aspiren a aplicar escalas numricas y son raras las veces
que tienen xito; usualmente, lo que se toma como xito, se logra sobre
la base de supuestos que no se ajustan a los requisitos que estos
exigen.
Uno de los errores ms frecuentes es asumir que la calificacin del
indicador que sustenta la escala se distribuye normalmente en los
portadores registrados. Partiendo de ello, el constructor de la escala
manipula sus unidades hasta obtener la supuesta distribucin normal a
partir del registro de las calificaciones. Las conclusiones obtenidas con
este procedimiento, por lo general no reflejan objetivamente lo que
acontece en la realidad educativa.
Otra suposicin que a menudo hacen los investigadores para construir
una escala numrica aparente para la calificacin de los indicadores de
los procesos educativos, es considerar que cuando califican la
respuesta de un sujeto en un inciso de un instrumento, sea
exactamente equivalente a la respuesta del sujeto en cualquier otro
inciso cuando ha sido calificada en el mismo rango. Lo hacen para
satisfacer las exigencias de las escalas numricas que precisan de una
unidad comn y constante de medida. As por ejemplo, suponen que la
respuesta correcta a un inciso cualquiera en una escala de habilidades
es exactamente equivalente, en la cantidad de habilidad exhibida, a la
respuesta correcta en cualquier otro inciso.
Se pasa por alto que al poner en correspondencia las observaciones
registradas con cierta estructura, no necesariamente numrica, queda
definido un conjunto restringido de operaciones, con las que puede
determinarse la incertidumbre del resultado; y que de acuerdo con ello,
puede inferirse que:
6
Existen diferentes escalas de medicin de acuerdo con las
posibilidades de transformar operacionalmente el indicador; y para cada
una de ellas, corresponde un conjunto de operaciones admisibles.
No basta con obtener un resultado, es necesario establecer su
incertidumbre.
Las escalas de medicin pueden ser, mtricas y no mtricas, de
acuerdo con que sostengan o no un isomorfismo con las estructuras
numricas.
Las escalas mtricas son estructuras que sostienen un isomorfismo
especfico con alguna de las estructuras numricas. Las escalas que
con mayor frecuencia pretende utilizar el docente en sus
investigaciones son: la de razn y la de intervalo, algo muy lgico
porque el cuerpo de operaciones admisibles que la sustentan se
corresponden con la estructura aritmtica en la que se ha insistido
desde los primeros grados en la escuela y la que sostiene muchas
operaciones de la prctica social; aunque, adems de estas, existen
otras de extraordinaria utilizacin en la medicin de magnitudes en los
procesos naturales y tecnolgicos, como las vectoriales y las
tensoriales.
A todas las escalas de medicin se les exige que cumplan con el
principio de equivalencia y la ley de la tricotoma disyuntiva; o sea, que
el atributo est presente en todos los elementos y el grado de la
calificacin del indicador en cada elemento resulte mayor, igual o menor
que en cualquier otro elemento de la poblacin; pero adems, a las
escalas mtricas se les exige la independencia con el patrn, de esta
manera, cuando se elige un patrn para la medida del grado del
indicador en los elementos de una poblacin, debe existir una
correspondencia biunvoca con la medida del indicador en otra escala
especfica que se haya construido con cualquier otro patrn en la
misma escala; esta exigencia determina que siempre ser posible
encontrar ecuaciones de transformacin de una a otra escala
especfica.
Para ello es indispensable que pueda aplicrsele el sistema de
operaciones definidas para la estructura numrica con las que se ha
hecho corresponder; como la proporcionalidad directa en la escala de
7
razn por ser admisible la multiplicacin por una constante o las
transformaciones lineales en la escala de intervalo.
Por ltimo, hay escalas numricas que precisan de la definicin de un
cero real absoluto en la calificacin del indicador, como es el caso de la
escala de razn. Este tipo de escala se destina esencialmente a
ponderar magnitudes de los procesos naturales y tecnolgicos, es poco
usual su utilizacin en la calificacin de los indicadores de los procesos
educativos, en los cuales resulta imposible definir que en los sujetos
est absolutamente ausente en algn grado el atributo.
Las escalas no mtricas son estructuras especficas que no sostienen
un isomorfismo con ninguna de las estructuras numricas y se destinan
a calificar cualidades y caractersticas.
A diferencia de las escalas mtricas, slo se les exige que cumplan con
el principio de equivalencia y a lo sumo, con la ley de la tricotoma
disyuntiva. Con ellas puede establecerse si un sujeto de la poblacin
pertenece a una de las subclases establecidas de acuerdo con
determinados criterios taxonmicos, o si posee en la calificacin del
indicador un grado del atributo igual, mayor o menor que el registrado
en otro elemento de la poblacin; sin embargo, en este tipo de escala
no puede calcularse exactamente esa cantidad, como es posible en las
escalas mtricas.
Estos tipos de escalas que no guardan isomorfismo con las estructuras
numricas se adecuan mucho ms a la calificacin de los indicadores
que generalmente aparecen en el campo de accin de las
investigaciones de los procesos educativos. Estn definidas dos
escalas de este tipo: la nominal o clasificatoria y la ordinal o de rango.
En la escala nominal o clasificatoria la medicin se da en un nivel
elemental cuando se utiliza slo para clasificar a los sujetos del grupo o
colectivo, teniendo en cuenta como criterio las caractersticas del
atributo en ellos. As por ejemplo, los alumnos de un grupo pueden
clasificarse por su procedencia familiar: obrera, campesina, profesional,
etc.
La operacin de escalamiento de la escala nominal o clasificatoria
consiste en partir de una clase dada y formar un conjunto de subclases
mutuamente excluyentes con rangos equivalentes y la nica relacin
que debe cumplir es el principio de equivalencia; esto es, que los
8
elementos incluidos en cualquier subclase deben ser portadores del
atributo general.
Puesto que en una escala nominal o clasificadora las subclases pueden
representarse por cualquier conjunto de smbolos, las nicas
operaciones admisibles en este tipo de escala son los llamados a
veces grupos simtricos de transformaciones. (2) En este tipo de
transformaciones, cualquier cambio en la escala debe conservar los
mismos elementos en cada subclase.
Esta limitacin en el sistema de operaciones admisibles determina que
no tenga ningn sentido el clculo de la media y la mediana como
valores centrales. La estadstica apropiada para describir la tendencia
central en una escala nominal o clasificatoria es la moda, definida como
la subclase que posea la mayor de las frecuencias; tambin es posible
describirla a partir de la frecuencia relativa porcentual.
En la escala ordinal o de rango, la medicin se da en un nivel en que el
estado del atributo se presente con diferentes grados en cada uno de
los elementos de la poblacin. Si la relacin de diferencia en el grado
del atributo se sostiene en todos los pares de elementos o en la mayor
parte de ellos, nuestra escala estar determinada por rangos
ordenados.
En este tipo de escala slo puede registrarse que el grado de la
calificacin del atributo sea igual, mayor o menor, cuando se compara
en cada una de las parejas de elementos de la poblacin; pero no se
puede determinar cunto de igual, mayor o menor es el grado del
atributo en cada una de ellas. As por ejemplo, estamos en presencia de
una escala ordinal o de rango, al calificar el rendimiento acadmico de
un grupo de estudiantes en excelente, bien, regular o mal; o cuando los
ordenamos de acuerdo con su grado de desarrollo cognitivo o
intelectual.
En la escala ordinal o de rango la operacin de escalamiento consiste
en comparar el grado del atributo en los elementos de la poblacin y
formar un conjunto ordenado; en ella, se mantiene la relacin de
equivalencia para el conjunto de elementos, porque todos tienen que
ser portadores del atributo; sin embargo, ahora se incorpora la ley de la
tricotoma disyuntiva, lo que significa que en cada elemento el grado del
atributo es mayor, igual o menor que en otro.
9
Puesto que cualquier transformacin que conserve el orden de los
elementos respecto al grado del atributo no altera la informacin
contendida en un escalamiento ordinal, es nica hasta una
transformacin monotnica (3). En este tipo de transformaciones,
cualquier cambio en la escala debe conservar el orden de los elementos
respecto al grado del atributo en ellos.
La estadstica apropiada para describir la tendencia central en una
escala ordinal o de rango es la mediana, definida como la calificacin
del indicador en el elemento central una vez ordenados de mayor a
menor o viceversa por la calificacin que hayan obtenido en el
indicador, razn por la cual no es afectada por las calificaciones
extremas del grado del atributo en algunos elementos de la poblacin,
como sucede con la media en la escala de razn y en la escala de
intervalo.
En el diseo de los modelos estadsticos para sintetizar y valorar los
resultados de las indagaciones empricas en los procesos educativos,
deben respetarse estos supuestos para las escalas en la calificacin de
sus indicadores, de otra manera, las conclusiones que pudieran
derivarse de su aplicacin no sern vlidas.
1.3. Las tcnicas no paramtricas en las investigaciones educativas.
Los anlisis realizados en los dos epgrafes anteriores sobre la
naturaleza de las poblaciones y los requisitos de medida indican que la
mayor parte de los modelos estadsticos en las investigaciones de los
procesos educativos, conducen a un conjunto de supuestos que
determinan la utilizacin de pruebas estadsticas diseadas
especialmente para este conjunto de exigencias. Un anlisis de las
tcnicas no paramtricas nos indica que responden a la mayora de
estos supuestos porque:
Las declaraciones de probabilidad obtenidas de las pruebas no
paramtricas son exactas o excelentes aproximaciones e
...independientes de la forma de distribucin de la poblacin de la que
se tom la muestra (4).
10
Existen pruebas estadsticas no paramtricas adecuadas para
comparar grupos o colectivos diferentes, mientras que las pruebas
paramtricas exigen suposiciones poco reales para estos casos.
Las pruebas no paramtricas se adecuan a las exigencias de las
pequeas muestras.
Cuando los indicadores se califican en escalas de medicin
clasificatoria o de rango, la mejor alternativa es utilizar una prueba
estadstica no paramtrica.
Otra ventaja que se le reconoce a las tcnicas no paramtricas es la
facilidad con que pueden ser aplicadas por los que no son especialistas,
como es el caso de la mayora de los docentes, porque lo que se
compara son distribuciones y no es necesario el clculo de parmetros.
Es por ello, que entre los especialistas existe el criterio errneo de
ubicarlas en un nivel elemental; se pasa por alto que si al aplicar las
tcnicas no paramtricas se tienen en cuenta todos los supuestos
establecidos para el diseo del modelo estadstico, relacionados con la
naturaleza de las poblaciones, los requisitos de las escalas de medicin
y la eleccin de la prueba de valoracin de acuerdo con la finalidad que
se persigue, estas tienen un alto grado de eficacia y se constituyen en
un procedimiento acorde con el mtodo cientfico exigido.
Las tcnicas no paramtricas no son privativas de las investigaciones
de los procesos educativos o sociales, por su rigor tambin tienen un
amplio margen de aplicacin en los procesos naturales y tecnolgicos;
as por ejemplo, tambin son muy utilizadas para validar medicamentos
y otorgar sus patentes, en las investigaciones de gentica, en
estaciones experimentales, tanto animales como forestales, y en los
procesos tecnolgicos de innumerables industrias.
11
2. FINALIDAD DE LAS INDAGACIONES EMPRICAS EN LAS
INVESTIGACIONES EDUCATIVAS
En el proceso lgico de la construccin del conocimiento del objeto en
las investigaciones educativas, es frecuente que el docente se enfrente
a la necesidad de determinar en qu medida son aceptables ciertas
hiptesis empricas que de alguna manera sustentan la estructura
terica que se pretende conformar para dar explicacin y solucin al
problema general que les ocupa.
La investigacin educativa exige como punto de partida que, mediante
un diagnstico, se caracterice la situacin que presenta el grupo o
colectivo y cada uno de los elementos constituyentes, de modo tal que
le permita enfrentar su investigacin sobre bases objetivas y lograr
resultados que puedan ser aplicados a partir de una atencin
diferenciada, acorde con las singularidades encontradas. Pero adems,
para contextualizar los resultados de la caracterizacin de su grupo o
colectivo, es de mucha utilidad la comparacin con otros de la misma
escuela, o con los resultados de comprobaciones realizadas en el
municipio, la provincia y hasta en la nacin.
Por ltimo, tambin es comn que necesite conocer con objetividad si
una estrategia aplicada a su grupo o colectivo, ya sea generada por el
investigador o por algn especialista de reconocido prestigio, logra las
transformaciones deseadas en sus alumnos.
En un estudio de sistematizacin realizado por el autor y cuyo resultado
fue presentado como ponencia central de una de las comisiones en el
Primer Simposio Iberoamericano de Investigacin sobre Eficacia
Escolar, se destaca que las indagaciones empricas que con mayor
frecuencia aparecen en el campo de accin de las investigaciones
educativas, pueden ser clasificadas en grupos bsicos; no por la
manera de haber logrado la informacin a partir de la observacin, los
test, las encuestas, las entrevistas, las guas de campo, etc., aspecto
que es de vital importancia y que refleja el mtodo cientfico, sino por la
finalidad y el tipo de informacin que se pretende obtener (5)
Independientemente que no sea una taxonoma acabada y por tanto,
posible de ser precisada, resulta de gran utilidad en la bsqueda de un
criterio racional para el diseo de los modelos estadsticos y la
12
seleccin de las pruebas estadsticas de valoracin de resultados, como
se mostrar posteriormente.
Las indagaciones empricas en las investigaciones educativas pueden
clasificarse de acuerdo con los siguientes grupos bsicos:
Caracterizacin de un grupo o colectivo, a partir de la calificacin del

estado de los indicadores del proceso.
Comparacin de grupos o colectivos, a partir de la significacin en la
diferencia de la calificacin del estado de un indicador del proceso.
Bsqueda de relacin o asociacin entre dos o ms indicadores del
proceso en un grupo o colectivo.
Valoracin de las transformaciones logradas en un grupo o
colectivo, a partir de la significacin en el cambio de un indicador del
proceso, al ejercer sobre ellos un sistema de acciones externas
controladas.
Es muy frecuente que los docentes seleccionen sus pruebas de
validacin por aproximacin a las utilizadas por otros investigadores en
sus trabajos, cuyos supuestos estiman semejantes. Para elegirla, se
necesitan criterios racionales que indiquen la prueba ptima a utilizar,
de las que puedan derivarse conclusiones y generalizaciones objetivas.
2.1. Criterios de seleccin de las pruebas estadsticas de valoracin

Actualmente, el campo de la estadstica se ha desarrollado a tal punto,
que se cuenta con pruebas estadsticas de valoracin especfica para
casi todos los propsitos. Sin embargo, con el objetivo de orientar al
docente y restringir las pruebas estadsticas slo a lo de mayor
prioridad en su campo de accin, en el presente trabajo se presentan,
nicamente, las pruebas no paramtricas que se adecuan a las
indagaciones empricas ms frecuentes en sus investigaciones y las
que se sostienen en escalas no mtricas de medicin con las que
pueden calificarse operacionalmente los indicadores a los cuales
usualmente se enfrentan; precisamente, estos sern los criterios
fundamentales para la eleccin de la prueba:
La finalidad de la indagacin emprica.
13
La escala de medicin utilizada para calificar el estado del indicador
o de los indicadores.
Estos dos criterios discriminan un subgrupo limitado de pruebas que
responden a ambos supuestos; sin embargo, para una eleccin de
mayor precisin, se necesitan otros criterios que responden a requisitos
ms especficos:
Si se presentan dos o ms subclases mutuamente excluyentes,
cuando la escala de medicin es clasificatoria.
Si se registran muchas o pocas ligaduras, cuando la escala es
ordinal o de rango.
Si son dos o ms grupos o colectivos, en los casos que la finalidad
de la indagacin sea la comparacin entre ellos.
Si existen o no calificaciones parciales de los indicadores en el
proceso, en el caso de que la finalidad de la indagacin sea la
valoracin de transformaciones logradas en un grupo o colectivo.
2.2. Algoritmo de seleccin para cada caso.
Para la caracterizacin de un grupo o colectivo, a partir de la
calificacin del estado de los indicadores del proceso, se deben aplicar
pruebas de valoracin de resultados de bondad de ajuste:
- La prueba Binomial, con aproximacin a la normal y arreglo de
continuidad, cuando el indicador es calificado en una escala
clasificatoria, con dos subclases mutuamente excluyentes.
- La prueba de X 2 de bondad de ajuste, cuando el indicador es
calificado en una escala clasificatoria, con ms de dos subclases
mutuamente excluyentes; pero adems, puede ser aplicada cuando
slo se registran dos subclases, aunque con menor potencia que la
prueba Binomial.
- La prueba de una muestra de Kolmogorov Smirnov, cuando el
indicador est calificado en una escala ordinal o de rango, no importa el
nmero de ligaduras; en el caso de que posea pocas ligaduras, deben
conformarse los intervalos de clase de acuerdo a los rangos
establecidos.
14
Para la comparacin de grupos o colectivos, a partir de la
significacin en la diferencia de la calificacin del estado de un
indicador del proceso, se deben aplicar pruebas de valoracin de
resultados para dos o ms muestras independientes:
- La prueba de X 2 para k muestras, cuando el indicador es calificado
en una escala clasificatoria, no importa el nmero de grupos o
colectivos que se pretenda comparar.
- La prueba de dos muestras de Kolmogorov Smirnov, cuando el
indicador es calificado en una escala ordinal con muchas ligaduras;
pero, slo cuando se estn comparando dos grupos o colectivos.
- La prueba U de Mann Whitney, cuando el indicador es calificado en
una escala ordinal con pocas ligaduras; pero, slo cuando se estn
comparando dos grupos o colectivos.
- La prueba para el anlisis de varianza de Kruskal Wallys, cuando
el indicador es calificado en una escala ordinal, no importa si se
registran pocas o muchas ligaduras, ni el nmero de grupos o colectivos
que se estn comparando; adems, tambin puede ser aplicada cuando
se estn comparando slo dos grupos o colectivos, aunque con menor
potencia.
Para la bsqueda de relacin o asociacin entre dos o ms
indicadores del proceso en un grupo o colectivo:
- Coeficiente de Contingencia, cuando los indicadores son medidos
en una escala nominal o clasificatoria.
- Coeficiente de Spearman, cuando los indicadores son medidos en
una escala ordinal; sin embargo, slo es posible utilizarla para dos
indicadores.
- Coeficiente de Kendall, cuando los indicadores son medidos en una
escala ordinal; sin embargo, slo es posible utilizarla para dos
indicadores, a partir de las distancias ordinales entre cada par de
registros.
- Coeficiente de correlacin multidimensional rp j cuando los

indicadores son medidos en una escala ordinal, para dos o ms
indicadores del fenmeno o proceso.
15
Para la valoracin de las transformaciones logradas en un grupo o
colectivo, a partir de la significacin en el cambio de un indicador del
proceso, al ejercer sobre ellos un sistema de acciones externas
controladas, se deben aplicar pruebas de valoracin de resultados para
dos o ms muestras relacionadas:
- La prueba de Mc Nemar para significacin de cambios, cuando el
indicador es calificado en una escala clasificatoria, pero registradas slo
antes y despus de haber ejercido el sistema de acciones externas
controladas.
- La prueba Q de Cochran, cuando el indicador es calificado en una
escala clasificatoria, cuando se realizan registros antes, despus e
intermedias; tambin puede ser aplicada cuando son registradas slo
antes y despus pero con menor potencia.
- La prueba de los Signos, cuando el indicador es calificado en una
escala ordinal con muchas ligaduras, slo se registra si existi aumento
o disminuy y registradas slo antes y despus de haber ejercido el
sistema de acciones externas controladas.
- La prueba de rangos sealados y pares igualados de Wilcoxon,
cuando el indicador es calificado en una escala ordinal con pocas
ligaduras y registradas slo antes y despus de haber ejercido el
sistema de acciones externas controladas; adems, los grupos o
colectivos de la muestra de control y experimental deben estar
constituidos por el mismo nmero de sujetos y caractersticas
semejantes para cada pareja de sujetos.
- La prueba para el anlisis de varianza de Friedman, cuando el
indicador es calificado en un escalamiento ordinal, no importa el nmero
de ligaduras y pueden realizarse registros antes, despus y parciales
intermedios; tambin puede ser aplicada cuando son registradas slo
antes y despus pero con menor potencia.
Como se ha mostrado, los criterios para la seleccin de la prueba
estadstica de valoracin discriminan, de las innumerables pruebas, un
grupo limitado de ellas que responden a los supuestos acerca de la
finalidad de la indagacin desde una perspectiva clsica de racionalidad
y los requisitos de medida para la calificacin de los indicadores que
con mayor frecuencia tienen que enfrentar los docentes en sus
investigaciones; con lo cual, los docentes pueden orientarse sin dedicar
16
excesivo tiempo, que deben emplear en otras prioridades de su labor
profesional.
3. PROCEDIMIENTO ALGORTMICO PARA VALORAR

HIPTESIS
Despus de discernir la hiptesis emprica que resulta importante
valorar, se debe disponer a la recopilacin de los datos que muestren la
informacin deseada, a travs de la aplicacin de instrumentos:
encuestas, entrevistas, observaciones directas, test de conocimientos,
etc. La decisin acerca del significado de los datos puede conducirnos a
la confirmacin o rechazo de la hiptesis emprica y con ellas, a la
estructura terica que sustenta la solucin del problema.
La decisin objetiva de si una hiptesis emprica especfica es aceptada

o rechazada a partir del registro de observaciones obtenido, debe
realizarse por un procedimiento que revele el mtodo cientfico utilizado.
El procedimiento que generalmente se sigue consta de varias etapas:
Formulacin de las hiptesis de partida.

Eleccin de la prueba estadstica.
Establecer el nivel de significacin.
Definicin de la regin de rechazo.
Clculo y decisin.
Formulacin de las hiptesis de partida.
Una vez definido el tipo de indagacin emprica que se va a realizar, de

acuerdo al problema planteado, corresponde formular las hiptesis de
partida: hiptesis de nulidad (Ho) e hiptesis alternativas (Ha). La
hiptesis de nulidad (Ho) es una hiptesis de diferencias nulas, se
formula con la intencin expresa de ser rechazada. Si se rechaza la
hiptesis de nulidad, entonces puede aceptarse la hiptesis alternativa
(Ha).
La hiptesis alternativa (Ha) es la aseveracin operacional de la

hiptesis emprica que se necesita probar, porque en alguna medida
17
contribuye a sustentar la estructura terica que da explicacin al
problema general de que se ocupa esta investigacin.
Eleccin de la prueba estadstica.
Al elegirse, se necesita una base racional que indique la prueba ptima

a utilizar, de las que puedan derivarse conclusiones y generalizaciones
objetivas. Actualmente, el campo de la estadstica se ha desarrollado
hasta tal punto, que se cuenta con pruebas estadsticas de valoracin
especfica para casi todos los propsitos.
Sin embargo, con el objetivo de orientar a los docentes y restringir las

pruebas slo a las de mayor prioridad en su campo de accin, se
presentan nicamente las que se adecuan a las indagaciones empricas
ms frecuentes en las investigaciones educativas y las que se
sostienen en escalas no mtricas de medicin, con las que pueden
calificarse operacionalmente los indicadores con los que usualmente se
enfrentan. En el esquema conceptual, referencial y operativo aparecen
los criterios de seleccin para cada caso.
Establecer el nivel de significacin

Una vez definidas las hiptesis de partida y que se haya seleccionado
la prueba estadstica de valoracin apropiada, es necesario fijar el nivel
de significacin. Este determina en ltima instancia la decisin de
aceptar o rechazar la hiptesis de nulidad (Ho) y, consecuentemente, la
hiptesis alternativa (Ha).
La decisin objetiva se logra al especificar todas las posibles muestras

que determinaran que Ho es verdadera y posteriormente se extrae de
este conjunto un sub-conjunto de muestras de condiciones tan
extremas que reduciran mucho la probabilidad de que la hiptesis de
nulidad (Ho) sea verdadera. Si la que se obtiene en el registro de
observaciones est entre ellas, entonces se rechaza la hiptesis de
nulidad (Ho) y aceptamos la hiptesis alternativa (Ha).
Es decir, se rechazar la hiptesis de nulidad (Ho) para aceptar la

hiptesis alternativa (Ha), si la prueba estadstica de valoracin
establece un valor cuya probabilidad asociada bajo la ocurrencia de la
18
hiptesis de nulidad (Ho) es igual o menor que una pequea
probabilidad a la que se llama nivel de significacin.
Cuando se procede a fijar el nivel de significacin para aceptar o

rechazar la hiptesis alternativa, el investigador debe analizar el posible
impacto del resultado prctico que ofrecer su investigacin. En el caso
especfico de las investigaciones educativas, se aceptar = 0,05 que
determina un 95 % de fiabilidad en los resultados, para validar las tesis
de maestras y = 0,01 que determina un 99% de fiabilidad, para
empeos mayores, como es el caso de tesis de doctorado.
El nivel de significacin se asocia al error de tipo I, que consiste en

tomar una decisin de rechazar la hiptesis de nulidad (Ho) siendo esta
verdadera. Cuanto mayor sea el nivel de significacin tanto ms
probable es que la hiptesis de nulidad sea rechazada
equivocadamente y, consecuentemente, mayor la probabilidad de
aceptar la hiptesis alternativa (Ha) siendo falsa.
En toda investigacin existe la posibilidad de cometer otro tipo de error,

simbolizado por , conocido como error de tipo II, y que se comete al
aceptar la hiptesis de nulidad (Ho) siendo falsa, es decir, el error de
desestimar la hiptesis alternativa (Ha) siendo verdadera.
Definicin de la regin de rechazo.
La regin de rechazo se compone de un conjunto de valores posibles
tan extremos que cuando (Ho) es verdadera es muy pequea la
probabilidad de que la muestra observada est entre ellos. La
probabilidad asociada con cualquier valor de la regin de rechazo es
igual o menor que .
La localizacin de la regin de rechazo est determinada por la

naturaleza de la hiptesis alternativa (Ha), si esta indica la direccin de
la diferencia preestablecida, entonces la prueba es de una cola; si la
hiptesis alternativa (Ha) no indica la direccin de la diferencia
preestablecida, entonces se necesita una prueba de dos colas. Las
pruebas de una cola y de dos colas se distinguen en la localizacin de
la regin de rechazo, pero no en el tamao de la regin de rechazo.
19
Mientras que en una prueba de una cola la regin de rechazo se
encuentra en un extremo de la distribucin muestral, en las pruebas de
dos colas la regin de rechazo se ubica en los dos extremos. El tamao
de la regin de rechazo queda expresado por el nivel de significacin.
En la prctica es bastante difcil y engorrosa la determinacin de la

distribucin muestral sin embargo, cada prueba de valoracin
estadstica compara los resultados de las frmulas de tipificacin con
una de las distribuciones tericas de referencia. De las diez que se
proponen en el esquema, ocho se comparan con la distribucin de los
valores tpicos de Chi Cuadrado. La prueba de Kolmogorov Smirnov de
bondad de ajuste se compara con los valores crticos de la tabla
homnima y el Coeficiente de Spearman, con los valores que aparecen
en la tabla de valores crticos t de Student.
De acuerdo con los niveles de significacin universalmente reconocidos

para las investigaciones educativas, = 0,05 o = 0,01, quedar
definida la regin de rechazo, buscando en la tabla de valores crticos
correspondientes, de acuerdo con los grados de libertad que se
calculan para cada caso, en cada prueba.
Clculo y decisin.
Si el valor calculado mediante la frmula de tipificacin que corresponde
a la prueba estadstica de validacin se encuentra en la regin de
rechazo, se rechaza la hiptesis de nulidad Ho y, consecuentemente se
acepta la hiptesis alternativa Ha.
3.1. Ejemplos didcticos de pruebas de hiptesis para valorar la

caracterizacin de un grupo o colectivo.
Prueba X de bondad de ajuste.
Un docente necesita conocer si los estudiantes de sus dos grupos de

preuniversitario, cuyas caractersticas psicolgicas generales conoce,
manifiestan alguna preferencia por uno de los dos mtodos posibles,
accesibles en ese nivel, para resolver un tipo de problema de su
asignatura de Ciencias. Con la intencin de que no influya en la posible
preferencia haber desarrollado un mtodo antes que otro, a un grupo,
constituido por 26 estudiantes, le presenta primero el mtodo A y,
20
posteriormente, el mtodo B; en el otro grupo, con la misma cifra de
estudiantes, le invierte el orden de la presentacin. Una semana
despus, solicita a todos los estudiantes que resuelvan un problema del
mismo tipo sin hacer alusin a ninguno de los dos mtodos.
Lgicamente, los 52 estudiantes que est observando, intentan resolver
el ejercicio por uno de los dos mtodos. Al docente no le interesa si
logran resolverlo o no, lo que est indagando es el nivel de preferencia
por uno de ellos. Los resultados fueron los siguientes:
33 de ellos eligieron el mtodo A, para un 63,46 %

19 de ellos eligieron el mtodo B, para un 36,54 %
Sin lugar a dudas, el resultado muestra una mayor cantidad de

estudiantes que seleccionaron el mtodo A. Teniendo en cuenta estos
resultados, cul es el nivel de preferencia, que los estudiantes de sus
dos grupos, manifiestan por el mtodo A?
Hiptesis de Nulidad Ho: La probabilidad de encontrar un estudiante

que prefiera el mtodo A, es igual a la probabilidad de encontrar un
estudiante que prefiera el mtodo B, p (A) = p (B) = .
Hiptesis Alternativa Ha: La probabilidad de encontrar un estudiante

que prefiera el mtodo A, es mayor a la probabilidad de encontrar un
estudiante que prefiera el mtodo B, p (A) > p (B).
Seleccin de la prueba estadstica de valoracin. Puesto que la

indagacin es de caracterizacin de un grupo o colectivo (colectivo de
estudiantes de sus grupos), a partir de la calificacin del estado de un
indicador del proceso (preferencia por uno de los dos mtodos) en una
escala nominal o clasificatoria con subclases mutuamente excluyentes
(preferencia por el mtodo A o por el mtodo B), la prueba estadstica
de valoracin de los resultados a aplicar es la prueba Binomial, con
aproximacin a la normal y arreglo de continuidad; sin embargo, aunque
tenga menor potencia, tambin es posible aplicar X 2 de bondad de
ajuste.
21
Fijar el nivel de significacin. Se establece un nivel de significacin
0,01 con el objetivo de lograr un 99% de fiabilidad en la conclusin que
ofrezca la aplicacin de la prueba de valoracin.
Definicin de la regin de rechazo. La prueba X de bondad de ajuste

se compara con la tabla de los valores crticos de X, que en este caso
particular, por tener dos clases mutuamente excluyentes, tiene un grado
de libertad. De esta manera, la regin de rechazo para 0,01 queda
definida: X 6,64.
Clculo y Decisin:
La frmula de tipificacin de X de bondad de ajuste:
2
k f obs f esp 2
i 1 f esp
Donde: f obs es la frecuencia observada en cada subclase; f esp es la

frecuencia esperada en cada subclase y k, el nmero de subclases o
categoras. Sustituyendo los valores queda:
(33 26) 2 (19 26) 2

2
3,76
26 26
El valor de X calculado (3,76) a partir de los resultados, es menor que
el que se establece en la regin de rechazo (X 6,64), lo que
determina que no se rechace la hiptesis de nulidad, razn por la cual,
el docente no podr concluir que exista algn motivo especial para que
sus estudiantes tengan preferencia por el mtodo A; lo ms probable es
que el resultado de la eleccin del mtodo A por un nmero mayoritario
de estudiantes haya sido casual o estocstico.
Prueba de Kolmogorov Smirnov de bondad de ajuste.

En una investigacin sobre higiene escolar el docente necesita conocer
si la ubicacin de las pruebas en alguno de los cinco turnos del horario,
22
favorece a los estudiantes en los resultados que obtienen en las
mismas. Para ello, tom el resultado de cada uno de los 30 estudiantes
de su grupo en las pruebas aplicadas en los cinco turnos. De esa
manera, logr un registro donde se plasmaban en qu turno los 30
estudiantes obtuvieron los mejores resultados en las pruebas.
Turnos 1 2 3 4 5 Total
Estudiantes 3 16 5 4 2 30
Es evidente que en la muestra revisada, los resultados de los

estudiantes en las pruebas son mejores en el 2do turno. Sin embargo, a
partir de este resultado, se pueden emitir conclusiones acerca de que
la ubicacin de las pruebas en dicho turno siempre favorece el
desempeo de los estudiantes en las mismas?
que obtenga un buen resultado, es igual en cualquiera de los turnos.

que obtenga un buen resultado habiendo realizado la prueba en el 2do
turno, es mayor a la probabilidad de encontrar un estudiante que
obtenga un buen resultado, habindola realizado en cualquiera del resto
de los turnos.

indagacin es de caracterizacin de un grupo o colectivo (estudiantes
del grupo) en relacin con un indicador del proceso (ubicacin de las
pruebas en el horario para favorecer a los estudiantes en su
desempeo) en una escala ordinal (turnos del horario del 1ro al 5to), la
prueba estadstica de valoracin de los resultados a aplicar es:
Kolmogorov Smirnov de bondad de ajuste.
23
Definicin de la regin de rechazo. La prueba de Kolmogorov Smirnov
de bondad de ajuste, se compara con la tabla de los valores crticos de
D en la prueba de una muestra de Kolmogorov-Smirnov, para el caso
de los 30 estudiantes. De esta manera, la regin de rechazo queda
definida:
Dmx 0,23
Clculo y Decisin:
Para la decisin se obtienen las distribuciones de frecuencias
acumulativas relativas observadas y la terica, definida a partir de la
distribucin equitativa de la hiptesis de nulidad:
Tabla de frecuencias observadas y de acuerdo con Ho.
Turnos 1 2 3 4 5
Frecuencia observadas 3 16 5 4 2
Terica 6 6 6 6 6
Tabla de frecuencias acumulativas.
Turnos 1 2 3 4 5
Frecuencia observadas 3 19 24 28 30
Terica 6 12 18 24 30
24
Tabla de frecuencias acumulativas relativas:
Turnos 1 2 3 4 5
Frecuencia observadas 0,10 0,63 0,80 0,93 1,00
Terica 0,20 0,40 0,60 0,80 1,00
Diferencias absolutas 0,10 0,23 0,20 0,13 0,00
Como la mxima de las diferencias absolutas entre las frecuencias

acumulativas relativas observadas y tericas (0,23) es igual a la que se
establece en la regin de rechazo (Dc > 0,23), se rechaza la hiptesis
de nulidad, razn por la cual, el docente puede concluir que existen
razones para inferir que las pruebas ubicadas en el 2do turno del
horario, favorecen el desempeo de los estudiantes en ellas.
3.2. Ejemplos didcticos de pruebas de hiptesis para comparar
grupos o colectivos.
Prueba de X para k muestras
En una investigacin acerca de los ingresos a las carreras pedaggicas,

se pretende indagar si existe afinidad por algn perfil de carrera, de
acuerdo con la procedencia de los tres preuniversitarios del territorio.
Con esa intencin se tom una muestra de estudiantes de los tres
preuniversitarios, en los tres perfiles de carreras: pedaggica,
tecnolgica y humanidades. Los resultados aparecen en la tabla.
25
Perfil de la Carrera
Pre-Univ. Sub Total
Pedaggica Tecnolgica Ciencias
Pre-Univ. 1 30 18 8 56
Pre-Univ. 2 16 34 14 64
Pre-Univ. 3 8 24 28 60
Sub Total 54 76 50 180
Los resultados porcentuales aparecen en la siguiente tabla:
Resultados porcentuales
Pre-Univ.
Pre-Univ. 1 53,57 % 32,14 % 14,28 %
Pre-Univ. 2 25,00 % 53,12 % 21,87 %
Pre-Univ. 3 13,33 % 40,00 % 46,66 %
A partir de los resultados obtenidos en la muestra, es evidente que

existe cierta tendencia de seleccin del perfil de la carrera, en
dependencia del preuniversitario del territorio de donde procede el
estudiante. Sin embargo, nada se puede inferir de dichos resultados
hasta tanto no se determine su incertidumbre; para ello, es necesario
aplicar una prueba estadstica de validacin.
matriculado en cualquiera de los tres perfiles de carreras, es igual para
26
los que provengan de cualquiera de los tres preuniversitarios del
territorio.

matriculado en uno de los tres perfiles de carreras, depende del
preuniversitario del territorio de donde provenga.

indagacin es de comparacin de tres colectivos (estudiantes que
provienen de cada uno de los tres preuniversitarios del territorio) en
relacin con un indicador del proceso (matrcula en los diferentes
perfiles: pedaggica, tecnolgica y de ciencias) en una escala nominal o
clasificatoria, la prueba estadstica de valoracin de los resultados a
aplicar es: X para k muestras.

Definicin de la regin de rechazo. La prueba estadstica de valoracin

de X para k muestras, se compara con los valores crticos de X, en
funcin de los grados de libertad que se establecen de acuerdo con la
frmula: df = (r 1) (k -1).
Donde r es el nmero de grupos o colectivos a comparar, en este caso r

= 3; y k es el nmero de categoras, en este caso k = 3, de lo que
resulta que los grados de libertad df = 4. Entonces, para el nivel de
significacin elegido, la tabla de valores crticos de X indica: 2 9,49
Clculo y Decisin:
La prueba estadstica de valoracin de X para k muestras se calcula de
acuerdo con la frmula:
f
2
r k f esp
2
obs
i 1 i 1 f esp
27
Donde:
k es el nmero de subclases mutuamente excluyentes en una de las

variables;
r, el nmero de subclases mutuamente excluyentes en la otra variable;
f obs , la frecuencia registrada en la subclase k-sima coincidente con la
subclase r-sima; y f esp , la frecuencia esperada en la subclase k-sima
coincidente con la subclase r-sima.
Las frecuencias esperadas se obtienen a partir del producto de los

subtotales extremos de cada celda, dividida por el total general. Por
ejemplo: la frecuencia observada de los estudiantes del preuniversitario
No 3, matriculados en las Tecnolgicas es 24; para calcular la
frecuencia esperada en esa celda, se realiza la siguiente operacin:
60 76
f esp 25,33
180
De esta manera se construye la tabla de frecuencias esperadas:
Frecuencias Esperadas
Pre-Univ.
Pre-Univ. 1 16,80 23,64 15,55
Pre-Univ. 2 19,20 27,02 17,77
Pre-Univ. 3 18,00 25,33 16,66
A partir de la frmula, el clculo de X resulta:
2 10,37 1,34 3,66 0,53 1,80 0,80 5,55 0,07 7,72 31,84
28
Como c calculado (31,84), es mucho mayor que 2 para la regin de
2
rechazo ( 2 9,49 ), se rechaza la hiptesis de nulidad; razn por la

cual, el docente puede concluir que los estudiantes manifiestan ciertas
preferencias en el perfil de la carrera pedaggica de acuerdo con el
preuniversitario de preferencia.
Prueba de Kruskal Wallis

Un metodlogo registr los ndices de creatividad a los 30 alumnos del
grupo en un instituto politcnico de informtica, provenientes de tres
secundarias bsicas de la localidad, con el fin de comparar la
efectividad del trabajo de los diferentes claustros en esa direccin. Para
ello les aplic un sistema de pruebas estandarizadas en una escala de
0 a 5. Los resultados se muestran en la tabla:
Sec. / Bs. S/B # 1 S/B # 2 S/B # 3
3,5 2,0 3,3
2,8 2,8 3,6
3,2 3,3 2,6
3,5 3,2 2,1
4,4 3,4 3,2

Indices
2,4 3,6 3,3
3,1 2,4 1,9
3,5 3,3 3,4
2,8 3,2
29
2,6 1,1
2,5
3,1
Para calcular la mediana M d en una distribucin simple, como son los

casos que se muestran, se ordenan los valores registrados de menor a
mayor o viceversa; si el nmero de registros es impar, la mediana
corresponde al valor central y si el nmero de registros es par, se
calcula el promedio de los dos valores centrales. De esta manera para
cada una de las localidades la mediana result:
Sec. / Bs. S/B # 1 S/B # 2 S/B # 3
Medianas ( M d ) 3,35 2,95 3,20
Como puede apreciarse, se registraron diferencias en los ndices de

creatividad en los alumnos provenientes de las Secundarias Bsicas.
Los que provienen de la S/B # 1 obtuvieron el mayor ndice, seguidos
de los de la S/B # 3; los de la S/B # 2 quedaron por debajo en la
calificacin. Sin embargo, estas diferencias sern lo suficientemente
significativas como para inferir que sea necesario establecer un trabajo
diferenciado con los claustros de las Secundarias Bsicas, en esta
direccin?
con un alto ndice de creatividad, es igual en las tres Secundarias
Bsicas.

con un alto ndice de creatividad en la S/B # 1 es mayor que en la S/B #
3 y mucho mayor que en la S/B # 2.
30
indagacin es la comparacin de grupos o colectivos (los alumnos
provenientes de las tres secundarias bsicas), a partir de la
significacin en la diferencia de la calificacin de un indicador del
proceso (desarrollo de la creatividad) en una escala ordinal o de rango,
la prueba estadstica de valoracin de los resultados a aplicar es:
Kruskal Wallis.

Definicin de la regin de rechazo. La prueba de Kruskal Wallis se

compara con la tabla de los valores crticos de X, que en este caso
particular, por estar comparando tres grupos o colectivos, tiene dos
grados de libertad. De esta manera, la regin de rechazo queda
definida:
X 2 5,99
Clculo y Decisin:
El clculo de X, para compararlo con el valor de X crtico en su tabla

de valores crticos, se calcula por la frmula:
12 k R 2j
N ( N 1)
n
j 1
3( N 1)
H2 j
1
T
N3 N
Donde N es el total de sujetos de todas las muestras, que en este caso

es 30 estudiantes; n j , el nmero de sujetos en la muestra j-sima; R j ,
la suma de los valores de los rangos en cada muestra que se debe
encontrar. Adems, T t 3 t donde t es el nmero de observaciones
ligadas en cada rango.
31
Se construye la tabla de rangos ordenados, de mayor a menor o
viceversa, de las calificaciones de los sujetos de todas las localidades,
teniendo en cuenta las posibles ligaduras que puedan existir entre ellas:
Sec. / Bs. S/B # 1 S/B # 2 S/B # 3
5,0 27,0 10,5
20,0 20,0 2,5
14,5 10,5 22,5
5,0 14,5 28,0
1,0 7,5 14,5

Rangos
25,5 2,5 10,5
17,5 25,5 29,0
5,0 10,5 7,5
20,0 14,5
22,5 30,0
24,0
17,5
Rj 93,5 202,0 169,5
De los datos del problema:
32
N 30
(n1 8), (n 2 12), (n3 10)
( R1 93,5), ( R2 202,0), ( R3 169,5)
Observaciones ligadas:
T t 3
t
T 52 3

2 2 33 3 2 4 3 4 198,0
12 93,5 2 202,0 2 169,5 2
3(30 1)
3030 1 8 12 10
H2 3,06
198,0
1 3
30 30
Se sustituye en la frmula:
El valor de X 2 H calculado (3,06) a partir de los datos observados, es

menor que el establecido en la regin de rechazo (5,99); razn por la
cual, no se puede rechazar la hiptesis de nulidad (Ho) y el metodlogo
debe concluir que no existen diferencias significativas en el desarrollo
de la creatividad de los alumnos provenientes de las diferentes
Secundarias Bsicas y, por consiguiente, tampoco habr razones para
una estrategia diferenciada con sus claustros en esta direccin de
trabajo.
3.3. Ejemplos didcticos de pruebas de hiptesis para valorar la

significacin en el cambio de un indicador en un grupo o colectivo.
Prueba Mc Nemar
Un profesor de postgrado est interesado en conocer el grado de
influencia que ejerce su curso de Tcnicas Participativas entre los que
lo reciben. Para ello, y a partir del listado de los interesados, visita sus
clases para registrar la medida en que los mismos la utilizan sin haber
recibido el curso. Con esta exploracin, desarrolla los contenidos
propios para la aplicacin de las tcnicas mediante conferencias y
33
talleres. Un tiempo prudencial despus de haber culminado su curso,
visita de nuevo las actividades docentes de los participantes y registra
de nuevo la utilizacin de dichas tcnicas.
Lgicamente, la utilizacin de las tcnicas participativas por parte de los
profesores en sus actividades docentes, en alguna medida es reflejo del
grado de influencia que ha ejercido su curso.
A continuacin se plantean los resultados del registro de las
observaciones del profesor en las actividades docentes visitadas:
Total de docentes visitados antes y despus del curso: 50
No utilizaban las tcnicas antes del curso y despus s: 28 (56 %)
Utilizaban las tcnicas antes del curso y posteriormente no: 8 (16
%)
No la utilizaban antes ni despus del curso: 8 (16 %)
La utilizaban antes y la siguen utilizando despus del curso: 6 (12
%)
Estos resultados nos indican que existe un mayor nmero de cambios
positivos (56 %) que negativos (16 %); adems, que en un 28 % de la
muestra no se registraron cambios en ninguna de las dos direcciones.
Sin embargo, el profesor del curso de postgrado no puede inferir a partir
de dichos resultados, que su curso siempre ejerce influencias positivas
en la utilizacin de las tcnicas; para ello, debe valorar si los mismos
son lo suficientemente significativos.
Hiptesis de nulidad Ho: El curso de Tcnicas Participativas no ejerce
influencias sobre los docentes que lo reciben. La probabilidad de
encontrar a un docente que utiliza las tcnicas participativas en las
actividades con sus estudiantes es la misma antes que despus de
haber recibido el curso, e igual a 0.5.
Hiptesis alternativa Ha: El curso de Tcnicas Participativas ejerce
influencias sobre los docentes que lo reciben en alguna medida hace
que las utilicen en las actividades con sus estudiantes. Entonces, la
probabilidad de encontrar un docente que utilice las tcnicas
participativas es mayor despus de haber recibido el curso que antes.
34
indagacin es de valoracin de la significacin en el cambio de un
indicador del fenmeno o proceso (grado de utilizacin de las tcnicas
participativas en las actividades con los estudiantes, antes y despus
de haber recibido el curso) despus de haberse ejercido sobre el grupo,
colectivo o comunidad (en nuestro caso el grupo de docentes que
asistieron al postgrado) un sistema de acciones externas controladas
(las actividades planificadas para el desarrollo del curso), en una escala
nominal o clasificatoria (las utilizan o no), la prueba estadstica de
valoracin de los resultados a aplicar es: Mc Nemar para la significacin
de cambios.
Fijar el nivel de significacin. El impacto de nuestra indagacin no tiene
grandes implicaciones; sin embargo, para mayor fiabilidad, asumiremos
el nivel de significacin 0,01
Definicin de la Regin de Rechazo. La prueba estadstica de
valoracin de Mc Nemar para la significacin de cambios se compara
con los valores de la tabla de valores crticos de X con un nmero de
grados de libertad constante e igual a df = 1; entonces para el nivel de
significacin elegido: X = 6,64.
Clculo y Decisin:
El clculo X a partir del registro de datos para comparar con la tabla
de valores crticos, se realiza mediante la frmula:
2 f D f ND 1 2
f D f ND
Donde:
f D Nmero de sujetos con cambios deseados despus de aplicar el
sistema de acciones externas controladas.
f ND : Nmero de sujetos con cambios no deseados despus de
aplicar el sistema de acciones externas controladas.
f D f ND
35
Diferencia absoluta entre los cambios deseados y los cambios no
deseados.
En nuestro caso: f D 28 y f ND 8
De donde:

2
28 8 1 2
10,02
28 8
Como el valor de la X calculada a partir de los registros, es mayor que
fD
la X crtica que aparece en la tabla para el nivel de significacin elegido

y los grados de libertad que exige Mc Nemar, el profesor de postgrado
puede emitir el criterio generalizado de que su curso de Tcnicas
Participativas ejerce influencias positivas sobre los docentes de tal
manera que incrementan su utilizacin en las actividades con sus
estudiantes.
Prueba de Wilcoxon.
Un psiclogo infantil desea comprobar si la asistencia al crculo infantil
tiene algn efecto sobre la capacidad de percepcin social de los nios,
lgicamente debido a la influencia del sistema de actividades que en
estas instituciones se realizan. Califica el grado de desarrollo de la
percepcin social mediante las respuestas de los nios a un grupo de
cuadros que representan una diversidad de situaciones sociales,
hacindoles una serie standard de preguntas acerca de los cuadros.
Con este instrumento puede obtener un puntaje de 0 a 100 para cada
nio.
Para probar el efecto de la asistencia al crculo infantil, consigue 10
pares de gemelos como sujetos. Entindase por gemelos a parejas de
nios cuyas caractersticas psicolgicas estn muy prximas y muy
similares los medios donde se desenvuelven, incluyendo a las personas
que le rodean.
Al azar, asigna un gemelo de cada pareja al crculo infantil por un
tiempo; el otro gemelo de la pareja permanece en su medio familiar. Al
final del plazo se le aplica a los 20 nios la prueba de percepcin social
sealados. Los resultados aparecen en la tabla:
36
Pareja de Calificacin del grado de
Gemelos. desarrollo de percepcin.
Crculo Infantil Medio familiar.
1 76 73
2 84 79
3 74 61
4 89 87
5 91 83
6 64 66
7 86 77
8 79 80
9 79 67
10 78 63
Para calcular la mediana (Md) en una distribucin simple, como son los
casos que nos ocupan, se ordenan los valores registrados de menor a
mayor o viceversa; si el nmero de registros es impar, la mediana
corresponde al valor central y si el nmero de registros es par, de
calcula el promedio de los dos valores centrales. De esta manera para
cada uno de los grupos la mediana result:
37
Mediana del grado de desarrollo de
percepcin.
Crculo Infantil Medio familiar.
79 75
Es evidente que los registros obtenidos en las muestras, los asignados

al crculo infantil tienen un mayor desarrollo de la percepcin social que
los que quedaron en el medio familiar; sin embargo, no sabemos si
podemos generalizar este resultado, para ello debemos valorar los
resultados obtenidos, mediante una prueba de validacin.
Hiptesis de nulidad Ho: No existe diferencia en el desarrollo de la
percepcin social de los nios que asisten a los crculos infantiles y los
que quedan en casa. La probabilidad de encontrar un nio con alto
grado de desarrollo de la percepcin social es igual entre los que
asisten al Crculo Infantil que entre los que se quedan en casa, e igual a
0.5.
Hiptesis de partida Ha: Los nios que asisten a al crculo infantil y son
sometidos al sistema de acciones planificadas, logran un mayor grado
de desarrollo en la percepcin social que los que quedan en casa.
Entonces, la probabilidad de encontrar un nio con un alto grado de
desarrollo en la percepcin social es mayor entre los que asisten al
Crculo Infantil que entre los que se quedan en casa.
Seleccin de la Prueba Estadstica de valoracin. Puesto que la
indagacin es la valoracin de un sistema de acciones (actividades
planificadas en los Crculos Infantiles) con relacin a un indicador del
proceso (grado de desarrollo de la percepcin social) en una escala
ordinal (escala de 0 a 100) con pocas ligaduras, la prueba estadstica
de valoracin de los resultados a aplicar es Wilcoxon.
Fijar el nivel de significacin. El impacto de nuestra investigacin no
tiene grandes implicaciones, pero asumiremos el nivel de significacin
0,01 para mayor fiabilidad.
38
Definicin de la Regin de Rechazo. La prueba de Wilcoxon se
compara con los valores de la tabla normal de probabilidades, donde,
para el caso especfico de una cola, ya que el psiclogo supone que los
que asisten al crculo infantil deben tener un mayor desarrollo en la
percepcin social que los que quedan en casa; entonces para el nivel
de significacin elegido: Z 2,33
Clculo y Decisin:
La prueba de Wilcoxon tipifica de acuerdo a la frmula:
N ( N 1)
T
4
N ( N 1)(2 N 1)
24
Donde:
N: nmero total de parejas de sujetos que presentan diferencias.
Cuando la diferencia es nula, se sacan de la muestra.
T: Suma de los rangos de un solo signo.
Grado de Percepcin Dif. Rangos Rangos +

Pareja
Crculo Familiar
1 76 72 4 4 4
2 84 79 5 5 5
3 74 61 13 9 9
4 89 87 2 1,5 1.5
5 91 83 8 6 6
39
6 64 66 -2 -1,5
7 86 77 9 7 7
8 79 82 -3 -3
9 79 67 12 8 8
10 78 63 15 10 10
Suma T = 50,5
Sustituyendo en la frmula:
10 10 1
50,5
4 2,34
10 10 1 2 10 1
24
Como el valor de Z calculado es mayor que Z para la regin de rechazo,

el psiclogo puede extender los resultados obtenidos en la muestra a la
poblacin especfica de donde la extrajo. Es ms probable encontrar un
nio con un alto grado de percepcin social entre los que asisten al
crculo infantil y recibe la influencia del sistema de actividades que all
se planifican, que entre los que se quedan en casa bajo el custodio de
algn familiar.
3.4. Ejemplos didcticos de pruebas de hiptesis para comparar
estrategias interventivas.
Prueba Q de Cochran.
Un control de la asistencia de los alumnos al laboratorio de

computacin en horario extraclase demostr que la misma era muy
40
baja. Con el objetivo de motivarlos se elabor e implement un sistema
de tareas. Para valorar su efectividad se control la asistencia durante
dos noches ms; la primera paralelamente a la implementacin de la
estrategia y, la segunda, la noche posterior a haber culminado la
misma. Los resultados del control de asistencia, se muestran en la
tabla:
Asistencia al laboratorio de computacin

Alumnos
Inicial Intermedia Posterior
1 0 0 1
2 1 0 1
3 0 0 1
4 0 0 0
5 0 0 0
6 1 1 1
7 0 1 1
8 0 0 1
9 0 1 0
10 1 0 1
11 1 0 1
12 1 1 1
41
13 1 0 1
14 0 1 1
15 0 1 0
16 1 1 1
17 0 1 0
18 0 1 1
Total 7 9 13
% 38,88 % 50,0 % 72,22 %
Es indudable que los resultados observados muestran un incremento de

su asistencia al laboratorio de computacin en horario extraclase,
despus de haber orientado el sistema de tareas. Sin embargo, cul
es realmente el nivel de significacin de este resultado?

que asista al laboratorio de computacin para realizar tareas
independientes, es igual antes que despus de haber implementado el
sistema de tareas.

que asista al laboratorio de computacin para realizar tareas
independientes, es mayor despus de haber implementado el sistema
de tareas.

indagacin es de valoracin de transformaciones logradas en un grupo
o colectivo, a partir del cambio en la calificacin de un indicador del
proceso (asistencia al laboratorio de computacin para realizar tareas
independientes), al ejercer sobre el grupo o colectivo un sistema de
42
acciones externas controladas (el sistema de tareas), en una escala
clasificatoria (asisti o no), la prueba estadstica de valoracin de los
resultados a aplicar es la Q de Chochran.

Definicin de la regin de rechazo. La prueba Q de Cochran se

compara con la tabla de los valores crticos de X 2 , que en este caso
particular, por tener tres momentos de registro, tiene dos grados de
libertad. De esta manera, la regin de rechazo queda definida:
X 2 5,99
Clculo y Decisin:
El clculo de 2 para compararlo con el valor de crt

2
en su tabla de
valores crticos, se calcula por la frmula:
Donde k es la cantidad de calificaciones que se realizaron a todos los

k k
2

( k 1) k G 2j
G j

j 1 j 1

Q N N
k Li L2i
i 1 i 1
sujetos; G j , la cantidad total de xitos en cada calificacin y L I , la

cantidad total de xitos de cada sujeto durante el proceso.
En la siguiente tabla aparecen los clculos:
Asistencia al laboratorio de computacin

Alumnos
Inicial Intermedia Posterior 2
LI LI
43
1 0 0 1 1 1
2 1 0 1 2 4
3 0 0 1 1 1
4 0 0 0 0 0
5 0 0 0 0 0
6 1 1 1 3 9
7 0 1 1 2 4
8 0 0 1 1 1
9 0 1 0 1 1
10 1 0 1 2 4
11 1 0 1 2 4
12 1 1 1 3 9
13 1 0 1 2 4
14 0 1 1 2 4
15 0 1 0 1 1
16 1 1 1 3 9
17 0 1 0 1 1
18 0 1 1 2 4
Gj 7 9 13 29 61
Sustituyendo en frmula, queda:
Q

(3 1) 3 7 2 92 132 292
4,86
3 28 61
44
Como la Q de Cochran, calculada a partir del registro de datos sobre la
asistencia (4,86) es menor que el establecido en la regin de rechazo
( X 2 5,99), no es posible rechazar la hiptesis de nulidad; razn por la
cual, el docente debe concluir que es poco probable que el sistema de
tareas independientes haya motivado significativamente la asistencia al
laboratorio de computacin en horario extraclase.
Prueba de Friedman.
Un investigador necesita conocer si un tipo de adiestramiento es
recomendable para que sus estudiantes logren resolver en el menor
tiempo posible un determinado tipo de clculo. Para ello, le pide a sus
18 estudiantes realizar un ejercicio tipo y registra el tiempo que le tom
a cada uno ejecutarlo. Posteriormente, comienza el entrenamiento y
an sin terminarlo, realiza un segundo control. Despus de haber
culminado el entrenamiento, realiza el ltimo control. Los resultados se
muestran en la siguiente tabla.
Control Control Control

Alumno Inicial (seg) Intermedio (seg) Final (seg)
1 58 32 47
2 59 50 38
3 54 33 42
4 50 39 64
5 31 57 44
6 61 52 38
7 48 59 31
45
8 57 33 45
9 39 60 49
10 35 58 47
11 62 54 38
12 58 47 33
13 46 59 31
14 64 53 39
15 57 57 39
16 48 59 36
17 56 64 42
18 58 41 32
Media 52,28 50,38 40,8
Obsrvese que el tiempo promedio en la ejecucin del ejercicio en el

grupo de alumnos fue disminuyendo en la medida en que avanz el
adiestramiento del docente; sin embargo, este resultado obtenido ser
lo suficientemente significativo como para establecer que el
adiestramiento especfico es exitoso?

que haya disminuido el tiempo de clculo, es igual antes que despus
de haber implementado el adiestramiento.
46
que haya disminuido el tiempo de clculo, es mayor despus de haber
implementado el adiestramiento.

indagacin es la valoracin de las transformaciones logradas en un
grupo o colectivo, a partir del cambio en la calificacin de un indicador
del proceso (rapidez en el clculo) en una escala ordinal, al ejercer
sobre ellos un sistema de acciones externas controladas (un tipo
especfico de adiestramiento para el clculo), la prueba estadstica de
valoracin de los resultados a aplicar es Friedman.

Definicin de las regin de rechazo. El resultado de la aplicacin de la

prueba de valoracin de Friedman se compara con la tabla de valores
crticos de Chi Cuadrado con un df = k 1; donde k es el nmero de
acciones externas a comparar (en este caso k = 3 y por consiguiente df
= 2). De esta manera, la regin de rechazo es: X 5,99.
Clculo y Decisin:
El clculo de X para compararlo la tabla de valores crticos, se calcula

por la frmula:
k
12
2
r
Nk ( k 1)
(R
j 1
j ) 2 3 N (k 1)
Donde N es nmero de sujetos del grupo, en este caso N=18; K, el

nmero de controles realizados, en este caso k=3; R j la suma de los
rangos registrados en cada control, que se debe calcular en la tabla de
rangos:
47
Alumno Inicial Intermedio Final
1 3 1 2
2 3 2 1
3 3 1 2
4 2 1 3
5 1 3 2
6 3 2 1
7 2 3 1
8 3 1 2
9 1 3 2
10 1 3 2
11 3 2 1
12 3 2 1
13 2 3 1
14 3 2 1
15 2,5 2,5 1
16 2 3 1
48
17 2 3 1
18 3 2 1
Rj 42,5 39,5 26,0
Sustituyendo en frmula, queda:
r2
12
18 3 3 1
42,5 2

39,5 2 26,0 2 3 18 3 1 8,5
Como la X calculada con las calificaciones observadas (8,5), es mayor
que el establecido en la regin de rechazo ( X 2 5,99), se rechaza la
hiptesis de nulidad; razn por la cual, el docente puede inferir que es
alta la probabilidad de que el tipo especfico de adiestramiento para el
clculo haya posibilitado en los alumnos mayor rapidez en las
operaciones.
3.5. Ejemplos didcticos de pruebas de hiptesis para determinar la

relacin entre dos o ms indicadores del proceso.
Prueba para el Coeficiente de Contingencia.
Al aplicar el sistema de instrumentos para la determinacin del sistema
representativo primario a una muestra de 100 estudiantes de
preuniversitario, se encontraron 47 visuales, 30 auditivos y 23
kinestsicos. Posteriormente, con el fin de indagar si exista alguna
relacin entre los sistemas y el rendimiento en la asignatura de
Geometra, se le aplic a todos los estudiantes de la muestra un
examen de dicha materia, y se obtuvieron los resultados que aparecen
en la tabla.
49
Rendimiento en Sistema Representativo Predominante. Sub Total
Geometra
Visual Auditivo Kinestsico
Bien 30 5 3 38
Regular 11 15 6 32
Mal 6 10 14 30
Subtotal 47 30 23 100
La prediccin del docente fue que deba existir alguna relacin, debido
al carcter esencialmente visual de las tareas externas de la Geometra.
Para buscarla, como uno de los indicadores registrados se logr en una
escala clasificatoria, se aplic la frmula del Coeficiente de
Contingencia:
2
C
N 2
Donde N es el nmero total de elementos en la muestra y 2 debe

calcularse mediante la frmula:

2
r k f obs f esp
2
i 1 i 1 f esp
Donde k es el nmero de subclases mutuamente excluyentes en una de

las variables y r, el nmero de subclases mutuamente excluyentes en la
otra variable; f obs es la frecuencia registrada en la subclase k-sima
coincidente con la subclase r-sima y f esp , la frecuencia esperada en
la subclase k-sima coincidente con la subclase r-sima.
50
Las frecuencias esperadas f esp se obtienen a partir del producto de los
subtotales extremos de cada celda, dividida por el total general.
Ejemplo: La frecuencia observada en los visuales evaluados de Bien es
30; para calcular la frecuencia esperada en esa celda, se realiza la
siguiente operacin:
38 47
f esp 17,86
100
De esta manera se construye la tabla de frecuencias esperadas:
Rendimiento en Sistema Representativo Predominante.

Geometra
Visual Auditivo Kinestsico
Bien 17,86 11,4 8,74
Regular 15,04 9,6 7,36
Mal 14,1 9,0 6,9
A partir de la frmula, el clculo de X resulta:
2 8,25 3,59 3,76 1,08 3,03 0,25 4,65 0,11 7,3 32,02
32,02
C 0,49
32,02 100
Sustituyendo en la frmula para el clculo del Coeficiente de
Contingencia:
El Coeficiente de Contingencia siempre resulta un valor entre 0 y 1. En

la medida en que se acerca a 1, la relacin o asociacin entre los
indicadores es mayor; cuando el valor se acerca a 0, significa que
existe poca o ninguna relacin.
51
En este caso (C = 0,49), se puede decir que, para la muestra elegida,
existe cierta relacin entre el sistema representativo primario en los
estudiantes y su rendimiento acadmico en la asignatura de Geometra.
Es evidente que los que presentan el sistema representativo visual

como primario, tienden a obtener mejores resultados acadmicos en la
asignatura; quizs determinado, como supuso el docente, por el
carcter esencialmente visual que presentan sus tareas externas. Sin
embargo, el resultado obtenido ser lo suficientemente significativo
como para aseverar esa conclusin?

que obtenga una buena calificacin en la asignatura de Geometra, es
igual siendo visual, auditivo o kinestsico.

visual que obtenga una buena calificacin en la asignatura de
Geometra, es mayor que siendo auditivo o kinestsico.

indagacin es la bsqueda de relacin o asociacin entre dos
indicadores del proceso (sistema representativo primario y el
rendimiento acadmico en la asignatura de Geometra), donde uno de
los indicadores est medido en una escala clasificatoria, la prueba
estadstica de valoracin de los resultados a aplicar es el Coeficiente de
Contingencia.

Definicin de la regin de rechazo. La prueba para la valoracin del

Coeficiente de Contingencia se compara con la tabla de valores crticos
de la distribucin de X 2 con un nmero de grados de libertad igual a: df
= (k-1)(r-1). Donde k es el nmero de subclases en uno de los
indicadores y r, el de la otra. En este caso: df = (3-1)(3-1) = 4. La regin
de rechazo para el nivel de significacin elegido es: X 13,29
52
Clculo y Decisin:
Para valorar el resultado obtenido del Coeficiente de Contingencia, se

calcula con las observaciones registradas y esperadas un valor de X, a
partir de la frmula:
f
2
r k f esp
2
obs
i 1 i 1 f esp
En el caso especfico del Coeficiente de Contingencia, su clculo

implica la determinacin anterior del valor de X, cuyo resultado aparece
al inicio del problema: X = 32,02.
Como el valor de X calculado con los datos observados (32,02), es

mayor que la establecida en la regin de rechazo (X 13,29), se
rechaza la hiptesis de nulidad; con lo cual, el docente puede concluir
que la probabilidad de encontrar un estudiante visual que obtenga una
buena calificacin en la asignatura Geometra, es mayor que siendo
auditivo o kinestsico.
Prueba para el coeficiente de correlacin de Spearman.

En una investigacin hace falta conocer qu nivel de relacin existe
entre la parte terica y la prctica de un curso de Ciencias Naturales.
Para ello se registraron las evaluaciones de los contenidos tericos y de
habilidades prcticas de 10 alumnos del grupo. Los resultados
aparecen en la tabla:
53
Nombre Teora Prctica
1. Roberto 76 73
2. Arturo 84 79
3. Jos ngel 74 61
4. Ana Mara 89 87
5. Pedro 91 83
6. Yirsy 64 66
7. Hctor Manuel 86 77
8. Mara Elena 71 69
9. Olga Mara 79 67
10. Malena 68 63
Para encontrar el coeficiente de correlacin, se aplica la frmula:
N3 N
TX TY di2
rS 6
N3 N N3 N
2 TX TY
12 12
Donde N es el tamao de la muestra (N = 10); d i2 la suma de los

cuadrados de las diferencias de los rangos de ambos indicadores;
TX , la suma de los diversos valores de TX para todos los grupos de
54
observaciones ligadas en la variable X; T
Y , la suma de los diversos
valores de TY para todos los grupos de observaciones ligadas en la
variable Y.
t3 t
Calculando T de acuerdo con la ecuacin T , donde t es el
12
nmero de observaciones ligadas en un rango dado.
Cuando no existen ligaduras, o el nmero de ellas es bajo en

comparacin con el nmero de elementos de la muestra, la frmula del
clculo queda de la forma:
6 d i2
rS 1
N3 N
Donde N es el tamao de la muestra y d i2 , la suma de los cuadrados

de las diferencias de los rangos de ambos indicadores.
Nombre Teora Prctica Rango Rango Dif. D

Teora Prctica
1. Roberto 76 73 6 5 1 1
2. Arturo 84 79 4 3 1 1
3. Jos 74 61 7 10 -3 9
4. Ana M 89 87 2 1 1 1
5. Pedro 91 83 1 2 -1 1
6. Yirsy 64 66 10 8 2 4
55
7. Hctor 86 77 3 4 -1 1
8. Elena 71 69 8 6 2 4
9. Olga 79 67 5 7 -2 4
10. Malena 68 63 9 9 0 0
d i
2 26
En la ltima columna observamos que la suma del cuadrado de las

diferencias es:
d i
2
26
En este caso no existen ligaduras, entonces se puede utilizar la

segunda frmula de clculo, quedando:
6 26
rS 1 0,84
103 10
Como se conoce, los valores del coeficiente de correlacin de

Spearman estn entre 0 y 1: cercana a 0 la correlacin es baja, cercana
a 1 la correlacin es alta. En este caso el resultado es alto, pero se
debe comprobar si es significativo o no, como para poder emitir una
conclusin con cierto rango de fiabilidad.

que obtenga una alta calificacin en la parte prctica del curso, es igual
habiendo obtenido una calificacin alta, media o baja en la parte terica.
56
que obtenga una alta calificacin en la parte prctica del curso, es
mayor cuando ha obtenido una alta calificacin en la parte terica, que
cuando haya obtenido media o baja en la parte terica.

indagacin es la bsqueda de relacin o asociacin entre dos
indicadores del proceso (rendimiento acadmico en ambas pruebas), en
una escala ordinal o de rango, la prueba estadstica de valoracin de
los resultados a aplicar es el coeficiente de correlacin de Spearman.

Definicin de la regin de rechazo. La prueba para la valoracin del

coeficiente de correlacin de Spearman se compara con la tabla de
valores crticos de la distribucin t de Student con un nmero de grados
de libertad: df = (N 2), donde N es el tamao de la muestra (N = 10),
que determina un df = (10 2) = 8. De esta manera, la regin de
rechazo queda establecida: t 3,35.
Clculo y Decisin:
Para el clculo de la t de Student, a partir de los datos registrados, que

se debe comparar con la t de Student de la regin de rechazo, se utiliza
la frmula:
N 2
t rS
1 rS2
Sustituyendo,
10 2
t 0,84 4,41
1 0,84
2
57
Como la t de Student calculada (4,41), es mayor que la establecida en
la regin de rechazo ( t 3,35), razn por la cual, se rechaza la hiptesis
de nulidad, el docente puede concluir que la probabilidad de encontrar
un estudiante que obtenga una alta calificacin en la parte prctica del
curso es mayor cuando ha obtenido una alta calificacin en la parte
terica, que cuando haya obtenido media o baja.
Referencias bibliogrficas
1. Castellanos, B. y otros (2005). Esquema conceptual, referencial y
operativo sobre la investigacin educativa. Editorial Pueblo y
Educacin. Ciudad de La Habana. Cuba. P.39.
2. Siegel, S. (1990). Diseo experimental no paramtrico aplicado a las
ciencias de la conducta. Editorial Tillas. Espaa. Versin de 1956. P.
43.
3. _________ (1990). Ob. cit. P. 45.
4. ________ (1990). Ob. cit. P. 53.
5. Prez Jacinto, O. (2005). Una estrategia alternativa para el diseo
de los modelos estadsticos en las investigaciones educativas. Curso de
postgrado en Pedagoga 2005. UNESCO-IPLAC. ISBN 959-18-0118-1.
P. 15.
Bibliografa
1. Ato, M. y Lpez, J. J. (1996). Anlisis estadstico para datos

categricos. Editorial Sntesis. Espaa.
2. Batanero, C. (2001). Training Researchers in the Use of Statistics.
Granada: International Association for Statistics Education e
International Statistical Institute, ISBN 90-73592-19-4.
3. __________ (2001). Didctica de la Estadstica. Granada: Grupo de
Investigacin en Educacin Estadstica, ISBN 84-699-4295-6. Espaa
58
4. Batanero, C. y Godino, J. D. (2001). Anlisis de datos y su didctica.
Departamento de Didctica de la Matemtica, Universidad de Granada,
ISBN 84-699-4296-6. Espaa.
5. Castellanos, B. y otros (2005). Esquema conceptual, referencial y
operativo sobre la investigacin educativa. Editorial Pueblo y
Educacin. La Habana, Cuba.
6. Hernndez Sampieri, R. y otros. (2002). Metodologa de la
investigacin. Editorial Mc Graw-Hill, Interamericana de Mxico. Mxico.
7. Martn Pliego, F. J. y Montero, J. M. (2005). Problemas de
Inferencia Estadstica. 3 Edicin. Editorial AC. Paraninfo. Espaa.
8. Prez Jacinto, O. (2006). ECRO sobre la estadstica en las
investigaciones educativas. En: IV Congreso Internacional Didctica de
las Ciencias. AESOFT s.a. ISBN 959-18-0070-3. La Habana, Cuba.
9. ______________ (2005). Una estrategia alternativa para el diseo
de los modelos estadsticos en las investigaciones educativas. Material
de Curso de Postgrado en el marco de Pedagoga 2005. Copyright
IPLAC Copyright Educacin Cubana. ISBN 959-18-0118-1.
10. ______________ (2005). Los modelos estadsticos en las Ciencias
de la Educacin. En: Memorias del Evento Provincial Universidad 2006.
AESOFT s.a. ISBN 959-16-0352-5. La Habana, Cuba.
11. ______________ (2002). Criterios de seleccin de las pruebas
estadsticas de valoracin. Pgina WEB RIEME. Red Iberoamericana
de Investigacin sobre Eficacia Escolar. Espaa.
12. Siegel, S. (1990). Estadstica no paramtrica aplicada a las ciencias
de la conducta. Editorial Trillas. Espaa.
13. Spiegel, R.M. y otros. (2001). Probabilidad y Estadstica. Editorial
Schaum. Graw-Hill, Interamericana de Mxico. Mxico.
14. Sprent, P. (1993). Applied Nonparametric Statistical Methods.
Editorial Chapman and Hall.
15. Vlez, R. y Garca, A. (1993). Principios de Inferencia Estadstica.
UNED.
59
ISBN 978-959-18-0674-1
9 789591 806741
60

2878

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

2878

Enviado por

Direitos autorais:

Formatos disponíveis

LOS DISEOS ESTADSTICOS EN LAS

Dr. C. Omar Prez Jacinto

Dr. C. Toms Crespo Borges

Universidad de Ciencias Pedaggicas Flix Varela

Dr. C. Ibrahim Arnaez

Dr. C. Ral Hernndez

Universidad de Ciencias Pedaggicas Ral Gmez Garca

Diseo y composicin: MSc. Nelson Piero Alonso

sobre la presente edicin, sello editor Educacin Cubana. Ministerio

Sello Editor EDUCACIN CUBANA

1. LOS MODELOS ESTADSTICOS EN LAS INVESTIGACIONES

1.1. Naturaleza de los elementos de las poblaciones en las

Caracterizacin de un grupo o colectivo, a partir de la calificacin del

2.1. Criterios de seleccin de las pruebas estadsticas de valoracin

- Coeficiente de correlacin multidimensional rp j cuando los

3. PROCEDIMIENTO ALGORTMICO PARA VALORAR

La decisin objetiva de si una hiptesis emprica especfica es aceptada

El procedimiento que generalmente se sigue consta de varias etapas:

Formulacin de las hiptesis de partida.

Formulacin de las hiptesis de partida.

Una vez definido el tipo de indagacin emprica que se va a realizar, de

La hiptesis alternativa (Ha) es la aseveracin operacional de la

Eleccin de la prueba estadstica.

Al elegirse, se necesita una base racional que indique la prueba ptima

Sin embargo, con el objetivo de orientar a los docentes y restringir las

Establecer el nivel de significacin

La decisin objetiva se logra al especificar todas las posibles muestras

Es decir, se rechazar la hiptesis de nulidad (Ho) para aceptar la

Cuando se procede a fijar el nivel de significacin para aceptar o

El nivel de significacin se asocia al error de tipo I, que consiste en

En toda investigacin existe la posibilidad de cometer otro tipo de error,

La localizacin de la regin de rechazo est determinada por la

En la prctica es bastante difcil y engorrosa la determinacin de la

De acuerdo con los niveles de significacin universalmente reconocidos

3.1. Ejemplos didcticos de pruebas de hiptesis para valorar la

Un docente necesita conocer si los estudiantes de sus dos grupos de

33 de ellos eligieron el mtodo A, para un 63,46 %

Sin lugar a dudas, el resultado muestra una mayor cantidad de

Hiptesis de Nulidad Ho: La probabilidad de encontrar un estudiante

Hiptesis Alternativa Ha: La probabilidad de encontrar un estudiante

Seleccin de la prueba estadstica de valoracin. Puesto que la

Definicin de la regin de rechazo. La prueba X de bondad de ajuste

La frmula de tipificacin de X de bondad de ajuste:

Donde: f obs es la frecuencia observada en cada subclase; f esp es la

(33 26) 2 (19 26) 2

Prueba de Kolmogorov Smirnov de bondad de ajuste.

Es evidente que en la muestra revisada, los resultados de los

Hiptesis Alternativa Ha: La probabilidad de encontrar un estudiante

Seleccin de la prueba estadstica de valoracin. Puesto que la

Tabla de frecuencias observadas y de acuerdo con Ho.

Tabla de frecuencias acumulativas.

Frecuencia observadas 0,10 0,63 0,80 0,93 1,00

Terica 0,20 0,40 0,60 0,80 1,00

Diferencias absolutas 0,10 0,23 0,20 0,13 0,00

Como la mxima de las diferencias absolutas entre las frecuencias

Prueba de X para k muestras

En una investigacin acerca de los ingresos a las carreras pedaggicas,

Sub Total 54 76 50 180

Los resultados porcentuales aparecen en la siguiente tabla:

Pre-Univ. 1 53,57 % 32,14 % 14,28 %

Pre-Univ. 2 25,00 % 53,12 % 21,87 %

Pre-Univ. 3 13,33 % 40,00 % 46,66 %

A partir de los resultados obtenidos en la muestra, es evidente que

Hiptesis Alternativa Ha: La probabilidad de encontrar un estudiante