Escolar Documentos
Profissional Documentos
Cultura Documentos
NDICE
Presentacin.,4 Introducin .5 PRIMERA UNIDAD. Concepto de estadstica y escalas de medicin6 Leccin I. Estadstica e investigacin..7 Leccin II. Escalas de medicin 24 Leccin III. Estadsticos y representacio9nes grficas de datos cialitativos, Cuasi-cuantitativos y cuantitativos.37 SEGUNDA UNIDAD. Estadsticos descriptivos, Distribucin normal, Muestreo, Prueba de hiptesis............................................................................50 Leccin IV. Medidas de tendencia central y de dispersin51 Leccin V. Distribucin normal..64 Leccin VI. Muestreo75 Leccin VII. Prueba de hiptesis y pruebas paramtricas y no paramtricas.88 TERCERA UNIDAD. Relacin de dos variables en Diseos para muestras Independiente..98 Leccin VIII. Relacin de dos variables categricas: La prueba Ji cuadrada99 Leccin IX. La prueba de la mediana..111 Leccin X. Relacin entre una variable cualitativa de dos categoras y una variable cuantitativa..121 10.1 Contraste parametrico: La prueba t de student para muestras independientes.121 10.2 Contraste no parametrico: La prueba U de Mann-Whitney130 Leccin XI. Relacin entre una variable cualitativa de ms de dos Categoras y una variable cuantitativa.137 11.1 Contraste parametrico: La prueba F de anlisis de varianza de una va (Anova)137 11.2 Contraste no parametrico: La prueba de anlisis de varianza no parametrico de Kruskall-Wallis (H).145 Leccin XII. Relacin entre dos variables cuantitativas..153 12.1 Contraste parametrico: El coeficiente de correlacin de 2
JAIME RAMIRO ALIAGA TOVAR Pearson..153 12.2 Contraste no parametrico: El coeficiente de correlacin de Spearman.161
CUARTA UNIDAD. Relacin de dos variables en Diseos para muestras dependientes o correlacionadas168 Leccin XIII. Diseos relacionados: Relacin entre dos variables cuantitativas.168 13.1 Contraste parametrico: La prueba t de student para muestras correlacionadas169 13.2 Contraste no parametrico: La prueba t de Wilcoxon para muestras correlacionadas173
Tabla A. Ley Normal..180 Tabla B. Ley de Student-Fisher..182 Tabla C. Ley X2 .184 Tabla D. Ley de Sndecor Anlisis de varianza (Anova).186 Tabla E. Significacin del Indice U de la prueba de Mann-Whitney.190 Tabla F. Significacin del coeficiente de correlacin de Pearson...191 Tabla G. Significacin del coeficiente de correlacin de Spearman...192 Tabla H. Significacin del Induce T de la prueba de Wilcoxon
PRESENTACIN
INTRODUCCIN
Es aceptado actualmente que el pensamiento matemtico-estadstico es necesario para comprender con profundidad los principios que rigen los fenmenos humanos, en especial los del comportamiento, donde es preciso el considerar grandes cantidades de datos para lograr informacin til y relevante. El comportamiento humano y social se distingue por su amplia variabilidad entre los sujetos y por sus constancias y pequeas variabilidades dentro de los mismos. La estadstica es un instrumento necesario para estudiar fenmenos, eventos, acontecimientos, procesos cuya caracterstica es la variabilidad y porque su fundamento la teora de la probabilidad. En psicologa, la cuantificacin es muy importante no slo para intentar comprender mejor los fenmenos psicolgicos en sus diversas manifestaciones, sino tambin para captar y conocer el desarrollo actual de nuestra ciencia, cuyos avances se recogen en publicaciones, reuniones peridicas y congresos, donde la mayor parte de la informacin se presenta en trminos estadsticos cuantitativos, por ejemplo, porcentajes, proporcin, variabilidad, correlacin, diferencia de grupos, escalas de puntuaciones, entre otros ms, para explicar un fenmeno psicolgico y social. La estadstica aparece entonces como una necesidad bsica colocada en los primeros escalones de una estructura piramidal de los conocimientos psicolgicos, conveniente de satisfacer antes de elevarse a otras reas ms puramente psicolgicas. En este contexto, Tcnicas Bivariadas de Anlisis es un texto de educacin a distancia de los alumnos de la Facultad de Psicologa y Ciencias Sociales de la Universidad Inca Garcilaso de la Vega, que de manera amigable en el sentido de buscar ms la comprensin de los conceptos estadsticos sin apelar a demostraciones matemticas-estadsticas muy elaboradas busca que el alumno vincule los conocimientos estadsticos con la investigacin cientfica, brindndole la informacin bsica y necesaria para describir y graficar la distribucin de variables, el seleccionar muestras, y, sobre todo, el analizar las relaciones que puedan establecerse entre dos variables en el mbito de los diseos metodolgicos para muestras independientes y para muestras dependientes o correlacionadas. Por ltimo, aparte de los necesarios clculos manuales se ha procurado que el estudiante se percate de lo necesario que resulta el dominio de los paquetes informatizados de anlisis estadstico de los cuales es ejemplo el SPSS. El Autor 5
Primera
UNIDAD
Concepto de estadstica y escalas de medicin
a partir del estudio de los datos en esa El medio de que se sirve para muestra, valindose del clculo de generalizar y deducir conclusiones, as probabilidades, se encarga de hacer como para tomar decisiones razonables inferencias acerca de la poblacin. de acuerdo con tales anlisis.
JAIME RAMIRO ALIAGA TOVAR sus resultados y conclusiones a otras poblaciones distintas o ms amplias (Sierra Bravo, 1991:241). La recogida de informacin implica bsicamente dos etapas: a) la seleccin y determinacin de la poblacin o muestra y las variables contenidas en estas que se quieren investigar. Asimismo, si se va estudiar una muestra la especificacin de su tamao y el tipo de muestreo a realizar (probabilstico o no probabilstico); b) la obtencin de los datos, que se logra mediante la observacin directa, la aplicacin de encuestas, test y entrevistas o la realizacin de experimentos en los elementos o individuos que componen la poblacin o muestra, Por otra parte, la ordenacin y presentacin de los datos implica la abstraccin de varias propiedades del conjunto de datos observados, comprendiendo la clasificacin, tabulacin y organizacin de los mismos. La clasificacin incluye el tratamiento de los datos considerados anmalos que pueden falsear un anlisis de los indicadores estadsticos. La tabulacin y presentacin implica el uso de distribuciones de frecuencias, el resumen de los datos en tablas y grficos estadsticos. Finalmente, el anlisis descriptivo de los datos se complementa con la elaboracin de indicadores estadsticos de estos por medio de las medidas de tendencia central (media aritmtica, mediana, modo), dispersin (desviacin estndar, desviacin media, varianza), de posicin (cuartiles y percentiles) y forma (asimetra y curtosis). Por ejemplo, un psiclogo que ha administrado un test de razonamiento aritmtico a 275 nios tiene como resultado un conjunto desorganizado de puntuaciones o datos; para su anlisis descriptivo tiene que ordenarlos por medio de una distribucin de frecuencias y tabularlos, vale decir inscribir de manera ordenada todas las puntuaciones o valores posibles, registrando al lado de cada uno el nmero de veces que ha ocurrido. Tambin puede hacer una representacin grfica de la distribucin de frecuencias, por ejemplo, por medio de un polgono de frecuencias o un histograma, y analizar si la distribucin es simtrica o no lo es, as como obtener la media aritmtica y la desviacin estndar de las puntuaciones y presentarlas en una tabla.
Campo de la estadstica que en base al anlisis de las propiedades de una muestra hace posible inferir conclusiones acerca de lo que est sucediendo en la poblacin que representa. El anlisis inferencial busca establecer cmo es la distribucin de los parmetros de la poblacin de la que fue extrada la muestra que la representa (Carro, 1997).
JAIME RAMIRO ALIAGA TOVAR Los procedimientos inferenciales son la estimacin estadstica y la prueba de hiptesis, y su instrumento es el clculo de probabilidades. Por ejemplo, un psiclogo clnico que estudia los efectos de cuatro clases de terapia no puede obtener datos de todos los pacientes que se encuentran en tratamiento teraputico. Tiene que obtener una muestra de pacientes por cada clase de terapia y en ellas realizar su estudio. Sobre la base de los resultados someter a contraste sus hiptesis y en el caso que el muestreo haya sido el adecuado sus resultados los extender a la poblacin.
JAIME RAMIRO ALIAGA TOVAR las manufacturados en un da cualquiera en una fbrica de prendas de vestir, entre otros eventos. En breve, experimentos deterministas son aquellas operaciones o procesos en los que s podemos decir lo que va a ocurrir; por otro lado, experimentos aleatorios son aquellas operaciones o procesos en los cuales no sabemos qu va a ocurrir pues siendo llevados al cabo varias veces en las mismas condiciones no tienen un mismo resultado final. Es decir, su resultado no puede ser pronosticado con certeza. El hecho que no tengan un mismo resultado se debe a factores aleatorios, no sistemticos, no sujetos a nuestro control (Amn, 2001). Un ejemplo de experimento aleatorio es tomar al azar de una poblacin una persona y observar su grado de instruccin. 2) Espacio muestral. Recibe esta denominacin el conjunto de todos los posibles resultados que se obtiene en un experimento aleatorio. Usualmente se le denota por la letra griega omega ( ). En el ejemplo anterior, todos los posibles resultados del grado de instruccin de la persona extrada al azar de una poblacin, son factibles de ser representados en el conjunto: = {sin instruccin, primaria incompleta, primaria completa, secundaria incompleta, secundaria completa, superior incompleta, superior completa} En un ejemplo que se refiere a la anotacin de la suma de puntos obtenidos como resultado del lanzamiento de dos dados, el espacio muestral es el siguiente: = { 2,3,4,5,6,7,8,9,10,11,12 }
3) Evento o suceso muestral aleatorio. Esta denominacin le corresponde a cada uno de los subconjuntos del espacio muestral . Se le designa empleando letras maysculas. Por ejemplo, en el caso del experimento aleatorio referido al grado de instruccin de una persona seleccionada al azar de una poblacin, una de las posibilidades y por lo tanto uno de los eventos o sucesos muestrales aleatorios, es: E1 = { persona con instruccin secundaria completa } En el caso del ejemplo referido al lanzamiento de los dos dados, son subconjuntos de , entre otros, los siguientes: Salir un nmero mayor o igual a 8: A = { 8, 9, 10, 11, 12 } Salir un nmero igual o menor a 3: B = { 2, 3 }
10
JAIME RAMIRO ALIAGA TOVAR Salir un nmero mltiplo de 3: C = { 3, 6, 9,12 } Salir un nmero primo: D = { 2, 3, 5,7,11 } 4) Evento o suceso mutuamente excluyente. Se presenta cuando la ocurrencia de alguno de ellos implica la no ocurrencia del otro (Gmez, Condado, Adriazola, Solano, 2005). Por ejemplo, en el espacio muestral , los eventos o sucesos: E1 = {persona con instruccin secundaria completa } y E2 = { persona con instruccin secundaria incompleta }, son sucesos o eventos que se excluyen mutuamente. 5) Espacio de eventos o sucesos. Es el conjunto de todos los eventos o sucesos que se encuentran en el espacio muestral . 6) Tipos de sucesos o eventos. Los tipos ms frecuentes de eventos o sucesos son: 1) eventos o sucesos elementales, formados por un solo resultado del experimento. Este es el caso de los ejemplos mostrados ms arriba; 2) sucesos compuestos, formados por dos o ms resultados del experimento; es decir, por dos o ms sucesos elementales; 3) sucesos seguros, aquellos que se comprueban al realizar el experimento aleatorio Est formado por todos los resultados posibles del experimento y, por tanto, coincide con el espacio muestral; 4) Suceso imposible, aquel que nunca se verifica. 7) Variable aleatoria. Tambin llamada variable de azar o variable estocstica. Se representa por las letras maysculas X, Y y sus valores por las letras minsculas correspondientes x, y, ... Es aqulla variable que es resultado de un experimento aleatorio, pudiendo por tanto tomar varios valores imprevistos. Tambin es una funcin o regla de relacin que asocia a cada elemento del espacio muestral . un nmero real. En otras palabras, si los eventos o sucesos elementales de un experimento aleatorio cualquiera pueden identificarse fcilmente mediante un nmero real, la variable aleatoria X es el conjunto de todos estos nmeros, conjunto que tambin recibe el nombre de rango de X El establecimiento de la correspondencia entre el conjunto de los posibles sucesos elementales y el conjunto de los nmeros reales debe hacerse de tal modo que a cada suceso elemental le corresponda un nmero real arbitrario y que a sucesos elementales distintos les correspondan nmeros distintos. Por ejemplo, si en el experimento aleatorio tomar al azar de una poblacin una persona y observar su grado de instruccin, los posibles resultados o sucesos elementales del espacio muestral = {sin instruccin, primaria incompleta, primaria completa, secundaria incompleta, secundaria completa, superior incompleta, superior completa}, los codificamos con los nmeros 1,2,3,4,5 y 6, entonces la variable aleatoria X ser: X = (1,2,3,4,5,6).
11
JAIME RAMIRO ALIAGA TOVAR Veamos otro ejemplo: si se trata de averiguar en un experimento aleatorio el tipo de leche peditrica que preferira un bebe entre las leches de marcas X, Y, Z, al suceso elemental preferir la leche X se le hace corresponder el nmero 1; al suceso elemental preferir la leche Y se le hace corresponder el nmero 2; al sucesos elemental preferir la leche Z se le hace corresponder el nmero 3, entonces la variable aleatoria X ser: X = (1,2,3). Es pertinente aclarar que a cada suceso elemental se le puede asociar cualquier nmero dentro del conjunto de los nmeros reales, siendo la nica condicin que a sucesos elementales distintos le correspondan tambin nmeros distintos. En este sentido, esta correspondencia es una aplicacin inyectiva, vale decir aquella en la que dados dos conjuntos A y B en este caso el conjunto de los sucesos elementales y el conjunto de los nmeros reales un elemento de B es imagen de uno y slo de uno de A. La figura 1 grfica esta aplicacin:
Las variables aleatorias pueden, a su vez, ser discretas o continuas. Una variable aleatoria discreta es aquella que tiene un rango finito de valores, es decir, adopta slo un nmero limitado de valores concretizado finalmente en nmeros enteros; en tanto que una variable aleatoria continua es aquella a la que se le permite asumir cualquier valor dentro de determinados lmites, vale decir cualquier valor dentro de un intervalo de nmeros reales (Gmez, Condado, Adriazola, Solano, 2005), concretizado finalmente en nmeros decimales. Ejemplos de variables aleatorias discretas son el nmero de pacientes en un servicio de psicologa, el nmero de trabajadores que ha recibido la visita de una trabajadora social, el nmero de hijos de una familia, el nmero de enfermos portadores del virus de inmunodeficiencia (VIH) que se atienden en un hospital, el nmero de revistas solicitados en una hemeroteca, el nmero de cursos a dictarse en un semestre acadmico. Ejemplos de variables aleatorias continuas son la estatura de los alumnos de una clase, el peso, el Cociente intelectual (CI), las puntuaciones logradas en un cuestionario que evala las estrategias de aprendizaje, el tiempo dedicado al estudio en una semana, el precio, las horas de 12
JAIME RAMIRO ALIAGA TOVAR duracin de una batera, el tiempo de duracin de un matrimonio, los ingresos econmicos. 8) Probabilidad. Existen hasta tres aproximaciones a este concepto: La clsica o axiomtica, la frecuentista y la subjetiva. En este apartado es ms importante la aproximacin frecuentista, pero veremos rpidamente la clsica y sobre la subjetivista slo anotaremos que es la base de los mtodos bayesianos, elaborados como alternativa a la estadstica tradicional centrada en el contraste de hiptesis (Silva y Muoz, 2000). a) En la probabilidad clsica (o a priori), la probabilidad se mide de la siguiente manera: al realizarse un experimento aleatorio se genera un espacio muestral que abarca el conjunto de N resultados o sucesos igualmente probables y mutuamente excluyentes, si dentro de estos N resultados el evento E ocurre m veces, la probabilidad de ocurrencia del evento E es igual a m/N. En otros trminos, la probabilidad de ocurrencia (p) o aparicin de un evento o suceso es la razn entre el nmero de casos favorables, o veces que puede presentarse este (m) y el caso de nmeros posibles (N), todos igualmente factibles. La frmula que se lee: la probabilidad de que ocurra el evento E es igual a m/N, es la siguiente: P (E) = m/N La probabilidad de un evento o suceso es un nmero comprendido entre 0 y 1. Si un suceso es imposible o no ocurre nunca, su probabilidad asociada es cero, mientras que si ocurriese siempre su probabilidad es 1. As, las probabilidades suelen venir expresadas como decimales, fracciones o porcentajes. Se dice que es una probabilidad a priori porque antes de realizar un experimento aleatorio, se debe conocer su espacio muestral asociado y, adems, el nmero de resultados posibles de cualquier evento o suceso o subconjunto de . Por ejemplo, si deseamos hallar la probabilidad de obtener sello al lanzar una moneda al aire, tenemos que existen dos casos posibles: = {cara, sello}, por tanto N = 2, y que el nmero de veces que puede salir sello es solamente una: E = { sello }, en consecuencia m = 1. Entonces, la probabilidad de que ocurra sello, es la siguiente: P(E) = m/N = 1/2 = 0,50 b) La probabilidad frecuentista o de frecuencia relativa ( o a posteriori) mide la frecuencia con la que se obtiene un resultado, evento o suceso (E) al llevar a cabo un experimento aleatorio o observacin del que se conocen todos los resultados, eventos o sucesos posibles, en un nmero grande de ocasiones (n), bajo condiciones suficientemente estables,. En vista que no se puede repetir un 13
JAIME RAMIRO ALIAGA TOVAR experimento aleatorio un nmero infinito de veces, esta probabilidad est vinculada a la idea de regularidad estadstica, segn la cual las frecuencias relativas tienden a estabilizarse a un valor fijo despus de repetir el experimento un nmero razonable de ocasiones (Amn, 2001). En consecuencia, la frecuencia relativa de la ocurrencia del evento o suceso E, m/n, estima la probabilidad de ocurrencia del evento E. (Gmez, Condado, Adriazola, Solano, 2005: 16). La formula es la siguiente: P (E) = m/n Esta definicin de probabilidad es a posteriori porque tan slo repitiendo un experimento aleatorio un nmero elevado de veces podremos saber cul es la probabilidad de cada suceso. Por ejemplo, si Pedro lanza una vez al aire una moneda no trucada, y sale sello, entonces el suceso sello ha aparecido el 100% de las veces y el suceso cara el 0%. Si l lanzara diez veces la moneda al aire, es posible que el suceso sello salga 6 veces y el suceso cara las 4 restantes. En este caso, la probabilidad del suceso sello en porcentajes ya no sera del 100%, sino que se habra reducido al 60%. Si Pedro repite este experimento un nmero elevado de veces, lo normal es que las probabilidades de los sucesos sello y cara se vayan aproximando al 50% cada una. Este 50% o, en decimales, 0,50 ser la probabilidad de estos sucesos segn el modelo de probabilidad frecuentista, pero si la experiencia dijera que en vez de 0,50 eran 0,47, 0,53 o 0,62 los valores que indican la estabilizacin de la proporcin de sellos, entonces atribuiramos 0,47, 0,53, 0,62 como probabilidades al suceso sello y no 0,50. (Amn, 2001:41). En el modelo frecuentista de la probabilidad ya no ser necesario que el nmero de soluciones sea finito, ni que todos los sucesos tengan la misma probabilidad. En base a la comprensin de todos los conceptos presentados, podemos decir que el clculo de probabilidades es un instrumento muy til para las ciencias fcticas si pretendemos tomar decisiones de modo responsable y con un riesgo mnimo de error en muchsimos problemas de importancia, pues nos brinda las reglas para el estudio de los experimentos aleatorios o de azar, sirviendo de base para la estadstica inductiva o inferencial, pues es () el puente que nos permite pasar de lo afirmado con certeza (en la muestra) a lo pronosticable slo con probabilidad (en la poblacin), de lo conocido a lo desconocido (Amn, 2001: 20).
1.1.3.2. Poblacin.
Una poblacin es el conjunto de todos los elementos o individuos que concuerdan con una serie de especificaciones (Selltiz, Jahoda, Deutsch y Cook, 1976). Por ejemplo, en una investigacin sobre las horas que los nios ven la televisin, la poblacin se defini as: Todos los nios de Lima Metropolitana que cursan el 4 grado de primaria, en instituciones educativas privadas del turno matutino. En esta definicin se delimita claramente la poblacin y se fija los criterios de inclusin y de exclusin. As, no participarn 14
JAIME RAMIRO ALIAGA TOVAR de este estudio los nios que no vivan en el rea metropolitana, que no vayan al colegio y los menores de 9 aos que es la edad-grado del 4 de primaria. Sin embargo, el trmino poblacin no se refiere necesariamente a personas. As, en un estudio pueden ser consideradas como poblacin el total de historias clnicas archivadas en un determinado centro hospitalario, todas las instituciones educativas primarias del Per, todas las reacciones de un sujeto observado en situaciones experimentales, el nmero de pernos producidos en un da o la suma de todas las posibles combinaciones de cinco cartas extradas de un juego de 52 cartas, en la que la suma de los puntos de cinco cartas constituye un individuo para su subsiguiente tratamiento estadstico. Una poblacin es denominada finita cuando el nmero de individuos que la constituyen es limitado. Es infinita cuando el nmero de individuos que la conforman no tiene un lmite; sin embargo, usualmente se considera como infinita a una poblacin que tiene ms de 100 000 individuos.
JAIME RAMIRO ALIAGA TOVAR respecto de una condicin o situacin o variable aleatoria X. Parmetros poblacionales son, entre otros, la media poblacional de la variable aleatoria X (X) y la varianza poblacional de la variable aleatoria X (2X). Por ejemplo, si el tiempo medio media poblacional de dedicacin al estudio de una poblacin de 100 000 estudiantes del quinto ao de secundaria es de 10,6 horas semanales, este valor ser el correspondiente parmetro poblacional. Los parmetros son cantidades indeterminadas, constantes o fijas (Sierra Bravo, 1991), que generalmente son desconocidas, por lo que para estimarlos con cierto margen de error se extraen con tcnicas probabilsticas las muestras o muestra.
1.1.3.5 Inferencia.
La inferencia es la accin y el efecto de inferir. El inferir es el sacar una consecuencia o deducir algo de otra cosa (Diccionario de la Lengua Espaola). En estadstica analizando la muestra y mediante el clculo de probabilidades se hace inferencias generalizables a la poblacin. Existen muestras aleatorias o probabilsticas y muestras no aleatorias o no probabilsticas. Las primeras pueden considerarse de tres maneras no equivalentes pero si muy relacionadas (Nolberto y Ponce, 2008): a) Unidades estadsticas seleccionadas probabilsticamente para ser investigadas. Es el subconjunto de individuos pertenecientes a una poblacin donde estn reflejadas las propiedades importantes de la misma que interesa analizar. Este subconjunto es extrado por el investigador con la finalidad de inferir caractersticas del total de la poblacin, necesitando para el efecto que la muestra sea representativa de esta; caracterstica que se garantiza con cierto margen de error y cuando son bien realizadas cuando la tcnica de extraccin de la poblacin o muestreo es probabilstico. Por ejemplo en el caso del estudio sobre las horas que un nio ve la televisin, la variable de inters es X, nmero de horas, que es posible de precisar si se conociera la distribucin de X, vale decir si se examinara a los 20 000 nios que componen la poblacin. Si se quisiera conocer la distribucin de la variable aleatoria X y los parmetros poblacionales media poblacional de X () y la varianza poblacional de X (2), se tendra que extraer al azar de la poblacin una muestra, por ejemplo de tamao n = 400.
1.1.3.6 Muestra.
Entonces, X1, es el nmero de horas que ve la televisin el primer nio seleccionado de la muestra, X2, el nmero de horas de televisin que ve el segundo nio seleccionado de la muestra,..X400, el nmero de horas que ve televisin el ltimo nio seleccionado de la muestra. b) Variables aleatorias tericas asociadas con las unidades estadsticas seleccionadas. Siguiendo con el ejemplo anterior, en vista que la seleccin de los 16
JAIME RAMIRO ALIAGA TOVAR 400 nios es al azar: X1 , X2 , X3, , X 400 constituye variables aleatorias. Estas variables son independientes y cada una tiene la misma distribucin que la variable aleatoria X. Matemticamente, el trmino muestra aleatoria se refiere no a cuatrocientos alumnos seleccionados para este estudio, sino a las cuatrocientos variables aleatorias X1, X2 , X3 , X400, asociadas con los alumnos seleccionados. c) Valores numricos correspondientes a las variables aleatorias. Se trata del conjunto de n nmeros reales x1, x2, x3,xn que son los valores observados de las variables aleatorias X1, X2, X3.Xn. La especificacin de estos valores es necesaria para previo anlisis poder sacar las conclusiones acerca de la poblacin que representa la muestra. Por ejemplo, en el caso del ejemplo anterior, una vez identificados los cuatrocientos alumnos, podemos determinar los valores numricos de las cuatrocientos variables aleatorias X1 , X2 , X3 , X4 , X5 , X6 . Supongamos que el primer alumno seleccionado ve 6 horas de televisin a la semana, en este caso la variable aleatoria X1 toma el valor x1 = 6; si el segundo alumno seleccionado ve televisin 3 horas a la semana, la variable aleatoria X 2 toma el valor x2 = 3, de igual manera las variables aleatorias X3 , X4 , X5 , X400 tomarn valores numricos que van a depender de las horas que ven televisin los alumnos . En este caso, el termino muestra aleatoria es utilizado no en relacin a los nios seleccionados o a las variables aleatorias asociados con ellos sino a los valores numricos x1 , x2 , x3 , x4 , x5, x400 que toman respectivamente cada una de las cuatrocientos variables aleatorias. En consecuencia, una muestra aleatoria de tamao n es un conjunto de n observaciones x1 , x2 , x3 ,..., x n sobre las variables X1 , X2 , X3 ,..., Xn , independientes e idnticamente distribuidas.(Nolberto y Ponce, 2008). Es un valor numrico obtenido con los valores de una muestra que resume alguna caracterstica de esta. Este valor constituye una variable aleatoria por qu est sujeto a la fluctuacin de la muestra en relacin al valor poblacional, que es constante (Sierra Bravo, 1991). Tomando al ejemplo anterior, si al extraer de la poblacin de 100 000 estudiantes del quinto ao de secundaria una muestra de 600 estudiantes y calculamos en 10,8 horas semanales el tiempo medio media muestral - dedicado al estudio por la muestra, 10,8 es un estadstico. Estadsticos son, entre otros, la media aritmtica muestral ( x ), la varianza muestral (S2) y la desviacin estndar o tpica muestral (S).
1.1.3.7. Estadstico.
1.1.3.8
JAIME RAMIRO ALIAGA TOVAR las preguntas de investigacin. El propsito del anlisis es reducir los datos a una forma inteligible e interpretable para que las relaciones de los problemas de investigacin puedan ser estudiadas y probadas (Kerlinger y Lee, 2002:172). Son ejemplos de modalidades de anlisis estadsticos la distribucin de frecuencias, los grficos, ndices, tasas, porcentaje, media aritmtica, desviacin estndar, coeficiente de correlacin, anlisis de varianza, anlisis de diferencias, anlisis de regresin, anlisis factorial.
18
Cuadro 2. Algunas aplicaciones estadsticas en el proceso de investigacin Etapas del proceso de investigacin Planteamiento del problema Marco terico, definiciones Hiptesis nula (Ho), hiptesis alterna (Hi), niveles de significacin, variables cualitativas, variables discontinuas o discretas, variables continuas. Diseo de experimentos, preexperimental, cuasi experimental, experimental, no experimental. Teora del muestreo, muestreo probabilstico, tipos, tamao de la muestra. Elaboracin de instrumentos de medicin, anlisis de tems, estimacin de la confiabilidad, validez, baremos. Medidas de tendencia central, medidas de dispersin, representaciones grficas,l seleccin de pruebas estadsticas, pruebas de hiptesis, pruebas paramtricas, pruebas no paramtricas, tcnicas multivariadas. Aplicaciones de la estadstica
Hiptesis, variables
Seleccin de la muestra
Recoleccin de datos
Informe de investigacin.
19
EJERCICIOS DE AUTOCOMPROBACIN I
A. Responda si las siguientes afirmaciones son verdaderas o falsas.
AFIRMACIONES 1. El campo de la estadstica descriptiva generaliza sus resultados y conclusiones a otras poblaciones distintas o ms amplias 2. La variable estocstica es resultado de un experimento aleatorio, en donde puede tomar varios valores imprevistos. 3. El estadstico constituye una variable aleatoria por qu est sujeto a la fluctuacin de la muestra en relacin al valor poblacional. 4. La probabilidad frecuentista est vinculada a la idea de irregularidad estadstica 5. Los procedimientos inferenciales son la estimacin estadstica y la prueba de hiptesis, y su instrumento es el clculo de probabilidades. 6. Espacio muestral es el conjunto de todos los posibles resultados que se obtiene en un experimento no aleatorio. 7. Las variables aleatorias pueden ser exclusivamente variables continuas 8. Los procesos inferenciales y descriptivos son la estimacin estadstica y la prueba de hiptesis, y su instrumento es el clculo de probabilidades 9. Los parmetros son cantidades determinadas y constantes que generalmente son desconocidas 10. La frecuencia relativa mide la frecuencia con la que se obtiene un resultado al llevar a cabo un experimento no aleatorio B. Complete cada enunciado: ENUNCIADO 1. Los campos de la estadstica son:.y
2. La recogida de informacin implica: a).. y, b). 3.La ordenacin y presentacin de los datos tiene que ver con a)..b).y, c) 4. Un experimento aleatorio tieneresultados. 5. Se denomina..o.a la fuente de donde se quiere conseguir 20
JAIME RAMIRO ALIAGA TOVAR informacin. 1. Las etapas del proceso de investigacin en las cuales la participacin de la estadstica es mnima o no se da, son las siguientes: . 2. En un fenmeno determinsticoocurrir.
C. En relacin al texto, elabore enunciados verdaderos en los que se incluyan los siguientes tres trminos: 1. Psicologa estadstica investigacin Enunciado: 2. Estadstica inferencial clculo de probabilidades - prueba de hiptesis Enunciado: 3. Poblacin - muestra investigacin Enunciado: 4. Experimento aleatorio espacio muestral - suceso muestral aleatorio Enunciado:
D. Argumente su respuesta a la siguiente pregunta: Por qu es importante la estadstica para la investigacin? Respuesta: ................................ :
21
JAIME RAMIRO ALIAGA TOVAR a) La edad en aos b) El nmero de ventanas en el domicilio c) El color de un automvil de ltimo modelo d) La fecha de hoy e) Las notas de los exmenes 6. Qu campo de la estadstica puede brindar la informacin de cul ser el precio del euro el da de maana? 7. En el siguiente enunciado identifique: poblacin, muestra, unidad estadstica, variable(s), tipo(s); adems defina los parmetros y valores estadsticos correspondientes. El departamento de Psicologa Organizacional de una empresa dedicada a la venta de test psicolgicos ha realizado un estudio con la finalidad de obtener algunos indicadores que permitan realizar una mejor planificacin de las actividades de la empresa para el ao siguiente. El estudio se realizo en una muestra de seis de sus quioscos de venta ubicadas en igual nmero de facultades de psicologa en Lima Metropolitana, consiguindose los resultados siguientes: - El 30% de los test proporcionados por la Casa Matriz ubicada en Madrid bimestralmente son vendidos en ese perodo. - La utilidad neta promedio por test vendido es de 30% del costo. - El 75% de los test vendidos son Test de Personalidad. a) Cul es la poblacin? b) Cul es la muestra? c) Cul es la unidad estadstica? d) Cules son las variables? e) Son las variables cuantitativas continuas o cuantitativas discretas? f) Cules son los parmetros?
Referencias bibliogrficas
Amn, J. (1987). Estadstica para psiclogos. Madrid: Pirmide Amn, J. (2001). Estadstica para psiclogos II. Madrid: Pirmide. Gmez, D., Condado, J., Adriazola, Y., Solano, O. (2005). Introduccin a la inferencia estadstica. Soporte del SPSS y MATLAB. Lima: Unidad de Posgrado, Facultad de Educacin UNMSM. Hernndez, R., Fernndez, C. y Baptista, P. (2006). Metodologa de la investigacin. Mxico: Mc.Graw Hill Kerlinger, F. y Lee, H. (2002). Investigacin del comportamiento en ciencias sociales. Mxico:McGrawHill. Nolberto, V. y Ponce, M. (2008). Estadstica Inferencial Aplicada. Lima: Unidad de Posgrado, Facultad de Educacin UNMSM. Selltiz, C., Jahoda, M., Deutsch, M. y Cook, S. W. (1976). Mtodos de investigacin en las relaciones sociales (8a. ed.). Madrid: Rialp. Sierra Bravo, R. (1991). Diccionario prctico de estadstica. Madrid: Paraninfo.
23
Una variable es un atributo, propiedad o cualidad de un individuo o grupo de individuos que puede presentarse con matices o modalidades diferentes, en grados, magnitudes o medidas distintas a lo largo de un continuo (Buenda, Cols, Hernndez, 1998:21). En trminos estadsticos, es una caracterstica de los individuos o unidades estadsticas que presentan diferentes valores o modalidades de respuestas, por ejemplo el nmero de horas que se ve la televisin, el nmero de hermanos o el grado de utilizacin de las estrategias de aprendizaje en la vida escolar. Su importancia es fundamental en la investigacin cientfica en vista que esta trata de descubrir la existencia de variables y su magnitud y probar la relacin que las unen entre s, aunque en sentido estricto la relacin se da entre modalidades o categoras de las variables (Babbie, 2000). Por otro lado, una constante es una caracterstica que siempre tiene un mismo valor. Por ejemplo, en un estudio que solamente se realiza en mujeres, la variable sexo se comporta como una constante. Al momento de realizar el anlisis estadstico de los datos referidos a la observacin de las variables de estudio, es conveniente preguntarse de cuntas variables se trata, como se presentan estas variables y en que escala de medicin estn medidas. Ocupndonos de las escalas de medicin de variables, el estudio del comportamiento humano en sus variadas manifestaciones requiere previamente de su medicin, pero el proceso de medicin ser distinto segn sea la diferente naturaleza de las variables involucradas en el hecho psicolgico o social, lo que significa que cada una de ellas deba ser medida de acuerdo con sus propias caractersticas. En este sentido, el proceso de medicin que es comn en todas las ciencias fcticas, obedece a un conjunto de reglas y normas para la conversin de modalidades o respuestas de las variables en nmeros que permiten su anlisis, de manera tal que se legitime el paso de la apreciacin de una caracterstica, por ejemplo, rasgos de personalidad, el grado de atencin de un 24
JAIME RAMIRO ALIAGA TOVAR escolar en clase, la actitud hacia las problemas sociales, el tiempo de vida de una persona, a un valor mtrico, que permite estudiar en forma cientfica dicha conducta humana o caracterstica.(Carro, 1997).
2.1.1 La medida.
2.2.3
Los niveles o escalas de medicin se originan en el hecho de que los nmeros que se asignan a las cantidades de las propiedades de los objetos o personas reflejan o todas o algunas de las caractersticas del sistema numrico.
25
JAIME RAMIRO ALIAGA TOVAR Se distinguen cuatro niveles o escalas de medicin, formulados en 1951 por S.S. Stevens, que difieren en la cantidad de informacin llevada por los nmeros que representan las magnitudes de las propiedades medidas, desde una informacin pobre a otra ms til. En este sentido, estos niveles o escalas son jerrquicos. Del orden inferior al superior, de lo ms simple a lo ms complejo, las escalas son: nominal, ordinal, de intervalo y de razn (proporcin o cociente). Cada una de estas escalas o niveles tiene su teora de la medicin (Siegel y Castellan, 1995), pues tienen ciertas propiedades formales que se refieren a las relaciones entre los objetos o variables a los que se les ha asignado nmeros y a las operaciones que se pueden realizar con dichos nmeros. En consecuencia, el anlisis estadstico de los resultados de la medicin de las variables en cada una de ellas, tiene sus reglas y restricciones propias, y sus procedimientos estadsticos apropiados.
Por ejemplo, la variable sexo tiene dos modalidades o categoras varn y mujer. Cualquier individuo puede ser clasificado como varn o mujer (exhaustividad) y slo pertenecer a una de esas dos categoras (exclusividad). Si le asignamos, el nmero 1 a varn y el 2 a mujer, el 1 representa a todos los varones y el 2 a todas las mujeres (equivalencia). Por otro lado, la escala nominal es invariante a cualquier transformacin numrica de sus modalidades o categoras. En la variable sexo, para hacer el escalamiento le asignamos un nmero (o letra) a cada una de sus categoras varn = 1, mujer = 2, contndose luego cuntos 1 y 2 hay. Se puede transformar este escalamiento en otro nuevo cambindose simplemente los nmeros asignados, por ejemplo varn = 4, mujer = 6.
2.2.3.2
Se tiene esta escala cuando los nmeros asignados slo indican un orden o rango entre los objetos. Podemos colocar a los individuos en una serie cuyo rango va del ms bajo al ms alto (o viceversa) segn las caractersticas que intentamos medir, pero no podemos decir cunta es la diferencia entre un par cualquiera de individuos. La nica caracterstica de los nmeros reales que cumple esta escala es el Orden. Esta escala no slo diferencia a los individuos nombrndolos o etiquetndolos sino que nos dice que un individuo tiene ms, o menos, de una cualidad determinada, pues adems de poseer las propiedades de equivalencia aplicable a los miembros de una misma clase, los objetos y sujetos pueden ser clasificados en funcin de su igualdad o desigualdad y su orden en el atributo, a travs de la expresin mayor que (>) menor que (<). Esta relacin se expresa, segn los casos, con trminos como ms de acuerdo, ms preferido, ms estable, etc. De acuerdo con lo anterior, la medicin en escala ordinal implica que: a) una serie de objetos estn ordenados de mayor a menor con respecto a un atributo; b) no sabemos cunto del atributo posee cada uno de los objetos en un sentido absoluto; y, c) no sabemos qu tan lejos estn los objetos con respecto al atributo. (Nunally y Bernstein, 1995). En otras palabras, en esta escala podemos decir la diferencia entre los individuos nombrndolos o etiquetndolos y tambin que individuo tiene ms, o menos, de una cualidad determinada, pero no podemos decir cunta es la diferencia entre un par cualquiera de individuos. Un ejemplo de medicin en esta escala es la variable nivel socioeconmico con las categoras Muy alto, Alto, Medio, Bajo, Muy bajo, a las que se asigna los nmeros 5,4,3,2 y 1. Estos nmeros son ordinales (primero, segundo, tercero, etc.) y son asignados atendiendo a la equivalencia o no equivalencia entre los 27
Escala Ordinal.
JAIME RAMIRO ALIAGA TOVAR individuos, y las distintas categoras son ordenadas de acuerdo al smbolo mas que.. ( >) o menos que (<). Otros ejemplos son: la Escala de dureza de minerales de Mohs, el orden de picoteo de las gallinas, los grados escolares, las escalas estticas, las escalas psicofsicas, las escalas de inteligencia expresadas en puntajes directos o brutos. El punto 0 existente, por ejemplo el no acertar ninguna pregunta de un test de razonamiento numrico, corresponde al test o instrumento utilizado pero no al constructo razonamiento numrico. En la medicin psicolgica y educativa, un ejemplo de unidad de medicin en escala ordinal es la escala percentil o puntuaciones percentiles. Las propiedades formales de esta escala son la equivalencia (=), no equivalencia () y la de relacin de orden ms que.. (>) y menor que (<) Este ltimo operador tiene las propiedades de ser irreflexiva (no es verdad que para ninguna x tal que se cumpla que x >x), asimtrica si hay un tal x > y, entonces en ningn caso y puede ser mayor que x; transitiva, si x > y, y a su vez y > z, entonces x > z. (Carro, 1997:23). La escala ordinal es invariante frente a cualquier transformacin en la que se mantenga el orden entre los elementos de las modalidades o categoras. Por ejemplo, en el escalamiento de la variable nivel socioeconmico Muy alto = 5, Alto, 4, Medio= 3, Bajo = 2 y Muy bajo = 1, sus propiedades y caractersticas permanecern inalteradas si le sumamos el valor 2 a cada uno de los nmeros asignados: Muy alto= 7, Alto= 6, Medio =5, Bajo= 4 y Muy bajo= 3. Esta transformacin no implica prdida de informacin. 2.2.3.3 Escala de Intervalos. La medida en esta escala cumple con dos de las caractersticas de los nmeros reales: el orden y las distancias iguales pero no con la del punto cero. Esta escala define: a) una unidad de medida constante, es decir en cualquier lugar del continuo de valores la unidad es la misma, unidad que, por otro lado, es arbitraria como lo es el punto cero de la escala por lo que no indica la ausencia del atributo que se esta midiendo ; y, b) tambin define el ordenamiento mayor que.. (>), Igual que( =) y menor que (<). Todo en relacin a que: a) se conoce el ordenamiento jerrquico de objetos en un atributo; b) tambin se conocen las distancias entre objetos en el atributo, pero c) se desconocen las magnitudes absolutas del atributo. (Nunally y Bernstein, 1995). En consecuencia, lo que distingue la medida de intervalo de la medida ordinal es que nos permite determinar cun lejos se encuentran dos personas o dos cosas. En este sentido es una escala verdaderamente cuantitativa ya que nos da la magnitud de una diferencia. Por ejemplo si medimos la temperatura de tres das con la escala centigrada: 20 el lunes, 22 el ma rtes y 26 el mircoles, C C C
28
JAIME RAMIRO ALIAGA TOVAR podemos decir la magnitud o proporcin de las diferencias entre las temperaturas no siendo necesario para ello que conozcamos el punto cero de la temperatura. Ejemplos de variables en escala de intervalo es la temperatura medida por las escalas Centgrada y Fahrenheit y las unidades de medicin o puntajes estandarizados de los tests, entre otros, el CI, el eneatipo, el decatipo y el puntaje T. Sus propiedades formales son la relacin de equivalencia (=), orden (>) y de proporcin conocida entre diferencias. Es esta ltima propiedad la que hace a la escala de intervalos una escala verdaderamente cuantitativa, por lo que se pueden utilizar legtimamente las operaciones bsicas de suma, resta, multiplicacin y divisin. Por otro lado, en lo referente a trasformaciones admisibles, esta escala permanece invariante frente a cualquier transformacin lineal: y = a + bx, es decir se pueden elaborar una escala con las mismas propiedades de escalamiento equivalencia si se transforma linealmente la escala original. En la ecuacin, a y b son constantes arbitrarias, donde a es el valor de la nueva variable equivalente al cero de la original y b el nmero de unidades que aumenta o disminuye la nueva variable por cada unidad de medida de aumento o disminucin de la variable original; en tanto que x representa a los valores de la variable original e y significa los valores resultantes de la transformacin lineal. (Carro, 1997). Es mediante una transformacin de este tipo que las unidades de medicin o puntajes estandarizados pueden ser transformados en sus equivalentes, as, el CI puede ser transformado en un puntaje eneatipo, decatipo, puntaje T o viciversa. Estos puntajes tienen las siguientes medias aritmticas y desviaciones estndares: CI = X = 100, S = 15 ; eneatipo X = 5, S = 2, decatipo = X = 5.5, S = 2, T = X = 50, S = 10. Supongamos que queremos transformar el CI = 98 de un nio a los puntajes estndar eneatipo, decatipo y T. Las operaciones responden a la siguiente frmula:
Obsrvese que la expresin entre parntesis equivale al puntaje estndar z pues las unidades o puntuaciones estndar expresan la distancia del individuo a la 29
JAIME RAMIRO ALIAGA TOVAR media aritmtica en funcin de la desviacin estndar o tpica de la distribucin de puntajes originales de la variable, test o prueba. En esta frmula: X = puntaje del individuo en la unidad o puntaje estndar que se va a transformar, X = media aritmtica de la unidad o puntaje estndar que se va a transformar; S= desviacin estndar de la unidad o puntaje estndar que va a ser transformada; S= desviacin estndar de la unidad o puntaje estndar a la que se quiere realizar la transformacin; X , media aritmtica de la unidad o puntaje estndar a la que se va a efectuar la transformacin. En consecuencia, el CI = 98, es equivalente al eneatipo 4.73 o 5, el decatipo 5,23 o 5, y el puntaje T 48,67 o 49. Para lograr la medicin de variables psicolgicas en una escala de intervalo se recurre a: a) la suposicin de una distribucin normal de las puntuaciones de los individuos de la poblacin y, b) el uso de la variacin o variabilidad entre los individuos como una unidad de medida (Magnusson, 1987).
JAIME RAMIRO ALIAGA TOVAR cierto tipo de problemas matemticos por el slo hecho de no haber podido contestar ninguno de los tems de un test que contiene este tipo de problemas.
2.3 Clasificacin de las variables segn el nivel o escala de medicin en las que han sido medidas.
El cuadro 3 resume las caractersticas bsicas de la relacin escala de medicin, tipo de variable. Cuadro 3. Relacin del nivel de medicin y el tipo de variable Escala/Nivel de medicin Nominal. El investigador conforma en la variable que estudia categoras excluyentes que no admiten orden entre ellas. Tipo de variable Cualitativa (si la propiedad se describe en forma cualitativa, no medible, pero si clasificable se denomina atributo). Ejemplos:Tipo de personalidad: extroverso, introverso); pas de nacimiento: Per, Rusia, Francia, Paraguay, etc; profesin: trabajador social, historiador, mdico, etc. Cualitativa o cuasicuantitativa. Ejemplo: nivel de inteligencia: Muy alto, alto, medio o normal, bajo muy bajo. Cuantitativa. Continuas (admiten en su rango de variacin nmeros decimales). Ejemplo: Puntuaciones escolares en escala vigesimal, talla, peso, ingresos econmicos. Discontinuas o discretas (slo admiten en su rango de variacin nmeros enteres o, mejor dicho, que varan de uno en uno). Ejemplos: nmero de hijos, nmero de camas en un hospital, nmero de cursos por alumno, nmero de ingresos a un hospital,
Ordinal. El investigador conforma en la variable que estudia categoras excluyentes, pero que admiten orden entre ellas. Intervalo. El investigador conforma en la variable categoras infinitas (No tiene punto 0 real). Razn. El investigador conforma en la variable categoras infinitas (Tienen un punto 0 real)
31
JAIME RAMIRO ALIAGA TOVAR alcohol, en gramos por semana es la de mejor calidad pues en comparacin a las otras contiene el mximo de informacin (Domenech, 1981). Por ltimo, en el siguiente variable: cuadro sintetizamos con un ejemplo los tipos de
ORDINAL
JUICIO DEL PACIENTE
CUANTITATIVA DISCRETA
NUMEROS DE ATAQUES EL LTIMO DA
CUANTITATIVA CONTINUA
FRECUENCIA CARDIACA DISTANCIA CAMINADA EN METROS
1 2 3 . . . .38
V H V . . . V
C A B . . . B
1 2 3 . . . 2
72 82 84 . . . 74
33
EJERCICIOS DE AUTOCOMPROBACIN II
Responda si las siguientes afirmaciones son verdaderas o falsas. AFIRMACIONES V 1. El tiempo que necesita para resolver este cuestionario es un ejemplo de variable cuantitativa discreta. 2. Los niveles o escalas de medicin tienen que ver con el hecho que los nmeros asignados a las cantidades de los atributos reflejan todas o algunas caractersticas de los nmeros reales. 3. La escala ordinal no nos dice nada acerca del tamao o tipo de diferencia existente entre los objetos 4. Para medir una propiedad o atributo debe existir una relacin isomrfica entre la cantidad del atributo y el nmero. 5. La escala de intervalos es la nica que cumple con las tres caractersticas de los nmeros reales. 6. Las variables cualitativas son aquellas que brindan mayor informacin en una investigacin. 7. En la escala nominal y ordinal, la nica relacin que hay es la de equivalencia 8. Los resultados de una prueba de la escala de inteligencia de Wechsler son ejemplo de variables continuas 9. Una variable categrica puede ser transformada en una cuantitativa en cualquier situacin. 10. Una variable puede ser cuantitativa y cualitativa al mismo tiempo Complete cada enunciado: F
ENUNCIADO 1. Una variable es un/una . de los individuos o unidades estadsticas. 2. Medir equivale a .. .. 3. Los niveles o escalas de medicin son: ..., ..., .. y . 4. La escala es utilizada cuando los datos observados se clasifican en diversas categoras en las que no se identifica ningn orden. 5. En la escala .. existe un cero absoluto, mientras que en la escala .. existe un cero relativo. 6. La es utilizada cuando los datos observados se clasifican en distintas categoras en las que se establece algn .. 7. Las variables ... pueden ser expresadas en escalas nominales o .. 34
JAIME RAMIRO ALIAGA TOVAR 8. Las variables .. pueden ser expresadas en escalas de intervalo o ..
En relacin al texto, elabore enunciados verdaderos en los que se incluyan los siguientes tres trminos: 1. Variable caracterstica valor Enunciado: 2. Medida asignar atributos Enunciado: 3. Origen orden distancia Enunciado: 4. Escala diferencias significativas cero absoluto Enunciado: 5. Investigador categoras excluyentes - orden Enunciado:
D. Argumente su respuesta a la siguiente pregunta: Por qu cree Ud. que en psicologa no se puede construir medidas en escala de razn? Respuesta:.. .......................................... :
35
2) En un estudio se quiere determinar el porcentaje de personas favorables a la devolucin de los pagos del FONABI, agrupados por edad. Quin es la unidad experimental?, cules son las variables? Respuestas a la seccin A: 1) F; 2) F; 3) V; 4) V; 5) F; 6) F; 7) V; 8) V; 9) F; 10) F
Referencias bibliogrficas
Babbie, E. (2000). Fundamentos de la investigacin social. Mxico: Thomson. Buenda, l., Colas, P., Hernndez, F. (1998): Mtodos de investigacin en Psicopedagoga. Madrid: McGraw-Hill. Briones, G. (1986). Mtodos y tcnicas de investigacin en las ciencias sociales. Trillas: Mxico. Carro, J. (1994). Psicoestadstica descriptiva. Salamanca: Amaru. Cortada, N. (1968). Manual para la construccin de tests objetivos de rendimiento. Buenos Aires: Paids Domenech, J. (1981). Una sntesis de los mtodos estadsticos en medicina. Barcelona: Herder. Magnusson, D. (1987). Teora de los tests. Mxico: Trillas. Nunally, J. y Bernstein, I. (1995). Teora psicomtrica. Mxico: McGrawHill. Siegel, S., Castelln, N.J. (1995). Estadstica no paramtrica aplicada a las Ciencias de la conducta. Mxico: Trillas.
36
Como ya sabemos, la operacin permisible en este tipo de escala es el conteo de las oportunidades que aparece cada una de las modalidades o categoras de la variable. Al conteo as realizado se le denomina frecuencia absoluta (f). Por otro lado, la frecuencia relativa o proporcin (fr) es la razn entre la frecuencia absoluta y el nmero de individuos de la muestra que se denota por la letra n. (fr = f/n). El porcentaje (P) es el tanto por cien correspondiente a cada una de las modalidades de la variable. En su obtencin, se divide la frecuencia absoluta (f) entre el nmero de individuos (n) y el resultado se multiplica por 100. (P = (f/n) 100). En la tabla 1 se muestra la distribucin de frecuencias donde se indican las frecuencias absolutas, frecuencias relativas y porcentajes de cada una de las modalidades o categoras de la variable sexo en una investigacin realizada en 1564 sujetos.
37
Se observa que la suma de las frecuencias absolutas es igual al nmero de elementos, y la suma de las frecuencias relativa, igual a la unidad.
Los datos cualitativos se representan usualmente de una manera grfica empleando los diagramas de barras y los grficos de sectores. Las figuras 1 muestra el diagrama de barras de la variable estado civil; las figuras 2 y 3 presentan el diagrama de barras y el grfico de sectores (torta) de la variable sexo.
38
En la elaboracin manual de un grfico de sectores basta multiplicar frecuencias relativas (fr) por 360 y traspasar esas medidas al crculo
las
39
3.2 Estadsticos y representaciones grficas de datos cuasicuantitativos. 3.2.1 Estadsticos. Los datos cuasicuantitativos se producen cuando
la medida se ha hecho en una escala ordinal o de rango, por lo que adquieren algunas de las propiedades de los datos generados por las escalas cuantitativas (Carro, 1994). De manera semejante a la organizacin de los datos cualitativos, los datos cuasicuantitativos tambin se organizan en una distribucin de frecuencias de acuerdo con su pertenencia o no a cada una de las categoras o modalidades de la variable, pero, adems, estas se ordenan de acuerdo con la mayor o menor posesin del atributo evaluado. Aparte de los estadsticos para datos nominales, pueden utilizarse las frecuencias absolutas acumuladas (fa) , las frecuencias o proporciones relativas acumuladas (fra) y los porcentajes acumulados.(Pa). Estos estadsticos indican el nmero de casos que hay en cierta categora o modalidad o categora de la variable y las anteriores o inferiores, en el caso de las frecuencias, o el porcentaje de casos en una categora o modalidad, en el caso de los porcentajes. . En la tabla 2 se muestran adems de las frecuencias absolutas, frecuencias relativas y porcentajes, las frecuencias absolutas acumuladas (fa), las frecuencias absolutas relativas acumuladas (fr a) y los porcentajes acumulados (Pa) correspondientes a cada una de las modalidades o categoras de la variable sexo en el estudio efectuado en una muestra de 1564 individuos.
Tabla 2. Sexo Frecuencia absoluta acumulada 805 1564 Frecuencia relativa acumulada 0,515 1,00 Porcentaje acumulado 51,5 100,00
40
3.2.2
Adems de las grficas para datos cualitativos, pueden emplearse los histogramas acumulados para frecuencias, proporciones o porcentajes.
Representaciones grficas.
Estadsticos.
JAIME RAMIRO ALIAGA TOVAR Estas distribuciones se agrupan en dos tipos: a) de datos no agrupados, (intervalo con amplitud igual a 1); y, b) de datos agrupados (intervalo con amplitud mayor a 1).
Es conveniente tener presente, que los intervalos, modalidades o categoras de la variable X son de amplitud 1 y conforman una variable cuantitativa continua atendiendo a sus lmites matemticos inferior y superior. Por ejemplo, el intervalo X = 25 empieza en 24,5 y finaliza en 25,5, el intervalo X = 26 comienza en 25,5 y finaliza en 26,5.
JAIME RAMIRO ALIAGA TOVAR Tabla 4. Puntuaciones de un test de inteligencia 185 187 164 165 168 176 182 180 190 178 174 168 160* 181 172 161 182 183 185 185 174 176 179 191** 176 180 181 183 179 174 173 168 172 161 172 177 175 161 176 178 166 172 176 178 184 188 173 184 166 163 175 171 174 170 168 165 163 160 176 182 191 172 169 172 167 172 175 178 176 170 171 189 177 184 168 174 169 171 179 182 187 173 164 185 164 179 171 172 170 168 164 161 167 163 168 176 171 188 171 172 180 167 162 168 170 171 170 187
4 intervalos 5 intervalos 6 intervalos 7 intervalos 8 intervalos 9 intervalos Dividir el nmero por 10 15.
2) Preparacin de un cuadro de distribuciones. Para la elaboracin de dicho cuadro se efectan los siguientes pasos: a) Valores extremos de la distribucin. Se busca por inspeccin los valores extremos de la variable y se subrayan estos valores. En el ejemplo, el extremo superior = 191 (**); y, el extremo inferior = 160 (*). b) Determinacin del rango o amplitud total. Para el efecto se resta del extremo superior el extremo inferior, logrndose la amplitud total, rango o recorrido de una distribucin: Amplitud total: 191 160 = 31
c) Determinacin del valor o amplitud de intervalo (i). Los intervalos deben tener la misma amplitud en todas las clases de la distribucin. Para obtenerlo, procedemos a dividir el rango entre el nmero de clases ms apropiada para el nmero de datos obtenido. En nuestro caso al ser el nmero de datos 108, dividiremos el rango entre 10 15. Al dividir la amplitud total entre 10 = 3.1; al dividir la misma amplitud entre 15 = 2.06 . Cul amplitud de intervalo escoger? El intervalo con un nmero impar de unidades es preferible al de nmero par porque su punto medio es un nmero entero y no una fraccin, sin embargo, no hay ninguna regla que determine rgidamente la amplitud o el valor del intervalo. d) (1) X Intervalos 190-192 187-189 184-186 181-183 178-180 175-177 172-174 169-171 166-168 163-165 160-162 N = 108 Tabla 5. Distribucin de frecuencias. (2) Xm Punto medio 191 188 185 182 179 176 173 170 167 164 161 (3) Recuento /// ///// / ///// // ///// //// ///// ///// ///// ///// /// ///// ///// ///// // ///// ///// //// ///// ///// /// ///// //// ///// // (4) f Frecuencia 3 6 7 9 10 13 17 14 13 9 7
Explicacin de la tabla 5.
44
JAIME RAMIRO ALIAGA TOVAR Columna (1) X.- Ordenacin de los intervalos. Para determinar los extremos del intervalo inferior se toma la puntuacin inferior y se le suma el valor del intervalo disminuido en 1. En el ejemplo, el extremo inferior del intervalo: 160 + (3 1) = 160 + 2 = 162 .Este intervalo comprende las puntuaciones 160, 161 y 162. En consecuencia, el extremo inferior del intervalo = 160; y el extremo superior del intervalo = 162. La formacin de los siguientes intervalos no ofrece ninguna dificultad si se suma al extremo inferior la amplitud del mismo; 160 + 3 = 163, que se constituye en el extremo inferior del siguiente intervalo. As llegamos hasta el ltimo intervalo que contiene la mxima puntuacin de la serie. (En el ejemplo = 191). Los intervalos se colocan en orden descendente ascendente comenzando por abajo y en nuestro ejemplo son: 160 162, 163 165, . . . . . . . . . . . . . . . . . . . . . . . . . . . . , 190 192. Columna (2) Xm.- Punto medio de los intervalos. Para calcular el punto medio de un intervalo cualquiera se calcula la media entre los extremos inferior y superior. En nuestro ejemplo, para el intervalo 178 180: (178 + 180) = 179 2 La columna (2) es el reflejo los puntos medios de cada intervalo. Columna (3) F. Recuento de frecuencias. El recuento se registra mediante palotes y frecuencias (f). Cada dato debe colocarse en el intervalo en el que est incluido. Se representa por un trazo vertical (palote). Hecho el recuento de trazos su valor se coloca debajo de la columna (f) que nos da el nmero de datos que est contenido en cada intervalo o la que es lo mismo el valor de la frecuencia de cada intervalo. La suma de todas las frecuencias debe ser igual al nmero de N (nmero de datos). En nuestro ejemplo N = 108. Al construir una distribucin de frecuencias por intervalos, hay que tener en cuenta, adems de los pasos anteriores, lo siguiente: a) Se debe mantener constante la amplitud del intervalo (en nuestro ejemplo: i = 3); b) los lmites de cada intervalo no son los extremos considerados, por ejemplo, 160 - 162, en el primer intervalo, pues los los lmites matemticamente no son nmeros enteros ya que no formaran una escala continua. Por eso se consideran como lmites inferior y superior de cada intervalo a los extremos aumentados en 0.5. un ejemplo: En el intervalo 160 - 162 se han considerado dichos valores como extremos pero si se quieren expresar los lmites, habra que escribir 159.5-162.5, con lo que quedaran los lmites de la siguiente forma: 169-171 (168.5-171.5); 166-168 45 Xm =
JAIME RAMIRO ALIAGA TOVAR (165.5-168.5); 163 - 165 (162.5 165.5); 160 162 (159.5-162-5). Con este artificio se consigue que una escala de intervalos sea continua porque el lmite superior coincide con el inferior del intervalo siguiente. Esto habr que tenerlo en cuenta cuando se hagan representaciones grficas.(Escotet,1985).
En el empleo de grficas para datos cuantitativos, las ms usuales son el histograma y el polgono de frecuencias. El histograma de los datos del ejemplo es el que sigue: Figura 5. Distribucin de frecuencias
F
6
10 12 12
10
4
6 6 5
8 7 6 5
4 3 3 3
Inteligencia
46
JAIME RAMIRO ALIAGA TOVAR entre los extremos inferior y superior. 8. Al construir una distribucin de frecuencias, .. se debe mantener constante.
En relacin al texto, elabore enunciados verdaderos en los que se incluyan los siguientes tres trminos: 1. Datos cualitativos grficos barras Enunciado: 2. Tabla frecuencias porcentajes Enunciado: 3. Datos cualitativos grficos histogramas Enunciado: 4. Rango extremo superior extremo inferior Enunciado: 5. Amplitud rango nmero de clases Enunciado:
D. Argumente su respuesta a la siguiente pregunta: Por qu cree Ud. que son necesarias las representaciones grficas? Respuesta:.. .......................................... :
48
Referencias bibliogrficas
Carro, J. (1994). Psicoestadstica descriptiva. Salamanca: Amaru. Clark-Carter, D. (2002). Investigacin cuantitativa en Psicologa. Mxico: Oxford. Escotet, M. A. (1985). Estadstica Psicoeducativa. Mxico. Trillas.
49
Segunda
UNIDAD
Estadsticos descriptivos, Distribucin normal, Muestreo, Prueba de hiptesis
50
Es aplicable solamente a datos cuantitativos. La media aritmtica de n nmeros es el cociente de dividir entre n la suma de esos nmeros.
51
Aplicando la frmula:
4.1.1.
Es el elemento que ocupa el lugar central en una serie de puntuaciones estadstica. Tambin se le define como el valor correspondiente al percentil 50, Vale decir, es aquella puntuacin por encima de la cual se encuentra la mitad de las puntuaciones y por debajo, la otra mitad.
Mediana.
En el proceso de su clculo se encuentran dos casos: mediana de datos no agrupados y mediana de datos agrupados. 52
El valor de la mediana es 11 pues es el puntaje que se encuentra en el centro de la serie. 2) Cuando N es par. El valor de la mediana es la semisuma de los dos puntajes centrales de la serie de nmeros: 11.5 11 12
10
13
14
La mediana es 11.5, que es el resultado de sumar 11 + 12 y dividir entre 2. Una frmula para hallar la Md de datos no agrupados es:
1 = lmite inferior / exacto de la fm clase modal N = total de frecuencias fa = frecuencia acumulada del Intervalo que precede al de la clase modal fm = frecuencia modal i = intervalo (amplitud) Siguiendo con el ejemplo de la distribucin, la mediana es:
53
JAIME RAMIRO ALIAGA TOVAR Los pasos seguir para calcular la Md en una distribucin de frecuencias son: 1) Hallar N/2, o sea la mitad de los casos de la distribucin 2) Empezar en el extremo de puntajes bajos de la distribucin y sumar los puntajes por orden hasta el lmite inferior exacto (1) del intervalo que contiene la mediana. La suma de esos puntajes es fa. 3) Calcular la cantidad de puntajes necesarios para llenar N/2, o sea calcular N/2 - Fa. Dividir esa cantidad por la frecuencia correspondiente al intervalo que contiene la mediana (fm) y multiplicar el resultado por la magnitud del intervalo de clase (i). 4) Sumar la cantidad contenida por el clculo de (3) el lmite inferior exacto (1) del intervalo que contiene la Md. Este procedimiento dar la mediana de la distribucin (Garret, 1974).
Es el punto medio del intervalo de clase que tenga ms frecuencias. As en nuestro ejemplo. el intervalo o clase modal es 20 - 24 y el modo directo es 22.
54
4.1.1.4 Cuando aplicar las distintas medidas de tendencia central 1. Usar la media aritmtica.
a) b) Cuando los puntajes estn distribuidos simtricamente siguiendo forma de campana de Gauss o distribucin normal). La media es el centro Cuando se desea la medida de tendencia central que tenga la mayor estabilidad. La media es ms estable que Md o Mo. Cuando haya que calcular ms tarde, otros estadsticos como la desviacin estndar o el coeficiente de correlacin. Muchos estadsticos estn basados en la media.
c)
2. Usar la mediana.
a) Cuando se desea el punto medio exacto de la distribucin, el punto correspondiente al 50 %. b) Cuando existen puntajes extremos que afectaran marcadamente la media. Los puntajes extremos no afectan la mediana ( como s afectan a la media).
3. Usar el modo.
a) Cuando todo lo que se desea es una medida de tendencia central rpida y aproximada. b) Cuando la medida de tendencia central fuese el valor ms tpico.
55
56
Procedimiento: a) Calcular la media aritmtica de la distribucin. b) Calcular las desviaciones de cada puntaje con respecto a esa media aritmtica. c) Elevar tales desviaciones al cuadrado. d) Sumar las desviaciones al cuadrado. e) Dividir esa suma entre el nmero de casos (N) f) Extraer la raz cuadrada de ese cociente. Ejemplo: Calcular la desviacin estndar (S) de los calificativos que un alumno recibi en el curso de Tcnicas bivariadas de anlisis: 10, 10, 8, 10, 10, 12, 10, 10
57
JAIME RAMIRO ALIAGA TOVAR Tabla 7 X 10 10 8 10 10 12 10 10 x = 80 (X - ) (10 -10) = 0 (10 10) = 0 (8-10) = -2 (10-10)=0 (10-10)=0 (12-10)=2 (10-10)= 0 (10-10) = 0 (X - )2 0 0 4 0 0 4 0 0 (X - )2 = 8
estndar
para
datos
58
Ejemplo: calcular la desviacin estndar de la siguiente distribucin de puntajes: Tabla 8 (1) X 50-54 45-49 40-44 35-39 30-34 25-29 20-24 15-19 10-14 5-9 0-4 i=5 (2) (3) pm f 52 1 47 3 42 6 37 18 32 19 27 24 22 12 17 9 12 5 7 2 2 1 N = 100 (4) (5) f.pm X 52 23.40 141 18.40 252 13.40 666 8.40 608 3.40 648 -1.60 264 -6.60 153 -11.6 60 -16.6 14 -21.6 2 -26.6 = f.pm 2860 (6) x2 547.56 338.56 179.56 70.56 11.56 2.56 43.56 134.56 275.56 466.56 707.56 x2= 368 (7) f.x2 547.56 1015.68 1077.36 1270.08 219.64 61.44 522.72 1211.04 1377.8 933.12 707.56 f.x2 =8944
= 9,45
= 28,60
JAIME RAMIRO ALIAGA TOVAR c) Lo que interesa en primer lugar es la concentracin alrededor de la media (el 50 % central de los casos) Usar la desviacin estndar: a) Cuando se busca el estadstico de dispersin que tenga la mayor estabilidad. b) Cuando desviaciones extremas ejerceran un efecto proporcionalmente mayor sobre la variabilidad. c) Cuando posteriormente deben calcularse coeficientes de correlacin y otros estadsticos ms avanzados. (Escotet, 1985)
60
EJERCICIOS DE AUTOCOMPROBACIN IV
Responda si las siguientes afirmaciones son verdaderas o falsas. AFIRMACIONES V 1. Las medidas de tendencia central ms usadas son la media aritmtica, la mediana, y el modo. 2. La media aritmtica es solamente aplicable a datos cualitativos. 3. La mediana es reconocida tambin como el valor que corresponde al percentil 50. 4. La medida de variabilidad ms sencilla pero menos exacta es la desviacin semiintercuartilar. 5. Modo es la tendencia no dominante y que corresponde al valor de menor frecuencia. 6. Utilizamos la media aritmtica cuando los puntajes estn distribuidos asimtricamente siguiendo la forma de la campana de Gauss. 7. La amplitud total o rango es la medida de variabilidad ms sencilla pero a la vez menos exacta. 8. En la distribucin de puntuaciones hay tres cuartiles (Q1, Q2, Q3) que la dividen en cuatro partes. 9. Se utiliza el rango o amplitud total cuando la mediana es la medida de tendencia central. 10. La desviacin estndar se utiliza cuando las desviaciones extremas ejerceran un efecto proporcionalmente menor sobre la variabilidad. F
B. Complete cada enunciado: ENUNCIADO 1) .es el cociente de dividir entre n la suma de esos nmeros 2) Son las medidas de tendencia central ms utilizadas:. , ..,., 3) Es aquella puntuacin por encima de la cual se encuentra la mitad de las puntuaciones y por debajo la otra mitad.. 4) ..es la tendencia dominante y es el elemento al que corresponde mayor frecuencia. 5) Las medidas de variabilidad ms empleadas son las siguientes:
61
JAIME RAMIRO ALIAGA TOVAR C. En relacin al texto, elabore enunciados verdaderos en los que se incluyan los siguientes tres trminos: 1. Media mediana modo Enunciado: 2. Estable media - modo Enunciado: 3. Media datos cualitativos clculo Enunciado: 4. Datos cualitativos grficos histogramas Enunciado: 5. Amplitud rango nmero de clases Enunciado: D. Argumente su respuesta a la siguiente pregunta: En qu casos la mediana sera la mejor medida de tendencia central en comparacin con la media aritmtica? Respuesta:.. .......................................... :
62
Referencias bibliogrficas
Clark-Carter, D. (2002). Investigacin cuantitativa en Psicologa. Mxico: Oxford. Escotet, M. A. (1985). Estadstica Psicoeducativa. Mxico. Trillas. Garret, H. (1974). Estadstica en psicologa y educacin. Buenos Aires: Paids.
63
5.1.2 La distribucin normal estndar o reducida. La distribucin normal es un tipo particular de distribucin
continua de probabilidad. Engloba a todo un conjunto de distribuciones que tienen en comn una serie de caractersticas que las diferencian de las restantes distribuciones continuas de probabilidad. La distribucin ms importante es la distribucin normal estndar o reducida, cuyo carcter diferencial viene dado por el hecho de que su media es igual a cero y la desviacin tpica o estndar es igual a 1 por lo que esta distribucin se corresponde exactamente con la distribucin normal de las puntuaciones tpicas z (zeta), cuya frmula y uno de sus usos vimos en la leccin 2.
64
5.1.2.1 Propiedades. a) La curva normal es una distribucin de probabilidad, por tanto, el rea bajo la
curva es igual a la unidad y la probabilidad de que un valor est entre los puntos a y b es igual al rea bajo la curva normal comprendido entre los puntos a y b (ver figura 6). Figura 6
b) La curva es asinttica: se extiende indefinidamente en las dos direcciones del continuo de valores sin tocar nunca el eje de abscisas. c) El punto de mxima ordenada (mxima altura de la curva) ser siempre el valor de la media de la distribucin. En el caso de la distribucin normal estndard, la mxima altura est en el valor cero del eje X, que es la media de esta distribucin (ver figura 7 ).
65
c) La media, mediana y moda coinciden en un mismo punto. Para la distribucin normal estndar es el valor cero. d) La curva normal es simtrica alrededor de la ordenada levantada en el punto correspondiente a la media (La asimetra = 0). e) La normal es mesocrtica (tiene una altura adecuada). f) La desviacin tpica de la distribucin normal estndar es igual a la unidad (igual que su varianza). g) Entre tres desviaciones tpicas por debajo de la media y tres desviaciones tpicas por encima de la media (un total de seis desviaciones tpicas), se encuentra prcticamente todos los casos de la distribucin normal. h) Los puntos en que la curva normal se vuelve de cncava hacia arriba a cncava hacia abajo estn situados en los valores de 1z y +1z, es decir a una distancia de una desviacin tpica a ambos lados de la media (Garret, 1974; Welkowitz, Ewen y Cohen, 1981).
5.1.2.2 Algunos ejemplos de problemas que pueden resolverse utilizando las propiedades de la distribucin normal.
Para comprender ms rpidamente los procedimientos de solucin es necesario consultar la Tabla A de la Distribucin normal que se encuentra al finalizar el texto. Una prueba de razonamiento lgico fue administrada a 1000 estudiantes que cursan el 5to. ao de secundaria, transformndose las puntuaciones directas en 66
JAIME RAMIRO ALIAGA TOVAR una puntuacin estndar Z de media 100 y desviacin estndar 20. Utilizando como modelo a la distribucin normal podemos convertir cualquier puntuacin directa en esta prueba (X) en una puntuacin Z y referirla a la tabla de la distribucin normal.
Z=
X 100 20
a) Se desea saber qu porcentaje de los estudiantes puede esperarse que obtengan puntuaciones entre 100 y 135. Para hallar la solucin convertiremos 135 es puntuacin estndar z:
135 100 = +1,75 20
Z=
Segn la tabla de la distribucin normal el porcentaje de rea entre la media y una puntuacin z de +1,75 es igual a 45,99%. En consecuencia, puede esperarse que aproximadamente el 46% de la poblacin obtenga puntuaciones entre 100 y 135. Figura 8
67
JAIME RAMIRO ALIAGA TOVAR b) Es importante determinar qu porcentaje de la poblacin tendr puntuaciones entre 90 y 100? Figura 9
Observando la tabla de la distribucin normal se encuentra que a -0,50 le corresponde 19,15%. Por tanto, aproximadamente el 19% de la poblacin lograra puntuaciones entre 90 y 100. c) El Director de un colegio particular desea saber con exactitud el porcentaje de alumnos cuyas notas en el simulacro de admisin se encuentren entre 73.4 y 108.0. Este problema es muy probable que induzca a confusin, a menos que se utilice un diagrama:
68
Existen varias maneras de obtener los valores buscados. Por ejemplo, en este caso, seguiremos un procedimiento bastante claro. En primer lugar, es necesario obtener el porcentaje entre 73.4 y la media (100); en segundo lugar, obtener el porcentaje entre la media y 108, y, en tercer lugar, sumar los dos valores para obtener el rea deseada. Los valores z son:
73.4 100 = 1,33 20 108 100 = +0,40 20
Z=
Z=
La tabla A muestra que a 1,33 le corresponde 0.09176 del rea de la curva normal o, en porcentaje, 9,176 valor que restado de 0,5000 y multi8plicado por 100 arroja que el 40,82% del rea total cae entre la media y z = - 1,33; por otro lado, a +0,40 le corresponde el 0,65542 de rea bajo la curva normal, valor que restado de 0,5000 nos indica que el 15,54% se la poblacin se encuentra entre la media y z = + 0,40. As, el porcentaje esperado entre 73,4 y 108 es igual a 40,82% + 15,54% = 56,36% de la poblacin. Otra manera de lograr esta cantidad es restando de 0,65542 el valor 0,09176 = 56,36%.
d). Qu porcentaje de la poblacin puede esperarse que obtenga puntuaciones superiores a 145?
69
JAIME RAMIRO ALIAGA TOVAR El porcentaje que nos interesa es el que corresponde a una puntuacin directa superior a 145. La puntuacin z correspondiente a la puntuacin directa 145 es igual a (145-100) /20 =+2,25. A +2,25 le corresponde el 0,98778 del rea bajo la curva normal, que multiplicado por 100 = 98,778 o redondeando 99. Obsrvese que accidentalmente hemos encontrado que 145 es, aproximadamente, el percentil 99 puesto que le supera alrededor de 1% de la poblacin. , Figura 11
5.2 La distribucin normal y su correspondencia con los rangos percentilares y calificaciones estndar de los tests. Otros ejemplos de
utilizacin de las propiedades de la distribucin normal en psicologa son, entre otros, la determinacin de la cantidad de individuos necesarios para realizar un sondeo o encuesta (que veremos en unidad posterior), el establecimiento de la dificultad relativa de los reactivos y la interpretacin de los puntajes directos obtenidos en un tests. Al respecto de este ltimo uso, en la prctica profesional del psiclogo, la interpretacin de los puntajes directos alcanzados por un sujeto en un test, se realiza comparando tal puntaje con las normas proporcionadas por el grupo normativo; normas que se sintetizan en la tabla de normas o baremo y que se expresan en diversos tipos de unidades de medicin psicolgica o de puntaje convertido, por ejemplo: rango percentiles, puntajes estndares o tpicos como los CId, T, eneatipos, decatipos, etc., que al estar relacionados con las propiedades 70
JAIME RAMIRO ALIAGA TOVAR de la distribucin normal tienen un significado estadstico preciso. La siguiente figura grfica estas relaciones.
71
EJERCICIOS DE AUTOCOMPROBACIN V
Responda si las siguientes afirmaciones son verdaderas o falsas. AFIRMACIONES V 1. La mayor parte de fenmenos psicolgicos, educativos y biolgicos siguen a la ley normal o de Laplace Gauss. 2. La distribucin normal es una curva con forma de campana asimtrica y asinttica. 3. La curva normal no es una distribucin de probabilidad. 4. La curva normal es til para resolver diversos tipos de problemas como los relativos a distribuciones de puntajes. 5. Los eneatipos y decatipos al estar relacionados con las propiedades de la distribucin normal tienen un significado estadstico preciso. 6. En el caso de la distribucin normal estndar el punto central es el valor cero. 7. La curva normal no es mesocurtica. 8. Utilizando como modelo a la distribucin normal se puede convertir cualquier puntuacin directa en puntuacin Z. 9. La desviacin tpica de la distribucin normal estndar es igual a la unidad. 10. Un total de 3 desviaciones tpicas se encuentran en todas las casos de la distribucin normal. Complete cada enunciado: ENUNCIADO 1. Al referirnos a la ley normal nos estamos refiriendo a la ley de Laplace Gauss, definida tericamente apartir de la ley de . 2. La distribucin mas importante es la.. 3. La curva normal es..alrededor de la ordenada 4. Los diferentes tipos de puntajes convertidos son : .. .. . 5. Los puntajes convertidos o unidades de medicin tienen relacin con las propiedades de . F
En relacin al texto, elabore enunciados verdaderos en los que se incluyan los siguientes tres trminos: 1. Media - desviacin estndar - distribucin normal reducida 72
JAIME RAMIRO ALIAGA TOVAR Enunciado: 2. Puntaje z, media aritmtica desviacin estndar Enunciado: 3. Asinttica simtrica distribucin normal Enunciado: 4. 68% - media desviacin estndar Enunciado: 5. Media desviacin estndar 95% Enunciado: D. Argumente su respuesta a la siguiente pregunta: Cul es la importancia de la distribucin normal? Respuesta:.. .......................................... :
73
Referencias bibliogrficas
Domenech, J. (1981). Una sntesis de los mtodos estadsticos en medicina. Garret, H. (1974). Estadstica en psicologa y educacin. Buenos Aires: Paids. Wellkowitz, J., Ewen, R., Cohen, J. (1981). Estadstica aplicada a las Ciencias de la Educacin. Madrid: Santillana, Aula XXI.
74
Leccin VI Muestreo
En el proceso de una investigacin el investigador llega a la etapa en la que tiene que determinar la muestra de la cual va a obtener los datos para someter a contraste sus hiptesis, si ese fuera el caso. Quines van a ser los sujetos investigados? es la pregunta; la respuesta depende de los objetivos del estudio que son los que proporcionan el marco de referencia conformado por un conjunto de elementos que es necesario esclarecer para legitimar la extrapolacin de los resultados a los que se llegue en el estudio a una poblacin que sea de inters.
JAIME RAMIRO ALIAGA TOVAR refiere a la mayor o menor magnitud de la diferencia entre su valor y el valor real del parmetro de la poblacin, diferencia debida a errores muestrales y no muestrales o de observacin. Los errores muestrales son de sesgo y aleatorios. Los de sesgo, denominados de parcialidad, se producen porque la muestra elegida no representa bien a la poblacin. Los aleatorios son aquellos que se deben a las diferencias existentes entre la verdadera composicin de ciertas poblaciones y de las muestras al azar que se extraen de ellas, debindose por lo tanto a una casualidad. Los errores no muestrales o de observacin se pueden producir por deficiencias en los registros de los datos y/o por errores de clculo. En vista que el valor real del parmetro en la poblacin es desconocido - para estimarlo es que se toma la muestra - slo es posible determinar la exactitud probable de la estimacin que recibe el nombre de precisin, la misma que depende de la magnitud del error de muestreo y ste a su vez del tamao de la muestra, cuestiones que veremos ms adelante cuando tratemos el muestreo probabilstico.
El decidir a quines se va a observar es una decisin que debe tomarse en primer lugar, ayuda a esta decisin los objetivos del estudio. Por ejemplo, un estudio que pretenda analizar la poblacin de estudiantes de psicologa, incluye a los alumnos de las facultades de psicologa de todo el pas? A los de la ciudad de Lima? A los estudiantes de las modalidades presencial y a distancia o solamente a una de estas modalidades? A los estudiantes de los turnos diurno y nocturno o solamente a uno de estos? A los estudiantes de todos los ciclos o semestres de 76
JAIME RAMIRO ALIAGA TOVAR estudio o solamente a alguno de ellos? El investigador debe precisar los criterios de elegibilidad o de exclusin que le permitan decidir si un individuo ser incluido o no en la poblacin de inters. En consecuencia, el investigador debe hacer que la poblacin quede claramente delimitada en torno a sus caractersticas de contenido, lugar y en el tiempo. Por ejemplo, la poblacin para una investigacin sobre el uso de la televisin por los nios se defini as: Todos los nios de Lima Metropolitana que cursen 4, 5 y 6 de primaria, en instituciones educativas estatales y privadas del turno matutino. En el ejemplo se delimita claramente la poblacin y se fija los criterios de inclusin y de exclusin. As no participarn de este estudio los nios que no vivan en el rea metropolitana, que no vayan al colegio y los menores de 9 aos que es la edad-grado del 4 de primaria.
77
JAIME RAMIRO ALIAGA TOVAR En estas muestras la eleccin de sus elementos no depende de la probabilidad, sino de causas relacionadas con las caractersticas del investigador o del que hace la muestra. En este sentido se vincula con el proceso de toma de decisiones de una persona o grupo de personas, por tal razn en la investigacin cuantitativa se considera que tienden a ser sesgadas pues al no tener un elemento de la poblacin la misma probabilidad de ser incluido en la muestra puede ser que alguna parte de la poblacin quede sin representacin; sin embargo, tambin se considera que si el investigador selecciona con criterios adecuados y con mucho cuidado la muestra, hace una interpretacin conservadora de los resultados y repite el estudio con nuevas muestras para asegurar la repetibilidad de los mismos, las muestras no probabilsticas pueden resultar razonablemente adecuadas (Polit y Hungler, 2000; Hernndez, Fernndez y Baptista, 2003).
JAIME RAMIRO ALIAGA TOVAR el nmero 05 es el nico seleccionado aleatoriamente); la siguiente unidad se selecciona sumando el intervalo muestral 09, al nmero de partida 05, obtenindose 14. Las dems unidades se seleccionan sumndoles sucesivamente el intervalo muestral al nmero anteriormente obtenido hasta completar la muestra. 3. Muestreo estratificado. Se utiliza cuando la poblacin de estudio no es homognea. Entonces sta se divide en subpoblaciones o estratos, de cada uno de stos se selecciona una muestra utilizando el muestreo aleatorio simple o sistemtico. Posteriormente, se combinan las estimaciones de cada estrato para formar una estimacin del valor de la poblacin total. Hay tres tipos de fracciones de muestreo: 1) Afijacin proporcional: el tamao de las muestras en cada estrato es proporcional al nmero de unidades de cada estrato de la poblacin. 2) Afijacin uniforme: el tamao de las muestras es igual en cada estrato, independiente del estrato de la poblacin. 3) Afijacin ptima: considera el tamao del estrato de la poblacin y la variabilidad (desviacin estndar) dentro de cada estrato. Veamos un ejemplo de afijacin proporcional. Una psicloga desea tomar de una poblacin de 1000 alumnos de una facultad de educacin a una muestra de 200 estudiantes estratificados por niveles de estudios: Avanzado (X, IX y VIII ciclo), Intermedio (VII, VI, V, IV ciclo), Inicial (III, II y I ciclo). Atendiendo al registro de matrculas los alumnos se estratifican de la siguiente manera. Tabla 9 Estrato (h) Tamao de la poblacin (por estrato) (Nh) 1. Avanzado 220 2. Intermedio 380 3. Inicial 400 Total poblacin 1000 (n)
Conociendo el nmero de sujetos por cada estrato, para determinar el tamao de las muestras en cada uno de ellos, la psicloga debe aplicar la misma fraccin de muestreo (f), o tasa muestral a cada estrato de la poblacin total. La fraccin de muestreo relaciona el tamao de la muestra deseada (N) (establecida en 200) con el tamao de la poblacin (n). La tasa muestral es: 200/1000 = 0,20. A continuacin multiplicara la tasa muestral 0.20 por cada Nh (tamao de cada 79
JAIME RAMIRO ALIAGA TOVAR estrato) para obtener la cantidad de unidades que deben seleccionarse en cada estrato. Tabla 10 Aplicacin de la fraccin muestral (f. Nh) 0.20 x 220 0.20 x 380 0.20 x 400
Estrato(h)
Establecido el tamao muestral de cada estrato la seleccin de los elementos o unidades de anlisis en cada uno de ellos se har por muestreo aleatorio simple o muestreo sistemtico. 4. Muestreo aleatorio de conglomerados o racimos. La muestra es escogida de la poblacin en grupos, no individualmente. Los conglomerados son las unidades de anlisis de la poblacin. Por ejemplo, los siguientes estudios: Estimacin de los niveles de inteligencia de nios entre 6 y 14 aos de edad, matriculados en las escuelas estatales y particulares de las UGEL de Lima Metropolitana, y Niveles de nutricin en nios de 0-6 aos residentes en los distritos del cono sur de Lima, tienen en comn el haber definido una unidad de muestreo apropiada, las UGEL y los distritos. En cada estudio las unidades de muestreo seleccionadas pueden tambin ser submuestreadas. As en la primera investigacin, pueden seleccionarse de cada UGEL dos colegios, uno estatal y uno privado, a continuacin, de cada colegio puede seleccionarse una seccin por cada edad-grado, y luego de cada seccin se extraer por muestreo aleatorio simple, sistemtico o estratificado tantas unidades o elementos como se haya estipulado como tamao de la muestra. Cuando este muestreo se produce en dos etapas recibe el nombre de muestreo bietpico y cuando se da en ms de dos etapas se denomina muestreo polietpico, como en el caso del ejemplo.
una de ellas es la siguiente: a) Muestra accidental, es aquella que se obtiene sin atender a un plan preconcebido de muestreo, por tanto los elementos o unidades de anlisis son el producto de circunstancias fortuitas. Un ejemplo es el investigador que entrevista 80
JAIME RAMIRO ALIAGA TOVAR a los primeros 100 personas que se pasean por cierto parque; tambin lo es el de los radioescuchas que llaman a una estacin de radio. b) Muestra de sujetos voluntarios, es aquella en la que a solicitud del investigador participan voluntariamente un conjunto de sujetos. Se utilizan mucho en estudios en los que el investigador tiene ms inters por los efectos de las condiciones a las que sern sometidos los participantes del estudio, por lo que se requiere que estas muestras sean homogneas en variables tales como la edad, sexo, inteligencia. c) Muestra intencional, es aquella en que los elementos se seleccionan atendiendo a un criterio o criterios que el investigador considera como relevantes para su estudio en base al conocimiento que tenga de la temtica y a su opinin personal. La generalizacin a la poblacin es nula o a lo ms sus resultados pueden extrapolarse a sujetos o elementos de similares caractersticas a los que formaron la muestra de estudio. Tambin se le utiliza como una muestra tentativa para decidir ms adelante cmo tomar una muestra aleatoria. d) Muestra de expertos, es aquella en la que los elementos se seleccionan en base a su idoneidad en algn aspecto que interesa al investigador. Se emplea bastante en estudios exploratorios y cualitativos. Un ejemplo se tiene en el estudio que pretende caracterizar a los investigadores en el campo educacional y el autor recurre a una muestra de investigadores reconocidos por su experiencia en este aspecto. Estas muestras son vlidas y tiles cuando los objetivos del estudio as lo requieren. e) Muestra por cuotas, es aquella que el investigador decide utilizar cuando tiene un buen conocimiento de los estratos de una poblacin y/o de los individuos ms representativos para los propsitos que persigue. Tiene parecido con el muestreo aleatorio estratificado, pero sin las caractersticas de aleatoriedad de ste. Se fijan unas cuotas o nmero de elementos que renen ciertas condiciones, por ejemplo, 40 personas de 20 a 40 aos de edad, de sexo femenino y residentes en el distrito de San Borja. Determinada la cuota se eligen los primeros sujetos que cumplan estas condiciones. f) Muestra Bola de nieve, es aquella en la que se obtiene en primer lugar una muestra reducida de elementos y a estos se les pregunta el nombre de otros individuos a quienes se encuestara y as sucesivamente. g) Muestra de sujetos-tipo, es aquella que se inscribe en un estudio cuyo propsito busca riqueza, profundidad y calidad de informacin. Son ejemplos los estudios acerca de patrones de consumo de jvenes de determinado nivel socioeconmico en los que se utiliza grupos de 8 a 12 jvenes que posean las
81
JAIME RAMIRO ALIAGA TOVAR mismas caractersticas socioeconmicas (Hernndez, Fernndez y Baptista, 2006) del referido segmento poblacional.
1) Estimacin del tamao de la muestra mediante una frmula Usualmente el tamao de la muestra utilizada en los estudios en psicologa, educacin y ciencias sociales se estima procediendo como si la poblacin fuera infinita - en una investigacin fctica significa una poblacin muy grande - y que el muestreo es sin reemplazamiento, es decir que el elemento extrado de la poblacin no vuelve a esta para la siguiente extraccin. Desde este punto de vista, es lcito suponer que la determinacin del tamao de la muestra bajo estas condiciones sobreestimar el nmero necesario de sujetos, lo cual evidentemente no perjudica al estudio sino que le da mayor precisin. (Sierra Bravo, 1994). Ejemplo: En una poblacin de 98,240 escolares del sexto grado de primaria pretende realizar una encuesta desendose con este propsito precisar manera conservadora y en las condiciones ms desfavorables el tamao muestra necesario para estimar los parmetros poblacionales con un nivel confianza del 95% y un margen de error muestral del +/-4%. Utilizando la siguiente frmula (Sierra Bravo, 1994). se de de de
82
Donde: N = total de la poblacin Za2 = 2,002 (la seguridad es del 95%) P = proporcin esperada (en este caso 50), con lo que se maximiza el tamao muestral). q = 1 p (en este caso 1-50 = 50) d = precisin (error muestral, 4%) En vista que la poblacin es inferior a 100,000, es necesario aplicar la frmula para poblaciones finitas y de proporciones por tratarse de una encuesta. El resultado indica 621 sujetos. Si la poblacin fuese infinita es decir superior a 100,000 sujetos, la frmula a aplicar comparndola con la frmula para poblaciones finitas, no incluye en el numerador a (N) y en el denominador solamente incluye a d2. De esta manera, si en el ejemplo anterior la poblacin hubiese sido de 115,280 sujetos el tamao de la muestra sera 625. 2) Estimacin del tamao de las muestra mediante una tabla.
Tamaos de muestras Los tamaos de muestras que figuran a continuacin corresponden al caso de trabajar con proporciones, P = 0.5, y con un nivel de confianza del 95%. Tabla 1. Relacin de tamaos en funcin de la poblacin y el error muestral. Errores muestrales Poblacin 500 1000 2000 5000 10000 25000 50000 100000 Infinito 1% 5000 7143 8333 9091 10000 2% 1250 1667 2000 2273 2381 2439 2500 3% 769 909 1000 1064 1087 1099 1111 4% 385 500 556 588 610 617 621 625 5% 222 286 345 370 385 394 397 398 400 10% 83 91 96 98 99 100 100 100 100
83
Obsrvese que a medida que el error muestral es menor el tamao exigido de la muestra es mayor. As para una poblacin de 10 000 sujetos la muestra exigida es de 91 sujetos para un margen de error de +/-10% y de 5000 sujetos para un margen de erro de +/-1%. Desde otro ngulo de observacin, esta tabla tambin nos permite tener una rpida visin de lo que significa el error muestral. Si en una poblacin de 5325 sujetos con un margen de error de +/- 2% hemos extrado aleatoriamente una muestra de 2000 y de esta el 75% responde en una encuesta que es contraria a la legalizacin del aborto, el porcentaje en toda la poblacin se encuentra entre el 73% al 77% con una confianza del 95%.
84
EJERCICIOS DE AUTOCOMPROBACIN VI
A. Responda si las siguientes afirmaciones son verdaderas o falsas. AFIRMACIONES V 1. Al utilizar la inferencia estadstica se intentan extraer conclusiones de los parmetros de una poblacin, a esta operacin se le denomina estimacin de parmetros. 2. La estimacin de parmetros es muy importante para muchos tipos de investigaciones. 3. En la estimacin de parmetros los datos reales estn libres del error de muestreo. 4. El error muestral de sesgo se produce cuando la muestra elegida representa bien a la poblacin. 5. Un error de observacin se puede producir por deficiencias en los registros de datos y/o por errores de clculo. 6. Es necesario que el investigador delimite con claridad una poblacin en torno a sus caractersticas de contenido, lugar y tiempo. 7. Si no existiese el marco de muestreo, el investigador puede elaborarlo. 8. Las muestras probabilsticas son esenciales cuando se pretende hacer estimaciones de variables a una poblacin. 9. En las muestras no probabilsticas la eleccin de sus elementos depende de la probabilidad y no de causas relacionadas con las caractersticas del investigador. 10. El muestreo estratificado es utilizado cuando la poblacin de estudio es homognea. F
B. Complete cada enunciado: ENUNCIADO Existen tres tipos de fracciones de muestreo:.,,.. Los errores muestrales son:,.. ..es el nico mtodo viable para obtener muestras representativas los estudios cuantitativos. El enunciado en estas muestras todos los elementos de la poblacin tienen la misma posibilidad de ser escogidos corresponde a .. Se utiliza cuando la poblacin de estudio no es homognea ..
85
JAIME RAMIRO ALIAGA TOVAR C. En relacin al texto, elabore enunciados verdaderos en los que se incluyan los siguientes tres trminos: 1. Probabilstico no probabilstico muestreo Enunciado: 4. Probabilstico - simple - sistemtico Enunciado: 3. Probabilstico estratificado afijacin proporcional Enunciado: 4. No probabilstico muestreo por expertos frmula para hallar tamao de muestra Enunciado: 5. Conglomerados racimos muestreo Enunciado: E. Argumente su respuesta a la siguiente pregunta: Qu pasara si no hubiese las tcnicas de muestreo al realizar una investi8gacin? Respuesta:.. .......................................... :
10 12 14 15 18 20 11 13 15 17 19
a) si quisiramos elaborar muestras de 2 sujetos cada una, cuntas muestras pueden ser seleccionadas? b) Haga una lista de todas las muestras posibles y encuentre sus medias muestrales. c) Obtenga el promedio de la media muestral. d) Construya una tabla de frecuencias para las medias muestrales con intervalos de clase de amplitud 2. e) Elabore un histograma de la tabla de frecuencias y observe la distribucin muestral. f) Establezca el tamao de muestra con un margen de error de +/- 4% y un nivel de confianza del 95% para una poblacin de 7 500 personas. Utilice la tabla de tamaos de muestras.
86
Referencias bibliogrficas
Hernndez, R., Fernndez, C. y Baptista, P. (2006). Metodologa de la investigacin. Mxico: Mc.Graw Hill Len, O. y Montero, I. (2003). Mtodos de Investigacin en. Psicologa y Educacin Mxico: Mc Graw Hill. Polit DF, Hungler BP.(2000). Investigacin Cientfica en Ciencias de la Salud.Mxico: McGrawHill. Sierra Bravo, R. (1994) Tcnicas de investigacin social: Ejercicios y problemas. Madrid: Paraninfo. Wellkowitz, J., Ewen, R., Cohen, J. (1981). Estadstica aplicada a las Ciencias de la Educacin. Madrid: Santillana, Aula XXI.
87
JAIME RAMIRO ALIAGA TOVAR lugar del promedio , podramos utilizar el promedio Md y establecer esta otra formulacin estadstica H: Mdv = Mdm (la mediana poblacional de los varones es igual a la mediana poblacional de las mujeres), o utilizar otras estrategias. (Pardo y San Martn, 1994). En consecuencia, existen varias formas diferentes de expresar estadisticamente una hiptesis cientfica concreta. Es necesario conocer qu hiptesis estadsticas podemos plantear, cmo debemos plantearlas y a qu tipo de hiptesis cientficas corresponden.
7.2.1 Hiptesis estadsticas alternativas (H1) y nula (Ho). El primer paso en el proceso de comprobacin de una
hiptesis de investigacin consiste en formular en trminos estadsticos su contenido. Esta formulacin se denomina hiptesis alternativa (H1 o Ha). Adems es necesario formular una hiptesis que la niegue y que se denomina hiptesis nula (Ho). En consecuencia, todo contraste de hiptesis se basa en la formulacin de dos hiptesis estadsticas: la hiptesis alternativa (H1) y la hiptesis nula (Ho). Ambas hiptesis (H1 y Ho) suelen plantearse como hiptesis rivales. Son hiptesis exhaustivas y mutuamente exclusivas, lo cual implica que si una es verdadera, la otra es necesariamente falsa.
7.2.2 La hiptesis nula (Ho) y la metodologa de prueba inversa. Como hemos visto, para comprobar una hiptesis
de investigacin es necesario, adems de formular la hiptesis alternativa (H1), elaborar una hiptesis nula (Ho), que es la negacin de la alterna y la que en realidad se somete a contraste. Es preciso realizar este artificio debido a que es la nica manera posible para probar la hiptesis. Esto se debe a que tericamente existen infinitas maneras diferentes de formular la H1, mientras que la Ho niega lo planteado en la H1. Sean, por ejemplo, las siguientes hiptesis: Hiptesis alternativa : Las lneas a y b no son iguales (H1: a b) Hiptesis nula : Las lneas a y b son iguales (Ho: a = b) a b ____________________ ____________________
89
JAIME RAMIRO ALIAGA TOVAR Existen muchas maneras que estas lneas sean diferentes, pero existe una sola manera que las lneas sean iguales (=). Entonces se trata de contrastar la Ho, es decir demostrar que las lneas son iguales. Si se acumulan datos que apoyan la hiptesis que las lneas son iguales, entonces se acepta la Ho y se rechaza la H1. Por el contrario, si los datos no confirman la igualdad de las lneas, se rechaza la Ho y se tiene que aceptar la H1.(Ejemplo tomado y ligeramente modificado de Meja y Reyes, 1994). La hiptesis nula (Ho) que es la que se somete a contraste (se acepta o rechaza), suele ser exacta (tal cosa es igual a la otra) ya que generalmente es una afirmacin concreta sobre la forma de la distribucin de la variable ( que pueden ser las distribuciones normal, t, Ji cuadrada, de Poisson, etc.) o sobre el valor de algunos de los parmetros de esa distribucin. En tanto que la hiptesis alternativa (H1) suele ser inexacta (tal cosa es distinta, mayor o menor que la otra).
7.2.3 Posibilidades de la hiptesis alternativa (H1). Cuando en la H1 aparece el signo decimos que el contraste es
bilateral o bidireccional. En un ejemplo de relacin del sexo y la autoestima: _ _ H1: XV XM (Dcima BILATERAL = hay diferencia en la autoestima entre varones y mujeres). Cuando en la H1 aparece el signo < o > decimos que el contraste es unilateral o unidireccional. Con el mismo ejemplo: _ _ H1: XV < XM (Dcima UNILATERAL = los varones tienen una menor autoestima que las mujeres. _ _ H1: XV > XM ( Dcima UNILATERAL= los varones tienen ms autoestima que las mujeres).
7.2.4 Errores que se pueden cometer al tomar decisiones con respecto a la hiptesis nula (Ho). Cuando estudiamos una muestra debemos tener presente que sus
resultados nunca sern iguales a los que se podran obtener si se estudiara a toda la poblacin, en otras palabras siempre habr un margen de error; asimismo, que la hiptesis de investigacin tiene que ser contrastada con los datos para determinar si estos la apoyan o no, para lo cual la hiptesis de investigacin y la hiptesis nula tienen que ser transformadas a smbolos estadsticos 90
JAIME RAMIRO ALIAGA TOVAR configurndose las hiptesis estadsticas H1 o hiptesis de investigacin y la Ho o hiptesis nula. Es claro que nunca se sabe con absoluta certeza la verdad o falsedad
de una hiptesis estadstica a no ser que se examine la poblacin entera.
En el proceso de contrastacin, es la Ho la que sometida a contraste teniendo el investigador que utilizar la estadstica inferencial a travs de pruebas estadsticas como un medio para tomar una decisin acerca de su aceptacin o rechazo. Al realizar el contraste de la Ho pueden producirse dos tipos de errores: Error tipo I o rechazar la Ho siendo verdadera, y el Error tipo II o aceptar la Ho siendo falsa. En el siguiente cuadro se resumen los errores tipo I y II.
Cuadro 5. Caractersticas de los errores tipo I y tipo II DECISION A TOMAR Aceptar Ho SITUACIN La Ho es verdadera La Ho es falsa Decisin acertada (No Error tipo II hay error) Probabilidad () Probabilidad (1 ) Error tipo I Decisin acertada (No Probabilidad () hay error) Probabilidad (1- )
Rechazar Ho
La probabilidad de cometer el error Tipo I (tipo de error tambin llamado falso positivo) se comete cuando se afirma la hiptesis del investigador siendo falsa; se denomina nivel de significacin y se representa por la letra griega alfa (). Por tanto, es la probabilidad de cometer un error tipo I y se aconstumbra que el investigador lo fije antes de empezar la investigacin. En la prctica es frecuente el uso de un nivel de significancia de 0,05 0,01, aunque tambin se usan otros valores, pero usualmente no menores a 0,05. Por otro lado, se conoce como nivel de confianza a la probabilidad a priori de que el intervalo de confianza a calcular contenga al verdadero valor del parmetro. Se indica por 1- y habitualmente se da en porcentaje (1-) %. Por ejemplo, si se escoge un nivel de significacin del 0,05 5% significa que al elaborar la regla de decisin para aceptar o rechazar la Ho aceptamos que existe unas cinco oportunidades entre cien de rechazar la hiptesis cuando debiera haberse aceptado; es decir, tenemos un 95% de confianza ( 1- = 95%) de que hemos adoptado la decisin correcta. En tal caso, decimos que la hiptesis ha sido rechazada al nivel de significacin 0,05 o que tiene una probabilidad del 5% de ser falsa. Cuanto mayor sea tanto ms probable es que se cometa el error tipo I. 91
El error tipo II (tipo de error tambin llamado falso negativo) se representa por la letra griega beta (), se comete cuando no se rechaza la Ho siendo esta falsa en la poblacin. Por tanto, y indicarn tanto el tipo de error como la probabilidad de cometerlo. Existen recomendaciones para disminuir el error tipo I y el error tipo II. Veamos las concernientes al error tipo I: a) Depurar la matriz o base de datos para evitar errores provenientes de valores extremos que puedan producir hallazgos significativos; b) Utilizar valores de alfa ms reducidos (0.01 0.001); c) Reproducir el estudio. Si al hacerlo se obtienen resultados similares, estaremos ms seguros de no estar cometiendo el error de tipo I. Por otro lado, recomendaciones para disminuir el error tipo II son: a) Estimar el poder estadstico del estudio; b) Incrementar el tamao del efecto a detectar; c) Incrementar el valor de alfa; d) Utilizar pruebas o tests paramtricos en lugar de pruebas o tests no paramtricos, por ser ms potentes. Los errores tipo I y tipo II estn relacionados. Una disminucin en la probabilidad de uno por lo general tiene como resultado un aumento en la probabilidad del otro. Una recomendacin general para equilibrar la posibilidad de su presentacin es incrementar el tamao de las muestras, hacerlas ms grandes. Actualmente se recomienda que los valores de y deben ser especificados por el investigador antes de iniciar la investigacin. Asimismo, estos valores determinan que tamao (n) de muestra tendra que escogerse para calcular la prueba estadstica elegida. Todava es comn que y n se especifiquen de antemano; al determinarse ambos, tambin queda determinada . Es pertinente sealar que cuando se rechaza la Ho, puede decirse que hay evidencia estadstica a favor de la Ha. En cambio, cuando se acepta la Ho no hay evidencia estadstica para estar a favor de la Ha. En consecuencia, el hecho de no rechazar la Ho no implica que esta sea cierta. Solamente significa que los datos de la muestra son insuficientes para concluir que Ha es cierta.
7.2.5
Si una diferencia ha de considerarse como estadsticamente significativa o no, depende de la probabilidad de que la diferencia en cuestin puede haber surgido por casualidad. Tambin depende de los objetivos del experimento. El nivel de significacin es el margen de tolerancia entre los cuales se afirma que el resultado de la investigacin se debe al azar, o es efecto de la variable independiente. En psicologa se utilizan preferentemente dos niveles de
Nivel de significacin.
92
JAIME RAMIRO ALIAGA TOVAR significacin o riesgo : 0.05 y 0.01, que expresados en porcentaje se denominan niveles de confianza del 95% y 99%, respectivamente).
libres variacin que tienen las categoras de las variables. Si por ejemplo se debe expresar: matrculados 68, aprobados 41, los desaprobados cuntos sern?. Estos sern necesariamente 27, que es la diferencia entre estas dos cifras que se han propuesto al azar. En este ejemplo existen tres categoras, y los grados de libertad son dos, porque 68 y 41 son cifras arbitrarias. Entonces los grados de libertad son : K 1 ( K: nmero de categoras; 1: constante). Los grados de libertad varan segn las pruebas estadsticas a usarse en el contraste de hiptesis.
JAIME RAMIRO ALIAGA TOVAR . Las poblaciones origen de las muestras deben seguir un patrn de distribucin normal (por su forma llamada campana de Gauss). Esta condicin es mucho ms importante de satisfacer en muestras pequeas. (la normalidad se comprueba, por ejemplo, empleando la prueba de Kolomogorov-Smirnov. . Las poblaciones origen de las muestras deben tener varianzas iguales u homocedasticidad, que se comprueba, por ejemplo, con la prueba F de Levene; es una condicin que siempre debe ser cumplida. Por otro lado, el requisito de medida exige que las variables hayan sido medidas en escala de intervalo o de razn, es decir que sean cuantitativas. Ejemplos de pruebas paramtricas son la t de Student, el coeficiente de correlacin lineal de Pearson, la prueba F de anlisis de varianza, entre otras muchas.
Son pruebas que no exigen el cumplimiento de condiciones en su modelo estadstico, por ejemplo la distribucin normal de los datos por lo que son llamadas tambin de "distribucin libre", salvo la condicin que el muestreo sea probabilstico, aleatorio. Las variables deben estar medidas en un escalamiento nominal o en un escalamiento ordinal de pocos niveles. Para aplicarlas, deben ser ciertos algunos requisitos que se encuentran en su modelo estadstico y cumplirse el requisito de medida.
7.3.3 Qu utilizamos un test estadstico paramtrico o uno no paramtrico? Para someter a contraste la hiptesis nula (Ho) si
hemos verificado o tenemos la certeza de que se cumplen los supuestos debemos aplicar una prueba paramtrica. Si no se cumplen los supuestos, debemos utilizar una prueba no paramtrica.
94
Complete cada enunciado: ENUNCIADO 1. Cuando del resultado de la prueba de hiptesis se Rechaza Ho, podemos decir que 2. El hecho de no rechazar la Ho no implica que . 3. La decisin de rechazar la Ho significa que.. 4. Cuanto mayor sea el , tanto ms probable es que se cometa el error . 5. El error ... es tambin llamado Falso negativo, mientras que el error .. es tambin llamado Falso positivo. 6. Una recomendacin para disminuir el error tipo I es 95
JAIME RAMIRO ALIAGA TOVAR . 7. El nivel de significacin es el . 8. Los grados de libertad son .
En relacin al texto, elabore enunciados verdaderos en los que se incluyan los siguientes tres trminos: 1. Hiptesis estadstica afirmacin variables Enunciado: 2. Error tipo I error tipo II hiptesis nula Enunciado: 3. Error tipo I rechazar hiptesis nula Enunciado: 4. Error tipo II no rechazar hiptesis nula Enunciado: 5. Supuestos prueba paramtrica prueba no paramtrica Enunciado: D. Argumente su respuesta a la siguiente pregunta: Por qu cree Ud. que se debe preferir las pruebas paramtricas en comparacin con las pruebas no paramtricas? Respuesta:.. .......................................... :
96
JAIME RAMIRO ALIAGA TOVAR 2. Asigne a cada concepto el nmero de la definicin que le corresponde. Concepto 1. Probabilidad de rechazar Ho siendo falsa ( ) 2. Probabilidad de aceptar Ho siendo falsa ( ) 3. Probabilidad de rechazar Ho siendo verdadera ( ) 1- 4. Probabilidad de aceptar Ho siendo verdadera ( ) 1- 3. Explique las tres condiciones del modelo estadstico de la prueba t de student. 4. Explique en qu consiste el nivel de significacin? 5. Explique en qu consiste la dcima unilateral. Respuestas a la seccin A: 1) V; 2) V; 3) V; 4) F; 5) V; 6) F; 7) F; 8) V; 9) V; 10) F.
Referencias bibliogrficas
Kerlinger, F. y Lee, H. (2002). Investigacin del comportamiento. McGraw-Hill: Mxico Manzano, V. (1995). Inferencia Estadstica. Aplicaciones con Spss/Pc+. Madrid. Ra-MA. Mejia, E. y Reyes, E. (1994). Tcnicas de investigacin educativa Lima: Cenit. Pardo, A. y San Martn, R. (2001): Anlisis de datos en Psicologa II. Madrid: Pirmide.
97