Você está na página 1de 97

JAIME RAMIRO ALIAGA TOVAR

TCNICAS BIVARIADAS DE ANLISIS

JAIME RAMIRO ALIAGA TOVAR

JAIME RAMIRO ALIAGA TOVAR

NDICE
Presentacin.,4 Introducin .5 PRIMERA UNIDAD. Concepto de estadstica y escalas de medicin6 Leccin I. Estadstica e investigacin..7 Leccin II. Escalas de medicin 24 Leccin III. Estadsticos y representacio9nes grficas de datos cialitativos, Cuasi-cuantitativos y cuantitativos.37 SEGUNDA UNIDAD. Estadsticos descriptivos, Distribucin normal, Muestreo, Prueba de hiptesis............................................................................50 Leccin IV. Medidas de tendencia central y de dispersin51 Leccin V. Distribucin normal..64 Leccin VI. Muestreo75 Leccin VII. Prueba de hiptesis y pruebas paramtricas y no paramtricas.88 TERCERA UNIDAD. Relacin de dos variables en Diseos para muestras Independiente..98 Leccin VIII. Relacin de dos variables categricas: La prueba Ji cuadrada99 Leccin IX. La prueba de la mediana..111 Leccin X. Relacin entre una variable cualitativa de dos categoras y una variable cuantitativa..121 10.1 Contraste parametrico: La prueba t de student para muestras independientes.121 10.2 Contraste no parametrico: La prueba U de Mann-Whitney130 Leccin XI. Relacin entre una variable cualitativa de ms de dos Categoras y una variable cuantitativa.137 11.1 Contraste parametrico: La prueba F de anlisis de varianza de una va (Anova)137 11.2 Contraste no parametrico: La prueba de anlisis de varianza no parametrico de Kruskall-Wallis (H).145 Leccin XII. Relacin entre dos variables cuantitativas..153 12.1 Contraste parametrico: El coeficiente de correlacin de 2

JAIME RAMIRO ALIAGA TOVAR Pearson..153 12.2 Contraste no parametrico: El coeficiente de correlacin de Spearman.161

CUARTA UNIDAD. Relacin de dos variables en Diseos para muestras dependientes o correlacionadas168 Leccin XIII. Diseos relacionados: Relacin entre dos variables cuantitativas.168 13.1 Contraste parametrico: La prueba t de student para muestras correlacionadas169 13.2 Contraste no parametrico: La prueba t de Wilcoxon para muestras correlacionadas173

Tabla A. Ley Normal..180 Tabla B. Ley de Student-Fisher..182 Tabla C. Ley X2 .184 Tabla D. Ley de Sndecor Anlisis de varianza (Anova).186 Tabla E. Significacin del Indice U de la prueba de Mann-Whitney.190 Tabla F. Significacin del coeficiente de correlacin de Pearson...191 Tabla G. Significacin del coeficiente de correlacin de Spearman...192 Tabla H. Significacin del Induce T de la prueba de Wilcoxon

JAIME RAMIRO ALIAGA TOVAR

PRESENTACIN

JAIME RAMIRO ALIAGA TOVAR

INTRODUCCIN
Es aceptado actualmente que el pensamiento matemtico-estadstico es necesario para comprender con profundidad los principios que rigen los fenmenos humanos, en especial los del comportamiento, donde es preciso el considerar grandes cantidades de datos para lograr informacin til y relevante. El comportamiento humano y social se distingue por su amplia variabilidad entre los sujetos y por sus constancias y pequeas variabilidades dentro de los mismos. La estadstica es un instrumento necesario para estudiar fenmenos, eventos, acontecimientos, procesos cuya caracterstica es la variabilidad y porque su fundamento la teora de la probabilidad. En psicologa, la cuantificacin es muy importante no slo para intentar comprender mejor los fenmenos psicolgicos en sus diversas manifestaciones, sino tambin para captar y conocer el desarrollo actual de nuestra ciencia, cuyos avances se recogen en publicaciones, reuniones peridicas y congresos, donde la mayor parte de la informacin se presenta en trminos estadsticos cuantitativos, por ejemplo, porcentajes, proporcin, variabilidad, correlacin, diferencia de grupos, escalas de puntuaciones, entre otros ms, para explicar un fenmeno psicolgico y social. La estadstica aparece entonces como una necesidad bsica colocada en los primeros escalones de una estructura piramidal de los conocimientos psicolgicos, conveniente de satisfacer antes de elevarse a otras reas ms puramente psicolgicas. En este contexto, Tcnicas Bivariadas de Anlisis es un texto de educacin a distancia de los alumnos de la Facultad de Psicologa y Ciencias Sociales de la Universidad Inca Garcilaso de la Vega, que de manera amigable en el sentido de buscar ms la comprensin de los conceptos estadsticos sin apelar a demostraciones matemticas-estadsticas muy elaboradas busca que el alumno vincule los conocimientos estadsticos con la investigacin cientfica, brindndole la informacin bsica y necesaria para describir y graficar la distribucin de variables, el seleccionar muestras, y, sobre todo, el analizar las relaciones que puedan establecerse entre dos variables en el mbito de los diseos metodolgicos para muestras independientes y para muestras dependientes o correlacionadas. Por ltimo, aparte de los necesarios clculos manuales se ha procurado que el estudiante se percate de lo necesario que resulta el dominio de los paquetes informatizados de anlisis estadstico de los cuales es ejemplo el SPSS. El Autor 5

JAIME RAMIRO ALIAGA TOVAR

Primera

UNIDAD
Concepto de estadstica y escalas de medicin

JAIME RAMIRO ALIAGA TOVAR

Leccin I Estadstica e investigacin


1.1 Estadstica 1.1.1 Definicin.
Se han propuesto varias definiciones de la estadstica que en lo sustancial son similares. En 1987 Amn presento una definicin que con algunas modificaciones adoptamos en este texto y mostramos en el cuadro 1. Cuadro 1. Definicin de Estadstica DEFINICIN Ciencia que de manera planificada recoge, ordena, presenta y analiza... EN ESTA DEFINICIN SE ENUNCIA: Funcin

los datos observados

El material del que parte

en una muestra extrada de cierta poblacin, y que...

El origen de los mismos

a partir del estudio de los datos en esa El medio de que se sirve para muestra, valindose del clculo de generalizar y deducir conclusiones, as probabilidades, se encarga de hacer como para tomar decisiones razonables inferencias acerca de la poblacin. de acuerdo con tales anlisis.

1.1.2 Campos de la estadstica. Los campos de la estadstica


son dos, estadstica descriptiva y estadstica inferencial. que se encarga de la recogida, ordenacin, presentacin y anlisis de los datos pertenecientes a una muestra extrada de una cierta poblacin, sin pretender extender o generalizar

1.1.2.1 Estadstica descriptiva. Campo

JAIME RAMIRO ALIAGA TOVAR sus resultados y conclusiones a otras poblaciones distintas o ms amplias (Sierra Bravo, 1991:241). La recogida de informacin implica bsicamente dos etapas: a) la seleccin y determinacin de la poblacin o muestra y las variables contenidas en estas que se quieren investigar. Asimismo, si se va estudiar una muestra la especificacin de su tamao y el tipo de muestreo a realizar (probabilstico o no probabilstico); b) la obtencin de los datos, que se logra mediante la observacin directa, la aplicacin de encuestas, test y entrevistas o la realizacin de experimentos en los elementos o individuos que componen la poblacin o muestra, Por otra parte, la ordenacin y presentacin de los datos implica la abstraccin de varias propiedades del conjunto de datos observados, comprendiendo la clasificacin, tabulacin y organizacin de los mismos. La clasificacin incluye el tratamiento de los datos considerados anmalos que pueden falsear un anlisis de los indicadores estadsticos. La tabulacin y presentacin implica el uso de distribuciones de frecuencias, el resumen de los datos en tablas y grficos estadsticos. Finalmente, el anlisis descriptivo de los datos se complementa con la elaboracin de indicadores estadsticos de estos por medio de las medidas de tendencia central (media aritmtica, mediana, modo), dispersin (desviacin estndar, desviacin media, varianza), de posicin (cuartiles y percentiles) y forma (asimetra y curtosis). Por ejemplo, un psiclogo que ha administrado un test de razonamiento aritmtico a 275 nios tiene como resultado un conjunto desorganizado de puntuaciones o datos; para su anlisis descriptivo tiene que ordenarlos por medio de una distribucin de frecuencias y tabularlos, vale decir inscribir de manera ordenada todas las puntuaciones o valores posibles, registrando al lado de cada uno el nmero de veces que ha ocurrido. Tambin puede hacer una representacin grfica de la distribucin de frecuencias, por ejemplo, por medio de un polgono de frecuencias o un histograma, y analizar si la distribucin es simtrica o no lo es, as como obtener la media aritmtica y la desviacin estndar de las puntuaciones y presentarlas en una tabla.

1.1.2.2 Estadstica inferencial.

Campo de la estadstica que en base al anlisis de las propiedades de una muestra hace posible inferir conclusiones acerca de lo que est sucediendo en la poblacin que representa. El anlisis inferencial busca establecer cmo es la distribucin de los parmetros de la poblacin de la que fue extrada la muestra que la representa (Carro, 1997).

JAIME RAMIRO ALIAGA TOVAR Los procedimientos inferenciales son la estimacin estadstica y la prueba de hiptesis, y su instrumento es el clculo de probabilidades. Por ejemplo, un psiclogo clnico que estudia los efectos de cuatro clases de terapia no puede obtener datos de todos los pacientes que se encuentran en tratamiento teraputico. Tiene que obtener una muestra de pacientes por cada clase de terapia y en ellas realizar su estudio. Sobre la base de los resultados someter a contraste sus hiptesis y en el caso que el muestreo haya sido el adecuado sus resultados los extender a la poblacin.

1.1.3 Conceptos implicados en la definicin


A una psicloga que trabaja en un colegio secundario le interesa comparar dos mtodos de enseanza de ingls, A y B, para determinar cul de ellos es ms eficaz para el incremento del nivel de aprendizaje de ese idioma. Al inicio de un semestre acadmico disea una investigacin experimental distribuyendo 60 alumnos del mismo grado en dos grupos, cada uno de los cuales recibe uno de los dos mtodos. Al finalizar el semestre halla que medido en una escala del 1 al 100 el nivel de aprendizaje del ingls del grupo que recibi el mtodo A es del 85% y el del grupo que sigui el mtodo B es del 75%. Ante esta informacin, es correcto suponer que el mtodo A es mejor que el mtodo para elevar el nivel de aprendizaje en ingls?. La respuesta que pueda darse est sujeta a un cierto grado de incertidumbre pues pueden haber influido diversos factores incluso el azar que hacen que los resultados sean diferentes. La estadstica proporciona las herramientas que pueden disminuir la variabilidad en los resultados, en especial el clculo de probabilidades brinda las reglas apropiadas para cuantificar la incertidumbre, ayudando de esa manera a una mejor toma de decisiones. Para una comprensin bsica del clculo de probabilidades es necesario conocer algunos conceptos que presentamos a continuacin: 1) Experimento aleatorio. Si una persona lanza una moneda al aire no sabe si va a salir cara o sello, pero si lanza una botella estar segura de que caer al suelo. Un fenmeno determinstico es aquel resultado nico o previsible de una observacin o experimento realizado bajo condiciones determinadas, por ejemplo el caso de la botella o la transformacin del agua en vapor cuando, a nivel del mar, es calentada a 100 grados Celsius. Por el contrario, un fenmeno aleatorio o estocstico es aquel resultado de una observacin o experimento que hecho bajo condiciones determinadas, tiene como resultados posibles un conjunto de alternativas, como en el caso del lanzamiento de la moneda al aire o como los tiene el jugar el tiro al blanco con un dardo, el administrar una prueba psicolgica o un cuestionario, el entrevistar a una persona, el contar las camisas falladas entre 9

1.1.3.1 Clculo de probabilidades.

JAIME RAMIRO ALIAGA TOVAR las manufacturados en un da cualquiera en una fbrica de prendas de vestir, entre otros eventos. En breve, experimentos deterministas son aquellas operaciones o procesos en los que s podemos decir lo que va a ocurrir; por otro lado, experimentos aleatorios son aquellas operaciones o procesos en los cuales no sabemos qu va a ocurrir pues siendo llevados al cabo varias veces en las mismas condiciones no tienen un mismo resultado final. Es decir, su resultado no puede ser pronosticado con certeza. El hecho que no tengan un mismo resultado se debe a factores aleatorios, no sistemticos, no sujetos a nuestro control (Amn, 2001). Un ejemplo de experimento aleatorio es tomar al azar de una poblacin una persona y observar su grado de instruccin. 2) Espacio muestral. Recibe esta denominacin el conjunto de todos los posibles resultados que se obtiene en un experimento aleatorio. Usualmente se le denota por la letra griega omega ( ). En el ejemplo anterior, todos los posibles resultados del grado de instruccin de la persona extrada al azar de una poblacin, son factibles de ser representados en el conjunto: = {sin instruccin, primaria incompleta, primaria completa, secundaria incompleta, secundaria completa, superior incompleta, superior completa} En un ejemplo que se refiere a la anotacin de la suma de puntos obtenidos como resultado del lanzamiento de dos dados, el espacio muestral es el siguiente: = { 2,3,4,5,6,7,8,9,10,11,12 }

3) Evento o suceso muestral aleatorio. Esta denominacin le corresponde a cada uno de los subconjuntos del espacio muestral . Se le designa empleando letras maysculas. Por ejemplo, en el caso del experimento aleatorio referido al grado de instruccin de una persona seleccionada al azar de una poblacin, una de las posibilidades y por lo tanto uno de los eventos o sucesos muestrales aleatorios, es: E1 = { persona con instruccin secundaria completa } En el caso del ejemplo referido al lanzamiento de los dos dados, son subconjuntos de , entre otros, los siguientes: Salir un nmero mayor o igual a 8: A = { 8, 9, 10, 11, 12 } Salir un nmero igual o menor a 3: B = { 2, 3 }

10

JAIME RAMIRO ALIAGA TOVAR Salir un nmero mltiplo de 3: C = { 3, 6, 9,12 } Salir un nmero primo: D = { 2, 3, 5,7,11 } 4) Evento o suceso mutuamente excluyente. Se presenta cuando la ocurrencia de alguno de ellos implica la no ocurrencia del otro (Gmez, Condado, Adriazola, Solano, 2005). Por ejemplo, en el espacio muestral , los eventos o sucesos: E1 = {persona con instruccin secundaria completa } y E2 = { persona con instruccin secundaria incompleta }, son sucesos o eventos que se excluyen mutuamente. 5) Espacio de eventos o sucesos. Es el conjunto de todos los eventos o sucesos que se encuentran en el espacio muestral . 6) Tipos de sucesos o eventos. Los tipos ms frecuentes de eventos o sucesos son: 1) eventos o sucesos elementales, formados por un solo resultado del experimento. Este es el caso de los ejemplos mostrados ms arriba; 2) sucesos compuestos, formados por dos o ms resultados del experimento; es decir, por dos o ms sucesos elementales; 3) sucesos seguros, aquellos que se comprueban al realizar el experimento aleatorio Est formado por todos los resultados posibles del experimento y, por tanto, coincide con el espacio muestral; 4) Suceso imposible, aquel que nunca se verifica. 7) Variable aleatoria. Tambin llamada variable de azar o variable estocstica. Se representa por las letras maysculas X, Y y sus valores por las letras minsculas correspondientes x, y, ... Es aqulla variable que es resultado de un experimento aleatorio, pudiendo por tanto tomar varios valores imprevistos. Tambin es una funcin o regla de relacin que asocia a cada elemento del espacio muestral . un nmero real. En otras palabras, si los eventos o sucesos elementales de un experimento aleatorio cualquiera pueden identificarse fcilmente mediante un nmero real, la variable aleatoria X es el conjunto de todos estos nmeros, conjunto que tambin recibe el nombre de rango de X El establecimiento de la correspondencia entre el conjunto de los posibles sucesos elementales y el conjunto de los nmeros reales debe hacerse de tal modo que a cada suceso elemental le corresponda un nmero real arbitrario y que a sucesos elementales distintos les correspondan nmeros distintos. Por ejemplo, si en el experimento aleatorio tomar al azar de una poblacin una persona y observar su grado de instruccin, los posibles resultados o sucesos elementales del espacio muestral = {sin instruccin, primaria incompleta, primaria completa, secundaria incompleta, secundaria completa, superior incompleta, superior completa}, los codificamos con los nmeros 1,2,3,4,5 y 6, entonces la variable aleatoria X ser: X = (1,2,3,4,5,6).

11

JAIME RAMIRO ALIAGA TOVAR Veamos otro ejemplo: si se trata de averiguar en un experimento aleatorio el tipo de leche peditrica que preferira un bebe entre las leches de marcas X, Y, Z, al suceso elemental preferir la leche X se le hace corresponder el nmero 1; al suceso elemental preferir la leche Y se le hace corresponder el nmero 2; al sucesos elemental preferir la leche Z se le hace corresponder el nmero 3, entonces la variable aleatoria X ser: X = (1,2,3). Es pertinente aclarar que a cada suceso elemental se le puede asociar cualquier nmero dentro del conjunto de los nmeros reales, siendo la nica condicin que a sucesos elementales distintos le correspondan tambin nmeros distintos. En este sentido, esta correspondencia es una aplicacin inyectiva, vale decir aquella en la que dados dos conjuntos A y B en este caso el conjunto de los sucesos elementales y el conjunto de los nmeros reales un elemento de B es imagen de uno y slo de uno de A. La figura 1 grfica esta aplicacin:

Figura 1. Aplicacin inyectiva

Las variables aleatorias pueden, a su vez, ser discretas o continuas. Una variable aleatoria discreta es aquella que tiene un rango finito de valores, es decir, adopta slo un nmero limitado de valores concretizado finalmente en nmeros enteros; en tanto que una variable aleatoria continua es aquella a la que se le permite asumir cualquier valor dentro de determinados lmites, vale decir cualquier valor dentro de un intervalo de nmeros reales (Gmez, Condado, Adriazola, Solano, 2005), concretizado finalmente en nmeros decimales. Ejemplos de variables aleatorias discretas son el nmero de pacientes en un servicio de psicologa, el nmero de trabajadores que ha recibido la visita de una trabajadora social, el nmero de hijos de una familia, el nmero de enfermos portadores del virus de inmunodeficiencia (VIH) que se atienden en un hospital, el nmero de revistas solicitados en una hemeroteca, el nmero de cursos a dictarse en un semestre acadmico. Ejemplos de variables aleatorias continuas son la estatura de los alumnos de una clase, el peso, el Cociente intelectual (CI), las puntuaciones logradas en un cuestionario que evala las estrategias de aprendizaje, el tiempo dedicado al estudio en una semana, el precio, las horas de 12

JAIME RAMIRO ALIAGA TOVAR duracin de una batera, el tiempo de duracin de un matrimonio, los ingresos econmicos. 8) Probabilidad. Existen hasta tres aproximaciones a este concepto: La clsica o axiomtica, la frecuentista y la subjetiva. En este apartado es ms importante la aproximacin frecuentista, pero veremos rpidamente la clsica y sobre la subjetivista slo anotaremos que es la base de los mtodos bayesianos, elaborados como alternativa a la estadstica tradicional centrada en el contraste de hiptesis (Silva y Muoz, 2000). a) En la probabilidad clsica (o a priori), la probabilidad se mide de la siguiente manera: al realizarse un experimento aleatorio se genera un espacio muestral que abarca el conjunto de N resultados o sucesos igualmente probables y mutuamente excluyentes, si dentro de estos N resultados el evento E ocurre m veces, la probabilidad de ocurrencia del evento E es igual a m/N. En otros trminos, la probabilidad de ocurrencia (p) o aparicin de un evento o suceso es la razn entre el nmero de casos favorables, o veces que puede presentarse este (m) y el caso de nmeros posibles (N), todos igualmente factibles. La frmula que se lee: la probabilidad de que ocurra el evento E es igual a m/N, es la siguiente: P (E) = m/N La probabilidad de un evento o suceso es un nmero comprendido entre 0 y 1. Si un suceso es imposible o no ocurre nunca, su probabilidad asociada es cero, mientras que si ocurriese siempre su probabilidad es 1. As, las probabilidades suelen venir expresadas como decimales, fracciones o porcentajes. Se dice que es una probabilidad a priori porque antes de realizar un experimento aleatorio, se debe conocer su espacio muestral asociado y, adems, el nmero de resultados posibles de cualquier evento o suceso o subconjunto de . Por ejemplo, si deseamos hallar la probabilidad de obtener sello al lanzar una moneda al aire, tenemos que existen dos casos posibles: = {cara, sello}, por tanto N = 2, y que el nmero de veces que puede salir sello es solamente una: E = { sello }, en consecuencia m = 1. Entonces, la probabilidad de que ocurra sello, es la siguiente: P(E) = m/N = 1/2 = 0,50 b) La probabilidad frecuentista o de frecuencia relativa ( o a posteriori) mide la frecuencia con la que se obtiene un resultado, evento o suceso (E) al llevar a cabo un experimento aleatorio o observacin del que se conocen todos los resultados, eventos o sucesos posibles, en un nmero grande de ocasiones (n), bajo condiciones suficientemente estables,. En vista que no se puede repetir un 13

JAIME RAMIRO ALIAGA TOVAR experimento aleatorio un nmero infinito de veces, esta probabilidad est vinculada a la idea de regularidad estadstica, segn la cual las frecuencias relativas tienden a estabilizarse a un valor fijo despus de repetir el experimento un nmero razonable de ocasiones (Amn, 2001). En consecuencia, la frecuencia relativa de la ocurrencia del evento o suceso E, m/n, estima la probabilidad de ocurrencia del evento E. (Gmez, Condado, Adriazola, Solano, 2005: 16). La formula es la siguiente: P (E) = m/n Esta definicin de probabilidad es a posteriori porque tan slo repitiendo un experimento aleatorio un nmero elevado de veces podremos saber cul es la probabilidad de cada suceso. Por ejemplo, si Pedro lanza una vez al aire una moneda no trucada, y sale sello, entonces el suceso sello ha aparecido el 100% de las veces y el suceso cara el 0%. Si l lanzara diez veces la moneda al aire, es posible que el suceso sello salga 6 veces y el suceso cara las 4 restantes. En este caso, la probabilidad del suceso sello en porcentajes ya no sera del 100%, sino que se habra reducido al 60%. Si Pedro repite este experimento un nmero elevado de veces, lo normal es que las probabilidades de los sucesos sello y cara se vayan aproximando al 50% cada una. Este 50% o, en decimales, 0,50 ser la probabilidad de estos sucesos segn el modelo de probabilidad frecuentista, pero si la experiencia dijera que en vez de 0,50 eran 0,47, 0,53 o 0,62 los valores que indican la estabilizacin de la proporcin de sellos, entonces atribuiramos 0,47, 0,53, 0,62 como probabilidades al suceso sello y no 0,50. (Amn, 2001:41). En el modelo frecuentista de la probabilidad ya no ser necesario que el nmero de soluciones sea finito, ni que todos los sucesos tengan la misma probabilidad. En base a la comprensin de todos los conceptos presentados, podemos decir que el clculo de probabilidades es un instrumento muy til para las ciencias fcticas si pretendemos tomar decisiones de modo responsable y con un riesgo mnimo de error en muchsimos problemas de importancia, pues nos brinda las reglas para el estudio de los experimentos aleatorios o de azar, sirviendo de base para la estadstica inductiva o inferencial, pues es () el puente que nos permite pasar de lo afirmado con certeza (en la muestra) a lo pronosticable slo con probabilidad (en la poblacin), de lo conocido a lo desconocido (Amn, 2001: 20).

1.1.3.2. Poblacin.

Una poblacin es el conjunto de todos los elementos o individuos que concuerdan con una serie de especificaciones (Selltiz, Jahoda, Deutsch y Cook, 1976). Por ejemplo, en una investigacin sobre las horas que los nios ven la televisin, la poblacin se defini as: Todos los nios de Lima Metropolitana que cursan el 4 grado de primaria, en instituciones educativas privadas del turno matutino. En esta definicin se delimita claramente la poblacin y se fija los criterios de inclusin y de exclusin. As, no participarn 14

JAIME RAMIRO ALIAGA TOVAR de este estudio los nios que no vivan en el rea metropolitana, que no vayan al colegio y los menores de 9 aos que es la edad-grado del 4 de primaria. Sin embargo, el trmino poblacin no se refiere necesariamente a personas. As, en un estudio pueden ser consideradas como poblacin el total de historias clnicas archivadas en un determinado centro hospitalario, todas las instituciones educativas primarias del Per, todas las reacciones de un sujeto observado en situaciones experimentales, el nmero de pernos producidos en un da o la suma de todas las posibles combinaciones de cinco cartas extradas de un juego de 52 cartas, en la que la suma de los puntos de cinco cartas constituye un individuo para su subsiguiente tratamiento estadstico. Una poblacin es denominada finita cuando el nmero de individuos que la constituyen es limitado. Es infinita cuando el nmero de individuos que la conforman no tiene un lmite; sin embargo, usualmente se considera como infinita a una poblacin que tiene ms de 100 000 individuos.

1.1.3.3 Individuo o unidad estadstica. Se denomina


as a cada uno de los elementos de una poblacin que llevan asociado una medida, un nmero de orden o un juicio. Por ejemplo, en el estudio sobre el uso de la televisin Ana ve televisin 4 horas diarias; en un estudio acerca de la estatura de los nios, Juan mide 1,25 m; en una investigacin sobre la relacin del lugar entre los hermanos con el rendimiento acadmico, Mara es la tercera de cinco hermanos; en un anlisis de la distribucin de la inteligencia en un grupo de estudiantes universitarias, Luisa tiene una inteligencia por encima del promedio. En estos ejemplos, los individuos coinciden con las personas estudiadas, pero, como sabemos segn el concepto de poblacin, no siempre es as, pues, en un experimento con animales, cada uno de estos se constituye en un individuo; en tanto que en otras investigaciones, los individuos pueden ser un paciente, una fbrica, una familia, una capital, oraciones, prrafos, artculos, entre otros. En sntesis, el individuo constituye la unidad bsica para la que se desea obtener informacin estadstica. Al investigar sobre una variable aleatoria en una poblacin, se tendrn como resultado los valores X1, X2, X3, X4, X5, X6, N, donde N es el total de elementos o individuos de la poblacin. Por ejemplo, en la investigacin acerca del tiempo que se ve televisin siendo la poblacin de 20 000 individuos, la distribucin de la variable aleatoria X = X1, X2, X3, X4, X5, X6, X7,X8, X9, X10,X 20 000 se lee as: el nmero de horas que ve el nio 1, el nmero de horas que ve el nio 2, y as sucesivamente hasta el nmero de horas que ve el nio 20 000.

1.1.3.4 Parmetro. Es un valor numrico obtenido a partir de los


valores de una poblacin que resume las caractersticas ms importantes de esta 15

JAIME RAMIRO ALIAGA TOVAR respecto de una condicin o situacin o variable aleatoria X. Parmetros poblacionales son, entre otros, la media poblacional de la variable aleatoria X (X) y la varianza poblacional de la variable aleatoria X (2X). Por ejemplo, si el tiempo medio media poblacional de dedicacin al estudio de una poblacin de 100 000 estudiantes del quinto ao de secundaria es de 10,6 horas semanales, este valor ser el correspondiente parmetro poblacional. Los parmetros son cantidades indeterminadas, constantes o fijas (Sierra Bravo, 1991), que generalmente son desconocidas, por lo que para estimarlos con cierto margen de error se extraen con tcnicas probabilsticas las muestras o muestra.

1.1.3.5 Inferencia.

La inferencia es la accin y el efecto de inferir. El inferir es el sacar una consecuencia o deducir algo de otra cosa (Diccionario de la Lengua Espaola). En estadstica analizando la muestra y mediante el clculo de probabilidades se hace inferencias generalizables a la poblacin. Existen muestras aleatorias o probabilsticas y muestras no aleatorias o no probabilsticas. Las primeras pueden considerarse de tres maneras no equivalentes pero si muy relacionadas (Nolberto y Ponce, 2008): a) Unidades estadsticas seleccionadas probabilsticamente para ser investigadas. Es el subconjunto de individuos pertenecientes a una poblacin donde estn reflejadas las propiedades importantes de la misma que interesa analizar. Este subconjunto es extrado por el investigador con la finalidad de inferir caractersticas del total de la poblacin, necesitando para el efecto que la muestra sea representativa de esta; caracterstica que se garantiza con cierto margen de error y cuando son bien realizadas cuando la tcnica de extraccin de la poblacin o muestreo es probabilstico. Por ejemplo en el caso del estudio sobre las horas que un nio ve la televisin, la variable de inters es X, nmero de horas, que es posible de precisar si se conociera la distribucin de X, vale decir si se examinara a los 20 000 nios que componen la poblacin. Si se quisiera conocer la distribucin de la variable aleatoria X y los parmetros poblacionales media poblacional de X () y la varianza poblacional de X (2), se tendra que extraer al azar de la poblacin una muestra, por ejemplo de tamao n = 400.

1.1.3.6 Muestra.

Entonces, X1, es el nmero de horas que ve la televisin el primer nio seleccionado de la muestra, X2, el nmero de horas de televisin que ve el segundo nio seleccionado de la muestra,..X400, el nmero de horas que ve televisin el ltimo nio seleccionado de la muestra. b) Variables aleatorias tericas asociadas con las unidades estadsticas seleccionadas. Siguiendo con el ejemplo anterior, en vista que la seleccin de los 16

JAIME RAMIRO ALIAGA TOVAR 400 nios es al azar: X1 , X2 , X3, , X 400 constituye variables aleatorias. Estas variables son independientes y cada una tiene la misma distribucin que la variable aleatoria X. Matemticamente, el trmino muestra aleatoria se refiere no a cuatrocientos alumnos seleccionados para este estudio, sino a las cuatrocientos variables aleatorias X1, X2 , X3 , X400, asociadas con los alumnos seleccionados. c) Valores numricos correspondientes a las variables aleatorias. Se trata del conjunto de n nmeros reales x1, x2, x3,xn que son los valores observados de las variables aleatorias X1, X2, X3.Xn. La especificacin de estos valores es necesaria para previo anlisis poder sacar las conclusiones acerca de la poblacin que representa la muestra. Por ejemplo, en el caso del ejemplo anterior, una vez identificados los cuatrocientos alumnos, podemos determinar los valores numricos de las cuatrocientos variables aleatorias X1 , X2 , X3 , X4 , X5 , X6 . Supongamos que el primer alumno seleccionado ve 6 horas de televisin a la semana, en este caso la variable aleatoria X1 toma el valor x1 = 6; si el segundo alumno seleccionado ve televisin 3 horas a la semana, la variable aleatoria X 2 toma el valor x2 = 3, de igual manera las variables aleatorias X3 , X4 , X5 , X400 tomarn valores numricos que van a depender de las horas que ven televisin los alumnos . En este caso, el termino muestra aleatoria es utilizado no en relacin a los nios seleccionados o a las variables aleatorias asociados con ellos sino a los valores numricos x1 , x2 , x3 , x4 , x5, x400 que toman respectivamente cada una de las cuatrocientos variables aleatorias. En consecuencia, una muestra aleatoria de tamao n es un conjunto de n observaciones x1 , x2 , x3 ,..., x n sobre las variables X1 , X2 , X3 ,..., Xn , independientes e idnticamente distribuidas.(Nolberto y Ponce, 2008). Es un valor numrico obtenido con los valores de una muestra que resume alguna caracterstica de esta. Este valor constituye una variable aleatoria por qu est sujeto a la fluctuacin de la muestra en relacin al valor poblacional, que es constante (Sierra Bravo, 1991). Tomando al ejemplo anterior, si al extraer de la poblacin de 100 000 estudiantes del quinto ao de secundaria una muestra de 600 estudiantes y calculamos en 10,8 horas semanales el tiempo medio media muestral - dedicado al estudio por la muestra, 10,8 es un estadstico. Estadsticos son, entre otros, la media aritmtica muestral ( x ), la varianza muestral (S2) y la desviacin estndar o tpica muestral (S).

1.1.3.7. Estadstico.

1.1.3.8

es la categorizacin, ordenacin, manipulacin y resumen de datos para responder a 17

Anlisis estadstico. El anlisis de los datos

JAIME RAMIRO ALIAGA TOVAR las preguntas de investigacin. El propsito del anlisis es reducir los datos a una forma inteligible e interpretable para que las relaciones de los problemas de investigacin puedan ser estudiadas y probadas (Kerlinger y Lee, 2002:172). Son ejemplos de modalidades de anlisis estadsticos la distribucin de frecuencias, los grficos, ndices, tasas, porcentaje, media aritmtica, desviacin estndar, coeficiente de correlacin, anlisis de varianza, anlisis de diferencias, anlisis de regresin, anlisis factorial.

1.2 Estadstica e investigacin. La investigacin cientfica


es la herramienta ms importante para avanzar conocimientos, para promover progresos y para capacitar al hombre para relacionarse ms eficazmente con su entorno, para conseguir sus propsitos y para resolver sus conflictos. En este sentido, se constituye en un proceso de obtencin, anlisis e interpretacin planificada y sistemtica de los datos para dar respuestas fiables a los problemas. En este proceso, los investigadores realizan un conjunto de actividades planificadas tales como muestrear, observar, experimentar, registrar, analizar, contrastar y otras ms, con dos propsitos fundamentales: producir conocimientos y teoras (investigacin bsica), por ejemplo en el estudio de la motivacin la teora de la atribucin de Weiner, y el resolver problemas prcticos (investigacin aplicada), por ejemplo, en relacin con la teora de la atribucin, la elaboracin de un programa para la mejora del estilo atributivo del comportamiento, que indudablemente se constituira es una propuesta til, de impacto y aplicable en los centros educativos del pas. Aspecto medular de las ciencias fcticas como lo son la psicologa y las ciencias sociales es la investigacin. En el proceso de investigacin la estadstica interviene en varias de sus etapas (Hernndez, Fernndez y Baptista, 2006): En el cuadro 2 se muestra algunas de las aplicaciones de la estadstica en el proceso de investigacin:

18

JAIME RAMIRO ALIAGA TOVAR

Cuadro 2. Algunas aplicaciones estadsticas en el proceso de investigacin Etapas del proceso de investigacin Planteamiento del problema Marco terico, definiciones Hiptesis nula (Ho), hiptesis alterna (Hi), niveles de significacin, variables cualitativas, variables discontinuas o discretas, variables continuas. Diseo de experimentos, preexperimental, cuasi experimental, experimental, no experimental. Teora del muestreo, muestreo probabilstico, tipos, tamao de la muestra. Elaboracin de instrumentos de medicin, anlisis de tems, estimacin de la confiabilidad, validez, baremos. Medidas de tendencia central, medidas de dispersin, representaciones grficas,l seleccin de pruebas estadsticas, pruebas de hiptesis, pruebas paramtricas, pruebas no paramtricas, tcnicas multivariadas. Aplicaciones de la estadstica

Hiptesis, variables

Seleccin del diseo apropiado

Seleccin de la muestra

Recoleccin de datos

Anlisis estadstico de datos

Informe de investigacin.

19

JAIME RAMIRO ALIAGA TOVAR

EJERCICIOS DE AUTOCOMPROBACIN I
A. Responda si las siguientes afirmaciones son verdaderas o falsas.

AFIRMACIONES 1. El campo de la estadstica descriptiva generaliza sus resultados y conclusiones a otras poblaciones distintas o ms amplias 2. La variable estocstica es resultado de un experimento aleatorio, en donde puede tomar varios valores imprevistos. 3. El estadstico constituye una variable aleatoria por qu est sujeto a la fluctuacin de la muestra en relacin al valor poblacional. 4. La probabilidad frecuentista est vinculada a la idea de irregularidad estadstica 5. Los procedimientos inferenciales son la estimacin estadstica y la prueba de hiptesis, y su instrumento es el clculo de probabilidades. 6. Espacio muestral es el conjunto de todos los posibles resultados que se obtiene en un experimento no aleatorio. 7. Las variables aleatorias pueden ser exclusivamente variables continuas 8. Los procesos inferenciales y descriptivos son la estimacin estadstica y la prueba de hiptesis, y su instrumento es el clculo de probabilidades 9. Los parmetros son cantidades determinadas y constantes que generalmente son desconocidas 10. La frecuencia relativa mide la frecuencia con la que se obtiene un resultado al llevar a cabo un experimento no aleatorio B. Complete cada enunciado: ENUNCIADO 1. Los campos de la estadstica son:.y

2. La recogida de informacin implica: a).. y, b). 3.La ordenacin y presentacin de los datos tiene que ver con a)..b).y, c) 4. Un experimento aleatorio tieneresultados. 5. Se denomina..o.a la fuente de donde se quiere conseguir 20

JAIME RAMIRO ALIAGA TOVAR informacin. 1. Las etapas del proceso de investigacin en las cuales la participacin de la estadstica es mnima o no se da, son las siguientes: . 2. En un fenmeno determinsticoocurrir.

C. En relacin al texto, elabore enunciados verdaderos en los que se incluyan los siguientes tres trminos: 1. Psicologa estadstica investigacin Enunciado: 2. Estadstica inferencial clculo de probabilidades - prueba de hiptesis Enunciado: 3. Poblacin - muestra investigacin Enunciado: 4. Experimento aleatorio espacio muestral - suceso muestral aleatorio Enunciado:

D. Argumente su respuesta a la siguiente pregunta: Por qu es importante la estadstica para la investigacin? Respuesta: ................................ :

Ejercicios por realizar


1. Cul es la probabilidad de que se obtengan los nmeros 3 o 6 al tirar un dado en una sola oportunidad? 2. Cul es la probabilidad de obtener 8 al tirar dos dados una sola vez? 3. De cuntas formas pueden mezclarse los siete colores del arco iris tomndolos de tres en tres? 4. Si usted quiere realizar una investigacin en nios de 6 aos de edad, cmo definira a su poblacin? 5. Indicar si los siguientes enunciados son variables o constantes

21

JAIME RAMIRO ALIAGA TOVAR a) La edad en aos b) El nmero de ventanas en el domicilio c) El color de un automvil de ltimo modelo d) La fecha de hoy e) Las notas de los exmenes 6. Qu campo de la estadstica puede brindar la informacin de cul ser el precio del euro el da de maana? 7. En el siguiente enunciado identifique: poblacin, muestra, unidad estadstica, variable(s), tipo(s); adems defina los parmetros y valores estadsticos correspondientes. El departamento de Psicologa Organizacional de una empresa dedicada a la venta de test psicolgicos ha realizado un estudio con la finalidad de obtener algunos indicadores que permitan realizar una mejor planificacin de las actividades de la empresa para el ao siguiente. El estudio se realizo en una muestra de seis de sus quioscos de venta ubicadas en igual nmero de facultades de psicologa en Lima Metropolitana, consiguindose los resultados siguientes: - El 30% de los test proporcionados por la Casa Matriz ubicada en Madrid bimestralmente son vendidos en ese perodo. - La utilidad neta promedio por test vendido es de 30% del costo. - El 75% de los test vendidos son Test de Personalidad. a) Cul es la poblacin? b) Cul es la muestra? c) Cul es la unidad estadstica? d) Cules son las variables? e) Son las variables cuantitativas continuas o cuantitativas discretas? f) Cules son los parmetros?

Respuestas a la seccin A: 1) F; 2) V; 3) V; 4) F; 5) F; 6) F; 7) F; 8) V, 9) F; 10)F

Para saber ms: Sitios Web de referencia


http://ponce.inter.edu/cai/reserva/lvera/CONCEPTOS_BASICOS.pdf http://www.ine.es/revistas/estaespa/122_3.pdf http://pepsic.bvs-psi.org.br/pdf/pp/v5/v5a10.pdf http://books.google.com.pe/books?id=S3i_fndtcIEC&printsec=frontcover&dq=EST ADISTICA+EN+CIENCIAS+SOCIALES&source=bl&ots=YziuO9HYCz&sig=2YhVm 22

JAIME RAMIRO ALIAGA TOVAR 7MRGcxW5XhJcTz0f9DcGs&hl=es&ei=a6I8TLfwPIP6lwej0YXHAw&sa=X&oi=book_result&ct=re sult&resnum=9&ved=0CDUQ6AEwCA#v=onepage&q&f=false http://books.google.com.pe/books?id=A9MOAQAAIAAJ&printsec=frontcover&dq=e stadistica+en+psicologia&source=gbs_similarbooks_s&cad=1#v=onepage&q&f=fal se

Referencias bibliogrficas
Amn, J. (1987). Estadstica para psiclogos. Madrid: Pirmide Amn, J. (2001). Estadstica para psiclogos II. Madrid: Pirmide. Gmez, D., Condado, J., Adriazola, Y., Solano, O. (2005). Introduccin a la inferencia estadstica. Soporte del SPSS y MATLAB. Lima: Unidad de Posgrado, Facultad de Educacin UNMSM. Hernndez, R., Fernndez, C. y Baptista, P. (2006). Metodologa de la investigacin. Mxico: Mc.Graw Hill Kerlinger, F. y Lee, H. (2002). Investigacin del comportamiento en ciencias sociales. Mxico:McGrawHill. Nolberto, V. y Ponce, M. (2008). Estadstica Inferencial Aplicada. Lima: Unidad de Posgrado, Facultad de Educacin UNMSM. Selltiz, C., Jahoda, M., Deutsch, M. y Cook, S. W. (1976). Mtodos de investigacin en las relaciones sociales (8a. ed.). Madrid: Rialp. Sierra Bravo, R. (1991). Diccionario prctico de estadstica. Madrid: Paraninfo.

23

JAIME RAMIRO ALIAGA TOVAR

Leccin 2 Escalas de medicin


2.1 La medicin comportamiento. en las ciencias del

Una variable es un atributo, propiedad o cualidad de un individuo o grupo de individuos que puede presentarse con matices o modalidades diferentes, en grados, magnitudes o medidas distintas a lo largo de un continuo (Buenda, Cols, Hernndez, 1998:21). En trminos estadsticos, es una caracterstica de los individuos o unidades estadsticas que presentan diferentes valores o modalidades de respuestas, por ejemplo el nmero de horas que se ve la televisin, el nmero de hermanos o el grado de utilizacin de las estrategias de aprendizaje en la vida escolar. Su importancia es fundamental en la investigacin cientfica en vista que esta trata de descubrir la existencia de variables y su magnitud y probar la relacin que las unen entre s, aunque en sentido estricto la relacin se da entre modalidades o categoras de las variables (Babbie, 2000). Por otro lado, una constante es una caracterstica que siempre tiene un mismo valor. Por ejemplo, en un estudio que solamente se realiza en mujeres, la variable sexo se comporta como una constante. Al momento de realizar el anlisis estadstico de los datos referidos a la observacin de las variables de estudio, es conveniente preguntarse de cuntas variables se trata, como se presentan estas variables y en que escala de medicin estn medidas. Ocupndonos de las escalas de medicin de variables, el estudio del comportamiento humano en sus variadas manifestaciones requiere previamente de su medicin, pero el proceso de medicin ser distinto segn sea la diferente naturaleza de las variables involucradas en el hecho psicolgico o social, lo que significa que cada una de ellas deba ser medida de acuerdo con sus propias caractersticas. En este sentido, el proceso de medicin que es comn en todas las ciencias fcticas, obedece a un conjunto de reglas y normas para la conversin de modalidades o respuestas de las variables en nmeros que permiten su anlisis, de manera tal que se legitime el paso de la apreciacin de una caracterstica, por ejemplo, rasgos de personalidad, el grado de atencin de un 24

JAIME RAMIRO ALIAGA TOVAR escolar en clase, la actitud hacia las problemas sociales, el tiempo de vida de una persona, a un valor mtrico, que permite estudiar en forma cientfica dicha conducta humana o caracterstica.(Carro, 1997).

2.2 Escalas de medicin.


La medida, como accin de medir, es el asignar nmeros a las cantidades de las propiedades o atributos de los objetos de acuerdo con ciertas reglas cuya validez puede probarse (Magnusson,1987). En otras palabras, medir es dar la magnitud de cierta propiedad o atributo, por ejemplo, la talla, la inteligencia, de uno o ms objetos o personas con ayuda del sistema numrico. En este punto es conveniente tener presente que la cuantificacin implica que tanto de un atributo est presente en un objeto - y los nmeros comunican la cantidad -, y tambin implica a la clasificacin, que es al menos igualmente importante para la ciencia como lo es la medicin. (Nunnally y Bernstein, 1994: 5). 2.2.2 Caractersticas del sistema numrico. El sistema numrico que se emplea en la medicin es el de los nmeros reales, los cuales tienen las siguientes caractersticas (Cortada, 1968): (1) Origen: La serie de nmeros (1,2,3....N) tiene un origen nico llamado cero. (2) Orden: Los nmeros estn ordenados (despus del 1 viene el 2, despus del 2 viene el 3, y as sucesivamente hasta N) (3) Distancia: La diferencia entre dos nmeros, es decir la diferencia entre dos pares de nmeros, puede ser mayor que(4 es mayor que 3), igual a que (3 es igual a 3), o menor que (2 es menor que 5). Un ejemplo del cumplimiento de estas tres caractersticas lo tenemos en la regla escolar. Para medir una propiedad o atributo debe existir una relacin isomrfica, es decir de uno a uno, entre las caractersticas del sistema numrico y las cantidades de la propiedad por medir, por ejemplo, la estabilidad emocional y la ascendencia.

2.1.1 La medida.

2.2.3

Los niveles o escalas de medicin.

Los niveles o escalas de medicin se originan en el hecho de que los nmeros que se asignan a las cantidades de las propiedades de los objetos o personas reflejan o todas o algunas de las caractersticas del sistema numrico.

25

JAIME RAMIRO ALIAGA TOVAR Se distinguen cuatro niveles o escalas de medicin, formulados en 1951 por S.S. Stevens, que difieren en la cantidad de informacin llevada por los nmeros que representan las magnitudes de las propiedades medidas, desde una informacin pobre a otra ms til. En este sentido, estos niveles o escalas son jerrquicos. Del orden inferior al superior, de lo ms simple a lo ms complejo, las escalas son: nominal, ordinal, de intervalo y de razn (proporcin o cociente). Cada una de estas escalas o niveles tiene su teora de la medicin (Siegel y Castellan, 1995), pues tienen ciertas propiedades formales que se refieren a las relaciones entre los objetos o variables a los que se les ha asignado nmeros y a las operaciones que se pueden realizar con dichos nmeros. En consecuencia, el anlisis estadstico de los resultados de la medicin de las variables en cada una de ellas, tiene sus reglas y restricciones propias, y sus procedimientos estadsticos apropiados.

2.2.3.1 Escala Nominal. Esta es una escala clasificatoria en la que los


nmeros o smbolos asignados slo permiten clasificar los objetos, personas o caracterstica, pues los nmeros se asignan nicamente para identificar o etiquetar las categoras donde se encuentran incluidas las personas o cosas. Estas clasificaciones pueden ser de una sola clase, como los nmeros en las camisetas deportivas de jugadores para identificarlos, o pueden aplicarse a grupos de personas, como cuando damos un nmero de cdigo 1 a las mujeres y 2 a los hombres, para identificar las modalidades de la variable sexo; o cuando empleamos la letra D para identificar a las personas nacidas en Lima y la E a las nacidas en Piura, como modalidades de la variable lugar de nacimiento. En cuanto queden de esta manera los objetos pueden ser clasificados y contados, se est autorizando a considerar la asignacin de nmeros como un procedimiento de medicin. Esta escala no nos dice nada acerca del tamao o tipo de diferencia existente entre los objetos, pues los nmeros no cumplen con ninguna de las tres caractersticas de los nmeros reales. La nica operacin aritmtica posible de realizar es la de contar, no pudindose realizar con los nmeros de estas escalas otras operaciones aritmticas. Las propiedades formales de esta escala aluden a que los datos en escala nominal han de pertenecer a modalidades o categoras que sean exhaustivas y excluyentes. Es decir, todo elemento o individuo ha de poder ser incluido en algunas de las modalidades, y un individuo solo ha de pertenecer a una de las modalidades o categoras de la variable. Asimismo, en la escala nominal, la nica relacin que hay es la de equivalencia, esto quiere decir que todos los miembros a los cuales se les ha asignado el mismo nmero o cdigo son iguales. Esta relacin se simboliza (=). 26

JAIME RAMIRO ALIAGA TOVAR

Por ejemplo, la variable sexo tiene dos modalidades o categoras varn y mujer. Cualquier individuo puede ser clasificado como varn o mujer (exhaustividad) y slo pertenecer a una de esas dos categoras (exclusividad). Si le asignamos, el nmero 1 a varn y el 2 a mujer, el 1 representa a todos los varones y el 2 a todas las mujeres (equivalencia). Por otro lado, la escala nominal es invariante a cualquier transformacin numrica de sus modalidades o categoras. En la variable sexo, para hacer el escalamiento le asignamos un nmero (o letra) a cada una de sus categoras varn = 1, mujer = 2, contndose luego cuntos 1 y 2 hay. Se puede transformar este escalamiento en otro nuevo cambindose simplemente los nmeros asignados, por ejemplo varn = 4, mujer = 6.

2.2.3.2

Se tiene esta escala cuando los nmeros asignados slo indican un orden o rango entre los objetos. Podemos colocar a los individuos en una serie cuyo rango va del ms bajo al ms alto (o viceversa) segn las caractersticas que intentamos medir, pero no podemos decir cunta es la diferencia entre un par cualquiera de individuos. La nica caracterstica de los nmeros reales que cumple esta escala es el Orden. Esta escala no slo diferencia a los individuos nombrndolos o etiquetndolos sino que nos dice que un individuo tiene ms, o menos, de una cualidad determinada, pues adems de poseer las propiedades de equivalencia aplicable a los miembros de una misma clase, los objetos y sujetos pueden ser clasificados en funcin de su igualdad o desigualdad y su orden en el atributo, a travs de la expresin mayor que (>) menor que (<). Esta relacin se expresa, segn los casos, con trminos como ms de acuerdo, ms preferido, ms estable, etc. De acuerdo con lo anterior, la medicin en escala ordinal implica que: a) una serie de objetos estn ordenados de mayor a menor con respecto a un atributo; b) no sabemos cunto del atributo posee cada uno de los objetos en un sentido absoluto; y, c) no sabemos qu tan lejos estn los objetos con respecto al atributo. (Nunally y Bernstein, 1995). En otras palabras, en esta escala podemos decir la diferencia entre los individuos nombrndolos o etiquetndolos y tambin que individuo tiene ms, o menos, de una cualidad determinada, pero no podemos decir cunta es la diferencia entre un par cualquiera de individuos. Un ejemplo de medicin en esta escala es la variable nivel socioeconmico con las categoras Muy alto, Alto, Medio, Bajo, Muy bajo, a las que se asigna los nmeros 5,4,3,2 y 1. Estos nmeros son ordinales (primero, segundo, tercero, etc.) y son asignados atendiendo a la equivalencia o no equivalencia entre los 27

Escala Ordinal.

JAIME RAMIRO ALIAGA TOVAR individuos, y las distintas categoras son ordenadas de acuerdo al smbolo mas que.. ( >) o menos que (<). Otros ejemplos son: la Escala de dureza de minerales de Mohs, el orden de picoteo de las gallinas, los grados escolares, las escalas estticas, las escalas psicofsicas, las escalas de inteligencia expresadas en puntajes directos o brutos. El punto 0 existente, por ejemplo el no acertar ninguna pregunta de un test de razonamiento numrico, corresponde al test o instrumento utilizado pero no al constructo razonamiento numrico. En la medicin psicolgica y educativa, un ejemplo de unidad de medicin en escala ordinal es la escala percentil o puntuaciones percentiles. Las propiedades formales de esta escala son la equivalencia (=), no equivalencia () y la de relacin de orden ms que.. (>) y menor que (<) Este ltimo operador tiene las propiedades de ser irreflexiva (no es verdad que para ninguna x tal que se cumpla que x >x), asimtrica si hay un tal x > y, entonces en ningn caso y puede ser mayor que x; transitiva, si x > y, y a su vez y > z, entonces x > z. (Carro, 1997:23). La escala ordinal es invariante frente a cualquier transformacin en la que se mantenga el orden entre los elementos de las modalidades o categoras. Por ejemplo, en el escalamiento de la variable nivel socioeconmico Muy alto = 5, Alto, 4, Medio= 3, Bajo = 2 y Muy bajo = 1, sus propiedades y caractersticas permanecern inalteradas si le sumamos el valor 2 a cada uno de los nmeros asignados: Muy alto= 7, Alto= 6, Medio =5, Bajo= 4 y Muy bajo= 3. Esta transformacin no implica prdida de informacin. 2.2.3.3 Escala de Intervalos. La medida en esta escala cumple con dos de las caractersticas de los nmeros reales: el orden y las distancias iguales pero no con la del punto cero. Esta escala define: a) una unidad de medida constante, es decir en cualquier lugar del continuo de valores la unidad es la misma, unidad que, por otro lado, es arbitraria como lo es el punto cero de la escala por lo que no indica la ausencia del atributo que se esta midiendo ; y, b) tambin define el ordenamiento mayor que.. (>), Igual que( =) y menor que (<). Todo en relacin a que: a) se conoce el ordenamiento jerrquico de objetos en un atributo; b) tambin se conocen las distancias entre objetos en el atributo, pero c) se desconocen las magnitudes absolutas del atributo. (Nunally y Bernstein, 1995). En consecuencia, lo que distingue la medida de intervalo de la medida ordinal es que nos permite determinar cun lejos se encuentran dos personas o dos cosas. En este sentido es una escala verdaderamente cuantitativa ya que nos da la magnitud de una diferencia. Por ejemplo si medimos la temperatura de tres das con la escala centigrada: 20 el lunes, 22 el ma rtes y 26 el mircoles, C C C

28

JAIME RAMIRO ALIAGA TOVAR podemos decir la magnitud o proporcin de las diferencias entre las temperaturas no siendo necesario para ello que conozcamos el punto cero de la temperatura. Ejemplos de variables en escala de intervalo es la temperatura medida por las escalas Centgrada y Fahrenheit y las unidades de medicin o puntajes estandarizados de los tests, entre otros, el CI, el eneatipo, el decatipo y el puntaje T. Sus propiedades formales son la relacin de equivalencia (=), orden (>) y de proporcin conocida entre diferencias. Es esta ltima propiedad la que hace a la escala de intervalos una escala verdaderamente cuantitativa, por lo que se pueden utilizar legtimamente las operaciones bsicas de suma, resta, multiplicacin y divisin. Por otro lado, en lo referente a trasformaciones admisibles, esta escala permanece invariante frente a cualquier transformacin lineal: y = a + bx, es decir se pueden elaborar una escala con las mismas propiedades de escalamiento equivalencia si se transforma linealmente la escala original. En la ecuacin, a y b son constantes arbitrarias, donde a es el valor de la nueva variable equivalente al cero de la original y b el nmero de unidades que aumenta o disminuye la nueva variable por cada unidad de medida de aumento o disminucin de la variable original; en tanto que x representa a los valores de la variable original e y significa los valores resultantes de la transformacin lineal. (Carro, 1997). Es mediante una transformacin de este tipo que las unidades de medicin o puntajes estandarizados pueden ser transformados en sus equivalentes, as, el CI puede ser transformado en un puntaje eneatipo, decatipo, puntaje T o viciversa. Estos puntajes tienen las siguientes medias aritmticas y desviaciones estndares: CI = X = 100, S = 15 ; eneatipo X = 5, S = 2, decatipo = X = 5.5, S = 2, T = X = 50, S = 10. Supongamos que queremos transformar el CI = 98 de un nio a los puntajes estndar eneatipo, decatipo y T. Las operaciones responden a la siguiente frmula:

Obsrvese que la expresin entre parntesis equivale al puntaje estndar z pues las unidades o puntuaciones estndar expresan la distancia del individuo a la 29

JAIME RAMIRO ALIAGA TOVAR media aritmtica en funcin de la desviacin estndar o tpica de la distribucin de puntajes originales de la variable, test o prueba. En esta frmula: X = puntaje del individuo en la unidad o puntaje estndar que se va a transformar, X = media aritmtica de la unidad o puntaje estndar que se va a transformar; S= desviacin estndar de la unidad o puntaje estndar que va a ser transformada; S= desviacin estndar de la unidad o puntaje estndar a la que se quiere realizar la transformacin; X , media aritmtica de la unidad o puntaje estndar a la que se va a efectuar la transformacin. En consecuencia, el CI = 98, es equivalente al eneatipo 4.73 o 5, el decatipo 5,23 o 5, y el puntaje T 48,67 o 49. Para lograr la medicin de variables psicolgicas en una escala de intervalo se recurre a: a) la suposicin de una distribucin normal de las puntuaciones de los individuos de la poblacin y, b) el uso de la variacin o variabilidad entre los individuos como una unidad de medida (Magnusson, 1987).

2.2.3.4 Escala de razn, proporcin o cociente. Esta escala es


la nica que cumple con las tres caractersticas de los nmeros reales, pues es una escala de intervalo con un cero racional o verdadero en lugar de un cero arbitrario que indica la ausencia del atributo, sin embargo si bien el punto cero es fijo la unidad de medida es arbitraria. Por ejemplo, las escalas de kilmetros y millas son equivalentes teniendo en comn el punto cero (ausencia de longitud o distancia), pero sus unidades de medida son arbitrarias. Aparte de las propiedades formales de las escalas de medida ordinal y de intervalo, posee la de proporcin conocida entre valores de la escala, esta propiedad hace que las mediciones sean isomrficas a la estructura aritmtica, por lo cual se pueden efectuar con estos nmeros todas las operaciones numricas, por ejemplo, adicin, sustraccin, divisin y multiplicacin (Nunally y Bernstein, 1995), as como entre las diferencias de los nmeros. Por otro lado, esta escala es invariante ante cualquier transformacin de la forma y = ax, donde y son los valores de la nueva escala de medida, x los valores de la escala original y a la constante multiplicativa propia de cada ecuacin de transformacin (Carro, 1997). Ejemplo, las equivalencias entre las escalas de temperatura Kelvin y Rankine, las que tiene un punto cero absoluto y difieren en sus unidades de medida. Otros ejemplos, son las longitudes, la densidad. En lo que refiere a variables psicolgicas, a pesar de haber interesado mucho la medida de rasgos psicolgicos en esta escala y haber habido intentos muy tempranos, por ejemplo los de Thurstone, en 1928, actualmente se considera que no hay las variables psicolgicas medidas en esta escala. No podemos concluir que una persona carece por completo, por ejemplo, de capacidad para resolver 30

JAIME RAMIRO ALIAGA TOVAR cierto tipo de problemas matemticos por el slo hecho de no haber podido contestar ninguno de los tems de un test que contiene este tipo de problemas.

2.3 Clasificacin de las variables segn el nivel o escala de medicin en las que han sido medidas.
El cuadro 3 resume las caractersticas bsicas de la relacin escala de medicin, tipo de variable. Cuadro 3. Relacin del nivel de medicin y el tipo de variable Escala/Nivel de medicin Nominal. El investigador conforma en la variable que estudia categoras excluyentes que no admiten orden entre ellas. Tipo de variable Cualitativa (si la propiedad se describe en forma cualitativa, no medible, pero si clasificable se denomina atributo). Ejemplos:Tipo de personalidad: extroverso, introverso); pas de nacimiento: Per, Rusia, Francia, Paraguay, etc; profesin: trabajador social, historiador, mdico, etc. Cualitativa o cuasicuantitativa. Ejemplo: nivel de inteligencia: Muy alto, alto, medio o normal, bajo muy bajo. Cuantitativa. Continuas (admiten en su rango de variacin nmeros decimales). Ejemplo: Puntuaciones escolares en escala vigesimal, talla, peso, ingresos econmicos. Discontinuas o discretas (slo admiten en su rango de variacin nmeros enteres o, mejor dicho, que varan de uno en uno). Ejemplos: nmero de hijos, nmero de camas en un hospital, nmero de cursos por alumno, nmero de ingresos a un hospital,

Ordinal. El investigador conforma en la variable que estudia categoras excluyentes, pero que admiten orden entre ellas. Intervalo. El investigador conforma en la variable categoras infinitas (No tiene punto 0 real). Razn. El investigador conforma en la variable categoras infinitas (Tienen un punto 0 real)

31

JAIME RAMIRO ALIAGA TOVAR

2.4 Puede una variable cuantitativa ser transformada en variable categrica?


Una variable cuantitativa puede ser transformada en una categrica, pero no sucede lo mismo a la inversa salvo un caso especial. Veamos los siguientes ejemplos: 1) Transformacin de variable cuantitativa a variable categrica: El nivel de conocimientos de un estudiante puede ser medido mediante una calificacin comprendida entre 0 y 20 (variable continua) o mediante una calificacin del tipo aprobado-desaprobado (categrica/atributo). 2) En un estudio del nmero de accidentes de trfico de un conductor en funcin de su emotividad, se distinguen dos variables. El nmero de accidentes es una variable cuantitativa discontinua (se pueden tener 0, 1, 2, 3,...etc., pero no 1.5) y la emotividad puede ser una variable cuantitativa si ha sido medida con un cuestionario que arroja puntuaciones estandarizadas o se asume que las puntuaciones directas, que propiamente son una escala ordinal, conforman una variable cuantitativa, o puede ser categrica/cualitativa si ha si como resultado de una entrevista es clasificado en: poco emotivo, emotivo, muy emotivo. 3) El caso especial se presenta nicamente con las variables categricas que tienen dos categoras. Por ejemplo, en una investigacin la variable Trabajo tiene dos categoras o modalidades Con trabajo y Sin trabajo. Esta variable es dicotmica o binaria y puede ser tratada como cuantitativa, pues se considera que las variables binarias (dicotmicas) forman escalas de intervalo (Nunally y Bernstein, 1995: 18). Por tanto, a la categora Con trabajo se le puede asignar el cdigo o nmero 1, y la categora Sin trabajo se le puede adjudica el cdigo o nmero 0, conformndose una dummy variable o variable ficticia (Briones, 1986: 236). A continuacin, se puede analizar la correlacin de esta variable cuantitativa con cualquier variable cuantitativa utilizando por ejemplo el coeficiente de correlacin de Pearson.

2.5 Regla fundamental


En la medida que sea posible se debe utilizar en investigacin variables cuantitativas porque aportan mayor cantidad de informacin. Por ejemplo, si a una investigadora le interesa estudiar el efecto del alcohol puede trabajar con cualquiera de las siguientes variables: a) Cualitativa ( 2 categoras ): abstemio /bebedor; b) Cualitativa ( 3 categoras ): abstemio/ bebedor; alcohlico; c) Cuantitativa discontinua: nmeros de copas bebidas por semana; d) Cuantitativas continua : gramos de alcohol ingeridos por semana. Sin embargo, la variable 32

JAIME RAMIRO ALIAGA TOVAR alcohol, en gramos por semana es la de mejor calidad pues en comparacin a las otras contiene el mximo de informacin (Domenech, 1981). Por ltimo, en el siguiente variable: cuadro sintetizamos con un ejemplo los tipos de

Cuadro 4. Valoracin de 3 tratamientos en 38 enfermos con isquemias coronarias


CUALITATIVA
IND SEXO TRATAMIENTO ASIGNADO

ORDINAL
JUICIO DEL PACIENTE

CUANTITATIVA DISCRETA
NUMEROS DE ATAQUES EL LTIMO DA

CUANTITATIVA CONTINUA
FRECUENCIA CARDIACA DISTANCIA CAMINADA EN METROS

1 2 3 . . . .38

V H V . . . V

C A B . . . B

Mucho mejor Igual Mejor . . . . Peor

1 2 3 . . . 2

72 82 84 . . . 74

185 120 136 . . . 173

Fuente: Domenech, (1981).

33

JAIME RAMIRO ALIAGA TOVAR

EJERCICIOS DE AUTOCOMPROBACIN II
Responda si las siguientes afirmaciones son verdaderas o falsas. AFIRMACIONES V 1. El tiempo que necesita para resolver este cuestionario es un ejemplo de variable cuantitativa discreta. 2. Los niveles o escalas de medicin tienen que ver con el hecho que los nmeros asignados a las cantidades de los atributos reflejan todas o algunas caractersticas de los nmeros reales. 3. La escala ordinal no nos dice nada acerca del tamao o tipo de diferencia existente entre los objetos 4. Para medir una propiedad o atributo debe existir una relacin isomrfica entre la cantidad del atributo y el nmero. 5. La escala de intervalos es la nica que cumple con las tres caractersticas de los nmeros reales. 6. Las variables cualitativas son aquellas que brindan mayor informacin en una investigacin. 7. En la escala nominal y ordinal, la nica relacin que hay es la de equivalencia 8. Los resultados de una prueba de la escala de inteligencia de Wechsler son ejemplo de variables continuas 9. Una variable categrica puede ser transformada en una cuantitativa en cualquier situacin. 10. Una variable puede ser cuantitativa y cualitativa al mismo tiempo Complete cada enunciado: F

ENUNCIADO 1. Una variable es un/una . de los individuos o unidades estadsticas. 2. Medir equivale a .. .. 3. Los niveles o escalas de medicin son: ..., ..., .. y . 4. La escala es utilizada cuando los datos observados se clasifican en diversas categoras en las que no se identifica ningn orden. 5. En la escala .. existe un cero absoluto, mientras que en la escala .. existe un cero relativo. 6. La es utilizada cuando los datos observados se clasifican en distintas categoras en las que se establece algn .. 7. Las variables ... pueden ser expresadas en escalas nominales o .. 34

JAIME RAMIRO ALIAGA TOVAR 8. Las variables .. pueden ser expresadas en escalas de intervalo o ..

En relacin al texto, elabore enunciados verdaderos en los que se incluyan los siguientes tres trminos: 1. Variable caracterstica valor Enunciado: 2. Medida asignar atributos Enunciado: 3. Origen orden distancia Enunciado: 4. Escala diferencias significativas cero absoluto Enunciado: 5. Investigador categoras excluyentes - orden Enunciado:

D. Argumente su respuesta a la siguiente pregunta: Por qu cree Ud. que en psicologa no se puede construir medidas en escala de razn? Respuesta:.. .......................................... :

Ejercicios por realizar


1) Indique la escala de medicin y el tipo de variable de lo siguiente: a) El nmero de aviones de un pas b) Universitarios matriculados en la Facultad de psicologa los aos 2006 a 2010. c) Pacientes neurticos y no neurticos atendidos en una clnica psicolgica. d) Tiempo que toma el desplazarse del domicilio al centro de trabajo. e) Nmero de alumnos asistentes a las clases de Historia del Per f) Tiempo de uso de la computadora a la semana g) Nota obtenida en un examen h) Nacionalidad de una persona i) Pulsaciones por minuto del corazn j) Nmero de granos de arena en una playa k) Nmero de celular l) Nmero de autos vendidos en una tienda en un da m) Nmero de bytes que puede almacenar un USB

35

JAIME RAMIRO ALIAGA TOVAR


n) El peso de una bolsa de azcar o) El nivel de colesterol de un producto

2) En un estudio se quiere determinar el porcentaje de personas favorables a la devolucin de los pagos del FONABI, agrupados por edad. Quin es la unidad experimental?, cules son las variables? Respuestas a la seccin A: 1) F; 2) F; 3) V; 4) V; 5) F; 6) F; 7) V; 8) V; 9) F; 10) F

Para saber ms: Sitios Web de referencia


http://aprendeenlinea.udea.edu.co/lms/moodle/file.php/481/Escala_medicio_intern et.pdf http://www.eumed.net/libros/2006c/203/1v.htm http://www.slideshare.net/byrong/escalas-de-medicin-en-estadstica http://www.spssfree.com/spss/analisis4.html http://bioestadistico.com/index.php?option=com_content&view=article&id=84&Item id=65

Referencias bibliogrficas
Babbie, E. (2000). Fundamentos de la investigacin social. Mxico: Thomson. Buenda, l., Colas, P., Hernndez, F. (1998): Mtodos de investigacin en Psicopedagoga. Madrid: McGraw-Hill. Briones, G. (1986). Mtodos y tcnicas de investigacin en las ciencias sociales. Trillas: Mxico. Carro, J. (1994). Psicoestadstica descriptiva. Salamanca: Amaru. Cortada, N. (1968). Manual para la construccin de tests objetivos de rendimiento. Buenos Aires: Paids Domenech, J. (1981). Una sntesis de los mtodos estadsticos en medicina. Barcelona: Herder. Magnusson, D. (1987). Teora de los tests. Mxico: Trillas. Nunally, J. y Bernstein, I. (1995). Teora psicomtrica. Mxico: McGrawHill. Siegel, S., Castelln, N.J. (1995). Estadstica no paramtrica aplicada a las Ciencias de la conducta. Mxico: Trillas.

36

JAIME RAMIRO ALIAGA TOVAR

Leccin 3 Estadsticos y representaciones grficas de datos cualitativos, cuasicuantitativos y cuantitativos


Finalizada una investigacin es necesario presentar a la comunidad cientfica o no los resultados cuantificables del estudio. La claridad es un requisito necesario de satisfacer para la mejor comprensin e interpretacin de los mismos.

3.1 Estadsticos y representaciones grficas de datos cualitativos. 3.1.1 Estadsticos.


Los datos cualitativos se generan cuando el investigador ha empleado una escala de tipo nominal o clasificatorio. En el anlisis estadstico descriptivos de estos datos se pueden emplear frecuencias absolutas, frecuencias relativas y porcentajes.

Como ya sabemos, la operacin permisible en este tipo de escala es el conteo de las oportunidades que aparece cada una de las modalidades o categoras de la variable. Al conteo as realizado se le denomina frecuencia absoluta (f). Por otro lado, la frecuencia relativa o proporcin (fr) es la razn entre la frecuencia absoluta y el nmero de individuos de la muestra que se denota por la letra n. (fr = f/n). El porcentaje (P) es el tanto por cien correspondiente a cada una de las modalidades de la variable. En su obtencin, se divide la frecuencia absoluta (f) entre el nmero de individuos (n) y el resultado se multiplica por 100. (P = (f/n) 100). En la tabla 1 se muestra la distribucin de frecuencias donde se indican las frecuencias absolutas, frecuencias relativas y porcentajes de cada una de las modalidades o categoras de la variable sexo en una investigacin realizada en 1564 sujetos.

37

JAIME RAMIRO ALIAGA TOVAR

Tabla 1. Frecuencia absoluta femenino masculino Total 805 759 1564

Sexo Frecuencia relativa 0,515 0,485 1,0

Porcentaje 51,5 48,5. 100,00

Se observa que la suma de las frecuencias absolutas es igual al nmero de elementos, y la suma de las frecuencias relativa, igual a la unidad.

3.1.2 Representaciones grficas.

Los datos cualitativos se representan usualmente de una manera grfica empleando los diagramas de barras y los grficos de sectores. Las figuras 1 muestra el diagrama de barras de la variable estado civil; las figuras 2 y 3 presentan el diagrama de barras y el grfico de sectores (torta) de la variable sexo.

Figura 1. Estado civil

38

JAIME RAMIRO ALIAGA TOVAR

En la elaboracin manual de un grfico de sectores basta multiplicar frecuencias relativas (fr) por 360 y traspasar esas medidas al crculo

las

39

JAIME RAMIRO ALIAGA TOVAR

3.2 Estadsticos y representaciones grficas de datos cuasicuantitativos. 3.2.1 Estadsticos. Los datos cuasicuantitativos se producen cuando
la medida se ha hecho en una escala ordinal o de rango, por lo que adquieren algunas de las propiedades de los datos generados por las escalas cuantitativas (Carro, 1994). De manera semejante a la organizacin de los datos cualitativos, los datos cuasicuantitativos tambin se organizan en una distribucin de frecuencias de acuerdo con su pertenencia o no a cada una de las categoras o modalidades de la variable, pero, adems, estas se ordenan de acuerdo con la mayor o menor posesin del atributo evaluado. Aparte de los estadsticos para datos nominales, pueden utilizarse las frecuencias absolutas acumuladas (fa) , las frecuencias o proporciones relativas acumuladas (fra) y los porcentajes acumulados.(Pa). Estos estadsticos indican el nmero de casos que hay en cierta categora o modalidad o categora de la variable y las anteriores o inferiores, en el caso de las frecuencias, o el porcentaje de casos en una categora o modalidad, en el caso de los porcentajes. . En la tabla 2 se muestran adems de las frecuencias absolutas, frecuencias relativas y porcentajes, las frecuencias absolutas acumuladas (fa), las frecuencias absolutas relativas acumuladas (fr a) y los porcentajes acumulados (Pa) correspondientes a cada una de las modalidades o categoras de la variable sexo en el estudio efectuado en una muestra de 1564 individuos.
Tabla 2. Sexo Frecuencia absoluta acumulada 805 1564 Frecuencia relativa acumulada 0,515 1,00 Porcentaje acumulado 51,5 100,00

femenino masculino Total

Frecuencia absoluta 805 759 1564

Frecuencia relativa 0,515 0,485 1,0

Porcentaje 51,5 48,5. 100,00

40

JAIME RAMIRO ALIAGA TOVAR

3.2.2

Adems de las grficas para datos cualitativos, pueden emplearse los histogramas acumulados para frecuencias, proporciones o porcentajes.

Representaciones grficas.

3.3 Estadsticos y representaciones grficas de datos cuantitativos. 3.3.1


Los datos cuantitativos son el resultado de la medicin de variables en escala de intervalos o de razn, las que como ya hemos visto (Leccin 2) tienen propiedades matemticas mejores que la escala ordinal y, por supuesto, que la escala nominal. La obtencin de los estadsticos apropiados para estos datos requieren previamente que estos se organicen en la distribucin de frecuencias, compuesta de intervalos y las frecuencias correspondientes a cada uno de ellos. 41

Estadsticos.

JAIME RAMIRO ALIAGA TOVAR Estas distribuciones se agrupan en dos tipos: a) de datos no agrupados, (intervalo con amplitud igual a 1); y, b) de datos agrupados (intervalo con amplitud mayor a 1).

3.3.1.1 Distribucin de datos no agrupados.


Solo en el primer caso se conoce con exactitud despus de realizado el conteo el nmero de veces que ocurre cada una de las modalidades o categoras; en el segundo, esto es imposible pero si se conoce el nmero de casos o veces en cada una de las modalidades o intervalos. Un ejemplo de datos cuantitativos no agrupados se tiene en la tabla 3 donde se presenta la distribucin de frecuencias de las puntuaciones, modalidades o intervalos, de 140 sujetos en un test de razonamiento verbal en el que se ha tenido de puntacin mxima 30 puntos y de mnima, 20 puntos. Tabla 3. Test de razonamiento verbal X 30 29 28 27 26 25 24 23 22 21 20 f 4 12 14 19 25 18 13 11 7 4 3

Es conveniente tener presente, que los intervalos, modalidades o categoras de la variable X son de amplitud 1 y conforman una variable cuantitativa continua atendiendo a sus lmites matemticos inferior y superior. Por ejemplo, el intervalo X = 25 empieza en 24,5 y finaliza en 25,5, el intervalo X = 26 comienza en 25,5 y finaliza en 26,5.

3.3.1.2 Distribucin de datos agrupados.


Por otro lado, elaborar una distribucin de frecuencias de datos cuantitativos agrupados requiere, antes que nada, recoger los datos en la muestra estudiada. Por ejemplo, se ha aplicado una prueba de inteligencia colectiva a 108 sujetos varones de 21 aos. Los puntajes directos logrados por los individuos son los siguientes: 42

JAIME RAMIRO ALIAGA TOVAR Tabla 4. Puntuaciones de un test de inteligencia 185 187 164 165 168 176 182 180 190 178 174 168 160* 181 172 161 182 183 185 185 174 176 179 191** 176 180 181 183 179 174 173 168 172 161 172 177 175 161 176 178 166 172 176 178 184 188 173 184 166 163 175 171 174 170 168 165 163 160 176 182 191 172 169 172 167 172 175 178 176 170 171 189 177 184 168 174 169 171 179 182 187 173 164 185 164 179 171 172 170 168 164 161 167 163 168 176 171 188 171 172 180 167 162 168 170 171 170 187

3.3.1.2.1 Elaboracin de la distribucin de frecuencias agrupadas.


1) Eleccin del nmero de intervalos. Los datos mostrados estn desordenados y es preciso agruparlos en grupos de caractersticas similares. En nuestro caso, se agruparn por puntuaciones prximas. Esto se logra mediante el agrupamiento en intervalos de clase. Existen varios procedimientos que ayudan a precisar el nmero de intervalos, modalidades, categoras de respuesta, necesarios En la prctica profesional se admite que el nmero de grupos de intervalos de clase debe estar entre 10 y 20 grupos, aunque para mayor comodidad se limitar el nmero entre 10 y 15 grupos ya que si hay ms de 15 grupos se dificulta la comprensin y se aumenta el trabajo sin ninguna ventaja. Cuando hay menos de 10 grupos (para 108 datos como en nuestro ejemplo) se aumenta el error. El nmero de intervalos aconsejable para una representacin grfica de la distribucin de frecuencias, atendiendo al nmero de puntuaciones o datos es el siguiente: De 1 intervalos. 10 15 21 31 51 71 Ms a a a a a a a de 10 14 20 30 50 70 90 90 datos:: : : : : : : : 43 No interesa el tratamiento por

4 intervalos 5 intervalos 6 intervalos 7 intervalos 8 intervalos 9 intervalos Dividir el nmero por 10 15.

JAIME RAMIRO ALIAGA TOVAR

2) Preparacin de un cuadro de distribuciones. Para la elaboracin de dicho cuadro se efectan los siguientes pasos: a) Valores extremos de la distribucin. Se busca por inspeccin los valores extremos de la variable y se subrayan estos valores. En el ejemplo, el extremo superior = 191 (**); y, el extremo inferior = 160 (*). b) Determinacin del rango o amplitud total. Para el efecto se resta del extremo superior el extremo inferior, logrndose la amplitud total, rango o recorrido de una distribucin: Amplitud total: 191 160 = 31

c) Determinacin del valor o amplitud de intervalo (i). Los intervalos deben tener la misma amplitud en todas las clases de la distribucin. Para obtenerlo, procedemos a dividir el rango entre el nmero de clases ms apropiada para el nmero de datos obtenido. En nuestro caso al ser el nmero de datos 108, dividiremos el rango entre 10 15. Al dividir la amplitud total entre 10 = 3.1; al dividir la misma amplitud entre 15 = 2.06 . Cul amplitud de intervalo escoger? El intervalo con un nmero impar de unidades es preferible al de nmero par porque su punto medio es un nmero entero y no una fraccin, sin embargo, no hay ninguna regla que determine rgidamente la amplitud o el valor del intervalo. d) (1) X Intervalos 190-192 187-189 184-186 181-183 178-180 175-177 172-174 169-171 166-168 163-165 160-162 N = 108 Tabla 5. Distribucin de frecuencias. (2) Xm Punto medio 191 188 185 182 179 176 173 170 167 164 161 (3) Recuento /// ///// / ///// // ///// //// ///// ///// ///// ///// /// ///// ///// ///// // ///// ///// //// ///// ///// /// ///// //// ///// // (4) f Frecuencia 3 6 7 9 10 13 17 14 13 9 7

Explicacin de la tabla 5.

44

JAIME RAMIRO ALIAGA TOVAR Columna (1) X.- Ordenacin de los intervalos. Para determinar los extremos del intervalo inferior se toma la puntuacin inferior y se le suma el valor del intervalo disminuido en 1. En el ejemplo, el extremo inferior del intervalo: 160 + (3 1) = 160 + 2 = 162 .Este intervalo comprende las puntuaciones 160, 161 y 162. En consecuencia, el extremo inferior del intervalo = 160; y el extremo superior del intervalo = 162. La formacin de los siguientes intervalos no ofrece ninguna dificultad si se suma al extremo inferior la amplitud del mismo; 160 + 3 = 163, que se constituye en el extremo inferior del siguiente intervalo. As llegamos hasta el ltimo intervalo que contiene la mxima puntuacin de la serie. (En el ejemplo = 191). Los intervalos se colocan en orden descendente ascendente comenzando por abajo y en nuestro ejemplo son: 160 162, 163 165, . . . . . . . . . . . . . . . . . . . . . . . . . . . . , 190 192. Columna (2) Xm.- Punto medio de los intervalos. Para calcular el punto medio de un intervalo cualquiera se calcula la media entre los extremos inferior y superior. En nuestro ejemplo, para el intervalo 178 180: (178 + 180) = 179 2 La columna (2) es el reflejo los puntos medios de cada intervalo. Columna (3) F. Recuento de frecuencias. El recuento se registra mediante palotes y frecuencias (f). Cada dato debe colocarse en el intervalo en el que est incluido. Se representa por un trazo vertical (palote). Hecho el recuento de trazos su valor se coloca debajo de la columna (f) que nos da el nmero de datos que est contenido en cada intervalo o la que es lo mismo el valor de la frecuencia de cada intervalo. La suma de todas las frecuencias debe ser igual al nmero de N (nmero de datos). En nuestro ejemplo N = 108. Al construir una distribucin de frecuencias por intervalos, hay que tener en cuenta, adems de los pasos anteriores, lo siguiente: a) Se debe mantener constante la amplitud del intervalo (en nuestro ejemplo: i = 3); b) los lmites de cada intervalo no son los extremos considerados, por ejemplo, 160 - 162, en el primer intervalo, pues los los lmites matemticamente no son nmeros enteros ya que no formaran una escala continua. Por eso se consideran como lmites inferior y superior de cada intervalo a los extremos aumentados en 0.5. un ejemplo: En el intervalo 160 - 162 se han considerado dichos valores como extremos pero si se quieren expresar los lmites, habra que escribir 159.5-162.5, con lo que quedaran los lmites de la siguiente forma: 169-171 (168.5-171.5); 166-168 45 Xm =

JAIME RAMIRO ALIAGA TOVAR (165.5-168.5); 163 - 165 (162.5 165.5); 160 162 (159.5-162-5). Con este artificio se consigue que una escala de intervalos sea continua porque el lmite superior coincide con el inferior del intervalo siguiente. Esto habr que tenerlo en cuenta cuando se hagan representaciones grficas.(Escotet,1985).

En el empleo de grficas para datos cuantitativos, las ms usuales son el histograma y el polgono de frecuencias. El histograma de los datos del ejemplo es el que sigue: Figura 5. Distribucin de frecuencias

3.3.2 Representaciones grficas.

F
6
10 12 12

10

4
6 6 5

8 7 6 5

4 3 3 3

0 160,00 170,00 180,00 190,00 200,00

Inteligencia

46

JAIME RAMIRO ALIAGA TOVAR

EJERCICIOS DE AUTOCOMPROBACIN III


Responda si las siguientes afirmaciones son verdaderas o falsas. AFIRMACIONES V 1. La frecuencia relativa de una clase se obtiene dividiendo la frecuencia de la clase entre el nmero de alumnos que conforman dicha clase. 2. Una distribucin de frecuencias relativas es un resumen, expresado en un cuadro, que muestra la frecuencia porcentual de cada clase. 3. La frecuencia porcentual de una clase se obtiene de la multiplicacin de la frecuencia relativa por 100. 4. La suma de las frecuencias absolutas, en algunos casos, no resulta ser igual al nmero de elementos. 5. Los grficos de barra se usan para representar datos cualitativos que se han resumido en una distribucin de frecuencias, frecuencias relativas o frecuencias porcentuales. 6. La frecuencia acumulada absoluta F de una clase es la cantidad de elementos que pertenecen hasta esa clase. 7. La frecuencia acumulada relativa H de una clase es la proporcin de elementos que pertenecen hasta esa clase multiplicada por 100. 8. Los histogramas son una clase de grfico que se utilizan para representar frecuencias acumuladas, proporciones o porcentajes. 9. El ancho de clase vara para todas las clases en un rango de 0.5 a 1 10. Para determinar los extremos del intervalo inferior se toma la puntuacin inferior y luego se le suma el valor del intervalo. Complete cada enunciado: ENUNCIADO 1. La de una clase es la frecuencia acumulada relativa multiplicada por 100. 2. Los datos cuasicuantitativos se producen cuando . 3. El ancho de cada clase es . . 4. se calcula restando el extremo superior y el extremo inferior. 5. El nmero de intervalos aconsejable entre 1 y 10 datos es . 6. Para la elaboracin de un cuadro de distribuciones se sigue los siguientes pasos: 1) ., 2).., 3) .., y 4) .. 7. Para hallar el punto medio de un intervalo cualquiera se calcula .. 47 F

JAIME RAMIRO ALIAGA TOVAR entre los extremos inferior y superior. 8. Al construir una distribucin de frecuencias, .. se debe mantener constante.

En relacin al texto, elabore enunciados verdaderos en los que se incluyan los siguientes tres trminos: 1. Datos cualitativos grficos barras Enunciado: 2. Tabla frecuencias porcentajes Enunciado: 3. Datos cualitativos grficos histogramas Enunciado: 4. Rango extremo superior extremo inferior Enunciado: 5. Amplitud rango nmero de clases Enunciado:

D. Argumente su respuesta a la siguiente pregunta: Por qu cree Ud. que son necesarias las representaciones grficas? Respuesta:.. .......................................... :

Ejercicios por realizar


Actividad: Empleando Excel elabore las representaciones grficas ms adecuadas para los datos de las tablas 3 y 4.

Respuestas a la seccin A: 1) V; 2) F; 3) V; 4) F; 5) V; 6) V; 7) F; 8) V; 9) F; 10) F.

48

JAIME RAMIRO ALIAGA TOVAR

Para saber ms: Sitios Web de referencia


http://www.fisterra.com/mbe/investiga/graficos/graficos.asp http://www.hiru.com/matematicas/representacion-grafica-de-datos-estadisticos http://www.bioestadistica.uma.es/libro/node8.htm http://www.uaq.mx/matematicas/estadisticas/xu3.html

Referencias bibliogrficas
Carro, J. (1994). Psicoestadstica descriptiva. Salamanca: Amaru. Clark-Carter, D. (2002). Investigacin cuantitativa en Psicologa. Mxico: Oxford. Escotet, M. A. (1985). Estadstica Psicoeducativa. Mxico. Trillas.

49

JAIME RAMIRO ALIAGA TOVAR

Segunda

UNIDAD
Estadsticos descriptivos, Distribucin normal, Muestreo, Prueba de hiptesis

50

JAIME RAMIRO ALIAGA TOVAR

Leccin 4 Medidas de tendencia central y de dispersin


4.1. Medidas de tenencia central
Habindose elaborado la distribucin de frecuencias, lo que generalmente sigue es calcular una medida de tendencia central que es un promedio que representa todas las puntuaciones logradas por la muestra brindando una descripcin concisa del rendimiento en su totalidad. Este promedio hace posible comparar dos o ms grupos en trminos de rendimiento tpico, caracterstico. Las medidas de tendencia mediana y el modo. central ms usadas son la media aritmtica, la

4.1.1. Media aritmtica.

Es aplicable solamente a datos cuantitativos. La media aritmtica de n nmeros es el cociente de dividir entre n la suma de esos nmeros.

4.1.1.1 Media aritmtica de datos no agrupados.


Ejemplo: En ocho controles mensuales, un alumno logro las calificaciones 12, 14, 8, 10, 12, 8, 6 y 14 en la asignatura de Historia del Per. La media aritmtica ser:

Por tanto, la frmula de la media aritmtica para datos no agrupados es la siguiente:

51

JAIME RAMIRO ALIAGA TOVAR

4.1.1.2 Media aritmtica de datos agrupados.


Cuando los datos se presentan agrupados, la obtencin de la media aritmtica se logra empleando la siguiente frmula:

Donde: f. = Frecuencia Xm = punto medio de clases e intervalos N = nmero de datos

Tabla 6 (1) X 30 34 25 29 20 24 15 19 10 14 59 (2) Xm 32 27 22 17 12 7 (3) f 3 2 6 4 3 2 20 (4) fa 20 17 15 9 5 2 (5) f. Xm 96 54 132 68 36 14 400

Aplicando la frmula:

4.1.1.

Es el elemento que ocupa el lugar central en una serie de puntuaciones estadstica. Tambin se le define como el valor correspondiente al percentil 50, Vale decir, es aquella puntuacin por encima de la cual se encuentra la mitad de las puntuaciones y por debajo, la otra mitad.

Mediana.

En el proceso de su clculo se encuentran dos casos: mediana de datos no agrupados y mediana de datos agrupados. 52

JAIME RAMIRO ALIAGA TOVAR

4.1.1.1 Mediana de datos no agrupados. En su clculo


hay dos casos: cuando N es impar y cuando N es par. 1) Cuando N es impar. Sea las siguientes edades cronolgicas: 9, 12, 10, 11, 14, 13, 9. Al ordenarlas por su magnitud, se tiene que: 9 9 10 (11) 12 13 14

El valor de la mediana es 11 pues es el puntaje que se encuentra en el centro de la serie. 2) Cuando N es par. El valor de la mediana es la semisuma de los dos puntajes centrales de la serie de nmeros: 11.5 11 12

10

13

14

La mediana es 11.5, que es el resultado de sumar 11 + 12 y dividir entre 2. Una frmula para hallar la Md de datos no agrupados es:

4.1.1.2 Mediana de datos agrupados.

1 = lmite inferior / exacto de la fm clase modal N = total de frecuencias fa = frecuencia acumulada del Intervalo que precede al de la clase modal fm = frecuencia modal i = intervalo (amplitud) Siguiendo con el ejemplo de la distribucin, la mediana es:

53

JAIME RAMIRO ALIAGA TOVAR Los pasos seguir para calcular la Md en una distribucin de frecuencias son: 1) Hallar N/2, o sea la mitad de los casos de la distribucin 2) Empezar en el extremo de puntajes bajos de la distribucin y sumar los puntajes por orden hasta el lmite inferior exacto (1) del intervalo que contiene la mediana. La suma de esos puntajes es fa. 3) Calcular la cantidad de puntajes necesarios para llenar N/2, o sea calcular N/2 - Fa. Dividir esa cantidad por la frecuencia correspondiente al intervalo que contiene la mediana (fm) y multiplicar el resultado por la magnitud del intervalo de clase (i). 4) Sumar la cantidad contenida por el clculo de (3) el lmite inferior exacto (1) del intervalo que contiene la Md. Este procedimiento dar la mediana de la distribucin (Garret, 1974).

4.1.1.3 Modo (Mo)


Modo o Moda es el elemento al que corresponde mayor frecuencia. Es la tendencia dominante. Hay dos clases de modos: modo directo o emprico y modo corregido o aproximado.

4.1.1.3.1 Modo directo o emprico.

Es el punto medio del intervalo de clase que tenga ms frecuencias. As en nuestro ejemplo. el intervalo o clase modal es 20 - 24 y el modo directo es 22.

4.1.1.3.2 Modo corregido o aproximado.


Podemos obtener una aproximacin a travs de la siguiente frmula:

Md = Mediana X = Media aritmtica En el mismo ejemplo

54

JAIME RAMIRO ALIAGA TOVAR

4.1.1.4 Cuando aplicar las distintas medidas de tendencia central 1. Usar la media aritmtica.
a) b) Cuando los puntajes estn distribuidos simtricamente siguiendo forma de campana de Gauss o distribucin normal). La media es el centro Cuando se desea la medida de tendencia central que tenga la mayor estabilidad. La media es ms estable que Md o Mo. Cuando haya que calcular ms tarde, otros estadsticos como la desviacin estndar o el coeficiente de correlacin. Muchos estadsticos estn basados en la media.

c)

2. Usar la mediana.
a) Cuando se desea el punto medio exacto de la distribucin, el punto correspondiente al 50 %. b) Cuando existen puntajes extremos que afectaran marcadamente la media. Los puntajes extremos no afectan la mediana ( como s afectan a la media).

3. Usar el modo.
a) Cuando todo lo que se desea es una medida de tendencia central rpida y aproximada. b) Cuando la medida de tendencia central fuese el valor ms tpico.

4.2 Medidas de variabilidad o dispersin


El clculo de las medidas de tendencia central nos brinda una idea de la poblacin o muestra en referencia a su rendimiento promedio; sin embargo esta informacin es insuficiente porque es una distribucin de puntuaciones no slo se observa una tendencia central sino que tambin se ve hay puntajes que se alejan o se acercan al promedio, es decir se encuentra una variabilidad o dispersin ya que hay una diferencia entre un valor individual y otro de tendencia central. Las medidas de variabilidad que veremos sern la amplitud total o rango, la desviacin semiintercuartilar y la desviacin estndar.

55

JAIME RAMIRO ALIAGA TOVAR

4.2.1 Amplitud total o rango (recorrido)


Es la medida de variabilidad ms sencilla pero menos exacta. Se le define como la diferencia entre la puntuacin mayor y la menor de una distribucin de puntajes.

4.12 Desviacin semiintercuartilar


En toda distribucin hay tres cuartiles (Q1, Q2, Q3) que la divide en cuatro partes. La distancia entre el primer y el tercer cuartel (Q3 - Q1) se llama amplitud intercuartilar. Por tanto, desviacin semiintercuartilar (Q) es igual a la mitad de la distancia entre el primero y el tercer cuartil.

Calcular la amplitud semintercuartilar de la distribucin de puntajes del ejemplo:

56

JAIME RAMIRO ALIAGA TOVAR

4.1.3 Desviacin estndar o tpica


La desviacin estndar o tpica es la medida de dispersin resultante de dividir la suma de las diferencias de los cuadrados de cada medida de la media aritmtica por el nmero total de elementos o medidas y extraerles su raz cuadrada. Se denomina tambin desviacin tipo, patrn y desviacin media cuadrtica. Por otro lado, es de recordar que el valor de la desviacin estndar elevado al cuadrado se constituye en la varianza; a la inversa, la raz cuadrada de la varianza brinda el valor de la desviacin estndar.

4.1.3.1 Desviacin estndar para datos no agrupados.


a) Desviacin estndar poblacional

b) Desviacin estndar muestral

Procedimiento: a) Calcular la media aritmtica de la distribucin. b) Calcular las desviaciones de cada puntaje con respecto a esa media aritmtica. c) Elevar tales desviaciones al cuadrado. d) Sumar las desviaciones al cuadrado. e) Dividir esa suma entre el nmero de casos (N) f) Extraer la raz cuadrada de ese cociente. Ejemplo: Calcular la desviacin estndar (S) de los calificativos que un alumno recibi en el curso de Tcnicas bivariadas de anlisis: 10, 10, 8, 10, 10, 12, 10, 10

57

JAIME RAMIRO ALIAGA TOVAR Tabla 7 X 10 10 8 10 10 12 10 10 x = 80 (X - ) (10 -10) = 0 (10 10) = 0 (8-10) = -2 (10-10)=0 (10-10)=0 (12-10)=2 (10-10)= 0 (10-10) = 0 (X - )2 0 0 4 0 0 4 0 0 (X - )2 = 8

4.1.3.2 Desviacin agrupados.


Frmula:

estndar

para

datos

58

JAIME RAMIRO ALIAGA TOVAR

Ejemplo: calcular la desviacin estndar de la siguiente distribucin de puntajes: Tabla 8 (1) X 50-54 45-49 40-44 35-39 30-34 25-29 20-24 15-19 10-14 5-9 0-4 i=5 (2) (3) pm f 52 1 47 3 42 6 37 18 32 19 27 24 22 12 17 9 12 5 7 2 2 1 N = 100 (4) (5) f.pm X 52 23.40 141 18.40 252 13.40 666 8.40 608 3.40 648 -1.60 264 -6.60 153 -11.6 60 -16.6 14 -21.6 2 -26.6 = f.pm 2860 (6) x2 547.56 338.56 179.56 70.56 11.56 2.56 43.56 134.56 275.56 466.56 707.56 x2= 368 (7) f.x2 547.56 1015.68 1077.36 1270.08 219.64 61.44 522.72 1211.04 1377.8 933.12 707.56 f.x2 =8944

= 9,45

= 28,60

4.1.1.6 Cuando se aplican las distintas medidas de variabilidad.


Usar el rango o amplitud total cuando: a) Los datos son demasiado escasos o demasiado dispersos como para justificar el clculo de una medida de variabilidad ms precisa. b) Todo lo que se desea es conocer los puntajes extremos o la dispersin total. Usar la Q: a) La mediana es la medida de tendencia central. b) Hay puntajes dispersos o extremos que influirn de una manera desproporcionada en la desviacin estndar. 59

JAIME RAMIRO ALIAGA TOVAR c) Lo que interesa en primer lugar es la concentracin alrededor de la media (el 50 % central de los casos) Usar la desviacin estndar: a) Cuando se busca el estadstico de dispersin que tenga la mayor estabilidad. b) Cuando desviaciones extremas ejerceran un efecto proporcionalmente mayor sobre la variabilidad. c) Cuando posteriormente deben calcularse coeficientes de correlacin y otros estadsticos ms avanzados. (Escotet, 1985)

60

JAIME RAMIRO ALIAGA TOVAR

EJERCICIOS DE AUTOCOMPROBACIN IV
Responda si las siguientes afirmaciones son verdaderas o falsas. AFIRMACIONES V 1. Las medidas de tendencia central ms usadas son la media aritmtica, la mediana, y el modo. 2. La media aritmtica es solamente aplicable a datos cualitativos. 3. La mediana es reconocida tambin como el valor que corresponde al percentil 50. 4. La medida de variabilidad ms sencilla pero menos exacta es la desviacin semiintercuartilar. 5. Modo es la tendencia no dominante y que corresponde al valor de menor frecuencia. 6. Utilizamos la media aritmtica cuando los puntajes estn distribuidos asimtricamente siguiendo la forma de la campana de Gauss. 7. La amplitud total o rango es la medida de variabilidad ms sencilla pero a la vez menos exacta. 8. En la distribucin de puntuaciones hay tres cuartiles (Q1, Q2, Q3) que la dividen en cuatro partes. 9. Se utiliza el rango o amplitud total cuando la mediana es la medida de tendencia central. 10. La desviacin estndar se utiliza cuando las desviaciones extremas ejerceran un efecto proporcionalmente menor sobre la variabilidad. F

B. Complete cada enunciado: ENUNCIADO 1) .es el cociente de dividir entre n la suma de esos nmeros 2) Son las medidas de tendencia central ms utilizadas:. , ..,., 3) Es aquella puntuacin por encima de la cual se encuentra la mitad de las puntuaciones y por debajo la otra mitad.. 4) ..es la tendencia dominante y es el elemento al que corresponde mayor frecuencia. 5) Las medidas de variabilidad ms empleadas son las siguientes:

61

JAIME RAMIRO ALIAGA TOVAR C. En relacin al texto, elabore enunciados verdaderos en los que se incluyan los siguientes tres trminos: 1. Media mediana modo Enunciado: 2. Estable media - modo Enunciado: 3. Media datos cualitativos clculo Enunciado: 4. Datos cualitativos grficos histogramas Enunciado: 5. Amplitud rango nmero de clases Enunciado: D. Argumente su respuesta a la siguiente pregunta: En qu casos la mediana sera la mejor medida de tendencia central en comparacin con la media aritmtica? Respuesta:.. .......................................... :

Ejercicios por realizar


1) Con los datos presentados en la Tabla 4 (n = 108 datos), realice lo siguiente: a) Calcule la media aritmtica, la mediana y el modo b) Calcule la desviacin estndar, la varianza, la desviacin media, y los cuartiles Q1, Q2 y Q3. 2) Haga un comentario acerca de las similitudes o diferencias entre los resultados de la media aritmtica y la mediana. Respuestas a la seccin A: 1) V; 2) F; 3) V; 4) F; 5) F; 6) F; 7) V; 8) V; 9) F; 10) F.

Para saber ms: Sitios Web de referencia


http://www.vitutor.com/estadistica/descriptiva/a_10.html http://eumed.net/cursecon/dic/oc/mediaritm.htm http://www.disfrutalasmatematicas.com/datos/desviacion-estandar.html http://www.spssfree.com/spss/analisis2.html

62

JAIME RAMIRO ALIAGA TOVAR

Referencias bibliogrficas
Clark-Carter, D. (2002). Investigacin cuantitativa en Psicologa. Mxico: Oxford. Escotet, M. A. (1985). Estadstica Psicoeducativa. Mxico. Trillas. Garret, H. (1974). Estadstica en psicologa y educacin. Buenos Aires: Paids.

63

JAIME RAMIRO ALIAGA TOVAR

Leccin V Distribucin normal


5.1 La Distribucin normal.
La mayor parte de fenmenos psicolgicos, educativos y biolgicos siguen aproximadamente esta ley. Siempre que la medida de una cierta variable sea el resultado de una multiplicidad de factores independientes, que suman sus efectos para dar esta medida, la ley de probabilidad de esta medida tiende a ser una ley normal (Domenech, 1981). Es una distribucin terica de probabilidad que se utiliza como modelo descriptivo de muchas distribuciones empricas de tipo biolgico, psicomtrico, etc. Por su forma acampanada tambin se le conoce como campana de Gauss y ha sido ha sido definida tericamente a partir de la teora de la probabilidad y tiene por nombre ley normal o de Laplace-Gauss.

5.1.1 Definicin. Es la curva de frecuencia cuya altura en cualquier


punto es inversamente proporcional al antilogaritmo de la mitad del cuadrado de la distancia de tal punto a la media, medida en unidades de desviacin estndar. Una definicin ms simple es: Es una curva con forma de campana, simtrica y asinttica, es decir que se acerca pero no toca el eje de abcisas. Los dos parmetros de la distribucin normal son la media aritmtica y la desviacin estndar.

5.1.2 La distribucin normal estndar o reducida. La distribucin normal es un tipo particular de distribucin
continua de probabilidad. Engloba a todo un conjunto de distribuciones que tienen en comn una serie de caractersticas que las diferencian de las restantes distribuciones continuas de probabilidad. La distribucin ms importante es la distribucin normal estndar o reducida, cuyo carcter diferencial viene dado por el hecho de que su media es igual a cero y la desviacin tpica o estndar es igual a 1 por lo que esta distribucin se corresponde exactamente con la distribucin normal de las puntuaciones tpicas z (zeta), cuya frmula y uno de sus usos vimos en la leccin 2.

64

JAIME RAMIRO ALIAGA TOVAR

5.1.2.1 Propiedades. a) La curva normal es una distribucin de probabilidad, por tanto, el rea bajo la
curva es igual a la unidad y la probabilidad de que un valor est entre los puntos a y b es igual al rea bajo la curva normal comprendido entre los puntos a y b (ver figura 6). Figura 6

b) La curva es asinttica: se extiende indefinidamente en las dos direcciones del continuo de valores sin tocar nunca el eje de abscisas. c) El punto de mxima ordenada (mxima altura de la curva) ser siempre el valor de la media de la distribucin. En el caso de la distribucin normal estndard, la mxima altura est en el valor cero del eje X, que es la media de esta distribucin (ver figura 7 ).

65

JAIME RAMIRO ALIAGA TOVAR Figura 7

c) La media, mediana y moda coinciden en un mismo punto. Para la distribucin normal estndar es el valor cero. d) La curva normal es simtrica alrededor de la ordenada levantada en el punto correspondiente a la media (La asimetra = 0). e) La normal es mesocrtica (tiene una altura adecuada). f) La desviacin tpica de la distribucin normal estndar es igual a la unidad (igual que su varianza). g) Entre tres desviaciones tpicas por debajo de la media y tres desviaciones tpicas por encima de la media (un total de seis desviaciones tpicas), se encuentra prcticamente todos los casos de la distribucin normal. h) Los puntos en que la curva normal se vuelve de cncava hacia arriba a cncava hacia abajo estn situados en los valores de 1z y +1z, es decir a una distancia de una desviacin tpica a ambos lados de la media (Garret, 1974; Welkowitz, Ewen y Cohen, 1981).

5.1.2.2 Algunos ejemplos de problemas que pueden resolverse utilizando las propiedades de la distribucin normal.
Para comprender ms rpidamente los procedimientos de solucin es necesario consultar la Tabla A de la Distribucin normal que se encuentra al finalizar el texto. Una prueba de razonamiento lgico fue administrada a 1000 estudiantes que cursan el 5to. ao de secundaria, transformndose las puntuaciones directas en 66

JAIME RAMIRO ALIAGA TOVAR una puntuacin estndar Z de media 100 y desviacin estndar 20. Utilizando como modelo a la distribucin normal podemos convertir cualquier puntuacin directa en esta prueba (X) en una puntuacin Z y referirla a la tabla de la distribucin normal.

Z=

X 100 20

a) Se desea saber qu porcentaje de los estudiantes puede esperarse que obtengan puntuaciones entre 100 y 135. Para hallar la solucin convertiremos 135 es puntuacin estndar z:
135 100 = +1,75 20

Z=

Segn la tabla de la distribucin normal el porcentaje de rea entre la media y una puntuacin z de +1,75 es igual a 45,99%. En consecuencia, puede esperarse que aproximadamente el 46% de la poblacin obtenga puntuaciones entre 100 y 135. Figura 8

67

JAIME RAMIRO ALIAGA TOVAR b) Es importante determinar qu porcentaje de la poblacin tendr puntuaciones entre 90 y 100? Figura 9

Ser necesario transformar el puntaje directo 90 a puntuacin z::


Z= 90 100 = 0,50 20

Observando la tabla de la distribucin normal se encuentra que a -0,50 le corresponde 19,15%. Por tanto, aproximadamente el 19% de la poblacin lograra puntuaciones entre 90 y 100. c) El Director de un colegio particular desea saber con exactitud el porcentaje de alumnos cuyas notas en el simulacro de admisin se encuentren entre 73.4 y 108.0. Este problema es muy probable que induzca a confusin, a menos que se utilice un diagrama:

68

JAIME RAMIRO ALIAGA TOVAR Figura 10

Existen varias maneras de obtener los valores buscados. Por ejemplo, en este caso, seguiremos un procedimiento bastante claro. En primer lugar, es necesario obtener el porcentaje entre 73.4 y la media (100); en segundo lugar, obtener el porcentaje entre la media y 108, y, en tercer lugar, sumar los dos valores para obtener el rea deseada. Los valores z son:
73.4 100 = 1,33 20 108 100 = +0,40 20

Z=

Z=

La tabla A muestra que a 1,33 le corresponde 0.09176 del rea de la curva normal o, en porcentaje, 9,176 valor que restado de 0,5000 y multi8plicado por 100 arroja que el 40,82% del rea total cae entre la media y z = - 1,33; por otro lado, a +0,40 le corresponde el 0,65542 de rea bajo la curva normal, valor que restado de 0,5000 nos indica que el 15,54% se la poblacin se encuentra entre la media y z = + 0,40. As, el porcentaje esperado entre 73,4 y 108 es igual a 40,82% + 15,54% = 56,36% de la poblacin. Otra manera de lograr esta cantidad es restando de 0,65542 el valor 0,09176 = 56,36%.

d). Qu porcentaje de la poblacin puede esperarse que obtenga puntuaciones superiores a 145?

69

JAIME RAMIRO ALIAGA TOVAR El porcentaje que nos interesa es el que corresponde a una puntuacin directa superior a 145. La puntuacin z correspondiente a la puntuacin directa 145 es igual a (145-100) /20 =+2,25. A +2,25 le corresponde el 0,98778 del rea bajo la curva normal, que multiplicado por 100 = 98,778 o redondeando 99. Obsrvese que accidentalmente hemos encontrado que 145 es, aproximadamente, el percentil 99 puesto que le supera alrededor de 1% de la poblacin. , Figura 11

5.2 La distribucin normal y su correspondencia con los rangos percentilares y calificaciones estndar de los tests. Otros ejemplos de
utilizacin de las propiedades de la distribucin normal en psicologa son, entre otros, la determinacin de la cantidad de individuos necesarios para realizar un sondeo o encuesta (que veremos en unidad posterior), el establecimiento de la dificultad relativa de los reactivos y la interpretacin de los puntajes directos obtenidos en un tests. Al respecto de este ltimo uso, en la prctica profesional del psiclogo, la interpretacin de los puntajes directos alcanzados por un sujeto en un test, se realiza comparando tal puntaje con las normas proporcionadas por el grupo normativo; normas que se sintetizan en la tabla de normas o baremo y que se expresan en diversos tipos de unidades de medicin psicolgica o de puntaje convertido, por ejemplo: rango percentiles, puntajes estndares o tpicos como los CId, T, eneatipos, decatipos, etc., que al estar relacionados con las propiedades 70

JAIME RAMIRO ALIAGA TOVAR de la distribucin normal tienen un significado estadstico preciso. La siguiente figura grfica estas relaciones.

Figura 12. Distribucin normal y unidades de medicin psicolgica

71

JAIME RAMIRO ALIAGA TOVAR

EJERCICIOS DE AUTOCOMPROBACIN V
Responda si las siguientes afirmaciones son verdaderas o falsas. AFIRMACIONES V 1. La mayor parte de fenmenos psicolgicos, educativos y biolgicos siguen a la ley normal o de Laplace Gauss. 2. La distribucin normal es una curva con forma de campana asimtrica y asinttica. 3. La curva normal no es una distribucin de probabilidad. 4. La curva normal es til para resolver diversos tipos de problemas como los relativos a distribuciones de puntajes. 5. Los eneatipos y decatipos al estar relacionados con las propiedades de la distribucin normal tienen un significado estadstico preciso. 6. En el caso de la distribucin normal estndar el punto central es el valor cero. 7. La curva normal no es mesocurtica. 8. Utilizando como modelo a la distribucin normal se puede convertir cualquier puntuacin directa en puntuacin Z. 9. La desviacin tpica de la distribucin normal estndar es igual a la unidad. 10. Un total de 3 desviaciones tpicas se encuentran en todas las casos de la distribucin normal. Complete cada enunciado: ENUNCIADO 1. Al referirnos a la ley normal nos estamos refiriendo a la ley de Laplace Gauss, definida tericamente apartir de la ley de . 2. La distribucin mas importante es la.. 3. La curva normal es..alrededor de la ordenada 4. Los diferentes tipos de puntajes convertidos son : .. .. . 5. Los puntajes convertidos o unidades de medicin tienen relacin con las propiedades de . F

En relacin al texto, elabore enunciados verdaderos en los que se incluyan los siguientes tres trminos: 1. Media - desviacin estndar - distribucin normal reducida 72

JAIME RAMIRO ALIAGA TOVAR Enunciado: 2. Puntaje z, media aritmtica desviacin estndar Enunciado: 3. Asinttica simtrica distribucin normal Enunciado: 4. 68% - media desviacin estndar Enunciado: 5. Media desviacin estndar 95% Enunciado: D. Argumente su respuesta a la siguiente pregunta: Cul es la importancia de la distribucin normal? Respuesta:.. .......................................... :

Ejercicios por realizar


1) Determine el porcentaje de poblacin que se encuentra entre -1,75 a 1,25 desviaciones estndares. 2) Determine el porcentaje de poblacin que se encuentra de 3,00 desviaciones estndares a ms. 3) Determine el porcentaje de poblacin que se halla entre +1 a +2 desviaciones estndares. 4) Determine en una poblacin de 10 000 personas a cuntas de ellas supera una persona que en un test de inteligencia tiene una puntuacin z de +1. 5) Determine en una poblacin de 10 000 personas a cuntas de ellas supera una persona que en un cuestionario de autoestima logra una puntuacin z de -1,25

Respuestas a la seccin A: 1) V; 2) F; 3) F; 4) V; 5) V; 6) V, 7) F; 8) V; 9) V; 10) F

Para saber ms: Sitios Web de referencia


http://www.vitutor.com/estadistica/descriptiva/a_10.html http://www.vitutor.com/pro/5/a_2.html http://www.disfrutalasmatematicas.com/datos/distribucion-normalestandar.html http://www.elosiodelosantos.com/sergiman/div/normres.html http://www.fisterra.com/mbe/investiga/distr_normal/distr_normal.asp

73

JAIME RAMIRO ALIAGA TOVAR

Referencias bibliogrficas
Domenech, J. (1981). Una sntesis de los mtodos estadsticos en medicina. Garret, H. (1974). Estadstica en psicologa y educacin. Buenos Aires: Paids. Wellkowitz, J., Ewen, R., Cohen, J. (1981). Estadstica aplicada a las Ciencias de la Educacin. Madrid: Santillana, Aula XXI.

74

JAIME RAMIRO ALIAGA TOVAR

Leccin VI Muestreo
En el proceso de una investigacin el investigador llega a la etapa en la que tiene que determinar la muestra de la cual va a obtener los datos para someter a contraste sus hiptesis, si ese fuera el caso. Quines van a ser los sujetos investigados? es la pregunta; la respuesta depende de los objetivos del estudio que son los que proporcionan el marco de referencia conformado por un conjunto de elementos que es necesario esclarecer para legitimar la extrapolacin de los resultados a los que se llegue en el estudio a una poblacin que sea de inters.

6.1 Estimacin de parmetros


Como vimos en la Leccin 1, los parmetros tienen un valor fijo (media poblacional, varianza poblacional, desviacin estndar poblacional, entre otros), en la mayora de los casos desconocidos; en tanto que los estadsticos si tienen un valor conocido calculado en la muestra (media muestral, varianza muestral, desviacin estndar muestral, entre otros), an cuando no sabemos con certeza en qu medida se aproximan al parmetro. Utilizando la inferencia estadstica el investigador intenta extraer conclusiones de los parmetros de una poblacin a partir de los estadsticos calculados en una muestra extrada al azar de dicha poblacin. A esta operacin se le denomina estimacin de parmetros, que es muy importante en muchos tipos de investigaciones, por ejemplo, encuestas, donde el propsito es conocer los valores o parmetros de una poblacin. En la estimacin de parmetros se asume que, la diferencia entre la media poblacional y la media de una muestra cualquiera de todas las posibles de elegir al azar de una poblacin, es un error producido por el muestreo. Si el investigador midiera la variable de inters en toda la poblacin no existira este error y la media de cualquier muestra extraida aleatoriamente de una poblacin sera exactamente igual a la media poblacional, pero esto nunca sucede, pues los datos reales siempre estn sujetos a error de muestreo (Welkowitz, Ewen y Cohen, 1981:145). Estimador es el procedimiento empleado para estimar el valor del parmetro (valor desconocido) a partir del estadstico encontrado en la muestra; son estimadores por ejemplo la media aritmtica y una proporcin muestrales. A su vez, una estimacin es el valor hallado en la muestra, por ejemplo, el valor de la media aritmtica y de la proporcin. La exactitud de una estimacin (accuracy) se 75

JAIME RAMIRO ALIAGA TOVAR refiere a la mayor o menor magnitud de la diferencia entre su valor y el valor real del parmetro de la poblacin, diferencia debida a errores muestrales y no muestrales o de observacin. Los errores muestrales son de sesgo y aleatorios. Los de sesgo, denominados de parcialidad, se producen porque la muestra elegida no representa bien a la poblacin. Los aleatorios son aquellos que se deben a las diferencias existentes entre la verdadera composicin de ciertas poblaciones y de las muestras al azar que se extraen de ellas, debindose por lo tanto a una casualidad. Los errores no muestrales o de observacin se pueden producir por deficiencias en los registros de los datos y/o por errores de clculo. En vista que el valor real del parmetro en la poblacin es desconocido - para estimarlo es que se toma la muestra - slo es posible determinar la exactitud probable de la estimacin que recibe el nombre de precisin, la misma que depende de la magnitud del error de muestreo y ste a su vez del tamao de la muestra, cuestiones que veremos ms adelante cuando tratemos el muestreo probabilstico.

6.2 Concepto de muestreo


Con el trmino muestreo los investigadores se refieren al proceso de seleccin de una parte de la poblacin para que represente al conjunto de ella, en otras palabras es el procedimiento utilizado para la eleccin de unidades dentro de un conjunto ms amplio de ellas. As pues, la muestra no es otra cosa que el resultado del muestreo y los distintos tipos de muestreo representan diversas formas de elegir la muestra (Sierra Bravo, 1991:332).

6.3 Diseo de muestreo


Comprende la definicin de la poblacin, el marco de muestreo, la eleccin del tipo de muestreo, probabilstico o no probabilstico, y el establecimiento del tamao de la muestra

6.3.1 Definicin de la poblacin objeto de estudio.

El decidir a quines se va a observar es una decisin que debe tomarse en primer lugar, ayuda a esta decisin los objetivos del estudio. Por ejemplo, un estudio que pretenda analizar la poblacin de estudiantes de psicologa, incluye a los alumnos de las facultades de psicologa de todo el pas? A los de la ciudad de Lima? A los estudiantes de las modalidades presencial y a distancia o solamente a una de estas modalidades? A los estudiantes de los turnos diurno y nocturno o solamente a uno de estos? A los estudiantes de todos los ciclos o semestres de 76

JAIME RAMIRO ALIAGA TOVAR estudio o solamente a alguno de ellos? El investigador debe precisar los criterios de elegibilidad o de exclusin que le permitan decidir si un individuo ser incluido o no en la poblacin de inters. En consecuencia, el investigador debe hacer que la poblacin quede claramente delimitada en torno a sus caractersticas de contenido, lugar y en el tiempo. Por ejemplo, la poblacin para una investigacin sobre el uso de la televisin por los nios se defini as: Todos los nios de Lima Metropolitana que cursen 4, 5 y 6 de primaria, en instituciones educativas estatales y privadas del turno matutino. En el ejemplo se delimita claramente la poblacin y se fija los criterios de inclusin y de exclusin. As no participarn de este estudio los nios que no vivan en el rea metropolitana, que no vayan al colegio y los menores de 9 aos que es la edad-grado del 4 de primaria.

6.3.2. Marco de muestreo. Es la relacin completa de las unidades


de muestreo, por ejemplo, la relacin de alumnos de psicologa de una determinada universidad, un plano, el disco duro de una computadora. Si no existiese es conveniente que el investigador lo elabore (Hernndez, Fernndez y Baptista, 2006).

6.3.3. Seleccin de la muestra. Sabemos que la muestra es un


subconjunto de la poblacin, lo que el investigador pretende es que este subconjunto sea un reflejo fiel del conjunto de la poblacin. En el proceso de seleccin de la muestra existen dos tipos de muestro, el probabilstico y el no probabilstico, pero es el primero el nico mtodo viable para obtener muestras representativas en estudios cuantitativos (Polit y Hungler, 2000:276). La eleccin que el investigador haga entre ambos tipos de muestreo depender de los objetivos de su investigacin, del diseo o esquema de la misma, y de la contribucin que piensa hacer con el estudio (Hernndez, Fernndez y Baptista, 2006). Segn el tipo de muestreo se da origen a las muestras probabilsticas y a las no probabilsticas.

6.3.3.1 Muestras probabilsticas. En estas muestras todos los


elementos de la poblacin tienen la misma posibilidad de ser escogidos. Por el fundamento matemtico que tienen los resultados a los cuales se llegue con estas muestras pueden ser inferidos o generalizados a la poblacin dentro de unos lmites de error (error de muestreo) que pueden ser calculados. Estas muestras son esenciales cuando se pretende hacer estimaciones de variables en la poblacin, por ejemplo, mediante encuestas. Se obtienen definiendo en primer lugar las caractersticas de la poblacin; en segundo lugar, precisando el tamao de la muestra y, en tercer lugar, efectuando una seleccin aleatoria de las unidades de anlisis.

77

JAIME RAMIRO ALIAGA TOVAR En estas muestras la eleccin de sus elementos no depende de la probabilidad, sino de causas relacionadas con las caractersticas del investigador o del que hace la muestra. En este sentido se vincula con el proceso de toma de decisiones de una persona o grupo de personas, por tal razn en la investigacin cuantitativa se considera que tienden a ser sesgadas pues al no tener un elemento de la poblacin la misma probabilidad de ser incluido en la muestra puede ser que alguna parte de la poblacin quede sin representacin; sin embargo, tambin se considera que si el investigador selecciona con criterios adecuados y con mucho cuidado la muestra, hace una interpretacin conservadora de los resultados y repite el estudio con nuevas muestras para asegurar la repetibilidad de los mismos, las muestras no probabilsticas pueden resultar razonablemente adecuadas (Polit y Hungler, 2000; Hernndez, Fernndez y Baptista, 2003).

6.3.3.2 Muestras no probabilsticas.

6.3.3.3 Elaboracin de la muestra probabilstica


Cuando la poblacin de estudio es muy numerosa se hace necesario seleccionar una muestra. Por numerosa entenderemos la cantidad de unidades o elementos poblacionales que no puede estudiarse con los recursos humanos, fsicos y financieros disponibles. El muestreo probabilstico es de cuatro tipos: 1. Muestreo aleatorio simple o al azar sin restricciones. Cada una de las unidades de la poblacin tiene la misma probabilidad de ser incluida en la muestra. Teniendo el marco de muestreo se numera todas las unidades de 1 a n; luego, con la ayuda de una tabla de nmeros aleatorios o algn otro mecanismo que asegura aleatoriedad, se extraen tantas unidades hasta completar el tamao de la muestra deseada. Es conveniente aclarar que este es un tipo de muestreo sin reemplazamiento. La muestra con reemplazamiento es el tipo de muestreo ideal segn la teora de las muestras. Sin embargo, el muestreo sin reemplazamiento no presenta tantas dificultades prcticas y de hecho es el ms usado (Nam Lim , 1976, citado en Sierra Bravo, 1994:193). 2. Muestreo sistemtico. Las unidades numeradas de 1 a n, son seleccionadas de acuerdo a cierto intervalo de muestreo k, cuyo valor es igual n/N. (donde n= tamao de la poblacin y N= tamao elegido de la muestra). Por ejemplo, en una poblacin de n= 1800 se desea seleccionar una muestra de N= 200. El intervalo ser k = 1800/200=9. Teniendo el marco muestral y una tabla de nmeros aleatorios u otro mecanismos que asegure aleatoriedad se selecciona al azar entre 1 y 9 un nmero de partida, por ejemplo el 05, entonces el sujeto que lleva 78

JAIME RAMIRO ALIAGA TOVAR el nmero 05 es el nico seleccionado aleatoriamente); la siguiente unidad se selecciona sumando el intervalo muestral 09, al nmero de partida 05, obtenindose 14. Las dems unidades se seleccionan sumndoles sucesivamente el intervalo muestral al nmero anteriormente obtenido hasta completar la muestra. 3. Muestreo estratificado. Se utiliza cuando la poblacin de estudio no es homognea. Entonces sta se divide en subpoblaciones o estratos, de cada uno de stos se selecciona una muestra utilizando el muestreo aleatorio simple o sistemtico. Posteriormente, se combinan las estimaciones de cada estrato para formar una estimacin del valor de la poblacin total. Hay tres tipos de fracciones de muestreo: 1) Afijacin proporcional: el tamao de las muestras en cada estrato es proporcional al nmero de unidades de cada estrato de la poblacin. 2) Afijacin uniforme: el tamao de las muestras es igual en cada estrato, independiente del estrato de la poblacin. 3) Afijacin ptima: considera el tamao del estrato de la poblacin y la variabilidad (desviacin estndar) dentro de cada estrato. Veamos un ejemplo de afijacin proporcional. Una psicloga desea tomar de una poblacin de 1000 alumnos de una facultad de educacin a una muestra de 200 estudiantes estratificados por niveles de estudios: Avanzado (X, IX y VIII ciclo), Intermedio (VII, VI, V, IV ciclo), Inicial (III, II y I ciclo). Atendiendo al registro de matrculas los alumnos se estratifican de la siguiente manera. Tabla 9 Estrato (h) Tamao de la poblacin (por estrato) (Nh) 1. Avanzado 220 2. Intermedio 380 3. Inicial 400 Total poblacin 1000 (n)

Conociendo el nmero de sujetos por cada estrato, para determinar el tamao de las muestras en cada uno de ellos, la psicloga debe aplicar la misma fraccin de muestreo (f), o tasa muestral a cada estrato de la poblacin total. La fraccin de muestreo relaciona el tamao de la muestra deseada (N) (establecida en 200) con el tamao de la poblacin (n). La tasa muestral es: 200/1000 = 0,20. A continuacin multiplicara la tasa muestral 0.20 por cada Nh (tamao de cada 79

JAIME RAMIRO ALIAGA TOVAR estrato) para obtener la cantidad de unidades que deben seleccionarse en cada estrato. Tabla 10 Aplicacin de la fraccin muestral (f. Nh) 0.20 x 220 0.20 x 380 0.20 x 400

Estrato(h)

Nmero de unidades en el estrato (Nh) 44 76 80

1. Avanzado 2. Intermedio 3. Inicial

Establecido el tamao muestral de cada estrato la seleccin de los elementos o unidades de anlisis en cada uno de ellos se har por muestreo aleatorio simple o muestreo sistemtico. 4. Muestreo aleatorio de conglomerados o racimos. La muestra es escogida de la poblacin en grupos, no individualmente. Los conglomerados son las unidades de anlisis de la poblacin. Por ejemplo, los siguientes estudios: Estimacin de los niveles de inteligencia de nios entre 6 y 14 aos de edad, matriculados en las escuelas estatales y particulares de las UGEL de Lima Metropolitana, y Niveles de nutricin en nios de 0-6 aos residentes en los distritos del cono sur de Lima, tienen en comn el haber definido una unidad de muestreo apropiada, las UGEL y los distritos. En cada estudio las unidades de muestreo seleccionadas pueden tambin ser submuestreadas. As en la primera investigacin, pueden seleccionarse de cada UGEL dos colegios, uno estatal y uno privado, a continuacin, de cada colegio puede seleccionarse una seccin por cada edad-grado, y luego de cada seccin se extraer por muestreo aleatorio simple, sistemtico o estratificado tantas unidades o elementos como se haya estipulado como tamao de la muestra. Cuando este muestreo se produce en dos etapas recibe el nombre de muestreo bietpico y cuando se da en ms de dos etapas se denomina muestreo polietpico, como en el caso del ejemplo.

6.3.3.4 Muestras no probabilsticas


En general, cuando el investigador hace uso de muestras no probabilsticas no
puede saber hasta qu punto sus resultados podrn proyectarse, con confiabilidad, hacia el conjunto ms amplio que desea conocer. Estas muestras se clasifican de diversas maneras;

una de ellas es la siguiente: a) Muestra accidental, es aquella que se obtiene sin atender a un plan preconcebido de muestreo, por tanto los elementos o unidades de anlisis son el producto de circunstancias fortuitas. Un ejemplo es el investigador que entrevista 80

JAIME RAMIRO ALIAGA TOVAR a los primeros 100 personas que se pasean por cierto parque; tambin lo es el de los radioescuchas que llaman a una estacin de radio. b) Muestra de sujetos voluntarios, es aquella en la que a solicitud del investigador participan voluntariamente un conjunto de sujetos. Se utilizan mucho en estudios en los que el investigador tiene ms inters por los efectos de las condiciones a las que sern sometidos los participantes del estudio, por lo que se requiere que estas muestras sean homogneas en variables tales como la edad, sexo, inteligencia. c) Muestra intencional, es aquella en que los elementos se seleccionan atendiendo a un criterio o criterios que el investigador considera como relevantes para su estudio en base al conocimiento que tenga de la temtica y a su opinin personal. La generalizacin a la poblacin es nula o a lo ms sus resultados pueden extrapolarse a sujetos o elementos de similares caractersticas a los que formaron la muestra de estudio. Tambin se le utiliza como una muestra tentativa para decidir ms adelante cmo tomar una muestra aleatoria. d) Muestra de expertos, es aquella en la que los elementos se seleccionan en base a su idoneidad en algn aspecto que interesa al investigador. Se emplea bastante en estudios exploratorios y cualitativos. Un ejemplo se tiene en el estudio que pretende caracterizar a los investigadores en el campo educacional y el autor recurre a una muestra de investigadores reconocidos por su experiencia en este aspecto. Estas muestras son vlidas y tiles cuando los objetivos del estudio as lo requieren. e) Muestra por cuotas, es aquella que el investigador decide utilizar cuando tiene un buen conocimiento de los estratos de una poblacin y/o de los individuos ms representativos para los propsitos que persigue. Tiene parecido con el muestreo aleatorio estratificado, pero sin las caractersticas de aleatoriedad de ste. Se fijan unas cuotas o nmero de elementos que renen ciertas condiciones, por ejemplo, 40 personas de 20 a 40 aos de edad, de sexo femenino y residentes en el distrito de San Borja. Determinada la cuota se eligen los primeros sujetos que cumplan estas condiciones. f) Muestra Bola de nieve, es aquella en la que se obtiene en primer lugar una muestra reducida de elementos y a estos se les pregunta el nombre de otros individuos a quienes se encuestara y as sucesivamente. g) Muestra de sujetos-tipo, es aquella que se inscribe en un estudio cuyo propsito busca riqueza, profundidad y calidad de informacin. Son ejemplos los estudios acerca de patrones de consumo de jvenes de determinado nivel socioeconmico en los que se utiliza grupos de 8 a 12 jvenes que posean las

81

JAIME RAMIRO ALIAGA TOVAR mismas caractersticas socioeconmicas (Hernndez, Fernndez y Baptista, 2006) del referido segmento poblacional.

6.3.4 Tamao de la muestra probabilstica


En el proceso de elaboracin de una muestra probabilstica no basta solamente el determinar la tcnica de muestreo probabilstico ms adecuado, falta saber cuntos elementos compondrn la muestra de estudio para estimar los parmetros de la poblacin en la variable de inters y estimar tambin los mrgenes de error correspondientes a dichas estimaciones. La estimacin del nmero de estos elementos debe ser realizada de tal manera que este nmero sea el suficiente a fin de que la muestra extrada aleatoriamente proporcione una seguridad estadstica de que los resultados que se obtengan analizndola puedan, dentro de los lmites estimados, representar realmente a la poblacin, lo que significa que el tamao de la muestra debe tener determinadas proporciones mnimas de acuerdo con las leyes de la probabilidad. Existen frmulas y tablas que calcular rpidamente el tamao de una muestra pero todas estas dependen del tener claramente especificado lo siguiente: Tipo de poblacin, finita o infinita - una poblacin infinita es aquella que tiene ms de 100,000 elementos; el nivel de confianza o porcentaje de seguridad o probabilidad que el tamao de la muestra a determinar proporciona una seguridad no total pero suficiente en la prctica para estimar el parmetro-, el error muestral y la varianza (Sierra Bravo, 1994).

1) Estimacin del tamao de la muestra mediante una frmula Usualmente el tamao de la muestra utilizada en los estudios en psicologa, educacin y ciencias sociales se estima procediendo como si la poblacin fuera infinita - en una investigacin fctica significa una poblacin muy grande - y que el muestreo es sin reemplazamiento, es decir que el elemento extrado de la poblacin no vuelve a esta para la siguiente extraccin. Desde este punto de vista, es lcito suponer que la determinacin del tamao de la muestra bajo estas condiciones sobreestimar el nmero necesario de sujetos, lo cual evidentemente no perjudica al estudio sino que le da mayor precisin. (Sierra Bravo, 1994). Ejemplo: En una poblacin de 98,240 escolares del sexto grado de primaria pretende realizar una encuesta desendose con este propsito precisar manera conservadora y en las condiciones ms desfavorables el tamao muestra necesario para estimar los parmetros poblacionales con un nivel confianza del 95% y un margen de error muestral del +/-4%. Utilizando la siguiente frmula (Sierra Bravo, 1994). se de de de

82

JAIME RAMIRO ALIAGA TOVAR

Donde: N = total de la poblacin Za2 = 2,002 (la seguridad es del 95%) P = proporcin esperada (en este caso 50), con lo que se maximiza el tamao muestral). q = 1 p (en este caso 1-50 = 50) d = precisin (error muestral, 4%) En vista que la poblacin es inferior a 100,000, es necesario aplicar la frmula para poblaciones finitas y de proporciones por tratarse de una encuesta. El resultado indica 621 sujetos. Si la poblacin fuese infinita es decir superior a 100,000 sujetos, la frmula a aplicar comparndola con la frmula para poblaciones finitas, no incluye en el numerador a (N) y en el denominador solamente incluye a d2. De esta manera, si en el ejemplo anterior la poblacin hubiese sido de 115,280 sujetos el tamao de la muestra sera 625. 2) Estimacin del tamao de las muestra mediante una tabla.

Tamaos de muestras Los tamaos de muestras que figuran a continuacin corresponden al caso de trabajar con proporciones, P = 0.5, y con un nivel de confianza del 95%. Tabla 1. Relacin de tamaos en funcin de la poblacin y el error muestral. Errores muestrales Poblacin 500 1000 2000 5000 10000 25000 50000 100000 Infinito 1% 5000 7143 8333 9091 10000 2% 1250 1667 2000 2273 2381 2439 2500 3% 769 909 1000 1064 1087 1099 1111 4% 385 500 556 588 610 617 621 625 5% 222 286 345 370 385 394 397 398 400 10% 83 91 96 98 99 100 100 100 100

(Arkin y Colton (1962, en Len y Montero, 2003).

83

JAIME RAMIRO ALIAGA TOVAR

Obsrvese que a medida que el error muestral es menor el tamao exigido de la muestra es mayor. As para una poblacin de 10 000 sujetos la muestra exigida es de 91 sujetos para un margen de error de +/-10% y de 5000 sujetos para un margen de erro de +/-1%. Desde otro ngulo de observacin, esta tabla tambin nos permite tener una rpida visin de lo que significa el error muestral. Si en una poblacin de 5325 sujetos con un margen de error de +/- 2% hemos extrado aleatoriamente una muestra de 2000 y de esta el 75% responde en una encuesta que es contraria a la legalizacin del aborto, el porcentaje en toda la poblacin se encuentra entre el 73% al 77% con una confianza del 95%.

84

JAIME RAMIRO ALIAGA TOVAR

EJERCICIOS DE AUTOCOMPROBACIN VI
A. Responda si las siguientes afirmaciones son verdaderas o falsas. AFIRMACIONES V 1. Al utilizar la inferencia estadstica se intentan extraer conclusiones de los parmetros de una poblacin, a esta operacin se le denomina estimacin de parmetros. 2. La estimacin de parmetros es muy importante para muchos tipos de investigaciones. 3. En la estimacin de parmetros los datos reales estn libres del error de muestreo. 4. El error muestral de sesgo se produce cuando la muestra elegida representa bien a la poblacin. 5. Un error de observacin se puede producir por deficiencias en los registros de datos y/o por errores de clculo. 6. Es necesario que el investigador delimite con claridad una poblacin en torno a sus caractersticas de contenido, lugar y tiempo. 7. Si no existiese el marco de muestreo, el investigador puede elaborarlo. 8. Las muestras probabilsticas son esenciales cuando se pretende hacer estimaciones de variables a una poblacin. 9. En las muestras no probabilsticas la eleccin de sus elementos depende de la probabilidad y no de causas relacionadas con las caractersticas del investigador. 10. El muestreo estratificado es utilizado cuando la poblacin de estudio es homognea. F

B. Complete cada enunciado: ENUNCIADO Existen tres tipos de fracciones de muestreo:.,,.. Los errores muestrales son:,.. ..es el nico mtodo viable para obtener muestras representativas los estudios cuantitativos. El enunciado en estas muestras todos los elementos de la poblacin tienen la misma posibilidad de ser escogidos corresponde a .. Se utiliza cuando la poblacin de estudio no es homognea ..

85

JAIME RAMIRO ALIAGA TOVAR C. En relacin al texto, elabore enunciados verdaderos en los que se incluyan los siguientes tres trminos: 1. Probabilstico no probabilstico muestreo Enunciado: 4. Probabilstico - simple - sistemtico Enunciado: 3. Probabilstico estratificado afijacin proporcional Enunciado: 4. No probabilstico muestreo por expertos frmula para hallar tamao de muestra Enunciado: 5. Conglomerados racimos muestreo Enunciado: E. Argumente su respuesta a la siguiente pregunta: Qu pasara si no hubiese las tcnicas de muestreo al realizar una investi8gacin? Respuesta:.. .......................................... :

Ejercicios por realizar


1) Cules son las caractersticas de un buen estimador? 2) Qu es el error de muestreo? 3) Cogiendo como fuente de informacin las tablas en las que se represento el muestreo estratificado, cuntas personas tendra cada estrato si el total de la poblacin es de 10 000? 4) Diez sujetos generan 10 puntuaciones,

10 12 14 15 18 20 11 13 15 17 19
a) si quisiramos elaborar muestras de 2 sujetos cada una, cuntas muestras pueden ser seleccionadas? b) Haga una lista de todas las muestras posibles y encuentre sus medias muestrales. c) Obtenga el promedio de la media muestral. d) Construya una tabla de frecuencias para las medias muestrales con intervalos de clase de amplitud 2. e) Elabore un histograma de la tabla de frecuencias y observe la distribucin muestral. f) Establezca el tamao de muestra con un margen de error de +/- 4% y un nivel de confianza del 95% para una poblacin de 7 500 personas. Utilice la tabla de tamaos de muestras.

86

JAIME RAMIRO ALIAGA TOVAR Respuestas a la seccin A: 1) V; 2) V; 3) F; 4) F; 5) V; 6) V; 7) V; 8) V; 9) F; 10) F.

Para saber ms: Sitios Web de referencia


http://www.chospab.es/calidad/archivos/Metodos/Muestreo.pdf http://www.uiah.fi/projekti/metodi/252.htm http://www.icm.csic.es/rec/gim/defini.htm http://www.angelfire.com/sc/matasc/EyD/bioesta/muest_noprob.htm http://sitios.ingenieria-usac.edu.gt/estadistica/estadistica3/teoria.html

Referencias bibliogrficas
Hernndez, R., Fernndez, C. y Baptista, P. (2006). Metodologa de la investigacin. Mxico: Mc.Graw Hill Len, O. y Montero, I. (2003). Mtodos de Investigacin en. Psicologa y Educacin Mxico: Mc Graw Hill. Polit DF, Hungler BP.(2000). Investigacin Cientfica en Ciencias de la Salud.Mxico: McGrawHill. Sierra Bravo, R. (1994) Tcnicas de investigacin social: Ejercicios y problemas. Madrid: Paraninfo. Wellkowitz, J., Ewen, R., Cohen, J. (1981). Estadstica aplicada a las Ciencias de la Educacin. Madrid: Santillana, Aula XXI.

87

JAIME RAMIRO ALIAGA TOVAR

Leccin VII Pruebas de hiptesis y pruebas paramtricas y no paramtricas


En la investigacin cientfica una hiptesis puede ser definida como (...) una forma de conjetura de las relaciones entre dos o ms variables (Kerlinger y Lee, 2003). Por ejemplo, Los varones y las mujeres no difieren en inteligencia (que equivale a decir que el sexo no est relacionado con la inteligencia). Para su comprobacin la hiptesis de investigacin debe ser transformada en hiptesis estadstica. El contraste de hiptesis, tambin llamado prueba de significacin o prueba estadstica, es un procedimiento que nos permite decidir si una proposicin acerca de una poblacin puede ser mantenida o debe ser rechazada a la luz de la informacin muestral disponible. En otras palabras, es (...) un proceso de decisin en el que una hiptesis formulada en trminos estadsticos es puesta en relacin con los datos empricos para determinar si es o no compatible con ellos (Pardo y San Martn, 1994:130). Una hiptesis estadstica es una afirmacin sobre la forma de una o ms distribuciones de probabilidad de las variables en la poblacin, por ejemplo, la distribucin normal, la distribucin t de student, la distribucin de Poisson, la distribucin Ji cuadrada, etc.), o sobre el valor de uno o ms parmetros de esas distribuciones. Se representan por la letra H seguida de una afirmacin que da contenido a la hiptesis. Por ejemplo: H: la variable X se distribuye normalmente con = 100 y = 15. H: < 30. H: Md1 Md2 H: 1 = 2 = 3 = 4. Una hiptesis estadstica surge de una hiptesis cientfica, pero no son la misma cosa. Mientras una hiptesis cientfica se refiere a algn aspecto de la realidad, una hiptesis estadstica se refiere a algn aspecto de una distribucin de probabilidad. Por ejemplo, la hiptesis cientfica los varones y las mujeres no difieren en la inteligencia puede ser expresada en la hiptesis estadstica H:v = m (la media poblacional de los varones es igual a la media poblacional de las mujeres), pero esta no es la nica formulacin estadstica posible. En efecto, en 88

7.1 El contraste de hiptesis.

7.2 Las hiptesis estadsticas.

JAIME RAMIRO ALIAGA TOVAR lugar del promedio , podramos utilizar el promedio Md y establecer esta otra formulacin estadstica H: Mdv = Mdm (la mediana poblacional de los varones es igual a la mediana poblacional de las mujeres), o utilizar otras estrategias. (Pardo y San Martn, 1994). En consecuencia, existen varias formas diferentes de expresar estadisticamente una hiptesis cientfica concreta. Es necesario conocer qu hiptesis estadsticas podemos plantear, cmo debemos plantearlas y a qu tipo de hiptesis cientficas corresponden.

7.2.1 Hiptesis estadsticas alternativas (H1) y nula (Ho). El primer paso en el proceso de comprobacin de una
hiptesis de investigacin consiste en formular en trminos estadsticos su contenido. Esta formulacin se denomina hiptesis alternativa (H1 o Ha). Adems es necesario formular una hiptesis que la niegue y que se denomina hiptesis nula (Ho). En consecuencia, todo contraste de hiptesis se basa en la formulacin de dos hiptesis estadsticas: la hiptesis alternativa (H1) y la hiptesis nula (Ho). Ambas hiptesis (H1 y Ho) suelen plantearse como hiptesis rivales. Son hiptesis exhaustivas y mutuamente exclusivas, lo cual implica que si una es verdadera, la otra es necesariamente falsa.

7.2.2 La hiptesis nula (Ho) y la metodologa de prueba inversa. Como hemos visto, para comprobar una hiptesis
de investigacin es necesario, adems de formular la hiptesis alternativa (H1), elaborar una hiptesis nula (Ho), que es la negacin de la alterna y la que en realidad se somete a contraste. Es preciso realizar este artificio debido a que es la nica manera posible para probar la hiptesis. Esto se debe a que tericamente existen infinitas maneras diferentes de formular la H1, mientras que la Ho niega lo planteado en la H1. Sean, por ejemplo, las siguientes hiptesis: Hiptesis alternativa : Las lneas a y b no son iguales (H1: a b) Hiptesis nula : Las lneas a y b son iguales (Ho: a = b) a b ____________________ ____________________

89

JAIME RAMIRO ALIAGA TOVAR Existen muchas maneras que estas lneas sean diferentes, pero existe una sola manera que las lneas sean iguales (=). Entonces se trata de contrastar la Ho, es decir demostrar que las lneas son iguales. Si se acumulan datos que apoyan la hiptesis que las lneas son iguales, entonces se acepta la Ho y se rechaza la H1. Por el contrario, si los datos no confirman la igualdad de las lneas, se rechaza la Ho y se tiene que aceptar la H1.(Ejemplo tomado y ligeramente modificado de Meja y Reyes, 1994). La hiptesis nula (Ho) que es la que se somete a contraste (se acepta o rechaza), suele ser exacta (tal cosa es igual a la otra) ya que generalmente es una afirmacin concreta sobre la forma de la distribucin de la variable ( que pueden ser las distribuciones normal, t, Ji cuadrada, de Poisson, etc.) o sobre el valor de algunos de los parmetros de esa distribucin. En tanto que la hiptesis alternativa (H1) suele ser inexacta (tal cosa es distinta, mayor o menor que la otra).

7.2.3 Posibilidades de la hiptesis alternativa (H1). Cuando en la H1 aparece el signo decimos que el contraste es
bilateral o bidireccional. En un ejemplo de relacin del sexo y la autoestima: _ _ H1: XV XM (Dcima BILATERAL = hay diferencia en la autoestima entre varones y mujeres). Cuando en la H1 aparece el signo < o > decimos que el contraste es unilateral o unidireccional. Con el mismo ejemplo: _ _ H1: XV < XM (Dcima UNILATERAL = los varones tienen una menor autoestima que las mujeres. _ _ H1: XV > XM ( Dcima UNILATERAL= los varones tienen ms autoestima que las mujeres).

7.2.4 Errores que se pueden cometer al tomar decisiones con respecto a la hiptesis nula (Ho). Cuando estudiamos una muestra debemos tener presente que sus
resultados nunca sern iguales a los que se podran obtener si se estudiara a toda la poblacin, en otras palabras siempre habr un margen de error; asimismo, que la hiptesis de investigacin tiene que ser contrastada con los datos para determinar si estos la apoyan o no, para lo cual la hiptesis de investigacin y la hiptesis nula tienen que ser transformadas a smbolos estadsticos 90

JAIME RAMIRO ALIAGA TOVAR configurndose las hiptesis estadsticas H1 o hiptesis de investigacin y la Ho o hiptesis nula. Es claro que nunca se sabe con absoluta certeza la verdad o falsedad
de una hiptesis estadstica a no ser que se examine la poblacin entera.

En el proceso de contrastacin, es la Ho la que sometida a contraste teniendo el investigador que utilizar la estadstica inferencial a travs de pruebas estadsticas como un medio para tomar una decisin acerca de su aceptacin o rechazo. Al realizar el contraste de la Ho pueden producirse dos tipos de errores: Error tipo I o rechazar la Ho siendo verdadera, y el Error tipo II o aceptar la Ho siendo falsa. En el siguiente cuadro se resumen los errores tipo I y II.

Cuadro 5. Caractersticas de los errores tipo I y tipo II DECISION A TOMAR Aceptar Ho SITUACIN La Ho es verdadera La Ho es falsa Decisin acertada (No Error tipo II hay error) Probabilidad () Probabilidad (1 ) Error tipo I Decisin acertada (No Probabilidad () hay error) Probabilidad (1- )

Rechazar Ho

La probabilidad de cometer el error Tipo I (tipo de error tambin llamado falso positivo) se comete cuando se afirma la hiptesis del investigador siendo falsa; se denomina nivel de significacin y se representa por la letra griega alfa (). Por tanto, es la probabilidad de cometer un error tipo I y se aconstumbra que el investigador lo fije antes de empezar la investigacin. En la prctica es frecuente el uso de un nivel de significancia de 0,05 0,01, aunque tambin se usan otros valores, pero usualmente no menores a 0,05. Por otro lado, se conoce como nivel de confianza a la probabilidad a priori de que el intervalo de confianza a calcular contenga al verdadero valor del parmetro. Se indica por 1- y habitualmente se da en porcentaje (1-) %. Por ejemplo, si se escoge un nivel de significacin del 0,05 5% significa que al elaborar la regla de decisin para aceptar o rechazar la Ho aceptamos que existe unas cinco oportunidades entre cien de rechazar la hiptesis cuando debiera haberse aceptado; es decir, tenemos un 95% de confianza ( 1- = 95%) de que hemos adoptado la decisin correcta. En tal caso, decimos que la hiptesis ha sido rechazada al nivel de significacin 0,05 o que tiene una probabilidad del 5% de ser falsa. Cuanto mayor sea tanto ms probable es que se cometa el error tipo I. 91

JAIME RAMIRO ALIAGA TOVAR

El error tipo II (tipo de error tambin llamado falso negativo) se representa por la letra griega beta (), se comete cuando no se rechaza la Ho siendo esta falsa en la poblacin. Por tanto, y indicarn tanto el tipo de error como la probabilidad de cometerlo. Existen recomendaciones para disminuir el error tipo I y el error tipo II. Veamos las concernientes al error tipo I: a) Depurar la matriz o base de datos para evitar errores provenientes de valores extremos que puedan producir hallazgos significativos; b) Utilizar valores de alfa ms reducidos (0.01 0.001); c) Reproducir el estudio. Si al hacerlo se obtienen resultados similares, estaremos ms seguros de no estar cometiendo el error de tipo I. Por otro lado, recomendaciones para disminuir el error tipo II son: a) Estimar el poder estadstico del estudio; b) Incrementar el tamao del efecto a detectar; c) Incrementar el valor de alfa; d) Utilizar pruebas o tests paramtricos en lugar de pruebas o tests no paramtricos, por ser ms potentes. Los errores tipo I y tipo II estn relacionados. Una disminucin en la probabilidad de uno por lo general tiene como resultado un aumento en la probabilidad del otro. Una recomendacin general para equilibrar la posibilidad de su presentacin es incrementar el tamao de las muestras, hacerlas ms grandes. Actualmente se recomienda que los valores de y deben ser especificados por el investigador antes de iniciar la investigacin. Asimismo, estos valores determinan que tamao (n) de muestra tendra que escogerse para calcular la prueba estadstica elegida. Todava es comn que y n se especifiquen de antemano; al determinarse ambos, tambin queda determinada . Es pertinente sealar que cuando se rechaza la Ho, puede decirse que hay evidencia estadstica a favor de la Ha. En cambio, cuando se acepta la Ho no hay evidencia estadstica para estar a favor de la Ha. En consecuencia, el hecho de no rechazar la Ho no implica que esta sea cierta. Solamente significa que los datos de la muestra son insuficientes para concluir que Ha es cierta.

7.2.5

Si una diferencia ha de considerarse como estadsticamente significativa o no, depende de la probabilidad de que la diferencia en cuestin puede haber surgido por casualidad. Tambin depende de los objetivos del experimento. El nivel de significacin es el margen de tolerancia entre los cuales se afirma que el resultado de la investigacin se debe al azar, o es efecto de la variable independiente. En psicologa se utilizan preferentemente dos niveles de

Nivel de significacin.

92

JAIME RAMIRO ALIAGA TOVAR significacin o riesgo : 0.05 y 0.01, que expresados en porcentaje se denominan niveles de confianza del 95% y 99%, respectivamente).

7.2.6 Grados de libertad. Son las posibilidades

libres variacin que tienen las categoras de las variables. Si por ejemplo se debe expresar: matrculados 68, aprobados 41, los desaprobados cuntos sern?. Estos sern necesariamente 27, que es la diferencia entre estas dos cifras que se han propuesto al azar. En este ejemplo existen tres categoras, y los grados de libertad son dos, porque 68 y 41 son cifras arbitrarias. Entonces los grados de libertad son : K 1 ( K: nmero de categoras; 1: constante). Los grados de libertad varan segn las pruebas estadsticas a usarse en el contraste de hiptesis.

7.3 Pruebas o tests estadsticos paramtricos y no paramtricos.


Las pruebas estadsticas de significacin se agrupan en dos grandes tipos: Se denominan as porque en su modelo estadstico entran en juego los parmetros poblacionales. permitiendo al investigador tomar una decisin con una probabilidad relativamente pequea de errar (Manzano, 1995). Son pruebas que a partir de los datos resultantes de la observacin con los instrumentos y tcnicas apropiadas de las variables de inters en las muestras seleccionadas, estiman los parmetros de la poblacin de acuerdo a modelos de condiciones muy restrictivas respecto a la forma en que se distribuyen esos parmetros. Para aplicarlas, deben ser ciertos algunos requisitos que se encuentran en su modelo estadstico y cumplirse el requisito de medida.

7.3.1 Pruebas paramtricas.

7.3.1.1 Modelo estadstico de la prueba de student.


Como ya sabemos en cualquier inferencia estadstica (prueba de hiptesis ) existe el peligro de cometer el error tipo I o el error tipo II. Por lo tanto el psiclogo debe alcanzar un equilibrio ptimo entre las probabilidades de cometer cualquiera de los dos tipos de errores. Este equilibrio lo da la potencia de la prueba. Las pruebas paramtricas en su modelo tienen suposiciones fuertes y amplias. Si estas suposiciones son vlidas, las pruebas paramtricas son las ms potentes, es decir, son las ms idneas para rechazar una Ho siendo falsa. El modelo de la prueba paramtrica t de student que tomamos como ejemplo tiene las siguientes suposiciones: . El muestreo debe ser aleatorio o al azar 93

JAIME RAMIRO ALIAGA TOVAR . Las poblaciones origen de las muestras deben seguir un patrn de distribucin normal (por su forma llamada campana de Gauss). Esta condicin es mucho ms importante de satisfacer en muestras pequeas. (la normalidad se comprueba, por ejemplo, empleando la prueba de Kolomogorov-Smirnov. . Las poblaciones origen de las muestras deben tener varianzas iguales u homocedasticidad, que se comprueba, por ejemplo, con la prueba F de Levene; es una condicin que siempre debe ser cumplida. Por otro lado, el requisito de medida exige que las variables hayan sido medidas en escala de intervalo o de razn, es decir que sean cuantitativas. Ejemplos de pruebas paramtricas son la t de Student, el coeficiente de correlacin lineal de Pearson, la prueba F de anlisis de varianza, entre otras muchas.

7.3.2 Pruebas no paramtricas.

Son pruebas que no exigen el cumplimiento de condiciones en su modelo estadstico, por ejemplo la distribucin normal de los datos por lo que son llamadas tambin de "distribucin libre", salvo la condicin que el muestreo sea probabilstico, aleatorio. Las variables deben estar medidas en un escalamiento nominal o en un escalamiento ordinal de pocos niveles. Para aplicarlas, deben ser ciertos algunos requisitos que se encuentran en su modelo estadstico y cumplirse el requisito de medida.

7.3.3 Qu utilizamos un test estadstico paramtrico o uno no paramtrico? Para someter a contraste la hiptesis nula (Ho) si
hemos verificado o tenemos la certeza de que se cumplen los supuestos debemos aplicar una prueba paramtrica. Si no se cumplen los supuestos, debemos utilizar una prueba no paramtrica.

94

JAIME RAMIRO ALIAGA TOVAR

EJERCICIOS DE AUTOCOMPROBACIN VII


Responda si las siguientes afirmaciones son verdaderas o falsas. AFIRMACIONES V 1. La hiptesis estadstica es una suposicin elaborada sobre uno o ms parmetros de la poblacin o sobre la distribucin de una poblacin, la cul puede ser verdadera o falsa. 2. La hiptesis nula (Ho) es la que se supone cierta mientras no se pruebe lo contrario y est siempre denotada por una igualdad. 3. La hiptesis alterna (H1) es aquella que se declarar como cierta con evidencia estadstica. Es contraria a la hiptesis nula (Ho). 4. La hiptesis nula (Ho) es, en general, la hiptesis que el investigador est interesado en verificar. 5. El error tipo I es decidir rechazar Ho cuando esta es verdadera o decidir rechazar Ho errneamente. 6. El error tipo II es decidir no rechazar la Ho cuando esta es verdadera o decidir aceptar errneamente la Ho. 7. El nivel de significacin es la probabilidad de cometer el error tipo I y no es fijado por la persona que realiza la investigacin. 8. La prueba t de Student es una prueba estadstica no paramtrica. 9. Para realizar la prueba t de Student se debe tomar en cuenta los siguientes supuestos: muestra(s) tomada(s) al azar, poblacin(es) normalmente distribuda(s), poblaciones con varianzas iguales, variables medidas en escala de intervalo o razn. 10. El supuesto de normalidad se comprueba empleando la prueba F de Levene. F

Complete cada enunciado: ENUNCIADO 1. Cuando del resultado de la prueba de hiptesis se Rechaza Ho, podemos decir que 2. El hecho de no rechazar la Ho no implica que . 3. La decisin de rechazar la Ho significa que.. 4. Cuanto mayor sea el , tanto ms probable es que se cometa el error . 5. El error ... es tambin llamado Falso negativo, mientras que el error .. es tambin llamado Falso positivo. 6. Una recomendacin para disminuir el error tipo I es 95

JAIME RAMIRO ALIAGA TOVAR . 7. El nivel de significacin es el . 8. Los grados de libertad son .

En relacin al texto, elabore enunciados verdaderos en los que se incluyan los siguientes tres trminos: 1. Hiptesis estadstica afirmacin variables Enunciado: 2. Error tipo I error tipo II hiptesis nula Enunciado: 3. Error tipo I rechazar hiptesis nula Enunciado: 4. Error tipo II no rechazar hiptesis nula Enunciado: 5. Supuestos prueba paramtrica prueba no paramtrica Enunciado: D. Argumente su respuesta a la siguiente pregunta: Por qu cree Ud. que se debe preferir las pruebas paramtricas en comparacin con las pruebas no paramtricas? Respuesta:.. .......................................... :

Ejercicios por realizar


1. Cules de las hiptesis que siguen estn bien formuladas ? a) Ho : = 3; H1: 3 b) Ho : > 3; H1: 3 c) Ho: 0.5; H1: < 0.5 d) Ho: = 0.5; H1: >0.5 e) Ho: 3; H1: = 3

96

JAIME RAMIRO ALIAGA TOVAR 2. Asigne a cada concepto el nmero de la definicin que le corresponde. Concepto 1. Probabilidad de rechazar Ho siendo falsa ( ) 2. Probabilidad de aceptar Ho siendo falsa ( ) 3. Probabilidad de rechazar Ho siendo verdadera ( ) 1- 4. Probabilidad de aceptar Ho siendo verdadera ( ) 1- 3. Explique las tres condiciones del modelo estadstico de la prueba t de student. 4. Explique en qu consiste el nivel de significacin? 5. Explique en qu consiste la dcima unilateral. Respuestas a la seccin A: 1) V; 2) V; 3) V; 4) F; 5) V; 6) F; 7) F; 8) V; 9) V; 10) F.

Para saber ms: Sitios Web de referencia


http://www.une.edu.py/maestriacs/pruebas_parametricas_y_no_parametricas.pdf http://www.seh-lelha.org/noparame.htm http://www.tesisperu.com/pastillas/adicionales/pastillas/Pastilla%20%20Pruebas%20estadisticas%20parametricas%20y%20no%20parametricas.pdf http://e-stadistica.bio.ucm.es/web_spss/proc_npar.html

Referencias bibliogrficas
Kerlinger, F. y Lee, H. (2002). Investigacin del comportamiento. McGraw-Hill: Mxico Manzano, V. (1995). Inferencia Estadstica. Aplicaciones con Spss/Pc+. Madrid. Ra-MA. Mejia, E. y Reyes, E. (1994). Tcnicas de investigacin educativa Lima: Cenit. Pardo, A. y San Martn, R. (2001): Anlisis de datos en Psicologa II. Madrid: Pirmide.

97

Você também pode gostar