Mtodos de adquisicin del conocimiento La bsqueda de la verdad ha sido una de las preocupaciones de siempre del ser humano. Ahora bien, Qu es la verdad? o Cmo llegar a la verdad?. En esta ocasin no nos centraremos en discutir sobre que es la verdad, nos enfocaremos en cmo llegar a la verdad, o mejor dicho como llegar al conocimiento vlido. Histricamente, la humanidad ha empleado cuatro mtodos para adquirir el conocimiento: La autoridad. El conocimiento se considera vlido por el slo hecho de que una tradicin o alguna persona reconocida afirma que lo es. El racionalismo. Al conocimiento se llega exclusivamente por la va del razonamiento, es decir, si las premisas de que se pa rte son vlidas, y el razonamiento que se sigue de acuerdo a la lgica es el correcto, entonces las conclusiones son vlidas tambin. La intuicin. El conocimiento proviene de una inspiracin, esa idea que aclara y salta a la conciencia como un todo. No se llega al conocimiento por medio de la razn, sino que por el contrario, con frecuencia la idea surge despus de que fall el razonamiento consciente. El mtodo cientfico. El conocimiento vlido es aquel que se cumple con las exigencias del mtodo. Aqu, ya sea mediante un razonamiento o por su intuicin, el investigador crea una hiptesis acerca de determinado aspecto de la realidad, misma que somete a prueba. Para ello, recoge ciertos datos que luego analiza estadsticamente y con ello confirma o rechaza su hiptesis. En este caso, no importa lo que el cientfico crea que es vlido, l debe someter a prueba su hiptesis. Con el anlisis estadstico de los datos, ser posible extraer una conclusin acorde a la realidad. As, el mtodo cientfico permite garantizar que las afirmaciones que hagamos se ajusten a lo que se demostr, antes de que las afirmaciones reciban la categora de conocimiento cientfico. As pues, el mtodo cientfico se apoya en la estadstica para evaluar las hiptesis que hacemos, ahora es conveniente de que definamos Estadstica. 1.2 Qu es la estadstica Es comn que en los medios de comunicacin o en nuestro entorno escuchemos frases que de alguna manera involucran el trmino estadstica: El cerebro de las mujeres pueden atender m s tareas a la vez que el cerebro de los hombres Las estadsticas del partido son El desempleo aumenta en Delicias segn las estadsticas del gobierno Datos estadsticos muestran el incremento de la violencia en el estado de Chihuahua En estos casos, el trmino estadstica tiene un uso relacionado con el manejo de nmeros, que si bien es cierto se relaciona con el contenido de nuestro curso, no es eso todo, ya que la estadstica es ms que slo nmeros, son los datos y lo que se hace con stos ltimos.
Una definicin concreta la propone Johnson (2004): Estadstica es la ciencia de recolectar, describir e interpretar datos As pues, la estadstica nos ayudar en el conocimiento de la realidad en tres etapas fundamentales: 1. Planear la bsqueda y la obtencin de la informacin. 2. Sistematizar y organizar la informacin para describirla y analizarla con facilidad. 3. Efectuar inferencias sobre la realidad a partir de la informacin obtenida, haciendo estimaciones o verificando conjeturas. 1.3 Estadstica descriptiva y 1.4 Estadstica Inferencial Para su estudio, la Estadstica se divide en dos: Estadstica descriptiva. Se refiere a las tcnicas que se utilizan para la organizacin, presentacin y descripcin de los datos. Tambin se conoce como estadstica deductiva. Estadstica inferencial. Se refiere a las tcnicas que se emplean con los datos obtenidos en la muestra, para a partir de ellos, hacer inferencias sobre sus respectivas poblaciones. Tambin se le conoce como estadstica inductiva Como se observa, comienzan a aparecer nuevos conceptos que tenemos que comprender. Poblacin. Conjunto de personas, objetos o de entidades, misma que se simboliza con N. Algunos le llaman tambin universo y lo refieren como la totalidad de todas las posibles observaciones. Dicha poblacin puede ser finita o infinita. Poblacin finita. Cuando la poblacin tiene fin. Por ejemplo, el nmero de alumnos del Centro Regional Delicias de la Universidad Pedaggica Nacional. Poblacin infinita. Cuando se desconoce o no tiene fin la poblacin. Por ejemplo, todos los posibles resultados (guila o sello) de sucesivas tiradas de una moneda. Muestra. Es un conjunto de medidas u observaciones tomadas a partir de una poblacin dada, por lo que es un subconjunto de la po blacin que se simboliza con N. Variable. Caracterstica de inters sobre cada elemento individual de una poblacin o muestra. Dato. Valor de la variable asociada a un elemento de la poblacin o muestra. Este valor puede ser un nmero, una palabra o un smbolo. Datos. Conjunto de valores recolectados para la variable de cada uno de los elementos que pertenecen a la muestra. 1.5 Breve introduccin a la Inferencia Estadstica. Recapitulando, los conceptos de poblacin y de muestra nos permiten considerar las tres etapas de la estadstica que hemos mencionado. La primera etapa refiere a la planeacin de la bsqueda y la obtencin de la informacin; en particular, esta parte incluye mtodos que permiten disear un esquema para la seleccin de una muestra representativa de la poblacin.
La segunda parte de la estadstica es la que se encarga de sistematizar y organizar la informacin contenida en una muestra o en una poblacin, es decir los valores de la variable. Esta parte incluye mtodos que permiten describir y analizar la informacin. La tercera parte comprende mtodos estadsticos que permiten inferir, a partir de la informacin de una muestra, cules pueden ser los rasgos principales de los valores de la poblacin. Pero ojo, cuando hacemos inferencias sobre la poblacin a partir de una muestra, estamos obteniendo ciertas conclusiones sobre la realidad. Por ello, el proceso de seleccin de los individuos, objetos o entidades que se estudiarn debe estar bien diseado, para que la muestra sea repre sentativa de la poblacin. Pero por muy representativa de la poblacin que sea la muestra, no deja de ser una subcoleccin de la poblacin, una de las muchas muestras posibles igualmente representativas. Es probable que si se hubiera obtenido otra muestra, los valores de sta habran sido distintos. Si ambas muestras son representativas de la poblacin, los valores de cada una nos dan una idea acerca de los valores de la poblacin, pero no nos informan totalmente acerca de ellos. Con una muestra representat iva, los mtodos de la estadstica inferencial permiten hacer ciertas afirmaciones acerca de la poblacin con la mxima confianza posible, es decir con el mnimo riesgo posible de cometer error, pero an as hay probabilidad de error. La probabilidad ocupa un lugar importante en este proceso, ya que aporta un lenguaje que permite expresar en forma cuantificable tanto la confianza que podemos tener en una inferencia estadstica como el riesgo de cometer un error en esta inferencia. La estadstica inferencial hace posible no slo hacer estimaciones sino tambin probar hiptesis. Esto significa poner a prueba conjeturas que se hacen acerca del fenmeno bajo estudio, es decir contrastar los hechos que se deducen de ellas con los hechos observados. Los mtodos estadsticos de prueba de hiptesis permiten decidir si la informacin contenida en una muestra contradice o corrobora una hiptesis planteada sobre la poblacin. Errores en el uso de la Estadstica Cmo se miente con estadstica? La estadstica puede ser una herramienta poderosa que nos ayuda a conocer la realidad. Sin embargo puede tambin servir para mentir... si no se tiene cuidado de usar correctamente los mtodos estadsticos y de interpretar correctamente sus resultados. Es famosa la siguiente frase del ministro ingls Disrael: hay tres clases de mentiras: las mentiras, las grandes mentiras y la estadstica. Curiosamente, la cita aparece con frecuencia en los libros de estadstica, aunque parece hacerle poca propaganda a la disciplina. Lo que ocurre es que la estadstica como toda herramienta, no puede cometer errores por s misma: los errores y las mentiras son responsabilidad de quien la usa incorrectamente.
Suele suceder que en la presentacin de resultados de investigaciones poco serias se utili ce la estadstica para dar la impresin de que todo ha sido realizado en forma muy cientfica. Con frecuencia ocurre tambin que quienes leen u oyen tales presentaciones presuponen, implcita o explcitamente que el estudio es en efecto muy cientfico; no le prestan atencin al reporte de nmeros y grficos pero creen a ojos cerrados las interpretaciones que se hacen de ellas. Se le presentan una serie de siete preguntas que le pueden servir de gua para un anlisis crtico de los reportes serios y de l os no tan serios. 1. Qu se est midiendo, y cmo? Como hemos visto, el uso de la estadstica requiere que las caractersticas de inters puedan ser medidas. Hay que tomar con alguna reserva los reportes de investigaciones que involucren caractersticas cuya medicin es tan compleja como la de la herencia gentica o del medio ambiente cultural si se reporta con detalle el procedimiento utilizado en la medicin. Es pertinente preguntarse de qu manera surgieron los datos obtenidos. Supongamos por ejemplo que un entusiasta estudiante de odontologa decide investigar con qu frecuencia se lavan los dientes los adultos de una comunidad, y que para ello les hace la siguiente pregunta: usted se lava los dientes tres veces al da, verdad?. 2. Cmo es la muestra? Los reportes de estudios que se hicieron sobre una muestra no siempre especifican cmo se observ sta. Entonces cabe preguntarse si la muestra es representativa de la poblacin sobre la que se pretende hacer inferencias. Supongamos, por ejemplo, que en una ciudad se desea investigar qu tipo de pelculas les gustan a los adultos de clase media, y que para ello se hace una encuesta de casa en casa, algunos barrios de clase media a medioda entre semana. Es obvio que los adultos que se entrevistan sern sobre todo amas de casa, y que una muestra as slo es representativa, si acaso, de la poblacin de adultos de clase media de esta ciudad que se encuentran en su casa a medioda entre semana. La muestra puede tambin ser demasiado pequea. Cuando las univ ersidades norteamericanas empezaron a admitir mujeres estudiantes, alguien report, alarmado, que 33.3% de las estudiantes de una universidad se haban casado con profesores de la institucin. La cifra es impresionante, pero deja de serlo cuando se sabe que en esa universidad haba tres mujeres estudiantes y que una de ellas se haba casado con un profesor. 3. Qu se est probando, y cmo? Nunca est de ms tener cuidado con frases que empiezan as: se ha demostrado que . Si el reporte incluye la prueba de alguna hiptesis, hay que buscar el planteamiento explcito de sta. Adems, como veremos en el transcurso de la asignatura, el uso de cada mtodo, y en especial de los inferenciales, requiere que los datos satisfagan ciertas condiciones. Conviene, pues, preguntarse si el mtodo estadstico utilizado es el ms apropiado para el tipo de datos obtenidos. 4. Qu informacin falta? Muchas de las trampas en las que incurren los reportes de investigaciones consisten en que no se incluye informacin que puede ser relevante, ya sean por falta de espacio o porque a los autores les interese ocultar dicha informacin. Un caso tpico es cuando no se reporta el tamao de la muestra. El reporte puede no incluir los datos obtenidos en la investigacin. Esto no es demasiado grave si se incluyen los resultados brindados por la estads tica descriptiva, pero lo es si se incluyen slo los datos favorables a la conclusin que se quiere obtener y se excluyen los que la contradicen. Puede tambin omitirse informacin que, explica los resultados de modo distinto al que se quiere presentar. Por ejemplo, un comerciante de cuadernos escolares puede vanagloriarse de haber logrado que sus ganancias crecieran en slo el transcurso de un mes mientras no informe que el crecimiento ocurri en septiembre y que adems aument el precio de los cuadernos por el inicio del ao escolar. 5. Se est hablando siempre de lo mismo? Es frecuente que se utilicen datos reales para obtener conclusiones disparatadas. Supongamos por ejemplo que se sabe que en cierta gran ciudad el nmero de personas atropelladas por vehculos motorizados a medioda es el cudruple del de los atropellados a medianoche. Alguien puede inferir que entonces es mucho ms seguro caminar por las calles de esa ciudad a medianoche que a medioda claro, sin tomar en cuenta que el nmero de personas que circulan por las calles en muchsimo mayor a medioda que a medianoche. En algunos estudios las trampas de este tipo pueden estar en el proceso de medicin. Por ejemplo hace algunas dcadas el nmero de indgenas que haba en la sierra tarahumara era de 28 mil slo cinco aos ms tarde era de 105 mil. Pero el aumento se explica, ms que por un crecimiento real de la poblacin por el inters de en ser contada, ya que el primer cen so se realiz para estudiar el pago de impuestos y el segundo para repartir vveres despus de una sequa. 6. Tiene sentido? Esta pregunta es una invitacin a que se considere si los resultados reportados en un escrito son congruentes con el sentido comn. Supongamos que un estudio reporta que la cosecha de maz va relacin directa con la precipitacin pluvial: mientras ms llueve, ms maz se cosecha. Esta coherente slo dentro de cierto rango: demasiada lluvia arruina la cosecha. Es muy frecuente que se utilicen nmeros impresionantemente precisos cuyo significado es escaso, como un gasto familiar diario promedio de $201.58, o una efectividad 54.813% mayor mtodo de enseanza (especialmente si no se dice mayor que qu). Eso s, nmeros as hacen que los reportes se vean muy verosmiles, o, como usualmente se dice, muy cientficos. 7. Quin lo dice? Muchas de las estadsticas que omos o leemos tienen fines publicitarios. Se ha demostrado estadsticamente que el fertilizando HHH es ms efectivo para el cultivo de la papa. Si esta afirmacin es firmada por los fabricantes del fertilizante HHH, hay serias razones para hacer un escrutinio minucioso de los datos, los mtodos utilizados y los resultados obtenidos con el fin de determinar si la conclusin es vlida o no. Las falacias pueden ser ms sutiles. Supongamos que a los fabricantes del fertilizante HHH les interesa parecer realmente muy cientficos. Entonces pueden crear el Laboratorio de Investigaciones Cientficas Agropecuarias Experimentales (o mejor an, el LICAESA). Tal vez, las preguntas y los ejemplos que hemos presentado le hayan dejado la idea de que los reportes que incluyen un tratamiento estadstico de la informacin mienten descaradamente y no es cierto. Muchas veces la estadstica se utiliza correctamente, y las conclusiones obtenidas son validas. Nuestro deseo es que esto ocurra cada vez con mayor frecuencia.
Y para no dejarse engaar, conviene manejar los aspectos elementales de la estadstica siempre con actitud crtica toda clase de reportes e informes, particularmente aquellos en los involucrados intereses monetarios o de poder. 1.6 Teora de Decisin en Estadstica DECISIONES ESTADSTICAS Muy a menudo, en la prctica, se tienen que tomar decisiones sobre poblaciones, partiendo de la informacin muestral de las mismas. Tales decisiones se llaman decisiones estadsticas. Por ejemplo, se puede querer decidir a partir de los datos del muestreo, si un suero nuevo es realmente efectivo para la cura de una enfermedad, si un sistema educacional es mejor que otro, si una moneda determinada est o no cargada, etc. HIPTESIS ESTADSTICAS. HIPTESIS NULA Para llegar a tomar decisiones, conviene hacer de terminados supuestos o conjeturas acerca de las poblaciones que se estudian. Tales supuestos que pueden ser o no ciertos se llaman hiptesis estadsticas y, en general, lo son sobre las distribuciones de probabilidad de las poblaciones. En muchos casos se formulan las hiptesis estadsticas con el solo propsito de rechazadas o invalidadas. Por ejemplo, si se quiere decidir si una moneda est cargada, se formula la hiptesis de que la moneda est bien, es decir, p = 0,5; donde p es la probabilidad de cara. Anlogamente, si se quiere decidir sobre si un procedimiento es mejor que otro, se formula la hiptesis de que no hay diferencia entre los procedimientos (es decir, cualquier diferencia observada se debe meramente a fluctuaciones en el muestreo de la misma poblacin). Tales hiptesis se llaman tambin hiptesis nulas y se denotan por H0. Cualquier hiptesis que difiera de una hiptesis dada se llama hiptesis alternativa. Por ejemplo, si una hiptesis es p = 0,5 hiptesis alternativas son p = 0,7; p< 0,5 o p > 0,5. Una hiptesis alternativa de la hiptesis nula se denota por H1 1.7 Componentes de una Investigacin Estadstica Una investigacin se puede denominar estadstica cuando las hiptesis son afirmaciones relativas a la distribucin de una o ms vari ables aleatorias. En estas investigaciones pueden identificarse, entre otros, los siguientes componentes: Un universo: un conjunto de entidades (personas, seres vivos, objetos inanimados) respecto de los cuales se desea conocer alguna o algunas de sus caractersticas. Variables: caractersticas medibles que poseen todas las unidades del universo. Objeto de la investigacin: no consiste en identificar las entidades del universo con ciertas caractersticas, sino que se trata de resumir informacin acerca de la distribucin de dichas caractersticas en la poblacin Procedimiento de recoleccin: es posible conocer, mediante un procedimiento adecuado, el valor de la o las variables de algunas o de todas las entidades del universo. Restricciones: en cuanto a los recursos disponibles (humanos, tcnicos, financieros) y en cuanto a la oportunidad en que deben darse a conocer los resultados de la investigacin, lo que obliga a elegir, entre varias estrategias alternativas, la que resulte ms eficiente.
La investigacin estadstica exige la participacin de diferentes especialistas (estadsticos, informticos, especialistas en la materia investigada) en un conjunto de actividades que deben seguir una secuencia lgica, aunque con variantes que la pueden hacer ms o menos eficiente, ms o menos exitosa. Una investigacin estadstica puede fracasar cuando no ha sido adecuadamente planificada, cuando el presupuesto es insuficiente o no se asigna en forma equilibrada entre las diferentes actividades, cuando no se dispone de personal capacitado o cuando se cometen errores graves en la ejecucin de las tareas o en el procesamiento de la informacin. La materia prima de la investigacin estadstica son los datos. La clave del xito de la investigacin est relacionada con los procedimientos que se siguen para la seleccin, la recoleccin y el tratamiento de los datos. Las actividades que involucra una investigacin estadstica pueden clasificarse con arreglo a diversos criterios. Uno de ellos se relaciona con el orden cronolgico en que deben ser realizadas. En este sentido, puede hablarse de tres grandes etapas o fases: - planificacin - ejecucin y procesamiento - anlisis y divulgacin. 1.8 Recoleccin de Datos En el entorno de ingeniera, los datos son casi siempre una muestra que ha sido seleccionado de alguna poblacin. Hay tres mtodos bsicos de recoleccin de datos: Un estudio retrospectivo usando datos histricos Un estudio observacional Un diseo de experimento Un procedimiento eficaz de recoleccin de datos puede simplificar el anlisis y conducir a una mejor comprensin de la poblacin o proceso que se est estudiando. Qu implica la Recoleccin de Datos? Una vez que seleccionamos el diseo de investigacin apropiado y la muestra adecuada de acuerdo con nuestro problema de estudio e hiptesis, la siguiente etapa consiste en recolectar los datos pertinentes sobre las variables involucradas en la investigacin. Recolectar los datos implica tres actividades estrechamente vinculadas entre s: Seleccionar un instrumento de medicin de los disponibles en el estudio del comportamiento o desarrollar uno (el instrumento de recoleccin de los datos). Este instrumento debe ser vlido y confiable, -de lo contrario no podemos basamos en sus resultados. Aplicar ese instrumento de medicin. Es decir, obtener las observaciones y mediciones de las variables que son de inters para nuestro estudio (medir variables). Preparar las mediciones obtenidas para que puedan analizarse correctamente (a esta actividad se le denomina codificacin de los datos).
QU SIGNIFICA MEDIR? De acuerdo con la definicin clsica del trmino ampliamente difundida medir significa asignar nmeros a objetos y eventos de acuerdo a reglas (Stevens, 1951), esta definicin es ms apropiada para las ciencias fsicas que para las ciencias sociales, ya que varios de los fenmenos que son medidos en stas no pueden caracterizarse como objetos o eventos, puesto que son demasiado abstractos para ello. Este razonamiento nos hace sugerir que es ms adecuado definir la medicin como el proceso de vincular conceptos abstractos con indicadores empricos proceso que se realiza mediante un plan explicito y organizado para clasificar (y frecuentemente cuantificar) los datos disponibles los indicadores en trminos del concepto que el investigador tiene en mente. Y en este proceso, el instrumento de medicin o de recoleccin de los datos juega un papel central. Sin l no hay observaciones clasificadas. En toda investigacin aplicamos un instrumento para medir las variables contenidas en las hiptesis (y cuando no hay hiptesis, simplemente para medir las variables de inters). Esa medicin es efectiva cuando el instrumento de recoleccin de los datos realmente representa a las variables que te nemos en mente. Si no es as nuestra medicin es deficiente y por lo tanto la investigacin no es digna de tomarse en cuenta. Desde luego, no hay medicin perfecta, es prcticamente imposible que representemos fielmente variables tales como la inteligencia, la motivacin, el nivel socioeconmico, el liderazgo democrtico, la actitud hacia el sexo y otras ms; pero s debemos de acercarnos lo ms posible a la representacin fiel de las variables a observar, mediante el instrumento de medicin que desarrollemos. QU REQUISITOS DEBE CUBRIR UN INSTRUMENTO DE MEDICIN? Toda medicin o instrumento de recoleccin de los datos debe reunir dos requisitos esenciales: confiabilidad y validez La confiabilidad de un instrumento de medicin se refiere al grado en que su aplicacin repetida al mismo sujeto u objeto, produce iguales resultados. La validez, en trminos generales, se refiere al grado en que un instrumento realmente mide la variable que pretende medir. El mtodo ms utilizado para recolectar datos es: Cuestionario o Entrevista personal o Entrevista telefnica 1.9 Estadstica Paramtrica (poblacin y muestras aleatorias) Hay dos clases de pruebas estadsticas: Las paramtricas y las no paramtricas. Las pruebas paramtricas tienen mayor capacidad para detectar una relacin real o verdadera entre dos variables, si es que la misma existe. Por ello, exigen que los datos a los que se aplican, cumplan tres requisitos: Variable numrica: Que las variables de estudio (dependiente) est medida en una escala que sea por lo menos de intervalo. Normalidad: Que los valores de la variable dependiente sigan una distribucin normal; por lo menos, en la poblacin a la que pertenece la muestra. Prueba estadstica: Kolmogorov Smirnov Homocedasticidad: Que las varianzas de la variable dependiente en los grupos que se comparan sean aproximadamente iguales (homogeneidad de las varianzas). Prueba estadstica: Test de Levene. Propiedades 1. Requieren que las variables se midan con la escala intervalo o de razn 2. Se relacionan con el estudio de un parmetro de la poblacin (media, varianza, desviacin estndar, etc.) Cuando se conoce la forma funcional de la funcin de distribucin que sigue la variable aleatoria objeto de estudio y slo tenemos que estimar los parametros que la determinan, estamos en un problema de inferencia estadstica paramtrica; por el contrario cuando no se conoce la forma funcional de la distribucin que sigue la variable aleatoria objeto de estudio, estamos ante un problema de inferencia estadstica no paramtr ica. En lo que sigue nos vamos a limitar a problemas de inferencia estadstica paramtrica, donde la variable aleatoria objeto de estudio sigue una distribucin normal, y slo tendremos que tratar de estimar los parmetros que la determinan, la media (medidas de tendencia central) y la desviacin tpica (medidas de dispersin). Esta situacin se presenta con frecuencia debido a que es posible a menudo conocer la forma funcional de la distribucin de probabilidad, por consideraciones tericas, quedando nicamente indeterminados los parmetros que determinan la funcin de distribucin. Promedio, media o media aritmtica: Se define como el cociente que se obtiene al dividir la suma de los valores de la variable por el n de observaciones. Se aplica a varia bles numricas. Su frmula es la siguiente: Para una muestra Para una poblacin Varianza: Es la media aritmtica de los cuadrados de las desviaciones. Se denota por S2 o 2. Este valor cuantifica el grado de dispersin o separacin de los valores de la distribucin con respecto a la media aritmtica. A mayor dispersin mayor valor de la varianza, a menor dispersin menor valor de la varianza.
Su frmula es la siguiente: Desviacin estndar: La desviacin estndar es una medida del grado de dispersin de los datos con respecto al valor promedio. Dicho de otra manera, la desviacin estndar es simplemente el "promedio" o variacin esperada con respecto a la media aritmtica. Se define como la raz de la varianza.