Escolar Documentos
Profissional Documentos
Cultura Documentos
FACULTAD DE INGENIERA
ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL
Octubre de 2015
Nuevo Chimbote - Per
DIOS
TODOPODEROSO,
sus
consejos,
su
apoyo
mis
abuelos
FRANCISCO,
JOSEFA
quienes
AGRADECIMIENTO
Atentamente,
Makely
PRESENTACIN
Seor profesor Jos Cerna Montoya:
Atentamente,
Makely
INDICE
DEDICATORIA
AGRADECIMIENTO
PRESENTACIN
INDICE
INTRODUCCIN
I.
CONFIABILIDAD
Teora clsica de la confiabilidad
Coeficiente test-retest
Coeficiente de formas paralelas
Coeficientes de consistencia interna
Mtodo de divisin por mitades.
Mtodo de Kuder-Richardson.
Confiabilidad entre calificadores
II.
VALIDEZ
Validez de contenido
Validez con relacin a criterio
Validez concurrente.
Validez predictiva.
Error estndar de estimacin.
Factores que afectan la validez con relacin a criterios
Validacin convergente y discriminante.
III.
METODOLOGIA
Tipo de investigacin
Identificacin de variables
Operalizacin de las variables
IV.
CONCLUSIN
REFERENCIAS BIBLIOGRFICAS
INTRODUCCIN
Todo instrumento de recoleccin de datos debe resumir dos requisitos esenciales:
validez y confiabilidad. Con la validez se determina la revisin de la presentacin del
contenido, el contraste de los indicadores con los tems (preguntas) que miden las
variables correspondientes. Se estima la validez como el hecho de que una prueba sea
de tal manera concebida, elaborada y aplicada y que mida lo que se propone medir.
Algunos autores como Black y Champion (1976), Johnston y Pennypacker
(1980:190-191), Kerlinger (1980:190-191), citados por Barba y Sols (1997:232-234),
sealan que la validez es un sinnimo de confiabilidad. El primero, se refiere al
significado de la medida como cierta y precisa. El segundo, se refiere al hecho de lo que
se mide actualmente es lo que se quiere medir. Se estima la confiabilidad de un
instrumento de medicin cuando permite determinar que el mismo, mide lo que se
quiere medir, y aplicado varias veces, indique el mismo resultado.
Hernndez et al (2003:243), indican que la confiabilidad de un instrumento de
medicin se refiere al grado en que su aplicacin repetida al mismo sujeto u objeto,
produce iguales resultados.
Para Baechle y Earle (2007:277-278) la validez es el grado en que una prueba o tem
de la prueba mide lo que pretende medir; es la caracterstica ms importante de una
prueba. Al referirse a la validez relativa a un criterio definen a ste como la medida en
que los resultados de la prueba se asocian con alguna otra medida de la misma aptitud;
Consideran los autores que en muchas ocasiones la validez relativa a un criterio se
estima en forma estadstica utilizando el coeficiente de correlacin de Pearson (tambin
denominado tabulacin cruzada, a este tipo de validez se le denomina validez
concurrente. Al definir el trmino fiabilidad, los autores argumentan que es la medida
del grado de consistencia o repetibilidad de una prueba. Una prueba tiene que ser fiable
para ser vlida, porque los resultados muy variables tienen muy poco significado.
Seisdedos (2004:19) opina que el grado en que la prueba mide una variable o
conjunto de conductas definidas por el investigador se le denomina validez de
constructo y al grado de concomitancia (correlacin) entre pruebas que apuntan a
variables o constructos similares los denomina validez concurrente o validez criterial.
Para acercarnos a la validacin de este trabajo adoptamos la tipologa propuesta por
Maxwell y Stake (2006:109), que plantea cinco tipos de validez que se pueden
relacionar con algunas etapas de nuestra investigacin:
1. Validez descriptiva. Se refiere a la que est relacionada con la etapa inicial de la
investigacin. Usualmente involucra la recopilacin de datos. El resultado principal es
la informacin que describe lo que fue observado y experimentado. Para ello es muy
importante tanto la seleccin del lenguaje como de los datos relevantes.
2. Validez interpretativa. La certeza en la interpretacin es vlida si los actores
pueden confirmar o reconocer los descubrimientos de la investigacin en particular.
3. Validez terica. La validez terica es un anlisis ms abstracto que la validez
descriptiva e interpretativa, relacionada con la inmediatez fsica y mental del fenmeno
estudiado. Las construcciones y marcos tericos de los investigadores, sean teoras o
metateoras conocidas, definen intrnsecamente la recopilacin y la interpretacin de los
datos en la etapa inicial de la investigacin.
4. Generalidad. Este tipo de validez se refiere al grado en que la explicacin es
aceptada para ser generalizable. Sin embargo es pertinente aclarar que para algunos
investigadores cualitativos, el generalizar descubrimientos, es considerado de poca
importancia.
5. Validez evaluativa. Se refiere a la aplicacin de un marco evaluativo, que es
similar en la investigacin cualitativa y cuantitativa. Es pertinente aclarar que la
evaluacin no puede ser considerada como un comunicado conclusivo.
Llama la atencin lo expresado por Smaling (s.f.:1), cuando relata que el carcter
cientfico de una investigacin incluida la cualitativa, lleva implcito la persuasin
argumentativa. Despus de todo, una investigacin que reclama su cientificidad debe
tener defensibilidad, para lo que se requiere calidad en la argumentacin para el pblico
lector.
CONFIABILIDAD
Ningn instrumento psicomtrico puede considerarse de valor a menos que sea una
medida consistente, o confiable. En consecuencia, una de las primeras cosas que ser
necesario determinar acerca de una prueba de elaboracin reciente es si resulta lo
suficientemente confiable como para medir lo que fue diseada para medir. Si, en
ausencia de cualquier cambio permanente en una persona debido al crecimiento, al
aprendizaje, a alguna enfermedad o lesin, las puntuaciones en una prueba varan con la
ocasin o la situacin, es probable que la prueba no sea lo suficientemente confiable
como para ser usada en describir y evaluar a la gente y hacer predicciones sobre su
conducta. Hablando en trminos estrictos, ms que ser una caracterstica de una prueba,
la confiabilidad es una propiedad de las puntuaciones obtenidas cuando se administra la
prueba a un grupo particular de personas en una ocasin particular y bajo condiciones
especficas (Thompson, 1994).
Note que confiabilidad no es lo mismo que estabilidad: al determinar la confiabilidad
se asume que la prueba mide una caracterstica relativamente estable. A diferencia de la
inestabilidad, la falta de confiabilidad es resultado de errores de medicin producidos
por estados internos temporales, como la baja motivacin o la falta de disposicin, o de
condiciones externas como un ambiente de prueba incmodo o con distracciones.
Teora clsica de la confiabilidad
En la teora clsica de los retest se supone que la calificacin observada de una
persona en una prueba est compuesta por una puntuacin "real" ms algn error no
sistemtico de medicin. La puntuacin real de una persona en una prueba particular se
A debe administrarse primero a la mitad del grupo y la forma B a la otra mitad; luego,
en la segunda aplicacin, el primer grupo presenta la forma B y el segundo la forma A.
La correlacin resultante entre las calificaciones de las dos formas, conocida como
coeficiente de estabilidad y equivalencia, toma en cuenta errores debidos a los
diferentes momentos de aplicacin o a los distintos reactivos.
Coeficientes de consistencia interna
Se dispone de formas paralelas para una serie de pruebas, en particular para pruebas
de habilidad (aprovechamiento, inteligencia, aptitudes especiales). Sin embargo, una
forma paralela de una prueba a menudo es costosa y difcil de elaborar. Por esta razn se
elabor un mtodo menos directo de tomar en cuenta los efectos de diferentes muestras
de los reactivos de una prueba sobre la confiabilidad. Este es el mtodo de consistencia
interna, que incluye el mtodo de divisin por mitades de Spearman, las frmulas de
Kudcr-Richardson y el coeficiente alfa de Cronbach. Sin embargo, los errores de
medicin causados por diferentes condiciones o momentos de aplicacin no se reflejan
en un coeficiente de consistencia interna. En consecuencia, este tipo de coeficientes no
pueden verse como verdaderos equivalentes de los coeficientes test-retest o de formas
paralelas.
Mtodo de divisin por mitades.
En este enfoque simplificado de la consistencia interna una sola prueba se considera
compuesta por dos partes (formas paralelas) que miden la misma cosa. De este modo,
puede aplicarse una prueba y asignar calificaciones separadas a sus dos mitades
seleccionadas de manera arbitraria. Por ejemplo, los reactivos con nmeros nones
pueden calificarse por separado de los que tienen nmeros pares. Entonces la
correlacin (roc) entre los dos conjuntos de calificaciones obtenidas por un grupo de
personas es un coeficiente de confiabilidad de formas paralelas para una mitad de la
prueba tan larga como la prueba original. Suponiendo que las dos mitades equivalentes
tienen medias y varianzas iguales, la confiabilidad de la prueba como un todo puede
estimarse mediante la frmula Spearman-Brown:
Para demostrar el uso de la frmula 5.4, suponga que la correlacin entre las
calificaciones totales obtenidas en los reactivos con nmeros nones y en los reactivos
con nmeros pares de una prueba es .80. Entonces la confiabilidad estimada de toda la
prueba es r11 = 2(.80)/(l +.80) = .89.
Mtodo de Kuder-Richardson.
Una prueba puede dividirse de muchas formas diferentes en dos mitades que
contengan igual nmero de reactivos. Como cada forma puede dar por resultado un
valor algo diferente de rM, no queda claro qu estrategia de divisin producir el mejor
estimado de confiabilidad. Una solucin al problema es calcular el promedio de los
coeficientes de confiabilidad obtenidos de todas las divisiones por mitades corno el
estimado global de confiabilidad. Esto puede hacerse, pero el siguiente procedimiento
abreviado fue elaborado por Kuder y Richardson (1937).
Bajo ciertas condiciones, la media de todos los coeficientes de divisin por mitades
puede estimarse mediante una de las siguientes frmulas:
es la media de las
Para demostrar la aplicacin de la frmula 5.6, suponga que una prueba que contiene
75 reactivos tiene una media de 50 y una varianza de 100. Entonces r,, = [75 - 50(75 50)/100]/74 = .84.
Coeficiente alfa. Las frmulas 5.5 y 5.6 son casos especiales del coeficiente alfa ms
general (Cronbach, 1951). El coeficiente alfa se define como:
VALIDEZ
De manera tradicional, la validez se ha definido como el grado en que una prueba
mide lo que est diseada para medir. Una desventaja de esta definicin es la
implicacin de que una prueba slo tiene una validez, la cual supuestamente es
establecida por un solo estudio para determinar si la prueba mide lo que se supone debe
medir. En realidad, una prueba puede tener muchas clases de validez, dependiendo de
los propsitos especficos para los cuales fue diseada, la poblacin objetivo, las
condiciones en que se aplica y el mtodo para determinar la validez.
Los mtodos por los cuales puede determinarse la validez incluyen (1) analizar el
contenido de la prueba, (2) calcular la correlacin entre las calificaciones en la prueba y
las calificaciones en el criterio de inters y (3) investigarlas caractersticas psicolgicas
particulares o constructos medidos por la prueba. Todos esos procedimientos son tiles
en la medida que mejoran la comprensin de lo que mide una prueba y proporcionan
informacin para tomar decisiones sobre la gente. Tambin puede ser de inters evaluar
la validez creciente de una prueba, es decir, qu tanto aade la prueba a la prediccin y
comprensin de los criterios que ya son anticipados por otras medidas.
A diferencia de la confiabilidad, la cual es influida slo por los errores no
sistemticos de medicin, la validez de una prueba es afectada tanto por los errores no
sistemticos como por los sistemticos (constantes). Por esta razn, una prueba puede
ser confiable sin ser vlida, pero no puede ser vlida sin ser confiable. La confiabilidad
es una condicin necesaria, pero no suficiente, para la validez.
Validez de contenido
La apariencia fsica de una prueba con respecto a sus propsitos particulares {validez
de facie) es ciertamente una consideracin importante a tener en cuenta al
comercializarla. No obstante, el concepto de validez de contenido se refiere a algo ms
que a la apariencia. La validez de contenido atae a si ste produce un rango de
respuestas que son representativas del dominio entero o universo de habilidades,
entendimientos y otras conductas que supuestamente debe medir la prueba. Se supone
que las respuestas a la muestra de reactivos de una prueba bien diseada son indicativas
de lo que seran las respuestas al universo entero de conductas de inters.
Un anlisis de la validez de contenido ocurre ms a menudo en conexin con las
pruebas de aprovechamiento, para las cuales por lo general no existe un criterio externo
especificado. La validez de contenido tambin es de inters en las medidas de aptitud,
inters y personalidad, aunque quiz menos que la validez de constructo o la relacionada
con un criterio. En una prueba de aprovechamiento se evala la validez de contenido
analizando la composicin de la prueba para determinar el grado en que representa los
objetivos de la enseanza. Una forma de lograr esto es comparar el contenido de la
prueba con un bosquejo o tabla de especificaciones concernientes a la materia que va a
ser cubierta por la prueba. Si expertos en la materia coinciden en que una prueba parece
y acta como un instrumento diseado para medir lo que se supone debe medir,
entonces se dice que posee validez de contenido.
III.
METODOLOGA
VALIDEZ
De manera tradicional, la validez se ha definido como el
grado en que una prueba mide lo que est diseada para
medir.
Los mtodos por los cuales puede determinarse la
validez incluyen: (1) analizar el contenido de la prueba,
(2) calcular la correlacin entre las calificaciones en la
prueba y las calificaciones en el criterio de inters y (3)
investigarlas caractersticas psicolgicas particulares o
constructos medidos por la prueba..
Los tipos de validez son:
Validez de contenido:
El concepto de validez de contenido se refiere a algo
ms que a la apariencia. La validez de contenido
atae a si ste produce un rango de respuestas que
son representativas del dominio entero o universo de
habilidades, entendimientos y otras conductas que
supuestamente debe medir la prueba.
Validez con relacin a criterio:
La validacin de cualquier prueba de habilidad
consiste en relacionar las calificaciones en la prueba
con el desempeo en medidas o estndares de criterio
con los cuales pueden compararse las calificaciones.
Validez concurrente:
Los procedimientos de validacin concurrente se
emplean siempre que una prueba se aplica a personas
clasificadas en varias categoras, como grupos de
diagnstico clnico o niveles socioeconmicos, con el
propsito de determinar si las puntuaciones en la
prueba de las personas ubicadas en una categora son
INSTRUMENTOS DE INVESTIGACIN
El xito de una investigacin, adems de
la plena identificacin de las variables,
la correcta formulacin de la hiptesis,
la estrategia adecuada para probar dichas
hiptesis, etc., depende de la calidad de
los instrumentos de investigacin de
datos, de ah que resulta muy importante
que el investigador asuma esta tarea con
la mayor responsabilidad posible.
Validez predictiva:
La validez predictiva atae a la precisin con que las
puntuaciones de una prueba predicen puntuaciones
de criterio, segn lo indica la correlacin entre la
prueba (predictor) y un criterio del desempeo
futuro.
IV.
REFERENCIAS BIBLIOGRFICAS
Yin, Robert K. (2009). Case Study Research, design and mhetods. Fourth edition,
California, U.S.A.. SAGE Inc.