Você está na página 1de 32

UNIVERSIDAD AUTÓNOMA DE TAMAULIPAS

ESTADÍSTICA INFERENCIAL

DOCENTE: MTRA.MARÍA BEATRÍZ ESPINOZA VÁZQUEZ

INTEGRANTES:

GUERRERO ANDRADE MIGUEL ANGEL

VÁZQUEZ DELMAR ALICIA

“INVESTIGACIÓN”

3º B – LICENCIATURA EN PSICOLOGÍA

H. MATAMOROS, TAMPS. 24 DE NOVIEMBRE DE 2017


ÍNDICIE

Prueba Ji Cuadrado………………………………………………………………………………………………03

Prueba Mann-Whitney…………………………………………………………………………………………08

Prueba de Wilcoxon………………………………………………………………………………...…………24

Análisis Factorial…………………………………………………………………………………………………28

Regresión Múltiple………………………………………………………………………….….…….……….30

Bibliografía…………………………………………………………………………………………………………32
PRUEBA JI CUADRADO = χ2

Esta prueba puede utilizarse incluso con datos medibles en una escala nominal. La hipótesis
nula de la prueba Chi-cuadrado postula una distribución de probabilidad totalmente
especificada como el modelo matemático de la población que ha generado la muestra.

Para realizar este contraste se disponen los datos en una tabla de frecuencias. Para cada
valor o intervalo de valores se indica la frecuencia absoluta observada o empírica (Oi). A
continuación, y suponiendo que la hipótesis nula es cierta, se calculan para cada valor o
intervalo de valores la frecuencia absoluta que cabría esperar o frecuencia esperada
(Ei=n·pi, donde n es el tamaño de la muestra y pi la probabilidad del i-ésimo valor o intervalo
de valores según la hipótesis nula). El estadístico de prueba se basa en las diferencias entre
la Oi y Ei y se define como:

Este estadístico tiene una distribución Chi-cuadrado con k-1 grados de libertad si n es
suficientemente grande, es decir, si todas las frecuencias esperadas son mayores que 5. En
la práctica se tolera un máximo del 20% de frecuencias inferiores a 5.

Si existe concordancia perfecta entre las frecuencias observadas y las esperadas el


estadístico tomará un valor igual a 0; por el contrario, si existe una grande discrepancia
entre estas frecuencias el estadístico tomará un valor grande y, en consecuencia, se
rechazará la hipótesis nula. Así pues, la región crítica estará situada en el extremo superior
de la distribución Chi-cuadrado con k-1 grados de libertad.

Para realizar un contraste Chi-cuadrado la secuencia es:

Analizar

Pruebas no paramétricas

Chi-cuadrado
En el cuadro de diálogo Prueba chi-cuadrado se indica la variable a analizar en Contrastar
variables.

En Valores esperados se debe especificar la distribución teórica activando una de las dos
alternativas. Por defecto está activada Todas las categorías iguales que recoge la hipótesis
de que la distribución de la población es uniforme discreto. La opción Valores requiere
especificar uno a uno los valores esperados de las frecuencias relativas o absolutas
correspondientes a cada categoría, introduciéndolos en el mismo orden en el que se han
definido las categorías.

El recuadro Rango esperado presenta dos opciones: por defecto está activada Obtener de
los datos que realiza el análisis para todas las categorías o valores de la variable; la otra
alternativa, Usar rango especificado, realiza el análisis sólo para un determinado rango de
valores cuyos límites Inferior y Superior se deben especificar en los recuadros de texto
correspondientes.

El cuadro de diálogo al que se accede con el botón Opciones ofrece la posibilidad de calcular
los Estadísticos Descriptivos y/o los Cuartiles, así como seleccionar la forma en que se desea
tratar los valores perdidos.

Esta prueba es aplicable para variables aleatorias discretas o continuas.

Sea una muestra aleatoria de tamaño n tomada de una población con una distribución
especificada f0(x) que es de interés verificar.

Suponer que las observaciones de la muestra están agrupadas en k clases, siendo oi la


cantidad de observaciones en cada clase i = 1, 2, ..., k

Con el modelo especificado f0(x) se puede calcular la probabilidad pi que un dato cualquiera
pertenezca a una clase i.

Con este valor de probabilidad se puede encontrar la frecuencia esperada ei para la clase
i, es decir, la cantidad de datos que según el modelo especificado deberían estar incluidos
en la clase i:

ei = pi n, i = 1, 2, ..., k

Tenemos entonces dos valores de frecuencia para cada clase i

oi: frecuencia observada (corresponde a los datos de la muestra)

ei: frecuencia esperada (corresponde al modelo propuesto)


La teoría estadística demuestra que la siguiente variable es apropiada para realizar una
prueba de bondad de ajuste:

Dado un nivel de significancia α se define un valor crítico 2 χα para el rechazo de la hipótesis


propuesta Ho: f(x) = f0(x).

Si las frecuencias observadas no difieren significativamente de las frecuencias esperadas


calculadas con el modelo propuesto, entonces el valor de estadístico de prueba χ2 será
cercano a cero, pero si estas diferencias son significativas, entonces el valor del estadístico
χ2 estará en la región de rechazo de Ho
Ejemplo:

Se ha tomado una muestra aleatoria de 40 baterías y se ha registrado su duración en años.


Estos resultados se los ha agrupado en 7 clases en el siguiente cuadro

Verificar con 5% de significancia que la duración en años de las baterías producidas por este
fabricante tiene duración distribuida normalmente con media 3.5 y desviación estándar 0.7

Solución:

Sea X: duración en años (variable aleatoria continua):

1) Ho: X ~ N (3.5,0.7) (distribución normal, µ=3.5, σ=0.7)

2) Ha: no H0

3) α = 0.05

Cálculo de la probabilidad correspondiente a cada intervalo:

p1 = P(X≤1.95) = P (Z≤ (1.95 – 3.5) /0.7) = 0.0136

p2 = P(1.95≤X≤2.45) = P ((1.95 – 3.5) /0.7 ≤Z≤ (2.45 – 3.5) /0.7) = 0.0532

p3 = P(2.45≤X≤2.95) = P ((2.45 – 3.5) /0.7 ≤Z≤ (2.95 – 3.5) /0.7) = 0.135 ... (etc.)

Cálculo de las frecuencias esperadas

e1 = p1 n = 0.0136 (40) ≈ 0.5

e2 = p2 n = 0.0532 (40) ≈ 2.1

e3 = p3 n = 0.135 (40) ≈ 5.4 ... (etc.)

Resumen de Resultados:
Es necesario que se cumpla la condición ∀i, ei ≥ 5 por lo que se deben agrupar clases
adyacentes. Como resultado se tienen cuatro clases k=4

Ahora se puede definir la región de rechazo de Ho:

Observemos que en este ejemplo la media y la desviación estándar de la distribución normal


no se estimaron, sino que están propuestas, de donde r = 0

α = 0.05, ν = k – 1 = 3, ⇒ 2 05.0 χ = 7.815 (Tabla χ 2)

Rechazar Ho si χ2 > 7.815

Cálculo del estadístico de prueba:

Decisión:

Como 3.05 no es mayor a 7.9815, se dice que no hay evidencia suficiente para rechazar el
modelo propuesto para la población.

Ejemplo:
En cierta máquina Expendedora de Refrescos existen 4 canales que expiden el mismo tipo
de bebida. Estamos interesados en averiguar si la elección de cualquiera de estos canales
se hace de forma aleatoria o por el contrario existe algún tipo de preferencia en la selección
de alguno de ellos por los consumidores. La siguiente tabla muestra el número de bebidas
vendidas en cada uno de los 4 canales durante una semana. Contrastar la hipótesis de que
los canales son seleccionados al azar a un nivel de significación del 5%.

Canal Número de bebidas consumidas mediante este expendedor


1 13
2 22
3 18
4 17

Solución:

Para realizar el contraste de Bondad de Ajuste debemos calcular las frecuencias esperadas
de cada suceso bajo la hipótesis de uniformidad entre los valores. Si la selección del canal
fuera aleatoria, todos los canales tendrían la misma probabilidad de selección y por lo tanto
la frecuencia esperada de bebidas vendidas en cada uno de ellos debería ser
aproximadamente la misma. Como se han vendido en total 70 refrescos, la frecuencia
esperada en cada canal es

Ei = n * pi = 70* ¼ = 17.5 i = 1, ..., k

El estadístico del contraste sería:

Este valor debemos compararlo con el valor crítico de la distribución 2 χ con (4-1) =3
grados de libertad. Este valor es: 0.95 (3) 7.81

Puesto que el valor del estadístico (2.34) es menor que el valor crítico, no podemos
rechazar la hipótesis de que los datos se ajustan a una distribución uniforme. Es decir, que
los canales son seleccionados aleatoriamente entre los consumidores.

PRUEBA MANN-WHITNEY
La prueba de Mann-Whitney es una prueba no paramétrica que permite comparar dos
muestras independientes.

Tres investigadores, Mann, Whitney y Wilcoxon, perfeccionaron por separado una prueba
no paramétrica muy similar que puede determinar si las muestras pueden considerarse
idénticas o no sobre la base de sus rangos.

Esta prueba se puede utilizar únicamente para estudiar las posiciones relativas de las
muestras. Por ejemplo, si generamos una muestra de 500 observaciones tomadas de una
distribución N (0,1) y una muestra de una distribución de 500 observaciones de una
distribución N (0,4), la prueba de Mann-Whitney no encontrará ninguna diferencia entre las
muestras.

Los resultados propuestos por XLSTAT se basan en el estadístico de U de Mann-Whitney.

Tras activar XLSTAT, seleccione el comando XLSTAT / Pruebas no paramétricas


/ Comparación de dos muestras (Wilcoxon, Mann-Whitney, ...), o bien haga clic en el
botón correspondiente del menú Pruebas no paramétricas (véase más abajo).

Una vez hemos hecho clic en el botón, aparece el cuadro de diálogo. Podemos seleccionar
los datos en la hoja de Excel. Seleccionamos una columna por variable debido a que
tenemos 4 columnas de datos y una columna que corresponde a los identificadores de las
especies.
En la pestaña Opciones, suponemos que la diferencia entre las muestras es igual a 0. Note
que con XLSTAT podemos calcular el valor p exacto.

Una vez hemos hecho clic en el botón OK, se muestran los resultados en una nueva hoja de
Excel (ya que hemos seleccionado una nueva hoja de Excel para los resultados).
Interpretación de una prueba de Mann-Whitney sobre dos muestras independientes

Los primeros resultados son los estadísticos de las diferentes muestras. Obtenemos un
resultado de la prueba para cada variable.

Podemos ver que en el caso de la primera variable queda rechazada la hipótesis nula de
igualdad. Podemos considerar, por tanto, que la longitud del sépalo es significativamente
diferente de una especie a otra.

Los resultados de las otras variables están asimismo disponibles en la salida.

Interpretar todos los estadísticos para la prueba Mann-Whitney:

N. El tamaño de la muestra (N) es el número total de observaciones en la muestra.

Interpretación. El tamaño de la muestra afecta el intervalo de confianza y la potencia de la


prueba.
Generalmente, un tamaño de la muestra más grande da como resultado un intervalo de
confianza más estrecho. Con un tamaño de la muestra más grande, la prueba también
tendrá más potencia para detectar una diferencia.

Mediana. La mediana es el punto medio del conjunto de datos. El valor de este punto medio

es el punto en el cual la mitad de las observaciones está por encima del valor y la otra mitad

está por debajo del valor. La mediana se determina jerarquizando las observaciones y
hallando la observación que ocupe el número [N + 1] / 2 en el orden jerarquizado. Si el

número de observaciones es par, entonces la mediana es el valor promedio de las

observaciones jerarquizadas en los números N / 2 y [N / 2] + 1.

Interpretación. La mediana de cada muestra es una estimación de la mediana de población


de cada muestra.

Diferencia. La diferencia es la diferencia entre las medianas de las dos muestras.

Puesto que la diferencia se basa en los datos de una muestra y no en toda la población, es
improbable que la diferencia en las muestras sea igual a la diferencia en las poblaciones.
Para estimar mejor la diferencia en las poblaciones, utilice el intervalo de confianza.

Intervalo de confianza (IC para la diferencia) y límites.

El intervalo de confianza proporciona un rango de valores probables para la diferencia de


población. Puesto que las muestras son aleatorias, es poco probable que dos muestras de
una población produzcan intervalos de confianza idénticos. Sin embargo, si usted repitiera
muchas veces la muestra, un determinado porcentaje de los intervalos o bordes de
confianza resultantes contendría la diferencia de población desconocida. El porcentaje de
estos intervalos o bordes de confianza que contiene el parámetro es el nivel de confianza
del intervalo. Por ejemplo, un nivel de confianza de 95% indica que, si usted toma 100
muestras aleatorias de la población, podría esperar que aproximadamente 95 de las
muestras contengan la diferencia de población.

Un borde superior define un valor en comparación con el cual es probable que la diferencia
de población sea menor. Un borde inferior define un valor en comparación con el cual es
probable que la diferencia de población sea mayor.

El intervalo de confianza ayuda a evaluar la significancia práctica de los resultados. Utilice


su conocimiento especializado para determinar si el intervalo de confianza incluye valores
que tienen significancia práctica para su situación. Si el intervalo es demasiado amplio para
ser útil, considere aumentar el tamaño de la muestra.
Estimación de la diferencia

IC para la Confianza

Diferencia diferencia lograda

-1.85 (-3, -0.9) 95.52%

En estos resultados, la estimación de la mediana de las poblaciones para la diferencia en el


número de meses que la pintura se mantiene en dos autopistas es −1.85. Usted puede estar
95.52% seguro de que la diferencia entre las medianas de las poblaciones está entre −3.0 y
−0.9.

Hipótesis nula e hipótesis alternativa. Las hipótesis nula y alternativa son dos enunciados

mutuamente excluyentes acerca de una población. Una prueba de hipótesis utiliza los datos

de la muestra para determinar si se puede rechazar la hipótesis nula.

Hipótesis nula. La hipótesis nula indica que un parámetro de población (tal como la media,
la desviación estándar, etc.) es igual a un valor hipotético. La hipótesis nula suele ser una
afirmación inicial que se basa en análisis previos o en conocimiento especializado.

Hipótesis alternativa. La hipótesis alternativa establece que un parámetro de población es


más pequeño, más grande o diferente del valor hipotético de la hipótesis nula. La hipótesis
alternativa es lo que usted podría pensar que es cierto o espera probar que es cierto.

Valor W. El estadístico de Mann-Whitney (valor W) es la suma de los rangos de la primera

muestra.

Minitab calcula el estadístico de Mann-Whitney de la siguiente manera:

1. Minitab jerarquiza las dos muestras combinadas. Minitab asigna el rango 1 a la


observación más pequeña, el rango 2 a la segunda observación más pequeña, y así
sucesivamente.
2. Si hay dos o más observaciones iguales, Minitab asigna el rango promedio a las dos
observaciones.
3. Minitab suma los rangos de la primera muestra.
Interpretación. Minitab utiliza el estadístico de Mann-Whitney para calcular el valor p, que
es una probabilidad que mide la evidencia en contra de la hipótesis nula.
Puesto que la interpretación del estadístico de Mann-Whitney depende del tamaño de la
muestra, utilice el valor p para tomar una decisión sobre la prueba. El valor p tiene el mismo
significado para muestras de cualquier tamaño.

Valor p. El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula.

Un valor p más pequeño proporciona una evidencia más fuerte en contra de la hipótesis

nula.

Interpretación. Utilice el valor p para determinar si la diferencia en las medianas de las


poblaciones es estadísticamente significativa.

Para determinar si la diferencia entre las medianas es estadísticamente significativa,


compare el valor p con el nivel de significancia. Por lo general, un nivel de significancia
(denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de
0.05 indica un riesgo de 5% de concluir que existe una diferencia cuando no hay una
diferencia real.

Valor p ≤ α: La diferencia entre las medianas no es estadísticamente significativa (Rechaza


H0)

Si el valor p es menor que o igual al nivel de significancia, la decisión es rechazar la hipótesis


nula. Usted puede concluir que la diferencia en las medianas de las poblaciones es
estadísticamente significativa. Utilice su conocimiento especializado para determinar si la
diferencia es significativa desde el punto de vista práctico.

Valor p > α: La diferencia entre las medianas no es estadísticamente significativa (No puede
rechazar H0)
Si el valor p es mayor que el nivel de significancia, la decisión es que no se puede rechazar
la hipótesis nula. Usted no tiene suficiente evidencia para concluir que la diferencia entre
las medianas de las poblaciones es estadísticamente significativa. Debe asegurarse de que
su prueba tenga suficiente potencia para detectar una diferencia que es significativa desde
el punto de vista práctico.

Un empate ocurre cuando el mismo valor está en ambas muestras. Si sus datos tienen
empates, Minitab muestra un valor p ajustado para empates y un valor p no ajustado. El
valor p ajustado por lo general es más exacto que el valor p sin ajustar. Sin embargo, el
valor p sin ajustar es el cálculo más conservador, porque siempre es mayor que el valor p
ajustado para un determinado par de muestras.

La prueba de Mann-Whitney se usa para comprobar la heterogeneidad de dos muestras


ordinales. El planteamiento de partida es:

 Las observaciones de ambos grupos son independientes


 Las observaciones son variables ordinales o continuas.
 Bajo la hipótesis nula, la distribución de partida de ambos grupos es la misma y,
 Bajo la hipótesis alternativa, los valores de una de las muestras tienden a exceder a
los de la otra: P(X > Y) + 0.05 P(X = Y) > 0.05.

Cálculo estadístico:

Para calcular el estadístico U se asigna a cada uno de los valores de las dos muestras su
rango para construir

Donde n1 y n2 son los tamaños respectivos de cada muestra; R1 y R2 es la suma de los


rangos de las observaciones de las muestras 1 y 2 respectivamente.

El estadístico U se define como el mínimo de U1 y U2.

Los cálculos tienen que tener en cuenta la presencia de observaciones idénticas a la hora
de ordenarlas. No obstante, si su número es pequeño, se puede ignorar esa circunstancia.

Distribución del estadístico.

La prueba calcula el llamado estadístico U, cuya distribución para muestras con más de 20
observaciones se aproxima bastante bien a la distribución normal.
La aproximación a la normal, z, cuando tenemos muestras lo suficientemente grandes viene
dada por la expresión:

Donde mU y sU son la media y la desviación estándar de U si la hipótesis nula es cierta, y


vienen dadas por las siguientes fórmulas:
Esta prueba estadística es útil cuando las mediciones se pueden ordenar en escala ordinal
(es decir, cuando los valores tienden a una variable continua, pero no tienen una
distribución normal) y resulta aplicable cuando las muestras son independientes.

Este procedimiento es una buena alternativa cuando no se puede utilizar la prueba t de


Student, en razón de no cumplir con los requisitos que esta prueba exige.

La fórmula es la siguiente:

Dónde:
U1 y U2 = valores estadísticos de U Mann-
Whitney.
n1 = tamaño de la muestra del grupo 1.
n2 = tamaño de la muestra del grupo 2. R1 =
sumatoria de los rangos del grupo 1.
R2 = sumatoria de los rangos del grupo 2.

Pasos:
 Determinar el tamaño de las muestras (n1 y n2). Si n1 y n2 son menores que 20, se
consideran muestras pequeñas, pero si son mayores que 20, se consideran muestras
grandes.
 Arreglar los datos en rangos del menor al mayor valor. En caso de que existan ligas o
empates de rangos iguales, se deberán detectar para un ajuste posterior.
 Calcular los valores de U1 y U2, de modo que se elija el más pequeño para comparar con
los críticos de U Mann-Whitney de la tabla de probabilidades asociadas con valores
pequeños como los de U en la prueba de Mann-Whitney.
 En caso de muestras grandes, calcular el valor Z, pues en estas condiciones se distribuye
normalmente.
 Decidir si se acepta o rechaza la hipótesis.
Ejemplo muestras pequeñas:

Un experimentador utiliza dos métodos para enseñar a leer a un grupo de 10 niños de 6


años, quienes ingresan por primera vez a la escuela. El experimentador quiere demostrar
que el procedimiento ideado por él es más efectivo que el tradicional; para ello, mide
el desempeño en la lectura en función de la fluidez, comprensión, análisis y síntesis.
El plan experimental preliminar consiste en elegir al azar tanto una muestra de 10 niños
como el método por utilizar.

Elección de la prueba estadística. El modelo experimental tiene dos muestras


independientes. Las mediciones revelan que no se satisfacen los requisitos para utilizar una
media aritmética, en razón de que uno de los valores en cada muestra se aleja demasiado
de las demás; por lo tanto, no corresponde a una escala de intervalo, de manera que se
decide usar una escala ordinal.

Planteamiento de la hipótesis:

 Hipótesis alterna (Ha). Las calificaciones de ejecución de lectura, según el método


de enseñanza del experimentador son más altas y diferentes que las observadas en el
método tradicional.
 Hipótesis nula (Ho). Las diferencias observadas entre las calificaciones de ejecución de
lectura mediante los dos métodos se deben al azar.

Nivel de significación. Para todo valor de probabilidad igual o menor que 0.05, se acepta
Ha y se rechaza Ho.

Zona de rechazo. Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza
Ha.

Dos métodos diferentes aplicados en dos grupos de niños:

Aplicación de la prueba estadística. De acuerdo con los pasos, las observaciones se deben
ordenar en rangos del menor al mayor. Rangos de lectura de la tabla anterior.
Calculamos la U:

De los dos valores de U calculados, se elige el más pequeño (4) y se comparan con los valores
críticos de U Mann-Whitney.

En caso de que el valor de U calculado no se localice en las tablas correspondientes, se


transformará en la fórmula siguiente:

U = n1n2 - U'

En esta fórmula, U' corresponde al valor más alto.

Decisión:

A la probabilidad del valor U de Mann-Whitney, calculado anteriormente, corresponde


0.048, el cual es más pequeño que el nivel de significancia; por lo tanto, se acepta Ha y se
rechaza Ho.
Interpretación.
Entre las calificaciones de la ejecución de lectura mediante los dos métodos de enseñanza
existe una diferencia significativa a un nivel de probabilidad de error menor que 0.05; es
decir, aun cuando las muestras son pequeñas, las calificaciones más altas mediante el
método diseñado por el experimentador señalan más efectividad, con la probabilidad de
equivocarse de 0.048 para aceptarlo.

Ejemplo aplicable cuando la muestra es mayor a 25 y donde n1 y n2 pueden ser iguales o


de un tamaño diferente:

El experimentador del ejemplo previo, entusiasmado por las observaciones preliminares,


decide aumentar el tamaño de las muestras. En este estudio tiene 10 niños con el método
tradicional y 25 mediante el procedimiento ideado por él. Los datos del nuevo estudio se
muestran en la tabla más adelante.

Elección de la prueba estadística. El diseño experimental tiene dos muestras


independientes. Las mediciones en esta condición quizá no impidan utilizar una prueba
paramétrica, sin embargo, para fines de aprendizaje, se decide utilizar una escala ordinal y
continuar con la prueba de U de Mann-Whitney.
Planteamiento de la hipótesis.

 Hipótesis alterna (Ha). Las calificaciones aportadas por el método reciente, ideado por el
experimentador, son diferentes y con valores más altos.
 Hipótesis nula (Ho). Las diferencias entre las calificaciones dadas por ambos métodos se
deben al azar.

Nivel de significación.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho.

Zona de rechazo. Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza
Ha.

Población de niños de 6 años a los cuales se les aplicó dos métodos de enseñanza.

Aplicación de la prueba estadística.

 Primero ordenamos los rangos de todas las observaciones.


 Dirección de las ligas o empates y el tamaño de estas.
Calculamos la U.

Tomando en cuenta los pasos, nos menciona que cuando la muestra es mayor que 25, se
distribuye normalmente, por lo cual se determina el valor Z para conocer la probabilidad.

Esto se calcula como sigue:

Dónde:
Z = valor estadístico de la curva normal.
U = cualquier valor de U calculado (ya sea U1 o U2).
= valor promedio de U.
sU = desviación estándar de U.

Calculamos el valor promedio de U:

La desviación estándar de U de determina de la forma siguiente:

Dónde:
sU = desviación estándar de U.
n1 y n2 = tamaño de la muestra de los grupos 1
y 2.
N = tamaño total de la muestra (la suma de n1 y
n2).
Li = sumatoria de las ligas o empates.

El cálculo de Li se realiza de la siguiente manera:

Una vez obtenida la sumatoria de Li, se determina la desviación estándar de U (? U)


mediante la expresión siguiente:
Una vez calculados los parámetros necesarios, se obtiene el valor Z conforme la siguiente
fórmula:

Para obtener la probabilidad del valor Z de 1.95, se debe consultar la tabla de tamaño de la
muestra en función de los valores d y buscar la hilera 1.9, en cuya columna 0.05 se localiza
el número 0.0256, que corresponde a la probabilidad del valor de U con respecto al
promedio. Esto quiere decir que es menor que el nivel de significancia.

Decisión.
A la cifra de Z de 1.95 le corresponde una probabilidad menor que 0.05, por lo cual se
acepta Ha y se rechaza Ho (tabla de probabilidades asociadas en valores extremos como los
de 2 en la distribución normal).

Interpretación.
El experimentador, al aumentar su muestra, confirma la investigación preliminar con una
muestra pequeña, con lo cual da a entender que los resultados logrados con el método
ideado por él son diferentes de los obtenidos con el método de enseñanza de lectura
tradicional; además, este último revela calificaciones más bajas y es menos efectivo que el
otro.

La efectividad del método ideado por el experimentador se traduce en mayor fluidez de la


lectura, mejor comprensión y análisis y síntesis superior, en razón de que las calificaciones
finales son consecuencia de estas condiciones.
Ejemplo:

Una dirección estatal de vialidad utiliza dos marcas de pintura para pintar las rayas en las
carreteras. Un funcionario de esa dirección desea saber si la durabilidad de las dos marcas
de pintura es diferente. Para cada pintura, el funcionario registra el número de meses que
la pintura se mantiene en la carretera.

El funcionario realiza una prueba de Mann-Whitney para determinar si la mediana del


número de meses que la pintura persiste es diferente para las dos marcas.

1. Abra los datos de muestra, PinturaCarreteras.MTW.


2. Elija Estadísticas > No paramétricos > Mann-Whitney.
3. En Primera muestra ingrese Marca A.
4. En Segunda muestra, ingrese Marca B.
5. Haga clic en Aceptar.

Interpretar los resultados

La hipótesis nula indica que la diferencia entre las dos marcas con respecto a la mediana del
número de meses que persiste la pintura es 0. Puesto que el valor p es 0.0019, que es menor
que el nivel de significancia de 0.05, el funcionario rechaza la hipótesis nula. El funcionario
concluye que la diferencia entre las dos marcas con respecto a la mediana del número de
meses que persiste la pintura no es 0. El IC de 95.5 por ciento indica que es probable que la
mediana de la población de la marca B sea mayor que la de la marca A.

Mann-Whitney: Marca A, Marca B

Método:

η₁: mediana de Marca A

η₂: mediana de Marca B

Diferencia: η₁ - η₂

Estadísticas descriptivas:

Muestra N Mediana

Marca A 11 36.0

Marca B 10 37.6
Estimación de la diferencia:

IC para la Confianza

Diferencia diferencia lograda

-1.85 (-3, -0.9) 95.52%

Prueba:

Hipótesis nula H₀: η₁ - η₂ = 0

Hipótesis alterna H₁: η₁ - η₂ ≠ 0

Método: Valor W Valor p:

No ajustado para empates 76.50 0.002

Ajustado para empates 76.50 0.002


PRUEBA DE WILCOXON

Es una prueba no paramétrica de comparación de dos muestras relacionadas, debe cumplir


las siguientes características:

• Es libre de curva, no necesita una distribución específica.

• Nivel ordinal de la variable dependiente.

Se utiliza para comparar dos mediciones de rangos (medianas) y determinar que la


diferencia no se deba al azar (que la diferencia sea estadísticamente significativa).

Prueba Signo-Rango

Se usa: Para comparar dos muestras relacionadas; es decir, para analizar datos obtenidos
mediante el diseño antes-después (cuando cada sujeto sirve como su propio control) o el
diseño pareado (cuando el investigador selecciona pares de sujetos y uno de cada par, en
forma aleatoria, es asignado a uno de dos tratamientos). Pueden existir además otras
formas de obtener dos muestras relacionadas.

Cuando la variable es:

 Cuantitativa medida en escala ordinal.


 Cuantitativa medida en escala de intervalo o de razón, pero las diferencias (di) de
los pares de datos no se distribuyen normalmente. En este caso, se usa en lugar de
la prueba t de Student para dos muestras relacionadas o “t pareada”.

Ejemplo:

Los datos corresponden a una muestra de 8 pacientes varones de 45 a 55 años de edad. Son
lecturas de colesterol total tomadas tras 12 horas de ayuno y repetida una hora después de
comer. ¿Hubo un incremento significativo de los niveles de colesterol después de la
comida?
Solución:

Hipótesis:

H0: No hubo incremento significativo de colesterol total después de la comida.

H1: Hubo incremento significativo de colesterol total después de la comida.

Cálculo del contraste T:

T = 33,5 (o T = 2,5)

Cálculo de zT:

En este caso n = 8 (ya que no hubo ningún par de datos iguales)

Valor de p:

p = 1 – 0,9850 p = 0,015

Decisión y Conclusión:

Siendo p = 0,015 (< 0,05), se rechaza la hipótesis nula. Se concluye que hubo un incremento
estadísticamente significativo de los niveles de colesterol después de la comida (p = 0,015).

Prueba Suma de Rangos


Se usa:

o Para comparar dos poblaciones independientes.


o Cuando la variable es:
 Cuantitativa medida en escala ordinal.
 Cuantitativa medida en escala de intervalo o de razón, pero la variable en una o en
las dos poblaciones no tiene distribución normal. En este caso, se usa en lugar de la
prueba t Student para dos muestras independientes.

Ejemplo:

Se tomó una muestra de 10 universitarias y otra de 10 universitarios para determinar si las


mujeres tenían actitud más positiva que los varones frente a la Iglesia católica. Los puntajes
en un cuestionario de actitudes fueron:( mayor puntaje, actitud más positiva).

¿La población de universitarias, tiene actitud más positiva que los universitarios frente a la
Iglesia católica?

Solución:

Hipótesis:

H0: mediana de puntajes de las mujeres ≤ mediana de varones.

H1: mediana de puntajes de las mujeres > mediana de varones.

En otros términos:

H0: Las mujeres no tienen actitudes más positivas que los varones frente a la Iglesia Católica.
H1: Las mujeres tienen actitudes más positivas que los varones frente a la Iglesia Católica.

Suma de Rangos:

W = suma de rangos.

W = 74,5

Cálculo de Z:

Valor de p:

Siendo la prueba unilateral: p = 0,0104

Decisión y Conclusión:

Decisión: Siendo p = 0,0104 (< 0,05), se rechaza la hipótesis nula.

Conclusión: Las mujeres tienen actitudes más positivas que los varones frente a la Iglesia
Católica (p = 0,0104)

ANÁLISIS FACTORIAL
Es una técnica estadística de reducción de datos usada para explicar las correlaciones entre
las variables observadas en términos de un número menor de variables no observadas
llamadas factores.

En numerosas áreas de Psicología y de Ciencias del Comportamiento no es posible medir


directamente las variables que interesan; por ejemplo, los conceptos de inteligencia y de
clase social. En estos casos es necesario recoger medidas indirectas que estén relacionadas
con los conceptos que interesan. Las variables que interesan reciben el nombre de variables
latentes y la metodología que las relaciona con variables observadas recibe el nombre de
Análisis Factorial.

El modelo de Análisis Factorial es un modelo de regresión múltiple que relaciona variables


latentes con variables observadas. El Análisis Factorial tiene muchos puntos en común con
el análisis de componentes principales, y busca esencialmente nuevas variables o factores
que expliquen los datos.

En el análisis de componentes principales, en realidad, sólo se hacen transformaciones


ortogonales de las variables originales, haciendo hincapié en la varianza de las nuevas
variables. En el análisis factorial, por el contrario, interesa más explicar la estructura de las
covarianzas entre las variables.

El análisis factorial se originó en psicometría, y se usa en las ciencias del comportamiento


tales como ciencias sociales, marketing, gestión de productos, investigación operativa, y
otras ciencias aplicadas que tratan con grandes cantidades de datos.

El análisis factorial se utiliza para identificar factores que expliquen una variedad de
resultados en diferentes pruebas.
Por ejemplo, investigación en inteligencia halla que la gente que obtienen una nota alta en
una prueba de habilidad verbal también se desempeña bien en pruebas que requieren
habilidades verbales. Los investigadores explican esto mediante el uso de análisis factorial
para aislar un factor a menudo llamado inteligencia cristalizada o inteligencia verbal, que
representa el grado en el cual alguien es capaz de resolver problemas usando habilidades
verbales.
Análisis factorial en psicología se asocia frecuentemente con la investigación sobre la
inteligencia. Sin embargo, también se ha utilizado en un amplio rango de dominios, tales
como personalidad, actitudes, creencias, etc. Está asociado a la psicometría, debido a que
puede evaluar la validez de un instrumento estableciendo si el instrumento de verdad mide
los factores postulados.

 Tipos de Análisis Factorial


El análisis factorial exploratorio, AFE, se usa para tratar de descubrir la estructura interna
de un número relativamente grande de variables. La hipótesis a priori del investigador es
que pueden existir una serie de factores asociados a grupos de variables. Las cargas de los
distintos factores se utilizan para intuir la relación de éstos con las distintas variables. Es el
tipo de análisis factorial más común.
El análisis factorial confirmatorio, AFC, trata de determinar si el número de factores
obtenidos y sus cargas se corresponden con los que cabría esperar a la luz de una teoría
previa acerca de los datos. La hipótesis a priori es que existen unos determinados factores
preestablecidos y que cada uno de ellos está asociado con un determinado subconjunto de
las variables. El análisis factorial confirmatorio entonces arroja un nivel de confianza para
poder aceptar o rechazar dicha hipótesis.

Ejemplo:

Se estudia una muestra de consumo de drogas entre 1634 estudiantes de Los Ángeles. Se
consideraron 13 tipos de sustancias y, así, 13 variables con 5 niveles de respuesta (desde
consumo nulo hasta consumo habitual). Se obtiene la matriz de correlaciones.

Se obtiene que el número más razonable de factores es de 6. El primero recoge drogas


socialmente aceptadas y blandas, el segundo factor se refiere a drogas duras, el tercer
factor es simplemente anfetaminas y el cuarto, hachís. Los dos últimos factores resultan
difíciles de interpretar.

Aunque el número de factores matemáticamente más coherente es 6, se puede considerar


una solución con 3 o 4 factores sólo dado que los residuos, obtenidos al restar la matriz de
correlaciones original y la reproducida, son pequeños.

REGRESIÓN MÚLTIPLE
Cuando existe una posible relación entra varias variables independientes y otra
dependiente se hace necesario el uso de la REGRESIÓN MULTIPLE.

La regresión múltiple se usa con mayor frecuencia en las publicaciones de las


investigaciones cuando se requiere crear un modelo donde se seleccionan variables que
pueden influir en la respuesta, descartando aquellas que no aportan información,
cuando se requiere detectar la interacción entre variables independientes que afectan
a la variable y cuando se requiere identificar variables confusoras.

Ejemplo:

Una Empresa de desarrollo de software establece relacionar sus Ventas en función del
número de pedidos de los tipos de software que desarrolla (Sistemas, Educativos y
Automatizaciones Empresariales), para atender 10 proyectos en el presente año.
En la Tabla representa Y (Ventas miles de S/.) X (Nº pedidos de sistemas), W (Nº de
pedidos de Aplicaciones Educativas) y Z (Nº de pedidos de Automatizaciones
empresariales).

Y 440 455 470 510 506 480 460 500 490 450

X 50 40 35 45 51 55 53 48 38 44

W 105 140 110 130 125 115 100 103 118 98

Z 75 68 70 64 67 72 70 73 69 74

 Análisis de Regresión Múltiple

Dispone de una ecuación con dos variables independientes adicionales:

Se puede ampliar para cualquier número "m" de variables independientes:

Para poder resolver y obtener y en una ecuación de regresión múltiple


el cálculo se presenta muy tediosa porque se tiene atender 3 ecuaciones que se
generan por el método de mínimo de cuadrados:

Para poder resolver se puede utilizar programas informáticos como AD+, SPSS y
Minitab y Excel.

REFERENCIAS BIBLIOGRÁFICAS
 http://www.ub.edu/aplica_infor/spss/cap5-2.htm
 http://www.bioingenieria.edu.ar/academica/catedras/metestad/PRUEBAS_DE_
BONDAD_DE_AJUSTE-1.pdf
 https://www.uoc.edu/in3/emath/docs/Chi_cuadrado.pdf
 https://help.xlstat.com/customer/es/portal/articles/2062371-prueba-de-mann-
whitney-tutorial-en-excel
 https://support.minitab.com/es-mx/minitab/18/help-and-how-
to/statistics/nonparametrics/how-to/mann-whitney-test/interpret-the-
results/all-statistics/
 https://support.minitab.com/es-mx/minitab/18/help-and-how-
to/statistics/nonparametrics/how-to/mann-whitney-test/before-you-
start/example/
 Downie, N. (1973) Métodos estadísticos aplicados. Harper & Row Publisher Inc.
Standard Book Number 06-3100746
 Farfán, J. (2013) Apuntes de estadística en investigación educativa. Universidad
Nacional Enrique Guzmán y Valle. Lima. Perú
 http://www.rincondepaco.com.mx/rincon/Inicio/Apuntes/Proyecto/archivos/Docu
mentos/Wilcoxon.pdf
 https://es.slideshare.net/pei.ac01/pruebas-no-parametricas-de-wilcoxon-
2007?from_action=save
 http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/AMult/tema4a
m.pdf
 http://estadisticauazteca.blogspot.mx/2010/07/regresion-multiple.html

Você também pode gostar