Escolar Documentos
Profissional Documentos
Cultura Documentos
Página 1 de 27
Estadísticas Comprensivos
D. Conceptos básicos
1. POBLACIÓN O UNIVERSO – Totalidad de individuos, objetos o medidas que comparten por lo menos una característica en
común. Deben compartir todas las características deseadas por el investigador. Todos los sujetos bajo observación.
2. PARÁMETRO – Cuando se estudia la totalidad de los casos en el universo. Es una medida única no tiene error y representa
el valor que toma la variable al momento de la medición.
3. ESTADÍGRAFO O LA ESTADÍSTICA – Si el investigador se limita al estudio de una muestra, los valores que obtiene para
las variables se denominan estadígrafos o las estadísticas. Por lo general el estadígrafo o estadísticas y el parámetro van a
diferir rara vez serán idénticos.
muestra estadística
parámetro universo
4. VARIABLE – Cualquier características bajo estudio que toma diferentes valores.
a. Variables continuas – aquellas que pueden tomar un número infinito de valores en la escala. Toda variable susceptible
a medición. Ej. masa, temperatura, peso, distancia, velocidad y tiempo.
b. Variable discretas – no pueden subdividirse a infinito, se le otorga un valor exacto. Ej. sexo, religión, marcas de auto,
graduados de universidad, etc.
5. VARIABLE INDEPENDIENTE – Factor que existe que se puede manipular y ver como se refleja en la variable
dependiente. La que manipula el investigador. Es la supuesta causa.
6. VARIABLE DEPENDIENTE – La que se mide en el estudio. Es la consecuente, el efecto, es la que se observa para ver si la
independiente cambia o se relaciona.
Página 2 de 27
Estadísticas Comprensivos
7. DATOS – Cifras, números o índices que han sido recopilados. Información que se recoge.
8. CLASES – Alternativas que toma o que se asignan a la variable. Algunas variables se distribuyen en clases nominales y otras
a través de valores numéricos. Ej. el género tiene dos clases varones y mujeres. Ej. el peso de estudiantes de cuarto año podría
representarse en clases agrupadas: 121-130, 131-140
9. LIMITES REALES DE LAS CLASES – Se definen como los puntos donde comienzan y terminan las clases. Estos se
obtienen (cuando son números enteros) restando .5 al límite inferior aparente y sumando .5 al superior. Cuando terminan en
decimal se utiliza el .05. El límite aparente es el número dado, no se le suma ni se le resta. El límite real es el .05.
10. PUNTO MEDIO – Valor en la clase agrupada que se ha de tomar como representativo de dicha clase. Se obtiene sumando
los límites aparentes de la clase y dividiendo por dos. (121+130 = 251/2 = 125.5)
11. INTERVALO DE CLASES – Se refiere al recorrido de cada clase; esto es, el número de términos incluidos. De 121-130 son
10. el número de clases es el número inferior del intervalo menos el número inferior del otro intervalo.
12. TIPOS DE ESCALA – Cuatro tipos de escala o niveles de medición para representar las variables que se interesan estudiar.
a. escala nominal –Variables cualitativas, representan características o atributos. Se definen a través de categorías. Ej.
variable género, varones, mujeres.
b. escala ordinal – Variable que nos da un orden pero no nos da la diferencia entre intervalos. Los números o clases
reflejen el orden de los sujetos bajo estudio, pero no la magnitud de las diferencias. Ej. ordenar minerales en término
de resistencia.
c. escala intervalo – Nos dan un orden y diferencias entre intervalos. Proporcionan números que reflejan, tanto el orden
como las diferencias entre los sujetos. Carecen de un cero absoluto, lo que impide comparaciones tales como:
inteligencia, Juan es el doble de inteligente que María. Aunque Juan haya obtenido 150 y María 75.
d. escala de razones – Poseen orden, la diferencia entre intervalos es la misma. Tienen un cero absoluto. Estas son
iguales a las escalas por intervalos, excepto en una cosa: las escala de razones tienen cero absoluto. Ej. longitud, peso,
tiempo.
13. MUESTRA – Una parte supuestamente representativa del universo del cual se obtuvo.
14. MUESTREO ALEATORIO- Todos los sujetos de la población tienen la misma oportunidad de ser escogidos. Esta es la
mejor forma de la selección de muestra. Hay 2 tipos de muestro aleatorio: Con reposición o técnico: la probabilidad se
mantiene, el sujeto es devuelto a sistema de elección. Sin reposición: probabilidad se aminora al no devolver al sujeto al
sistema de elección.
Página 3 de 27
Estadísticas Comprensivos
a. MUESTRA POR CONGLOMERADOS-Se selecciona al azar los grupos, es preferible escoger más en el medio y
menos al final. Se considera el grupo y no los sujetos, se recomienda para cuando es difícil conseguir muestreo al azar.
b. MUESTRA SIMPLE-Se escoge toda la población, se depositan los nombre en una urna y se seleccionan 100. las
desventajas es que se necesitan saber todos los nombres y tenerlos en lista y que se debe tener contacto con todas las
personas.
c. MUESTRA POR ESTRATOS -Dividir la población en distintos grupos y seleccionar una muestra que sea
representativa.
d. MUESTRA PROPORCIONAL-El propósito es mantener la proporción que existe en la población.
Página 4 de 27
Estadísticas Comprensivos
18. ERROR RESIDUAL – se incluyen todas las demás fuentes de variación no controladas. Ej. factores ambientales,
condiciones anímicas de los sujetos.
19. NÚMEROS RELATIVOS-Permiten al investigador establecer relaciones simples, lo que facilita no solo el extraer
conocimientos y las referencias numéricas, sino también hacer las comparaciones sin los inconvenientes asociados a los
números.
a. Razones- es la más frecuentemente utilizada. Relacionan 2 cantidades. EJ. 8 mujeres por cada 10 hombres.
b. Proporciones-la suma de proporciones en una distribución dad es igual a 1. relaciona 3 cantidades o más. EJ.
P=A/A+B, donde P=proporción, A=cantidad que se quiere cambiar a proporción y B= a la otra cantidad.
c. Por cientos- proporciones por 100.
d. Cambio porcentil-es una medida que permite determinar en cuanto por ciento ha mermado o a aumentado un
fenómeno entre 2 puntos de referencia. Es ver el cambio a través del tiempo.
e. Tasas-se relaciona a un evento con la población expuesta a dicho evento. Las mismas indican riesgo. Se afectan por:
distribución de población por edad, ingreso y educación. Para eliminar 3 puntos decimales o más, las tasas se
multiplican por 1000.
20. DISTRIBUCIÓN DE FRECUENCIAS-Agrupa los datos para facilitar el manejo. Organiza la información en forma lógica
para que se le puedan aplicar los métodos estadísticos.
21. TABLAS SIMPLES-Contiene una variable. Presentan en la columna izquierda la característica que se intenta estudiar,
acompañada de otra columna a la derecha indicando frecuencia o número de participantes que caen en esa categoría.
22. ARREGLO DE VALORES-Se ubican los números en un orden particular, generalmente en forma descendente.
23. DISTRIBUCIÓN CON CLASES NO AGRUPADAS-Quiere decir el número de términos incluidos o los valores no
agrupados.
24. DISTRIBUCIÓN CON CLASES AGRUPADAS-Cuando se suman más cantidades de intervalos (+ de las f=Σf). Se logra
sumar las frecuencias a partir de la clase menor en dirección a la mayor. Cuando se agrupa es conveniente mantener la
distribución en 15 clases; no menos de 10 ni mayor de 20. siempre que sea posible debe proveerse un intervalo igual para
todas las clases.
25. TABLAS BIVARIABLES-Permiten observar la posible existencia de relaciones entre características bajo estudio. Se cruzan
2 variables.
Página 5 de 27
Estadísticas Comprensivos
26. TABLAS MULTIVARIABLES- Se combinan 3 o más variables. Facilitan mantener constante el efecto de terceras
variables.
27. GRÁFICOS-Se hacen para ilustrar las tendencias de las variables, comparar 2 variables o resaltar algún aspecto. Para reducir
una posibilidad de distorsión de datos al utilizar la regla ¾ . el eje Y es aproximadamente ¾ partes del eje X.
28. TIPOS DE GRÁFICAS:
a. Polígono de frecuencias-consiste en una línea que une las frecuencias que corresponden a cada clase en la variable. Es
de utilidad al comparar 2 o más distribuciones simultáneamente. Puede utilizarse con variables continuas y discretas.
b. Histograma-se utiliza para variables continuas. En el histograma las barras están unidas y tienen el mismo ancho. Si
los intervalos difieren, el ancho debe ajustarse.
c. Gráfica de barras-se utiliza para variables discretas. Se construyen barras que indican la concentración de casos. El
ancho de la barra debe ser igual y la separación entre una y otra debe mantenerse constante.
d. Ojiva o gráfica cumulativa- es una gráfica para hallar medidas de posición relativa. Esto significa, medidas que
permiten ubicar los participantes uno respecto al otro. Los participantes, por lo tanto, se ubican en los segmentos y no
en los puntos específicos que representan estas medidas.
29. MEDIDAS DE POSICIÓN RELATIVA-Indican la posición relativa del sujeto.
a. Cuartilas-dividen la distribución en 4 partes iguales.
b. Decilas-dividen la distribución en 10 partes iguales.
c. Percentila-expresa el punto en la distribución debajo del cual cae un porcentaje específico de casos. Conozco el por
ciento, pero no se la puntuación. La distribución se divide en 100 partes iguales.
d. Rango percentil-expresa el porcentaje de las puntuaciones que están por debajo de una puntucón en especiódico.
Conozco la puntuación, pero no se el por ciento.
e. Cambio porcentual-
Percentila - nos dejamos llevar por el porciento (%) % va a la izquierda y la puntuación o número a la
derecha.
Página 6 de 27
Estadísticas Comprensivos
Página 7 de 27
Estadísticas Comprensivos
Rango Percentil – nos dejamos llevar por el número (#) % va a la izquierda y la puntuación o número a la
derecha.
Página 8 de 27
Estadísticas Comprensivos
Cambio Porcentual – porciento que ha mermado un indicador o fenómeno cualquiera, en por lo menos dos
puntos de referencia.
%
[ ][ ]
= cambio porcentual
% = X-Y 100 Y = valor que toma la variable
Y en el punto base (puede ser
una fecha o una clase
previa)
X = valor que toma la misma variable en
el otro punto de referencia
Si 100 personas han sido asesinadas en el 2000 y al presente han ocurrido 80 asesinatos. ¿Cuánto representa
en cambio porcentual?
% =
[ ][ ]
X-Y
Y
100 % =
[ ][ ]
80-100
100
100 % =
[ ][ ]
20
100
100
% =
[ ][ ]
%.20
= 100
20%
Página 9 de 27
Estadísticas Comprensivos
30. MEDIDAS DE TENDENCIA CENTRAL (mtc) – son aquellas que identifican el punto en la distribución. moda, media
aritmética y mediana. Identifican el punto en la distribución respecto al cual los demás valores tienden a concentrarse.
i. Distribución simétrica – las tres medidas proveen idénticos valores.
ii. Distribución asimétrica positiva – la media será mayor que la mediana y ésta mayor que la moda.
iii. Distribución asimétrica negativa – la media será menor que la mediana y la mediana menor que la moda.
a. moda – es el valor que más se repite. Es inestable y se emplea muy raras veces. Sólo un caso es suficiente
para modificar el valor modal, esto es moverlo de una clase a otra. Se pueden encontrar distribuciones con
más de una moda, con esta es poco probable que podamos hacer comparaciones válidas del comportamiento
observado en grupos.
b. media aritmética o promedio – valor en la distribución respecto del cual, la suma de las desviaciones es
igual a cero. Contrario a la moda toma en consideración todos los valores de la distribución bajo estudio.
Es la (mtc) que más se utiliza. Es la más apropiada para una distribución con alto grado de asimetría. Las
desviaciones por enciama de ésta son iguales a las que están por debajo de ella. Se obtiene sumando todos
los valores numéricos de la distribución y se divide entre el total de casos incluidos. Sus limitaciones se
afectan por los valores extremos y no puede obtenerse en distribuciones con clases aviertas.
c. media ponderada-se utiliza si se quiere obtener una media de un grupo de medias ya obtenidas.
d. mediana-punto que divide la puntuación en 2 partes iguales. Punto debajo del cual se encuentra el 50%.
No se afecta por valores extremos y puede computarse con clases abiertas. Se utiliza cuando la distribución
bajo estudio presenta tendencia asimétrica, ya sea positiva o negativa. Es la utilizada en las distribuciones
asimétricas por su estabilidad.
31. MEDIDAS DE VARIACIÓN O DISPERSIÓN – o medidas de variabilidad. Indican el grado en que los sujetos se dispersan
respecto del centro de la distribución. Permiten al investigador intuir cuán homogéneos, parecidos o estables son los elementos
bajo estudio (en una variable cualquiera), en contraste con otros grupos de interés. Cuanto más diferentes más elevado será el
indicador de variación.
a. recorrido o campo de dispersión – este índice es el más simple y a la vez el menos confiable de las medidas de
variación. Es la diferencia entre el puntaje más alto o el dato mayor y el más bajo o el dato menor de la distribución.
La desventaja es que ignora las puntuaciones del medio.
R = valor mayor – valor menor + 1
Página 10 de 27
Estadísticas Comprensivos
b. recorrido intercuartil-es más estable que el recorrido, puesto que se obtiene a partir de 2 medidas de posición (Q3 y
Q1). No toma en consideración los sujetos que estén por encima de Q3 ni los que estén por debajo de Q1. el uso de
ésta no es muy corriente. Representa el 50% de la distribución porque solo considera 2 cuartilas.
c. varianza – al igual que la desviación estándar son las mejores medidas de dispersión. Toman en consideración todos
los puntajes y controlan por el efecto de valores extremos. Según aumentan las diferencias, comienzan a elevarse. Esta
se refiere a las desviaciones cuadradas medias respecto de la media. Nunca es negativa. Cuando en la distribución
todas las puntuaciones son iguales, la varianza es cero. Se le conoce también como media de cuadradas. Es muy
utilizada.
d. desviación estándar o típica – al igual que la varianza son las mejores medidas de dispersión. Toman en
consideración todos los puntajes y controlan por el efecto de valores extremos. Según aumentan las diferencias,
comienzan a elevarse. Esta es la raíz cuadrada de la varianza. Mientras más alto el número más diferencias entre los
sujetos, mientras más bajo sea el número menos diferencias entre los sujetos por lo tanto más homogéneos será el
grupo.
El y el 2 representan parámetros de variación cuando se incluyen todos los sujetos que forman el universo.
El S y el S2 sólo describen la variación de la muestra. Tiende a subestimar la variación del universo.
El s y el s2 se introducen en la corrección al momento de computar la variación muestra con miras a obtener una
estimación no sesgada de la variación poblacional.
Página 11 de 27
Estadísticas Comprensivos
f. variación cualitativa - medidas de variación para clases son asignadas a la variable por orden categórico (varón-
mujer) o nominal-ordinal (alto, medio bajo; muy de acuerdo, de acuerdo, en desacurdo, muy en desacuerdo; etc.)
Miden variación de índole cualitativa. Estas dan resultados similares.
Indice de Variación Cualitativa (Mueller and Schuessler; 1961) – (IVQ) valor máximo(100)
Indice de Dispersión (Hammond y Householder (1962) – (D) valor máximo (1)
1. IVQ = se multiplica por 100 .997 x 100 (99.7)
2. D = .997, .729
a. Mientras más bajo sea el # más homogéneo van a ser los grupos o la actitud.
b. Mientras más alto sea el # más heterogéneo van a ser los grupos o la actitud.
32. CORRELACIÓN-Nos permite observar posibles relaciones entre variables. Las técnicas a utilizarse varían dependiendo del
tipo de escalas o las variables y la naturaleza de la correlación. Ayuda a los psicólogos a hacer intervenciones de predicicón y
prevención.
a. Las limitaciones de la correlación son: no implica causalidad, hay que tener en consideración las variables interventoras
que afecten el estudio; únicamente los estudios de carácter experimental, en particular los que son completamente
aleatorios, permiten hacer inferencias de causa y efecto.
b. Los tipos de correlación son:
(1 y 2 son solo posibles en escalas ordinales y de intervalos y en relación lineal).
1. inversa (mientras X sube, Y baja)
2. directa (mientras X sube, Y sube).
3. simple (determina la relación entre 2 variables.
Página 12 de 27
Estadísticas Comprensivos
33. CORRELACIÓN PARA ESCALAS NOMINALES- Proporcionan categorías, no orden numérico que indique posición o
cantidad. Señalan intensidad de la asociación, no dirección.
a. Coeficiente Phi- fluctúa entre 0 y 1. Mientras más se acerca a 0, más baja la relación; mientras más se acerca a 1, más
intensa.
b. Coeficiente V de Cramer-se utiliza cuando se hacen observaciones, más lo observado y lo esperado. Se utiliza en talbas
mayores de 2 x 2.
c. Coeficiente Lambda-es utilizado en tablas mayores de 2 x 2. se interpreta como el porciento de reducción en error al
predecir Y partiendo de la variable X.
34. CORRELACIÓN PARA ESCALAS DE INTERVALOS Y DE RAZONES- Para las mismas se utilizan la correlación
producto momento Pearson (ryx). Solo debe utilizarse cuando la relación es de carácter lineal. Fluctúa entre 0 y 1 si la
relación es directa; y entre 0 y –1 si es inversa.
a. Relación lineal directa
b. Relación lineal inversa
35. CORRELACIÓN PAR ESCALAS ORDINALES- Proveen categorías o números que identifican posiciones y rangos.
Permite observar relaciones directas o inversas, siempre que la relación sea de carácter lineal. Si el coeficiente de correlación
resulta positivo, implica que el ordenamiento bajo la variable X sigue el mismo patrón que bajo Y; si resulta negativo, entonces
el ordenamiento de X se mueve en dirección opuesta a Y.
a. Coeficiente Spearman (rs)-posiblemente el más usado. Es importante recordar que si se correlaciona rangos o
posiciones y no la magnitud de las variables.
b. Coeficiente Gamma-fluctúa entre 0 u 1, si la relación es directa.
36. DESVIACIONES O PUNTUACIONES ESTANDARIZADAS-Formas de expresar los resultados de los exámenes
psicológicos. Son puntuaciones de una distribución que han sido alteradas para hacer que la media y la desviación estándar de
la distribución tengan unos valores estándar específicos.
a. Puntuación Z-indica cuántas desviaciones típicas o estándar se aleja cada sujeto del centro de la distribución. La
media es 0 y la desviación estándar es 1. proveen para transformar puntuaciones crudas a valores estandarizados o
tipificados. La fórmula es Z= puntaje crudo (X) menos media de la muestra dividido entre la desviación típica (s). Se
utilizan para muestras mayor de 30.
Página 13 de 27
Estadísticas Comprensivos
b. Puntuación t-se usa cuando no conocemos la desviación típica o cuando la muestra es pequeña. Los límites son: la
selección de la muestra debe ser al azar, la distribución del muestreo debe ser normal, la variable dependiente debe
distribuirse en forma normal, ambas muestras deben tener varianzas iguales y solo se pueden comparar 2 grupos.
c. Equivalencias entre puntuaciones Z y rangos porcentiles-(ver papel)
d. Puntuaciones T-la media es 50 y la desviación estándar es 10. el proceso para transformar Z a T involucra 2 pasos
relativamente simples. Primero se transforman los puntajes crudos a puntajes Z para luego convertir dichos puntajes a
valores T. Esto último se hace multiplicando Z por 10 y sumando 50 al resultado. (T=50 + (10)).
(ver información más abajo)
37. ESTUDIOS EXPOSTFACTO O DESCRIPTIVO – no es posible manipular libremente las variables independientes. No
son pruebas, son medidas o retratos de algo que estamos midiendo. Se pueden derivar conclusiones de asociación entre las
variables. Contesta la pregunta de investigación.
38. ESTUDIOS EXPERIMENTALES - se manipula libremente las variables independientes. La manipulación puede ser
cualitativa (manipulación de tipo, droga, estímulo) o cuantitativa (manipulación de cantidades, dosis, nivel de ruido). Conlleva
probar la influencia de una variable dependiente sobre una independiente.
39. HIPÓTESIS CIENTÍFICA – proposición explicativas de los problemas que se plantea el investigador, esto es, sugerencias
de solución. Casi nunca se pueden probar directamente. Necesario para definir variables operacionales. No pueden probar
causa y efecto. Ej. Los descansos periódicos contribuyen a reducir los accidentes de trabajo.
40. HIPÓTESIS ESTADÍSTICA – son las proposiciones operacionales de las hipótesis científicas. Enunciados respecto de uno
o más parámetros. Es una expresión de la hipótesis científica en términos de afirmaciones respecto de parámetros
desconocido. Operacionalización de la hipótesis científica. Operacionalizar es que se puede medir.
41. HIPÓTESIS NULA – expresión que niega la existencia de diferencias significativas entre los grupos comparados. No
expresa diferencias entre los grupos. En otras palabras establece que las muestras han sido seleccionadas de un mismo
universo, y que cualesquiera diferencias observadas entre los estadígrafos, pueden razonablemente atribuirse a factores
aleatorios. Establece que son los factores aleatorios los que explican las diferencias que se observan entre los grupos que se
comparan y no la variable independiente.
a. Ho : x1 = x2 El promedio de la primera muestra es igual al promedio de la segunda muestra.
42. FACTORES ALEATORIOS – fuentes de variación más allá del control del investigador o que éste no ha controlado por
alguna razón.
Página 14 de 27
Estadísticas Comprensivos
43. HIPÓTESIS ALTERNA – también conocida como hipótesis del investigador. Sostiene que las diferencias son significativas
y que no están explicadas por factores aleatorios sino por la variable o variables independientes que introduce o examina el
investigador. Nos dice que ‘si hay diferencias entre ambos grupos. Sostiene que las diferencias son significativas, que las
discrepancias no están explicadas por factores aleatorios; sino por la variable independiente que introduce o examina el
investigador. Es la que mejor representa la hipótesis científica.
44. UNILATERAL – sostiene que las diferencias significativas van en una dirección dada. Tengo suficiente evidencia para
sostener que se irá la diferencia para un lado. Habrá inclinación. Se utiliza cuando se conoce el problema.
45. BILATERAL – sostiene que hay diferencias significativas pero no especifica en que dirección.
46. NIVEL DE SIGNIFICACIÓN – también nivel alfa (α). Probabilidades (en 100) que se ha de tomar como punto de
referencia para decidir si las diferencias observadas pueden razonablemente atribuirse a factores aleatorios. La aceptación o
rechazo de la hipótesis nula depende del valor alfa y el valor obtenido. Los estadísticos han adoptado como niveles alfa o de
significación: .05, .01 y .001 aplican a los estudios experimentales.
47. SE ACEPTA O SE CONFIRMA - no debe entenderse que dicha confirmación es de carácter absoluto. Lo más que
podemos decir es que no tenemos suficiente evidencia para rechazarla.
48. ERROR ALFA O TIPO I – se rechaza la hipótesis nula cuando debió aceptarse. La probabilidad de cometer dicho error varía
con el nivel de significación seleccionado. Mientras menor sea el nivel de significación, más poderosa será la prueba.
Mientras nos movemos de .001 hacia arriba más probabilidad de rechazar la hipótesis nula cuando debiera aceptarse, aumenta.
49. ERROR BETA O TIPO II – aceptar la hipótesis nula siendo falsa. La probabilidad de cometer dicho error varía con el nivel
de significación seleccionado. Mientras nos movemos de .001 hacia arriba se reduce el riesgo de aceptar la hipótesis nula
siendo falsa.
50. ESTIMACIÓN DE PARÁMETROS-Estimación de punto y Estimación de intervalo.
51. CONTRASTES DE HIPÓTESIS:
a. Contraste de la media de una muestra vs. la media del universo-si la media conocida de una población sufrido
modificaciones significativas. Si la muestra es 30 o más, se utiliza la curva normal, 30 o menos se usa la t.
b. Contrastes de la proporción de una muestra vs. la proporción del universo- determina si la proporción de veces
que ocurre un evento en una muestra (Ps) difiere significativamente de una proporción teórica o conocida del universo.
Para muestras de 30 casos se utiliza la curva normal, para muestras mayor de 30 se utiliza la distribución binomial.
c. Contraste de la varianza en una muestra vs. la proporción del universo-Chi cuadrado- se utiliza en aquellas
situaciones donde sólo se examinan 3 o más niveles de un factor y donde la variable es nominal (para pruebas
Página 15 de 27
Estadísticas Comprensivos
independientes). Se utiliza solamente con la curva normal, se puede utilizar con muestras pequeñas siempre que las
variables tiendan a la normalidad.
52. DISEÑOS INTRAGRUPOS- (2 nivels y/o tratamientos).
a. Contrastes de medias-pruebas t.
b. Contrastes de varianza-pruebas t.
c. Contrastes de proporciones-curva normal o Chi-cuadrada.
d. Contrastes para escalas ordinales-prueba de signos-se utiliza cuando la normalidad no se sostiene y/o cuando la
escala es de carácter ordinal, pero no es confiable, no utiliza los valores numérico asignados a los sujetos, solo
considera signos de aumento o reducción sin indicadores de cambio, sin tomar en cuenta la magnitud de las diferencias;
o T de Wilcoxon-es una alternativa para la prueba de signos, considera la magnitud del cambio observado en la escala
ordinal entre el momento antes y el momento después, se convierte en una prueba más potente, requiere identificar
tanto la dirección del cambio como las diferencias entre los 2 momentos en que se observa la variable.
53. DISEÑOS ENTRE GRUPOS- (2 niveles o tratamientos)
a. Contrastes de medias-muestras mayores de 30 se utiliza la curva normal; 30 se utiliza prueba t.
b. Contrastes de proporciones-mayor de 30 se utiliza curva normal; 30 se utiliza prueba t.
c. Contrastes de varianza-razón F-se le conoce también como ANOVA. Se utiliza en situaciones donde la variable
dependiente se representa a través de una escala por intervalos. Dicha metodología, no solo aplica a un factor, sino que
debe extenderse a diseños multifactoriales. La variación total que se observa en la variable dependiente se divide en 2
componentes. El primero se denomina en variación entre grupos, y el segundo, variación intragrupos.
d. Contrastes de escalas ordinales – prueba U de Mann Whitney-se utiliza para muestras independientes, cuando las
variables de interés se definen en función de escalas ordinales. La muestra es de 3 a 20 casos; pero si es mayor se
puede utilizar transformando a Z.
e. Pruebas de ajuste e independencia-se utiliza Chi-cuadrado.
f. Valores obtenidos vs. valores críticos.
g. Toma de decisiones comparando P contra nivel alfa.
h. Toma de decisiones comparando valor obtenido contra valor crítico.
i. Concepto de grados de libertad para t- n-1; Chi cuadrado y razón F-..
Página 16 de 27
Estadísticas Comprensivos
= el promedio de la muestra
-
Z= = promedio del universo
/
= desviación standard del universo
= número de sujetos
= (x – x)2
n
Curva Normal-
o Ej. Prevalencia de uso de drogas ilícitas en los Estados Unidos.
o Datos:
=66.85
=53.68
=1.38
=214
Página 17 de 27
Estadísticas Comprensivos
Quiero ver si hay diferencia significativa entre haber encontrado un promedio de la muestra de 53.68 personas y promedio del
universo de 66.85 .
La Z nos determina si hay diferencia significativa. Si hay realmente diferencia ya se sabe lo que queremos saber es si es
significativa.
LIBRO TABLA A EN LA PAG. 475.
Si el margen de error o nivel de significancia es de .05, si es igual o menor entonces las diferencias serán significativas.
Ej. En este estudio la z obtenida de 3.01 nos permite inferir que hubo diferencias significativas con un margen de error de .05
(.0044) (.0013).
Las estadísticas son valores absolutos por lo tanto se elimina el (-) .
Ej. Si la a obtenida es mayor que 4.00 se infiere que existen diferencias significativas bien marcadas entre los blancos
americanos y los puertorriqueños.
En la campana el área a la derecha de la z se compara con el nivel de significancia.
Ej. Se encontró diferencia significativa entre los hombres blancos y los hombres puertorriqueños entre las mismas edades.
SI NO HAY DIFERENCIAS SIGNIFICATIVAS SE ACEPTA LA HIPÓTESIS NULA.
SI EXITEN DIFERENCIAS SIGNIFICATIVAS SE RECHAZA LA HIPÓTIESIS NULA.
Otra forma de trabajar la Z es con la Zc, la Zcrítica. Estos son los valores exactos en la curva normal que si su a es entre esos
es significativa, si no no lo es.
TABLA DE Zc EN LA PAG. 235.
Página 18 de 27
Estadísticas Comprensivos
Ej.
o Ho es igual =
o Ho es menor <
o to = 5
o = .05 nivel de significancia alpha
o n = 28
o gl = 27
o tc = 1.70
o = se rechaza la hipótesis nula.
Varianza es la variación, es igual que desviación standar pero se le quita la raíz cuadrada.
Campana
Valor crítico a partir de ese punto hacia su derecha o izquierda va aser la zona de rechazo o la hipótesis nula.
Unilateral (one tail)- el x1 es mayor > que (promedio del universo) derecha
Unilateral (one tail)- el x1 es menor < que (promedio del universo) izquierda
Página 19 de 27
Estadísticas Comprensivos
= bilateral
Chi cuadrada = X2
En chi cuadrada se compara la varianza de la muestra con la varianza del universo.
S2 = varianza de la muestra
O2 = varianza del universo
2
2
( - 1) s2 X = Chi Cuadrado
X = 2
s = muestra
2
2 = universo
= tamaño de la muestra
Mientras más se acerca al 0 son más homogéneos.
Tamaño de la muestra le restamos uno y es (n-1)
H 1 = s 2 > 2 X2 es significativa
TABLA PAG. 483-484
Ej.
o 51 sujetos
o H1 = s2 2 (bilateral)
o Valores críticos
izq. 32.35
der. 71.42
o s2 = 98
o 2 = 111 2 2 2 2
( - 1) s (51 - 1) 98 X = 44.14
X = X =
2
111
o Hipótesis aceptada
32.35 71.42
44.14 Página 20 de 27
Estadísticas Comprensivos
Página 21 de 27
Estadísticas Comprensivos
Página 22 de 27
Estadísticas Comprensivos
Página 23 de 27
Estadísticas Comprensivos
Página 24 de 27
Estadísticas Comprensivos
Página 25 de 27
Estadísticas Comprensivos
Página 26 de 27
Estadísticas Comprensivos
Página 27 de 27