Estadísticas

Estadísticas Comprensivos
REPASO COMPRENSIVOS 2003-ESTADÍSTICAS
A. Estadística Descriptiva vs. Inferencial:

1. Estadística descriptiva - un conjunto de métodos apoyados en las matemáticas que facilitan obtener conocimiento de las
referencias numéricas. Cuerpo integrado de métodos que permiten recopilar, organizar, analizar e interpretar información
numérica información que de otra forma tendría poco o ningún significado. Nos ayudan a describir observaciones.
2. Inferencia estadística – nos permite evaluar los riesgos envueltos en las inferencias que se hacen a partir de muestras. Es
hacer inferencias sobre los resultados que se obtienen. Toda investigación científica, con muy raras excepciones, si
alguna, está dirigida a identificar parámetros poblacionales. Existen métodos que nos permiten llegar a conclusiones
respecto del universo, cuando sólo una parte del mismo ha sido estudiada, este proceso se denomina Inferencia Estadística;
siendo las pruebas de hipótesis su área de mayor relevancia.
B. Usos legítimos de la Estadística

1. Descubrir la existencia o no existencia de problemas: Los estudios que aportan evidencias de problemas recurren al
conjunto de herramientas que proveen los métodos estadísticos tanto descriptivos como inferenciales.
2. Descubrir las posibles causas de los problemas: Cuando se descubre la existencia de un problema, se procede a identificar
aquellos factores que pudieran estar asociados al mismo. La aplicación de métodos estadísticos le permite substanciar sus
hipótesis, sopesar evidencias, aceptar o descartar explicaciones.
3. Evaluar soluciones aplicadas a los problemas: Los métodos estadísticos nos permiten examinar alternativas de carácter
correctivo; aplicar las que considere pertinentes, y luego evaluar la efectividad de las mismas.
C. Usos ilegítimos de la Estadística

1. Comparar datos que no siempre son comparables.
2. Derivar conclusiones de datos no representativos. Muestras que no reúnan los requisitos.
3. Esconder parte de las evidencias
Página 1 de 27
4. Manipular representaciones gráficas.

5. Confundir asociaciones con causalidad.
6. Derivar conclusiones que no se sostienen con la evidencia disponible.
7. Medir cambio a partir de bases inadecuadas.
8. Interpretar acomodaticiamente los resultados
D. Conceptos básicos
1. POBLACIÓN O UNIVERSO – Totalidad de individuos, objetos o medidas que comparten por lo menos una característica en
común. Deben compartir todas las características deseadas por el investigador. Todos los sujetos bajo observación.
2. PARÁMETRO – Cuando se estudia la totalidad de los casos en el universo. Es una medida única no tiene error y representa
el valor que toma la variable al momento de la medición.
3. ESTADÍGRAFO O LA ESTADÍSTICA – Si el investigador se limita al estudio de una muestra, los valores que obtiene para
las variables se denominan estadígrafos o las estadísticas. Por lo general el estadígrafo o estadísticas y el parámetro van a
diferir rara vez serán idénticos.
 muestra estadística
 parámetro universo
4. VARIABLE – Cualquier características bajo estudio que toma diferentes valores.
a. Variables continuas – aquellas que pueden tomar un número infinito de valores en la escala. Toda variable susceptible
a medición. Ej. masa, temperatura, peso, distancia, velocidad y tiempo.
b. Variable discretas – no pueden subdividirse a infinito, se le otorga un valor exacto. Ej. sexo, religión, marcas de auto,
graduados de universidad, etc.
5. VARIABLE INDEPENDIENTE – Factor que existe que se puede manipular y ver como se refleja en la variable
dependiente. La que manipula el investigador. Es la supuesta causa.
6. VARIABLE DEPENDIENTE – La que se mide en el estudio. Es la consecuente, el efecto, es la que se observa para ver si la
independiente cambia o se relaciona.
Página 2 de 27
7. DATOS – Cifras, números o índices que han sido recopilados. Información que se recoge.
8. CLASES – Alternativas que toma o que se asignan a la variable. Algunas variables se distribuyen en clases nominales y otras
a través de valores numéricos. Ej. el género tiene dos clases varones y mujeres. Ej. el peso de estudiantes de cuarto año podría
representarse en clases agrupadas: 121-130, 131-140
9. LIMITES REALES DE LAS CLASES – Se definen como los puntos donde comienzan y terminan las clases. Estos se
obtienen (cuando son números enteros) restando .5 al límite inferior aparente y sumando .5 al superior. Cuando terminan en
decimal se utiliza el .05. El límite aparente es el número dado, no se le suma ni se le resta. El límite real es el .05.
10. PUNTO MEDIO – Valor en la clase agrupada que se ha de tomar como representativo de dicha clase. Se obtiene sumando
los límites aparentes de la clase y dividiendo por dos. (121+130 = 251/2 = 125.5)
11. INTERVALO DE CLASES – Se refiere al recorrido de cada clase; esto es, el número de términos incluidos. De 121-130 son
10. el número de clases es el número inferior del intervalo menos el número inferior del otro intervalo.
12. TIPOS DE ESCALA – Cuatro tipos de escala o niveles de medición para representar las variables que se interesan estudiar.
a. escala nominal –Variables cualitativas, representan características o atributos. Se definen a través de categorías. Ej.
variable género, varones, mujeres.
b. escala ordinal – Variable que nos da un orden pero no nos da la diferencia entre intervalos. Los números o clases
reflejen el orden de los sujetos bajo estudio, pero no la magnitud de las diferencias. Ej. ordenar minerales en término
de resistencia.
c. escala intervalo – Nos dan un orden y diferencias entre intervalos. Proporcionan números que reflejan, tanto el orden
como las diferencias entre los sujetos. Carecen de un cero absoluto, lo que impide comparaciones tales como:
inteligencia, Juan es el doble de inteligente que María. Aunque Juan haya obtenido 150 y María 75.
d. escala de razones – Poseen orden, la diferencia entre intervalos es la misma. Tienen un cero absoluto. Estas son
iguales a las escalas por intervalos, excepto en una cosa: las escala de razones tienen cero absoluto. Ej. longitud, peso,
tiempo.
13. MUESTRA – Una parte supuestamente representativa del universo del cual se obtuvo.
14. MUESTREO ALEATORIO- Todos los sujetos de la población tienen la misma oportunidad de ser escogidos. Esta es la
mejor forma de la selección de muestra. Hay 2 tipos de muestro aleatorio: Con reposición o técnico: la probabilidad se
mantiene, el sujeto es devuelto a sistema de elección. Sin reposición: probabilidad se aminora al no devolver al sujeto al
sistema de elección.
Página 3 de 27
a. MUESTRA POR CONGLOMERADOS-Se selecciona al azar los grupos, es preferible escoger más en el medio y
menos al final. Se considera el grupo y no los sujetos, se recomienda para cuando es difícil conseguir muestreo al azar.
b. MUESTRA SIMPLE-Se escoge toda la población, se depositan los nombre en una urna y se seleccionan 100. las
desventajas es que se necesitan saber todos los nombres y tenerlos en lista y que se debe tener contacto con todas las
personas.
c. MUESTRA POR ESTRATOS -Dividir la población en distintos grupos y seleccionar una muestra que sea
representativa.
d. MUESTRA PROPORCIONAL-El propósito es mantener la proporción que existe en la población.
15. MUESTREO NO ALEATORIO-

a. MUESTREO SISTEMÁTICO-No es totalmente al azar, se tiene una forma controlada de seleccionar la población.
El proceso es el siguiente: se escribe una lista de los sujetos de la población, se decide seleccionar cierta cantidad de
sujetos, se divide la población entre la muestra que quiero y me da la que debo tener. EJ. De una población de 1000,
deseo una muestra de 100. divido y la muestra sería seleccionar de cada 10 sujetos 1.
b. MUESTRA POR DISPONIBILIDAD-Son las más comunes, pero las menos recomendadas. Es fácil de obtener por
la accesibilidad de los sujetos, pero no representa lo que existe en la población.
16. ERROR DE MUESTREO – fuente de error donde existen variaciones asociadas a los sujetos. Selección de un sujeto no tan
significativo. Al trabajar con la población no hay error de muestreo pues se incluye a todos los sujetos. Error debido a la
selección de la muestra. Es la diferencia en cálculos de los parámetros de la población y los estadígrafos de la muestra. Se
puede reducir, pero nunca se elimina.
17. TAMAÑOS DE MUESTRAS –
 n = muestra
 N = número de población total
 Z2 = nivel de confianza
 PuQu = variancia de la población binaria
 E2 = error a tolerar de muestreo
Página 4 de 27
18. ERROR RESIDUAL – se incluyen todas las demás fuentes de variación no controladas. Ej. factores ambientales,
condiciones anímicas de los sujetos.
19. NÚMEROS RELATIVOS-Permiten al investigador establecer relaciones simples, lo que facilita no solo el extraer
conocimientos y las referencias numéricas, sino también hacer las comparaciones sin los inconvenientes asociados a los
números.
a. Razones- es la más frecuentemente utilizada. Relacionan 2 cantidades. EJ. 8 mujeres por cada 10 hombres.
b. Proporciones-la suma de proporciones en una distribución dad es igual a 1. relaciona 3 cantidades o más. EJ.
P=A/A+B, donde P=proporción, A=cantidad que se quiere cambiar a proporción y B= a la otra cantidad.
c. Por cientos- proporciones por 100.
d. Cambio porcentil-es una medida que permite determinar en cuanto por ciento ha mermado o a aumentado un
fenómeno entre 2 puntos de referencia. Es ver el cambio a través del tiempo.
e. Tasas-se relaciona a un evento con la población expuesta a dicho evento. Las mismas indican riesgo. Se afectan por:
distribución de población por edad, ingreso y educación. Para eliminar 3 puntos decimales o más, las tasas se
multiplican por 1000.
20. DISTRIBUCIÓN DE FRECUENCIAS-Agrupa los datos para facilitar el manejo. Organiza la información en forma lógica
para que se le puedan aplicar los métodos estadísticos.
21. TABLAS SIMPLES-Contiene una variable. Presentan en la columna izquierda la característica que se intenta estudiar,
acompañada de otra columna a la derecha indicando frecuencia o número de participantes que caen en esa categoría.
22. ARREGLO DE VALORES-Se ubican los números en un orden particular, generalmente en forma descendente.
23. DISTRIBUCIÓN CON CLASES NO AGRUPADAS-Quiere decir el número de términos incluidos o los valores no
agrupados.
24. DISTRIBUCIÓN CON CLASES AGRUPADAS-Cuando se suman más cantidades de intervalos (+ de las f=Σf). Se logra
sumar las frecuencias a partir de la clase menor en dirección a la mayor. Cuando se agrupa es conveniente mantener la
distribución en 15 clases; no menos de 10 ni mayor de 20. siempre que sea posible debe proveerse un intervalo igual para
todas las clases.
25. TABLAS BIVARIABLES-Permiten observar la posible existencia de relaciones entre características bajo estudio. Se cruzan
2 variables.
Página 5 de 27
26. TABLAS MULTIVARIABLES- Se combinan 3 o más variables. Facilitan mantener constante el efecto de terceras
variables.
27. GRÁFICOS-Se hacen para ilustrar las tendencias de las variables, comparar 2 variables o resaltar algún aspecto. Para reducir
una posibilidad de distorsión de datos al utilizar la regla ¾ . el eje Y es aproximadamente ¾ partes del eje X.
28. TIPOS DE GRÁFICAS:
a. Polígono de frecuencias-consiste en una línea que une las frecuencias que corresponden a cada clase en la variable. Es
de utilidad al comparar 2 o más distribuciones simultáneamente. Puede utilizarse con variables continuas y discretas.
b. Histograma-se utiliza para variables continuas. En el histograma las barras están unidas y tienen el mismo ancho. Si
los intervalos difieren, el ancho debe ajustarse.
c. Gráfica de barras-se utiliza para variables discretas. Se construyen barras que indican la concentración de casos. El
ancho de la barra debe ser igual y la separación entre una y otra debe mantenerse constante.
d. Ojiva o gráfica cumulativa- es una gráfica para hallar medidas de posición relativa. Esto significa, medidas que
permiten ubicar los participantes uno respecto al otro. Los participantes, por lo tanto, se ubican en los segmentos y no
en los puntos específicos que representan estas medidas.
29. MEDIDAS DE POSICIÓN RELATIVA-Indican la posición relativa del sujeto.
a. Cuartilas-dividen la distribución en 4 partes iguales.
b. Decilas-dividen la distribución en 10 partes iguales.
c. Percentila-expresa el punto en la distribución debajo del cual cae un porcentaje específico de casos. Conozco el por
ciento, pero no se la puntuación. La distribución se divide en 100 partes iguales.
d. Rango percentil-expresa el porcentaje de las puntuaciones que están por debajo de una puntucón en especiódico.
Conozco la puntuación, pero no se el por ciento.
e. Cambio porcentual-
 Percentila - nos dejamos llevar por el porciento (%) % va a la izquierda y la puntuación o número a la
derecha.
Página 6 de 27
100 – 83 = 17% sabemos que es 100%

83 % 104 83 – 0 = 83% sabemos que hay un 0
El 17% obtuvo una puntuación de 104 o más para

arriba.
Obtuvo un 83% menos de 104 para abajo.
La percentila 71 en una prueba de inteligencia acendió a 60.

= un 71% obtuvo menos de 60 puntos en la prueba.
100 – 71 = 29% sabemos que es 100%

arriba. (El número se incluye cuando hablamos de +
para arriba.)
100 – 88 = 12% sabemos que es 100%


arriba. (El número se incluye cuando hablamos de +
para arriba.)
Página 7 de 27
 Rango Percentil – nos dejamos llevar por el número (#) % va a la izquierda y la puntuación o número a la
derecha.
100 – 83 = 17% sabemos que es 100%

Los que obtuvieron 104 o más estan en el 17%

superior.
Los que obtuvieron menos de 104 están en el 83%
inferior.
La percentila 71 en una prueba de inteligencia acendió a 60.

= un 71% obtuvo menos de 60 puntos en la prueba.
100 – 71 = 29% sabemos que es 100%


superior.
Los que obtuviron menos de 60 están en el 71%
inferior.
100 – 88 = 12% sabemos que es 100%


superior.
Los que obtuviron menos de 219 están en el 88%
inferior.
Página 8 de 27
 Cambio Porcentual – porciento que ha mermado un indicador o fenómeno cualquiera, en por lo menos dos
puntos de referencia.
%
[ ][ ]
= cambio porcentual
% = X-Y 100 Y = valor que toma la variable
Y en el punto base (puede ser
una fecha o una clase
previa)
X = valor que toma la misma variable en
el otro punto de referencia
Si 100 personas han sido asesinadas en el 2000 y al presente han ocurrido 80 asesinatos. ¿Cuánto representa
en cambio porcentual?
% =
[ ][ ]
X-Y
Y
100 % =
[ ][ ]
80-100
100
100 % =
[ ][ ]
20
100
100
% =
[ ][ ]
%.20
= 100
20%
El 20% de cambio porcentual.
Página 9 de 27
30. MEDIDAS DE TENDENCIA CENTRAL (mtc) – son aquellas que identifican el punto en la distribución. moda, media
aritmética y mediana. Identifican el punto en la distribución respecto al cual los demás valores tienden a concentrarse.
i. Distribución simétrica – las tres medidas proveen idénticos valores.
ii. Distribución asimétrica positiva – la media será mayor que la mediana y ésta mayor que la moda.
iii. Distribución asimétrica negativa – la media será menor que la mediana y la mediana menor que la moda.
a. moda – es el valor que más se repite. Es inestable y se emplea muy raras veces. Sólo un caso es suficiente
para modificar el valor modal, esto es moverlo de una clase a otra. Se pueden encontrar distribuciones con
más de una moda, con esta es poco probable que podamos hacer comparaciones válidas del comportamiento
observado en grupos.
b. media aritmética o promedio – valor en la distribución respecto del cual, la suma de las desviaciones es
igual a cero. Contrario a la moda toma en consideración todos los valores de la distribución bajo estudio.
Es la (mtc) que más se utiliza. Es la más apropiada para una distribución con alto grado de asimetría. Las
desviaciones por enciama de ésta son iguales a las que están por debajo de ella. Se obtiene sumando todos
los valores numéricos de la distribución y se divide entre el total de casos incluidos. Sus limitaciones se
afectan por los valores extremos y no puede obtenerse en distribuciones con clases aviertas.
c. media ponderada-se utiliza si se quiere obtener una media de un grupo de medias ya obtenidas.
d. mediana-punto que divide la puntuación en 2 partes iguales. Punto debajo del cual se encuentra el 50%.
No se afecta por valores extremos y puede computarse con clases abiertas. Se utiliza cuando la distribución
bajo estudio presenta tendencia asimétrica, ya sea positiva o negativa. Es la utilizada en las distribuciones
asimétricas por su estabilidad.
31. MEDIDAS DE VARIACIÓN O DISPERSIÓN – o medidas de variabilidad. Indican el grado en que los sujetos se dispersan
respecto del centro de la distribución. Permiten al investigador intuir cuán homogéneos, parecidos o estables son los elementos
bajo estudio (en una variable cualquiera), en contraste con otros grupos de interés. Cuanto más diferentes más elevado será el
indicador de variación.
a. recorrido o campo de dispersión – este índice es el más simple y a la vez el menos confiable de las medidas de
variación. Es la diferencia entre el puntaje más alto o el dato mayor y el más bajo o el dato menor de la distribución.
La desventaja es que ignora las puntuaciones del medio.
R = valor mayor – valor menor + 1
Página 10 de 27
b. recorrido intercuartil-es más estable que el recorrido, puesto que se obtiene a partir de 2 medidas de posición (Q3 y
Q1). No toma en consideración los sujetos que estén por encima de Q3 ni los que estén por debajo de Q1. el uso de
ésta no es muy corriente. Representa el 50% de la distribución porque solo considera 2 cuartilas.
c. varianza – al igual que la desviación estándar son las mejores medidas de dispersión. Toman en consideración todos
los puntajes y controlan por el efecto de valores extremos. Según aumentan las diferencias, comienzan a elevarse. Esta
se refiere a las desviaciones cuadradas medias respecto de la media. Nunca es negativa. Cuando en la distribución
todas las puntuaciones son iguales, la varianza es cero. Se le conoce también como media de cuadradas. Es muy
utilizada.
d. desviación estándar o típica – al igual que la varianza son las mejores medidas de dispersión. Toman en
consideración todos los puntajes y controlan por el efecto de valores extremos. Según aumentan las diferencias,
comienzan a elevarse. Esta es la raíz cuadrada de la varianza. Mientras más alto el número más diferencias entre los
sujetos, mientras más bajo sea el número menos diferencias entre los sujetos por lo tanto más homogéneos será el
grupo.
e. Símbolos que representan estas medidas .

  = desviación típica del universo
 2 = varianza del universo
 S = desviación típica de la muestra
 S2 = varianza de la muestra
 s = desviación típica corregida (estimada) para el universo
 s2 = variancia corregida (estimada) para el universo
El  y el  2 representan parámetros de variación cuando se incluyen todos los sujetos que forman el universo.
El S y el S2 sólo describen la variación de la muestra. Tiende a subestimar la variación del universo.
El s y el s2 se introducen en la corrección al momento de computar la variación muestra con miras a obtener una
estimación no sesgada de la variación poblacional.
Página 11 de 27
f. variación cualitativa - medidas de variación para clases son asignadas a la variable por orden categórico (varón-
mujer) o nominal-ordinal (alto, medio bajo; muy de acuerdo, de acuerdo, en desacurdo, muy en desacuerdo; etc.)
Miden variación de índole cualitativa. Estas dan resultados similares.
 Indice de Variación Cualitativa (Mueller and Schuessler; 1961) – (IVQ) valor máximo(100)
 Indice de Dispersión (Hammond y Householder (1962) – (D) valor máximo (1)
1. IVQ = se multiplica por 100 .997 x 100 (99.7)
2. D = .997, .729
a. Mientras más bajo sea el # más homogéneo van a ser los grupos o la actitud.
b. Mientras más alto sea el # más heterogéneo van a ser los grupos o la actitud.
32. CORRELACIÓN-Nos permite observar posibles relaciones entre variables. Las técnicas a utilizarse varían dependiendo del
tipo de escalas o las variables y la naturaleza de la correlación. Ayuda a los psicólogos a hacer intervenciones de predicicón y
prevención.
a. Las limitaciones de la correlación son: no implica causalidad, hay que tener en consideración las variables interventoras
que afecten el estudio; únicamente los estudios de carácter experimental, en particular los que son completamente
aleatorios, permiten hacer inferencias de causa y efecto.
b. Los tipos de correlación son:
 (1 y 2 son solo posibles en escalas ordinales y de intervalos y en relación lineal).
1. inversa (mientras X sube, Y baja)
2. directa (mientras X sube, Y sube).
3. simple (determina la relación entre 2 variables.
Página 12 de 27
33. CORRELACIÓN PARA ESCALAS NOMINALES- Proporcionan categorías, no orden numérico que indique posición o
cantidad. Señalan intensidad de la asociación, no dirección.
a. Coeficiente Phi- fluctúa entre 0 y 1. Mientras más se acerca a 0, más baja la relación; mientras más se acerca a 1, más
intensa.
b. Coeficiente V de Cramer-se utiliza cuando se hacen observaciones, más lo observado y lo esperado. Se utiliza en talbas
mayores de 2 x 2.
c. Coeficiente Lambda-es utilizado en tablas mayores de 2 x 2. se interpreta como el porciento de reducción en error al
predecir Y partiendo de la variable X.
34. CORRELACIÓN PARA ESCALAS DE INTERVALOS Y DE RAZONES- Para las mismas se utilizan la correlación
producto momento Pearson (ryx). Solo debe utilizarse cuando la relación es de carácter lineal. Fluctúa entre 0 y 1 si la
relación es directa; y entre 0 y –1 si es inversa.
a. Relación lineal directa
b. Relación lineal inversa
35. CORRELACIÓN PAR ESCALAS ORDINALES- Proveen categorías o números que identifican posiciones y rangos.
Permite observar relaciones directas o inversas, siempre que la relación sea de carácter lineal. Si el coeficiente de correlación
resulta positivo, implica que el ordenamiento bajo la variable X sigue el mismo patrón que bajo Y; si resulta negativo, entonces
el ordenamiento de X se mueve en dirección opuesta a Y.
a. Coeficiente Spearman (rs)-posiblemente el más usado. Es importante recordar que si se correlaciona rangos o
posiciones y no la magnitud de las variables.
b. Coeficiente Gamma-fluctúa entre 0 u 1, si la relación es directa.
36. DESVIACIONES O PUNTUACIONES ESTANDARIZADAS-Formas de expresar los resultados de los exámenes
psicológicos. Son puntuaciones de una distribución que han sido alteradas para hacer que la media y la desviación estándar de
la distribución tengan unos valores estándar específicos.
a. Puntuación Z-indica cuántas desviaciones típicas o estándar se aleja cada sujeto del centro de la distribución. La
media es 0 y la desviación estándar es 1. proveen para transformar puntuaciones crudas a valores estandarizados o
tipificados. La fórmula es Z= puntaje crudo (X) menos media de la muestra dividido entre la desviación típica (s). Se
utilizan para muestras mayor de 30.
Página 13 de 27
b. Puntuación t-se usa cuando no conocemos la desviación típica o cuando la muestra es pequeña. Los límites son: la
selección de la muestra debe ser al azar, la distribución del muestreo debe ser normal, la variable dependiente debe
distribuirse en forma normal, ambas muestras deben tener varianzas iguales y solo se pueden comparar 2 grupos.
c. Equivalencias entre puntuaciones Z y rangos porcentiles-(ver papel)
d. Puntuaciones T-la media es 50 y la desviación estándar es 10. el proceso para transformar Z a T involucra 2 pasos
relativamente simples. Primero se transforman los puntajes crudos a puntajes Z para luego convertir dichos puntajes a
valores T. Esto último se hace multiplicando Z por 10 y sumando 50 al resultado. (T=50 + (10)).
(ver información más abajo)
37. ESTUDIOS EXPOSTFACTO O DESCRIPTIVO – no es posible manipular libremente las variables independientes. No
son pruebas, son medidas o retratos de algo que estamos midiendo. Se pueden derivar conclusiones de asociación entre las
variables. Contesta la pregunta de investigación.
38. ESTUDIOS EXPERIMENTALES - se manipula libremente las variables independientes. La manipulación puede ser
cualitativa (manipulación de tipo, droga, estímulo) o cuantitativa (manipulación de cantidades, dosis, nivel de ruido). Conlleva
probar la influencia de una variable dependiente sobre una independiente.
39. HIPÓTESIS CIENTÍFICA – proposición explicativas de los problemas que se plantea el investigador, esto es, sugerencias
de solución. Casi nunca se pueden probar directamente. Necesario para definir variables operacionales. No pueden probar
causa y efecto. Ej. Los descansos periódicos contribuyen a reducir los accidentes de trabajo.
40. HIPÓTESIS ESTADÍSTICA – son las proposiciones operacionales de las hipótesis científicas. Enunciados respecto de uno
o más parámetros. Es una expresión de la hipótesis científica en términos de afirmaciones respecto de parámetros
desconocido. Operacionalización de la hipótesis científica. Operacionalizar es que se puede medir.
41. HIPÓTESIS NULA – expresión que niega la existencia de diferencias significativas entre los grupos comparados. No
expresa diferencias entre los grupos. En otras palabras establece que las muestras han sido seleccionadas de un mismo
universo, y que cualesquiera diferencias observadas entre los estadígrafos, pueden razonablemente atribuirse a factores
aleatorios. Establece que son los factores aleatorios los que explican las diferencias que se observan entre los grupos que se
comparan y no la variable independiente.
a. Ho : x1 = x2 El promedio de la primera muestra es igual al promedio de la segunda muestra.
42. FACTORES ALEATORIOS – fuentes de variación más allá del control del investigador o que éste no ha controlado por
alguna razón.
Página 14 de 27
43. HIPÓTESIS ALTERNA – también conocida como hipótesis del investigador. Sostiene que las diferencias son significativas
y que no están explicadas por factores aleatorios sino por la variable o variables independientes que introduce o examina el
investigador. Nos dice que ‘si hay diferencias entre ambos grupos. Sostiene que las diferencias son significativas, que las
discrepancias no están explicadas por factores aleatorios; sino por la variable independiente que introduce o examina el
investigador. Es la que mejor representa la hipótesis científica.
44. UNILATERAL – sostiene que las diferencias significativas van en una dirección dada. Tengo suficiente evidencia para
sostener que se irá la diferencia para un lado. Habrá inclinación. Se utiliza cuando se conoce el problema.
45. BILATERAL – sostiene que hay diferencias significativas pero no especifica en que dirección.
46. NIVEL DE SIGNIFICACIÓN – también nivel alfa (α). Probabilidades (en 100) que se ha de tomar como punto de
referencia para decidir si las diferencias observadas pueden razonablemente atribuirse a factores aleatorios. La aceptación o
rechazo de la hipótesis nula depende del valor alfa y el valor obtenido. Los estadísticos han adoptado como niveles alfa o de
significación: .05, .01 y .001 aplican a los estudios experimentales.
47. SE ACEPTA O SE CONFIRMA - no debe entenderse que dicha confirmación es de carácter absoluto. Lo más que
podemos decir es que no tenemos suficiente evidencia para rechazarla.
48. ERROR ALFA O TIPO I – se rechaza la hipótesis nula cuando debió aceptarse. La probabilidad de cometer dicho error varía
con el nivel de significación seleccionado. Mientras menor sea el nivel de significación, más poderosa será la prueba.
Mientras nos movemos de .001 hacia arriba más probabilidad de rechazar la hipótesis nula cuando debiera aceptarse, aumenta.
49. ERROR BETA O TIPO II – aceptar la hipótesis nula siendo falsa. La probabilidad de cometer dicho error varía con el nivel
de significación seleccionado. Mientras nos movemos de .001 hacia arriba se reduce el riesgo de aceptar la hipótesis nula
siendo falsa.
50. ESTIMACIÓN DE PARÁMETROS-Estimación de punto y Estimación de intervalo.
51. CONTRASTES DE HIPÓTESIS:
a. Contraste de la media de una muestra vs. la media del universo-si la media conocida de una población sufrido
modificaciones significativas. Si la muestra es 30 o más, se utiliza la curva normal, 30 o menos se usa la t.
b. Contrastes de la proporción de una muestra vs. la proporción del universo- determina si la proporción de veces
que ocurre un evento en una muestra (Ps) difiere significativamente de una proporción teórica o conocida del universo.
Para muestras de 30 casos se utiliza la curva normal, para muestras mayor de 30 se utiliza la distribución binomial.
c. Contraste de la varianza en una muestra vs. la proporción del universo-Chi cuadrado- se utiliza en aquellas
situaciones donde sólo se examinan 3 o más niveles de un factor y donde la variable es nominal (para pruebas
Página 15 de 27
independientes). Se utiliza solamente con la curva normal, se puede utilizar con muestras pequeñas siempre que las
variables tiendan a la normalidad.
52. DISEÑOS INTRAGRUPOS- (2 nivels y/o tratamientos).
a. Contrastes de medias-pruebas t.
b. Contrastes de varianza-pruebas t.
c. Contrastes de proporciones-curva normal o Chi-cuadrada.
d. Contrastes para escalas ordinales-prueba de signos-se utiliza cuando la normalidad no se sostiene y/o cuando la
escala es de carácter ordinal, pero no es confiable, no utiliza los valores numérico asignados a los sujetos, solo
considera signos de aumento o reducción sin indicadores de cambio, sin tomar en cuenta la magnitud de las diferencias;
o T de Wilcoxon-es una alternativa para la prueba de signos, considera la magnitud del cambio observado en la escala
ordinal entre el momento antes y el momento después, se convierte en una prueba más potente, requiere identificar
tanto la dirección del cambio como las diferencias entre los 2 momentos en que se observa la variable.
53. DISEÑOS ENTRE GRUPOS- (2 niveles o tratamientos)
a. Contrastes de medias-muestras mayores de 30 se utiliza la curva normal; 30 se utiliza prueba t.
b. Contrastes de proporciones-mayor de 30 se utiliza curva normal; 30 se utiliza prueba t.
c. Contrastes de varianza-razón F-se le conoce también como ANOVA. Se utiliza en situaciones donde la variable
dependiente se representa a través de una escala por intervalos. Dicha metodología, no solo aplica a un factor, sino que
debe extenderse a diseños multifactoriales. La variación total que se observa en la variable dependiente se divide en 2
componentes. El primero se denomina en variación entre grupos, y el segundo, variación intragrupos.
d. Contrastes de escalas ordinales – prueba U de Mann Whitney-se utiliza para muestras independientes, cuando las
variables de interés se definen en función de escalas ordinales. La muestra es de 3 a 20 casos; pero si es mayor se
puede utilizar transformando a Z.
e. Pruebas de ajuste e independencia-se utiliza Chi-cuadrado.
f. Valores obtenidos vs. valores críticos.
g. Toma de decisiones comparando P contra nivel alfa.
h. Toma de decisiones comparando valor obtenido contra valor crítico.
i. Concepto de grados de libertad para t- n-1; Chi cuadrado y razón F-..
Página 16 de 27
54. PRUEBAS UTILIZANDO LA CURVA NORMAL.
 Curva normal-es también conocida como curva o distribución Z.

 Será la más apropiada siempre que la muestra esté constituida por 30 o más sujetos.
 Contraste entre muestra y universo.
 Cuando se interesa comparar una muestra y tiene universo identificado y tiene 30 ó más casos.
 Es un modelo matemático cuyo formato está definido por la siguiente expresión.
= el promedio de la muestra
 - 
Z= = promedio del universo

/
= desviación standard del universo
= número de sujetos
53.68-66.85 13.17 13.17 Z= -140

Z= Z= Z=
1.38 /  214 1.38 / 14.62 .094
 Desviación típica o standard del universo
 =   (x – x)2
n
 Curva Normal-
o Ej. Prevalencia de uso de drogas ilícitas en los Estados Unidos.
o Datos:
 =66.85
 =53.68
 =1.38
 =214
Página 17 de 27
 Quiero ver si hay diferencia significativa entre haber encontrado un promedio de la muestra de 53.68 personas y promedio del
universo de 66.85 .
 La Z nos determina si hay diferencia significativa. Si hay realmente diferencia ya se sabe lo que queremos saber es si es
significativa.
 LIBRO TABLA A EN LA PAG. 475.
 Si el margen de error o nivel de significancia es de .05, si es igual o menor entonces las diferencias serán significativas.
 Ej. En este estudio la z obtenida de 3.01 nos permite inferir que hubo diferencias significativas con un margen de error de .05
(.0044) (.0013).
 Las estadísticas son valores absolutos por lo tanto se elimina el (-) .
 Ej. Si la a obtenida es mayor que 4.00 se infiere que existen diferencias significativas bien marcadas entre los blancos
americanos y los puertorriqueños.
 En la campana el área a la derecha de la z se compara con el nivel de significancia.
 Ej. Se encontró diferencia significativa entre los hombres blancos y los hombres puertorriqueños entre las mismas edades.
 SI NO HAY DIFERENCIAS SIGNIFICATIVAS SE ACEPTA LA HIPÓTESIS NULA.
 SI EXITEN DIFERENCIAS SIGNIFICATIVAS SE RECHAZA LA HIPÓTIESIS NULA.
 Otra forma de trabajar la Z es con la Zc, la Zcrítica. Estos son los valores exactos en la curva normal que si su a es entre esos
es significativa, si no no lo es.
 TABLA DE Zc EN LA PAG. 235.
55. PRUEBAS UTILIZANDO LAS DISTRIBUCIONES t.
 Contrastar la muestra con el universo con muestra menores de 30 casos.


Z=
 -   = el promedio de la muestra
s/  = promedio del universo
s = desviación standard estimada del universo
 = número de sujetos
 Se introducen los grados de libertad g.l. = n-1

 TABLA B PAG. 477
Página 18 de 27
 SI EL VALOR DE LA To ES MAYOR QUE LA Tc EL PROMEDIO DE MUESTRA VA A DIFERIR

SIGNIFICATIVAMENTE DEL PROMEDIO DEL UNIVERSO. SE RECHAZA LA HIPÓTESIS NULA.
 SI EL VALOR DE To ES MENOR QUE LA Tc NO VA HABER DIFERENCIA SIGNIFICATIVA Y SE ACEPTA LA
HIPÓTESIS NULA O SE CONFIRMA.
 Depende también si es unilateral o bilateral.
 Ej.
o Ho es igual =
o Ho es menor <
o to = 5
o  = .05 nivel de significancia alpha
o n = 28
o gl = 27
o tc = 1.70
o = se rechaza la hipótesis nula.
56. PRUEBAS UTILIZANDO CHI CUADRADO.
 Varianza es la variación, es igual que desviación standar pero se le quita la raíz cuadrada.
 Campana
Rechazo Aceptación Rechazo heterogéneo homogéneo heterogéneo

Ho Ho Ho

Valor crítico a partir de ese punto hacia su derecha o izquierda va aser la zona de rechazo o la hipótesis nula.

Unilateral (one tail)- el x1 es mayor > que  (promedio del universo) derecha

Unilateral (one tail)- el x1 es menor < que  (promedio del universo) izquierda
Página 19 de 27

 = bilateral

Chi cuadrada = X2

En chi cuadrada se compara la varianza de la muestra con la varianza del universo.

S2 = varianza de la muestra

O2 = varianza del universo
2
2
( - 1) s2 X = Chi Cuadrado
X = 2
s = muestra
2
2 = universo
 = tamaño de la muestra

Mientras más se acerca al 0 son más homogéneos.

Tamaño de la muestra le restamos uno y es (n-1)

H 1 = s 2 > 2 X2 es significativa

TABLA PAG. 483-484

Ej.
o 51 sujetos
o H1 = s2  2 (bilateral)
o Valores críticos
 izq. 32.35
 der. 71.42
o s2 = 98
o 2 = 111 2 2 2 2
( - 1) s (51 - 1) 98 X = 44.14
X = X =
2
 111
o Hipótesis aceptada
Rechazo Aceptación Rechazo

H1 H1 H1
32.35 71.42
44.14 Página 20 de 27
Mariblanca Quintero 4ta asignación 25/4/01 Tabla de Información Estadística

Diseño Condicio Comentarios:
Prueba nes de
uso
1 Media Aritmética  Promedio, valor en la
distribución respecto del cual, la
X suma de las desviaciones es igual a
cero
2 Mediana  Valor que divide la
Md distribución en dos partes iguales.
Contrario a la media, esta medida
no se afecta por valores extremos.
3 Moda  Es el valor que más se
Moda
repite
4 Varianza  se refiere a las
 2 = del
Según van apareciendo diferencias, desviaciones cuadradas medias
universo
el índice de varianza comienzan a respecto de la media
S2 = de la
elevarse, alejándose más del punto
muestra
cero.
5 Desviación Estándar  Esta es la raíz cuadrada
 = del
Según van apareciendo diferencias, de la varianza
universo
el índice de la desviación estándar
S = de la
comienzan a elevarse, alejándose
muestra
más del punto cero.
Contraste entre la media de una muestra con la media del universo
6 Curva Normal 30  Si la Z obtenida (Zo) es mayor que
Se conoce promedio o proporción Z sujetos o la Z crítica (Zc) habrán diferencias
sobre la población. Se conoce la H0: Z0 < Zc más significativas entre la muestra y el
desviación estándar. H1: Z0 > Zc universo. Se rechaza la hipótesis
nula (H0).
 Si el valor Z obtenido (Z0) es menor
Página 21 de 27

Prueba nes de
uso
que el valor Z crítico (Zc) (según el
nivel de significación), no habrá
diferencias significativas. Se acepta
la hipótesis nula (H0).
7 Modelo t  Si el valor t obtenido (t0) es mayor
Se desconoce la desviación estándar t que el valor t crítico (tc) (según el
H0: t 0 < t c nivel de significación), habrá
H1: t0 > t c diferencias significativas. Se
rechaza la hipótesis nula (H0).
 Si el valor t obtenido (t0) es menor
30 que el valor t crítico (tc) (según el
sujetos o nivel de significación), no habrá
menos diferencias significativas. Se acepta
 La t crítica (tc) : valor que resulta
del cruce del nivel de significación
(según la unilateralidad o
bilateralidad de la hipótesis) con los
grados de libertad (n-1).
8 Chi Cuadrado X2 X2 30  Prueba unilateral
Contraste de varianza, siempre que sujetos o o Si la hipótesis es mayor “>”
la variable tienda a la normalidad y/o más la X2 obtenida (X2o) será
cuando la muestras son grandes si la significativa si es igual o
distribución no es normal. mayor que la X2 crítica (X2c).
o Si la hipótesis es mayor “<”
la X2 obtenida (X2o) será
significativa si es igual o
menor que la X2 crítica (X2c).
 Prueba bilateral
o Los valores críticos deben
Página 22 de 27

Prueba nes de
uso
ubicarse para ambas
direcciones.
 Grados de libertad- (n-1)
Prueba nes de
uso
Contraste para muestras correlacionadas (diseños intragrupos)-se miden las variables antes y después
9 Curva Normal 30  Mismo procedimiento que la #11
Z sujetos o pero el denominador se le debe
más sacar la raíz cuadrada.
10 Modelo t  Si el valor t obtenido (t0) es mayor
Se utilizan dos tiempos X1 y X2, que el valor t crítico (tc) (según el
se buscan las diferencias D, nivel de significación), habrá
se desconoce la desviación estándar diferencias significativas. Se
30 que el valor t crítico (tc) (según el
t sujetos o nivel de significación), no habrá
menos diferencias significativas. Se acepta
 La t crítica (tc) : valor que resulta
del cruce del nivel de significación
(según la unilateralidad o
bilateralidad de la hipótesis) con los
grados de libertad (n-1).
11 Chi Cuadrado X2 X2 30  Si el valor X2 obtenido (X2o) es
pruebas de proporción, antes P1 y sujetos o mayor que el valor X2 crítico (X2c)
después P2 más (según el nivel de significación),
habrá diferencias significativas. Se
Página 23 de 27

Prueba nes de
uso
 Si el valor X2 obtenido (X2o) es
menor que el valor X2 crítico (X2c)
(según el nivel de significación), no
acepta la hipótesis nula (H0).
 El valor crítico se contrasta con el
límite crítico correspondiente a un
grado de libertad y bajo el nivel de
significancia seleccionado.
12 Prueba de Signos y Distribución  Prueba unilateral
Binomial o Si la probabilidad es igual o
Escalas ordinales, se le asignan menor que el nivel de
signos positivos (+) cuando hay significación establecido, se
aumento y negativo (-) cuando hay rechaza la hipótesis nula
disminución. Supone observar (H0).
aumentos o reducciones. o Si la probabilidad es igual o
30 mayor que el nivel de
P[ n
r ] sujetos o significación establecido, se
menos acepta la hipótesis nula
(H0).
 Prueba bilateral
o Si la prueba es bilateral la
probabilidad obtenida tiene
que multiplicarse por 2 y
luego comparar con el nivel
de significancia establecido.
13 T de Wilcoxon Tw 5 a 50  Sumatoria menor absoluta
Considera la magnitud del cambio sujetos  Si la Tw obtenida (Two) es menor
observado en la escala ordinal entre que la Tw crítica (Twc), se rechaza
el momento antes y el después, es la Ho.
Página 24 de 27

Prueba nes de
uso
más potente. Información catalogada
en rangos.
Prueba nes de
uso
14 Curva Normal de Probabilidades  Si la Z obtenida (Zo) es mayor que
la Z crítica (Zc) habrán diferencias
significativas entre la muestra y el
universo. Se rechaza la hipótesis
50
nula (H0).
Z sujetos o
 Si el valor Z obtenido Z0) es menor
más
Contraste para muestras independientes (diseños entregrupos)
15 Curva Normal 30  Si la Z obtenida (Zo) es mayor que
Promedio de grupo 1 X1 y promedio sujetos o la Z crítica (Zc) habrán diferencias
de grupo 2 X2. Se necesita saber las más significativas entre la muestra y el
medias y las desviación estándar. universo. Se rechaza la hipótesis
nula (H0).
Z
 Si el valor Z obtenido Z0) es menor
16 Modelo t t 30  Los grados de libertad para
Tiene que haber algo diferente entre sujetos o muestras iguales es: n1 + n2 –2.
las muestras para poder ser menos  Si el valor t obtenido (t0) es mayor
comparados. Se necesita saber las que el valor t crítico (tc) (según el
Página 25 de 27

Prueba nes de
uso
medias y la varianza. nivel de significación), habrá
diferencias significativas. Se
que el valor t crítico (tc) (según el
17 Modelos F  Varianza mayor el numerador y
varianza menor denominador.
18 Chi Cuadrado X2  La sumatoria es la diferencia
Escala nominal. Más usada cuando cuadrada entre lo observado y lo
los datos son paramétricos y las esperado dividido entre lo esperado.
observaciones en categorías.  Grados de libertad: (cantidad de
Cantidad de lo observado comparada líneas –1) (cantidad de columnas –
con la cantidad de lo esperado. 1). Hay tablas para 2x2 y para
mayores de 2x2.
30
sujetos o
X2 mayor que el valor X2 crítico (X2c)
más
(según el nivel de significación),
(según el nivel de significación), no
acepta la hipótesis nula (H0).
19 K- Prueba de la mediana K 30  Sujetos por encima y por debajo de
También recomendada para escalas sujetos o la mediana de cada uno de los
ordinales, datos no paramétricos. más grupos.
Página 26 de 27

Prueba nes de
uso
Permite contrastes entre K el número  Si el valor X2 obtenido (X2o) es
de grupos tomando como punto de mayor que el valor X2 crítico (X2c)
referencia los valores críticos de X2. se rechaza la hipótesis nula (H0) lo
obtenido será diferente a lo
esperado.
se acepta la hipótesis nula (H0) lo
obtenido será igual a lo esperado.
Prueba nes de
uso
20 Prueba H-Krustal Wallis  Se observan diferencias
Es más potente que la prueba de la significativas.
30
mediana, o más probable de rechazar
sujetos o
la H0 cuando es falsa. Se organiza la H
más
información en rangos a partir del
valor menor o mayor considerando
todas las muestras como una.
Página 27 de 27

Estadísticas

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Estadísticas

Enviado por

Direitos autorais:

Formatos disponíveis

Estadísticas Comprensivos

REPASO COMPRENSIVOS 2003-ESTADÍSTICAS

A. Estadística Descriptiva vs. Inferencial:

B. Usos legítimos de la Estadística

C. Usos ilegítimos de la Estadística

4. Manipular representaciones gráficas.

15. MUESTREO NO ALEATORIO-

100 – 83 = 17% sabemos que es 100%

El 17% obtuvo una puntuación de 104 o más para

La percentila 71 en una prueba de inteligencia acendió a 60.

El 29% obtuvo una puntuación de 60 o más para

Obtuvo un 71% menos de 60 para abajo.

100 – 88 = 12% sabemos que es 100%

El 12% obtuvo una puntuación de 219 o más para

Obtuvo un 88% menos de 219 para abajo.

100 – 83 = 17% sabemos que es 100%

Los que obtuvieron 104 o más estan en el 17%

La percentila 71 en una prueba de inteligencia acendió a 60.

100 – 71 = 29% sabemos que es 100%

Los que obtuvieron 60 o más estan en el 29%

100 – 88 = 12% sabemos que es 100%

Los que obtuvieron 219 o más estan en el 12%

El 20% de cambio porcentual.

e. Símbolos que representan estas medidas .

54. PRUEBAS UTILIZANDO LA CURVA NORMAL.

 Curva normal-es también conocida como curva o distribución Z.

53.68-66.85 13.17 13.17 Z= -140

 Desviación típica o standard del universo

55. PRUEBAS UTILIZANDO LAS DISTRIBUCIONES t.

 Contrastar la muestra con el universo con muestra menores de 30 casos.

 Se introducen los grados de libertad g.l. = n-1

 SI EL VALOR DE LA To ES MAYOR QUE LA Tc EL PROMEDIO DE MUESTRA VA A DIFERIR

56. PRUEBAS UTILIZANDO CHI CUADRADO.

Rechazo Aceptación Rechazo heterogéneo homogéneo heterogéneo

Rechazo Aceptación Rechazo

Mariblanca Quintero 4ta asignación 25/4/01 Tabla de Información Estadística

Diseño Condicio Comentarios:

Diseño Condicio Comentarios:

Diseño Condicio Comentarios:

Diseño Condicio Comentarios:

Diseño Condicio Comentarios:

Diseño Condicio Comentarios:

Você também pode gostar