Metodologa de la investigacin Profesor: GAMRRA LEIVA, Pedro
Contenido
1. INTRODUCCIN A STATGRAPHICS ....................................................................... 1 1.2. Cmo iniciar Statgraphics ................................................................................ 1 1.3. Cmo leer datos de un fichero en Statgraphics .............................................. 2 1.4. Obtencin de estadsticos descriptivos bsicos ............................................ 3 1.5. Generacin de grficos ..................................................................................... 6 1.6. Cuantiles y probabilidades de distribuciones: ................................................ 9
2. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPTESIS PARA UNA Y DOS POBLACIONES ...................................................................................................... 12 2.1. Intervalos de confianza para una poblacin ..................................................... 13 2.2. Contrastes de hiptesis para una poblacin ................................................. 18 2.3. Contrastes de hiptesis para dos poblaciones ............................................. 22
Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 1
1. INTRODUCCIN A STATGRAPHICS
1.2. Cmo iniciar Statgraphics Inicio Todos los programas Statgraphics Centurion XVI.I Statgraphics
Statgraphics es un paquete estadstico de Software comercial basado en ventanas y orientado a Estadstica I y II.la docencia, que incluye herramientas para tratar distintas tcnicas estudiadas Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 2
1.3. Cmo leer datos de un fichero en Statgraphics Archivo Abrir Abrir Datos OK Archivo de datos STATGRAPHICS Aceptar Abrir archivo de Datos 93cars.sgd Abrir
Antes de continuar, examina brevemente los datos y como estn organizados.
Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 3
Cuntas variables estn incluidas en el conjunto de datos? En la base de datos 93cars.sgd estn incluidas 26 variables
De cuntas observaciones se dispone para cada variable? En esta base de datos se dispone de 93 observaciones por cada variable
De qu tipo es cada variable? A continuacin separare las 26 variables con las que contamos en los tipos de variables existentes utilizando la connotacin de su descripcin.
- Variables cuantitativas: Min Price, Mid Price, Max Price, Cylinders, Engine Size, Horsepower, RPM, Revs per Mile, Fuel tank, Passengers, Length, Wheelbase, Width, U Turn Space, Rear seat, Luggage y Weight - Variables cualitativas: Make, model y type, MPG City, MPG Highway y Drive Train - Variables categricas: Air bags, Manual y Domestic
1.4. Obtencin de estadsticos descriptivos bsicos Describir Datos Numricos Anlisis de una variable Aceptar MPG City Datos Aceptar Tablas y grficos Grfico de Dispersin Grafico de Caja y Bigotes Aceptar
1. Repite el anlisis para un par de variables, seleccionando
Describir Datos Numricos Anlisis multivariado Aceptar
y a continuacin las variables MPG city y Horsepower (potencia), pulsando el botn Datos. Selecciona la opcin Solamente Casos Completos en la siguiente ventana. Obtn los valores de la covarianza de ambas variables y su coeficiente de correlacin, as como su diagrama de dispersin.
Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 5
Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 6
1.5. Generacin de grficos
Graficar Grficos Exploratorios Histograma Aceptar
Si queremos modificar algunas de las caractersticas del grfico:
(BD) Opciones de Ventana Nmero de Clases 15 Aceptar
Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 7
2. Genera un grfico de dispersin para las variables MPG City y Horsepower.
Graficar Grficos de Dispersin Grafico Univariante Aceptar
Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 8
(BD) Opciones de Ventana Nmero de Clases 15 Aceptar
Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 9
1.6. Cuantiles y probabilidades de distribuciones:
Describir Ajuste de distribuciones Distribuciones de Probabilidad
Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 10
Supongamos que quisiramos calcular la probabilidad a la derecha del valor 1,5 para una distribucin t de Student con 24 grados de libertad. En la ventana anterior: (BD) Opciones de Anlisis G. L. 24
(BD) Opciones de ventana Variable Aleatoria: 1,5
Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 11
Podemos tambin obtener el valor del cuantil correspondiente a una determinada probabilidad. Por ejemplo, vamos a obtener el cuantil correspondiente a una probabilidad del 98% (el valor de la variable que deja a su derecha una probabilidad del 2%) para una t de Student con 14 grados de libertad. (I) Tablas y grficos Distribuciones Acumuladas Inversas (BD) Opciones de Anlisis G. L. 14 (BD) Opciones de Ventana FDA 0,98
El valor buscado es 2,26379. Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 12
3. Encuentra la probabilidad a la derecha del valor 32,37 bajo una distribucin chi cuadrado (Chi-square) con 19 grados de libertad. Encuentra tambin los cuantiles correspondientes al 2,5% y al 97,5% para dicha distribucin.
Los valores buscados son para el 97.5% 32.8523 y para el 2.5% es 8.9065 2. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPTESIS PARA UNA Y DOS POBLACIONES Problema: En una clnica se ofrecen tratamientos para la reduccin de peso en pacientes. Se supone que la disminucin de peso que se observa tras un tratamiento de dos meses sigue una distribucin normal. De una muestra aleatoria simple de 16 pacientes se han obtenido los valores de reduccin que se indican a continuacin:
12,5 14,3 9,8 15,3 10,5 11,8 9,5 8,4
Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 13
9,3 8,9 10,6 12,0 14,1 8,8 12,1 9,4
2.1. Intervalos de confianza para una poblacin Calcula un intervalo de confianza al 95% para la reduccin de peso media en todos los pacientes que siguen el tratamiento.
Archivo Nuevo Archivo Guardar Guardar Datos Describir Datos Numricos Anlisis de una Variable (Datos) Col_1 (Tablas) Resumen Estadstico Aceptar
Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 14
Para calcular el intervalo de confianza podramos aplicar la frmula vista en clase, esto es, x tn-1,/2 s/n
para la que ya tenemos los valores de x, s y n, pero debemos calcular el cuantil correspondiente de la distribucin t de Student
Describir Ajuste de Distribuciones Distribuciones de probabilidad Students t G. L. 15 TABLAS Distribuciones Acumuladas Inversas (BD) Opciones de Ventana FDA 0,975
Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 15
Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 16
Obtenemos la pantalla siguiente (con el valor de tn-1,/2 = 2,13145):
y el intervalo ser el correspondiente x tn-1,/2 s/n
11,0813 2,13145 x 2,1532/16 = [9.93394;12.22866]
Statgraphics tiene otra manera ms directa de realizar estos clculos. Para ello, desde la ventana con los datos que hemos introducido seleccionamos en el men Describir las opciones siguientes,
Describir Datos Numricos Anlisis de una Variable (Datos) Col_1
(TABLAS) Intervalos de confianza
Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 17
(Opciones de Ventana BD) Nivel de Confianza 95
Para el 95% (que tambin es el valor por defecto) obtenemos el resultado indicado en la captura de pantalla siguiente (y en particular el intervalo [9,93 ; 12,23]):
4. Para el conjunto de datos 93cars.sgd, calcula un intervalo de confianza para la media de la variable MPG City al 99%.
Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 18
2.2. Contrastes de hiptesis para una poblacin (x 10)/(s/n ) = (11,0813 10)/(2,1532/16) = 2.008731
Describir Ajuste de Distribuciones Distribuciones de probabilidad Students t
Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 19
G. L. 15
TABLAS Distribuciones Acumuladas
(BD) Opciones de Ventana Variable Aleatoria 2,008731
Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 20
Describir Datos Numricos Anlisis de una variable (Datos) PESO (TABLAS) Prueba de Hiptesis
(BD) Opciones de Ventana Media/Mediana 10 Hiptesis Alternativa Mayor Que
Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 21
Este resultado coincide con el anlisis que habamos realizado anteriormente.
Prueba de los signos Hiptesis Nula: mediana = 10,0 Alternativa: mayor que
Nmero de valores menores a la mediana hipottica: 7 Nmero de valores mayores a la mediana hipottica: 9
Estadstico para Grandes Muestras = 0,25 (aplicada la correccin por continuidad) Valor-P = 0,401292 No se rechaza la hiptesis nula para alfa = 0,05.
Prueba de rangos con signo Hiptesis Nula: mediana = 10,0 Alternativa: mayor que
Rango medio de valores menores a la mediana hipottica: 5,42857 Rango medio de valores mayores a la mediana hipottica: 10,8889
Estadstico para Grandes Muestras = 1,52592 (aplicada la correccin por continuidad) Valor-P = 0,0635148 No se rechaza la hiptesis nula para alfa = 0,05.
Prueba chi-cuadrada Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 22
2.3. Contrastes de hiptesis para dos poblaciones Supongamos que queremos contrastar con los datos del problema anterior si la reduccin de peso promedio obtenida no excede 10 Kg (H0 : 10).
Supongamos tambin que queremos hacerlo para un nivel de significacin del 5%.
Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 23
Describir Datos Numricos Pruebas de Hiptesis Media Normal (Hiptesis alterna) Mayor Que
Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 24
5. Para el conjunto de datos 93cars.sgd, contrasta si existe evidencia suficiente para rechazar que la eficiencia de los automviles en carretera no ha cambiado desde el ao anterior, cuando el valor promedio entre todos los vehculos era de 28,3 mpg. Lleva a cabo el contraste para un nivel de significacin del 1%.
EJERCICIO N2: Estamos interesados en saber si los salarios medios en dos grandes ciudades de un pas son homogneos o si, por el contrario, se puede evidenciar que hay diferencias significativas en los salarios que perciben los trabajadores de estas 2 ciudades. Para ello se tomaron muestras aleatorias independientes de trabajadores (de actividades similares y niveles similares) en las 2 ciudades y se obtuvieron los siguientes datos: Ciudad 1 5.9 6.1 6.3 6.1 6 6.2 5.7 6.3 6.6 Ciudad 2 6.4 6.3 6.5 6.1 5 5.5 4.7 5.1 2.8 1.8 1.5 Plantea un contraste bilateral para ver si hay diferencias significativas en los salarios que perciben los trabajadores de estas 2 ciudades. A qu conclusin llegas para un nivel de significacin de 0,1? Da una cota para el p-valor. Comparar Dos Muestras Muestras Independientes (Muestra 1) Col_1 , (Muestra 2) Col_2 Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 25
(TABLAS) Resumen Estadstico
Con estos valores podemos calcular el estadstico del contraste, y tenemos que
sp 2 = (8x0,2598 2 + 10x1,838 2 )/18 = 1,907778
t = (6,13333 - 4,7)/(1,907778 (1/9+1/11)) = 2,308792
Describir Ajuste de Distribuciones Distribuciones de probabilidad Students t G. L. 18 TABLAS Distribuciones Acumuladas (BD) Opciones de Ventana Variable Aleatoria 2,308792
Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 26
Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 27
Al tratarse de un contraste bilateral, su p-valor ser 2x0,3934 = 0,7868, y no rechazamos la hiptesis nula para un nivel de significacin del 1%.
Si queremos realizar este mismo contraste de una manera ms directa, podemos seleccionar en el men Comparar,
Comparar Dos Muestras Muestras Independientes (Muestra 1) Col_1 , (Muestra 2) Col_2 (TABLAS) Comparacin de Medias
Alternativamente, puedes llevar a cabo este anlisis seleccionando Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 28
Comparar Dos Muestras Pruebas de Hiptesis
e introduciendo los datos para el contraste en la ventana emergente.
Si las muestras fuesen pareadas, bastara con seleccionar en el men Comparar,
Comparar Dos Muestras Muestras Pareadas Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 29
y seguir un procedimiento similar.
ANOVA:
Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 30
Examen de Practica Unidad I
Metodologa de la Investigacin- VII CICLO Pgina 31
6. En la Web puede conseguir un conjunto de datos para trabajar las distintas prcticas. Estos datos pueden corresponden a consumos de automviles fabricados en Europa, Japn y los EEUU o otros temas aplicados a la Agroindustria. Lee dichos datos en Statgraphics y lleva a cabo contrastes de hiptesis para determinar si en funcin de estos datos puedes concluir que los consumos medios son diferentes para automviles fabricados en las distintas zonas o el tema tratado con datos Agroindustriales, teniendo en cuenta los intervalos de confianza, ANOVA Y prueba de hiptesis.
La data antes mostrada fue recolectada despus de una prueba de concentracin de microorganismo producido de acuerdo a los diversos factores como son agitacin, temperatura o velocidad de alimentacin.
Por lo tanto rechazamos la Ho y entonces la Temperatura la marcha si es significativa para el crecimiento del microorganismo. Por lo tanto al ser el valor de probabilidad alto, respecto del 5% no podemos rechazar la Ho: sabiendo que no hay diferencias entre los tratamientos. No hay interaccin