Proyecto Estadistica

ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL
ESTADÍSTICA
PROYECTO:
CONTRASTES DE HIPÓTESIS
GRUPO
INTEGRANTES:
 Ballén Gavilánez Elías León
 Malavé Hernández Jenifer Allison
 Mero Cheme Viviana Jaritza
 Toala Chancay César Luis
 Vergara Bazán Juan Carlos
Profesor: Ing. Nadia Cárdenas Escobar
Paralelo Nº2
GUAYAQUIL – ECUADOR
I. INTRODUCCIÓN AL TEMA DE ESTUDIO
1.1. OBJETIVO GENERAL

Realizar inferencia a través de observaciones experimentales, revisando
estadística descriptiva, nociones de probabilidad, modelos de variables
aleatorias y fundamentos de contraste de hipótesis.
1.2. OBJETIVOS ESPECÍFICOS

Aprender el manejo de software estadístico.
Interpretar resultados en base a criterios estadísticos
1.3. MARCO TEÓRICO

Conceptos básicos
a) Hipótesis estadística. Consiste en un supuesto o proposición sobre los
parámetros de una o varias poblaciones, o distribución bajo estudio.
b) Población. Conjunto de individuos sobre los que se desea conocer algo

en una investigación. Pueden ser personas, animales, objetos, entre
otros.
c) Muestra. Es una parte o subconjunto representativo de la población

sobre la que se realizará la investigación. Para obtener su tamaño o
cantidad existen diversas fórmulas que serán vistos más adelante.
d) Muestreo. Es el método o procedimiento utilizado para determinar los

componentes de la muestra de la población total.
e) Nivel de confianza. Es el porcentaje de intervalos que incluirían el

parámetro de población si se tomaran muestras de la misma población
una y otra vez. Los niveles de confianza más usuales son: 90%; 95% y
99%.
f) Porcentaje de error. Representa el grado de error que se tiene en la

generalización.
g) Variabilidad. Es el porcentaje o probabilidad con que se aceptó

(variabilidad positiva p) o rechazó (variabilidad negativa q) la hipótesis
investigada en un estudio previo al actual.
Tamaño de la Muestra
El tamaño de una muestra puede calcularse de dos formas, lo que dependerá
del tipo de variable y de la población con que se vaya a trabajar.
1. Con variable cualitativa (Estimación de porcentajes). Esto es cuando
las variables con que se trabaja no pueden expresarse numéricamente,
ya que se refieren a características o cualidades no medibles, de las
cuales lo único que puede obtenerse son resultados porcentuales.
 Población Desconocida: se utiliza la siguiente fórmula:

𝑍 2 𝑝𝑞
𝑛= 2
𝐸
 Población Conocida: se utiliza la siguiente fórmula:

𝑁𝑍 2 𝑝𝑞
𝑛=
(𝑁 − 1)𝐸 2 + 𝑍 2 𝑝𝑞
Para ambos casos n es el tamaño de la muestra, Z es el nivel de

confianza, E es el error permitido, p es la variabilidad positiva, q es la
variabilidad negativa y N es el tamaño de la población.
2. Con variable cuantitativa (Estimación de promedios). Esto es cuando

las variables con que se trabaja son de tipo numérico y permiten
realizarse operaciones aritméticas con ellas.
 Población Desconocida: se utiliza la siguiente fórmula:

𝑍2𝜎 2
𝑛= 2
𝐸
 Población Conocida: se utiliza la siguiente fórmula:

𝑁𝑍 2 𝜎 2
𝑛=
(𝑁 − 1)𝐸 2 + 𝑍 2 𝜎 2
Para ambos casos n es el tamaño de la muestra, Z es el nivel de

confianza, E es el error permitido, 𝜎 2 es la varianza y N es el tamaño de
la población.
Tabla de Distribución de Frecuencias

Arreglo rectangular para agrupación de datos que permite interpretar los
resultados de manera más factible. Consta de:
 Número de clases (k). Número de intervalos a utilizar para agrupar
los datos. Generalmente se calcula mediante la ecuación k = 1 +
3,322log(n), donde n es el número de datos.
 Clases. Son los intervalos que agrupan los datos de acuerdo a rangos
dados por un límite inferior (Li) y uno superior (Ls).
 Marca de Clase (m). Es el promedio entre los límites inferior y
superior de cada clase.
 Frecuencia Absoluta (fi). Es el número de observaciones en la
muestra que pertenecen a cada clase.
 Frecuencia Relativa (fi/n). Es el resultado de dividir cada frecuencia
absoluta para n.
 Frecuencia Absoluta Acumulada (Fi). Es la suma de las frecuencias
absolutas.
 Frecuencia Relativa Acumulada (Fi/n). Es el resultado de dividir el
valor de cada frecuencia absoluta acumulada para n.
Figura 1. Ejemplo de Tabla de Frecuencias – Obtenido de Libro de Probabilidad y Estadística Básica de Luis
Rodríguez.
Histograma
Es un gráfico que permite representar la distribución de frecuencia de los datos.
Se construye dibujando rectángulos cuya base corresponde a cada clase y
altura a la frecuencia relativa de la clase correspondiente.
Figura 2. Ejemplo de Histograma - Obtenido de Libro de

Probabilidad y Estadística Básica de Luis Rodríguez.
Medidas de Tendencia Central

Son valores numéricos que pueden sintetizar y representar todos los datos. Las
principales son:
 Media Aritmética. Es el promedio de los datos de la muestra.
 Mediana. Es el valor que está en medio de los datos ordenados.
 Moda. Es el valor que más se repite o que ocurre con más frecuencia
entre los datos. Es posible que no exista moda o que exista más de una
moda.
Medidas de Dispersión
Son valores numéricos que proveen información sobre el comportamiento de
los datos. Las principales son:
 Rango. Es la diferencia entre el valor mayor y menor de los datos de la
muestra.
 Varianza. Cuantificación de las distancias de los datos respecto a la
media aritmética.
 Desviación Típica o Estándar. Es la raíz cuadrada positiva de la
varianza.
Medidas de Posición
Son números que dividen al conjunto de datos ordenados, en otros grupos de
aproximadamente igual cantidad con el objetivo de resaltar su ubicación.
 Cuartiles. Números que dividen la muestra en 3 grupos iguales, cada
uno acumula el 25% de la información.
 Deciles. Números que dividen la muestra en 10 grupos iguales, cada
uno acumula el 10% de la información.
 Percentiles o Porcentiles. Números que dividen la muestra en 100
grupos iguales, cada uno acumula el 1% de la información.
Intervalos de Confianza
Los intervalos de confianza son rangos dentro de los que se puede esperar que
se encuentre un parámetro a estimar.
Los más comunes son:
Muestras grandes (n≥30)
Parámetro: μ
Intervalo de Población con Distribución
desconocida, varianza 𝜎 2 𝜎 𝜎
Confianza para la 𝑥̅ − 𝑍𝛼⁄2 ≤ μ ≤ 𝑥̅ + 𝑍𝛼⁄2
Parámetro: √𝑛 √𝑛
Media
Muestra grande, por TLC, el
𝑥̅ −μ
estadístico 𝑍 = 𝜎/√𝑛 tiene D.
Normal Estándar aprox.
Figura 3. Gráfico de Distribución Normal Estándar con los intervalos de confianza para la media.
Muestras pequeñas (n<30)
Parámetro: μ 𝜎 𝜎
Intervalo de 𝑥̅ − 𝑍𝛼⁄2 ≤ t ≤ 𝑥̅ + 𝑍𝛼⁄2
Población con Distribución √𝑛 √𝑛
Confianza para la
Normal, varianza 𝜎2
Media 𝑣 = 𝑛 − 1 𝑔. 𝑙.
desconocida
Parámetro:
Figura 4. Gráfico de Distribución T con los intervalos

de confianza para la media.
Intervalo de 𝜎 𝜎
Confianza para la (n − 1) − 𝑆 2 ≤ 𝜎 2 ≤ (n − 1) + 𝑆 2 2
𝑥𝛼2⁄2 𝑥1−𝛼⁄2
Varianza
Figura 5. Gráfico de Distribución Ji-Cuadrado con los

intervalos de confianza para la varianza.
En todo caso, el intervalo calculado va a depender de:

 El tamaño muestral, pues mientras más datos se hayan incluido en el
cálculo, se espera que la diferencia entre el valor estimado y el valor real
desconocido sea más pequeña.
 El nivel de confianza con que se haya trabajado.
Prueba de Hipótesis
Es una técnica que consiste en suponer cierto valor para el parámetro de
interés y aceptar o rechazar dicha información utilizando los datos de la
muestra.
Para su realización se necesitarán dos hipótesis, una hipótesis nula (Ho) que
es la propuesta para el parámetro de estudio y una hipótesis alternativa (Ha)
que es propuesta en oposición a Ho y que es aceptada únicamente cuando se
rechace Ho.
Cuando se realizan estas pruebas es muy común que se cometan errores.
Siendo Ho la hipótesis propuesta para el parámetro de interés y suponiendo
que la prueba estadística ha sido realizada, se pueden tomar dos decisiones
que incurrirán a errores:
1. Rechazar Ho sin conocer que era verdadera. (Error Tipo I)
2. No rechazar Ho sin conocer que esta es falsa. (Error Tipo II)
Estos errores pueden cuantificarse de acuerdo a la probabilidad de cometerlos:
Medida del Error Tipo I:
𝛼 = 𝜃𝑃(𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻𝑜 𝑑𝑎𝑑𝑜 𝑞𝑢𝑒 𝐻𝑜 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎)
Medida del Error Tipo II:
𝛽 = 𝑃(𝑁𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻𝑜 𝑑𝑎𝑑𝑜 𝑞𝑢𝑒 𝑜𝑡𝑟𝑎 ℎ𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎)
* 𝛼 es el nivel de significancia de la prueba, comúnmente es dado como dato
para realizar la prueba, siendo por lo general 1%, 2%, 5%, 10%.
Tipos de Prueba:
 Prueba de 1 cola: 𝐻𝑜 = 𝜃 𝑦 𝐻𝑎: 𝜃 < 𝜃𝑜 𝑜 𝐻𝑜 = 𝜃 𝑦 𝐻𝑎: 𝜃 > 𝜃𝑜
 Prueba de 2 colas: 𝐻𝑜 = 𝜃 𝑦 𝐻𝑎: 𝜃 < 𝜃𝑜 v 𝜃 > 𝜃𝑜
Región de Rechazo de la Prueba
Constituye la zona o región en la que se rechaza la hipótesis nula y se obtiene
en base al valor del nivel de confianza 𝛼. Para las pruebas de una cola existe
una región de rechazo, mientras que para las de dos colas se tienen dos
regiones de rechazo.
Cuando en la prueba no se cuenta con un asociado, se recurre al valor p de
la prueba, el cual constituye el valor más pequeño de nivel de significancia a
partir del cual se rechaza Ho.
 No se rechaza Ho: p>0.1
 Se rechaza Ho: p<0.05
 Zona de indecisión: p>0.05 y p<0.1
Tabla de Contingencia
Las tablas de contingencia (también llamadas a veces tablas dinámicas, tablas
cruzadas, tablas de control o crosstabs) son posiblemente la técnica estadística
más utilizada en análisis de datos.
Estas tablas se componen de dos variables y se basan en el cálculo de
porcentajes. Donde el objetivo es descifrar si tales dos variables están
relacionadas, lo cual se averigua mediante la distribución de porcentajes. Es
decir, se trata de analizar si la distribución de porcentajes de una variable se
repite por igual en las categorías de la otra variable. Debido a que se estudia
una variable en función de otra, el investigador ha de distinguir entre la variable
dependiente (o a explicar) y la variable independiente (o explicativa). Esta
distinción entre variable independiente y dependiente es importante porque la
variable independiente se sitúa en columnas, y la variable dependiente en filas.
El investigador es el que decide cuál variable es independiente (o explicativa) y
cuál dependiente (o a explicar). Veamos un ejemplo paso a paso.
Condiciones para análisis de tablas de contingencia:
 Sólo se pueden relacionar dos variables.
 Las variables a analizar deben ser nominales u ordinales. Las variables
nominales son las que no tienen orden interno establecido (como género
o estado civil), y las variables ordinales en cambio sí tienen un orden
interno establecido y el paso de una categoría a otra no es igual (p.ej.
nivel educativo, interés en la política (alto-medio-bajo-ninguno).
Las tablas de contingencia no se usan para analizar relaciones de variables
escalares como la edad de muchas categorías ya que si se usara la tabla
sería inmensa e ilegible. Si se quiere usar un escalar como variable en una
tabla de contingencia se debe recodificarla por rangos. Ya que al hacer esto,
deja de ser escalar y pasa a ser ordinal, y por tanto sí se puede incluir un
análisis de tablas de contingencia. Ejemplo: interés en la política según grupos
de edad.
Figura 6. Ejemplo de tabla de contingencia para analizar el interés en la política según grupos de edad
II. INICIO DEL ESTUDIO

HIPÓTESIS PROPUESTAS:
 Se desea saber si los estudiantes la Escuela Superior Politécnica del
Litoral de la facultad de Ingeniería Mecánica y Ciencias de la Producción
de la carrera de Ingeniería Industrial perteneciente al Primer semestre
2017-2018 duermen en promedio más de 6 horas diarias.
 Se desea saber si los estudiantes la Escuela Superior Politécnica del
Litoral de la facultad de Ingeniería Mecánica y Ciencias de la Producción
de la carrera de Ingeniería Industrial perteneciente al Primer semestre
2017-2018 cursan en promedio menos de 5 materias.
 Se desea saber si la media del promedio del primer parcial en la materia

de Cálculo de una variable de los estudiantes la Escuela Superior
Politécnica del Litoral de la facultad de Ingeniería Mecánica y Ciencias
de la Producción de la carrera de Ingeniería Industrial perteneciente al
Primer semestre 2017-2018 es mayor a 7.
III. METODOLOGÍA EMPLEADA PARA EL ESTUDIO
3.1. DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA
POBLACIÓN Y MUESTRA
La población a considerar es el número de estudiantes de la carrera de
Ingeniería Industrial que ingresaron a la ESPOL en el I Término 2017, es decir,
los que se encuentran actualmente en primer semestre.
Esta información fue obtenida mediante papel certificado en la Secretaría
Académica de la ESPOL, tal como se muestra en la fotografía 1. Donde se
observa que la población (N) para dicha carrera tiene un valor de 41.
Fotografía 1. Número de estudiantes por carrera, Año 2017 – I Término
Para la determinación del tamaño de la muestra (n), se utilizó la ecuación para

el tamaño de la muestra para promedios, con población conocida o finita.
𝑁𝑍 2 𝜎 2
𝑛=
(𝑁 − 1)𝐸 2 + 𝑍 2 𝜎 2
Donde:
n es el tamaño de la muestra.
N es el tamaño de la población, con valor 𝑁 = 41
Z es el valor de distribución normal estándar para el nivel de confianza
escogido, se trabajará con un 95% de confianza, para el cual 𝑍 = 1,96.
E es el error permisible dado por el investigador. Se trabajará con 𝑒 = 0.05.
𝜎 2 es la varianza, cuyo valor puede ser calculado o estimado, para este caso
se estimó una 𝜎 2 = 0.5.
Reemplazando:
41(1,96)2 (0,5)2
𝑛=
(41 − 1)(0,05)2 + (1,96)2 (0,5)2
𝑛 = 37,13
𝑛 ≈ 37
De acuerdo al cálculo, el tamaño ideal de la muestra sería de 37 estudiantes de
primer semestre de la carrera de Ingeniería Industrial.
3.2. CUESTIONARIO
El cuestionario formulado presenta 6 preguntas de interés para la

verificación de las hipótesis planteadas, además en él se solicita el
número de matrícula para verificaciones posteriores, siendo el
siguiente:
ENCUESTA DIRIGIDA A LOS ESTUDIANTES DE LA CARRERA DE INGENIERÍA

INDUSTRIAL DEL PRIMER TÉRMINO 2017.
Número de matrícula ___________________
Marque con una X su respuesta.

1. ¿Cuál es su género?
__ Masculino
__ Femenino
2. ¿Cuántas materias está cursando este semestre?
__1 __4 __7 __10
__2 __5 __8
__3 __6 __9
3. ¿Está cursando la materia de Cálculo de una Variable este semestre?

__ SÍ
__ NO
4. Si su respuesta fue Sí. ¿Cuál es su promedio del primer parcial para dicha
materia según consta en el Académico en Línea? Por favor, escriba su
respuesta con sinceridad y con letra legible.
Promedio ____
5. ¿Cuántas horas de estudio en promedio le dedica a la materia de Cálculo

de una Variable cada semana? Por favor, escriba su respuesta con
sinceridad y con letra legible.
Horas de estudio ____
6. ¿Cuántas horas de sueño en promedio tiene usted al día? Por favor,

escriba su respuesta con sinceridad y con letra legible.
Horas de sueño ____
3.3. LEVANTAMIENTO DE LA INFORMACIÓN
El levantamiento de la información se realiza de acuerdo a si se

requiere un Muestreo de Tipo No Estadístico o uno de Tipo
Estadístico. En este caso se precisa del segundo, el mismo que
puede ser llevado a cabo de varias maneras, como por Muestreo
Aleatorio Simple, Estratificado, Conglomerado o Sistemático entre
otras.
Por ser el más sencillo en cuanto a aplicación se ha elegido el

Muestreo Aleatorio Simple. En este tipo de muestreo, se deben
satisfacer las condiciones:
 Cada elemento de la población tiene la misma probabilidad de

ser escogido.
 Todas las posibles muestras del tamaño muestral (n) tienen la
misma probabilidad de ser seleccionadas.
Este método también se lo conoce como sorteo, rifa o la tómbola.
Para llevar a cabo el Muestreo Aleatorio Simple cumpliendo las

condiciones anteriores, la muestra se debe seleccionar
aleatoriamente de entre la población. Para esto se decidió proceder
de la siguiente forma:
1. Se creó en Excel una lista con los datos de todos los estudiantes
de la población objetivo. Los cuales fueron obtenidos en la
secretaría de la Facultad de Ingeniería Mecánica y Ciencias de la
Producción, como se muestra en la fotografía 2.
Fotografía 2. Listado de los estudiantes novatos de la carrera de Ingeniería Industrial I Término
2017
2. Se utilizó la función “ALEATORIO” para obtener los 37

estudiantes a ser seleccionados, siendo los siguientes.
Figura 7. Estudiantes seleccionados para el

levantamiento de la información.
Una vez realizada la toma de datos, se realizó la tabulación,

obteniendo la siguiente tabla.
Figura 8. Tabla Obtenida en R, con la información de cada estudiante por variable.
IV. ANÁLISIS DE LAS VARIABLES E INTERPRETACIÓN DE

RESULTADOS
TABLAS DE FRECUENCIA (MUJERES)

Número de Materias
Tabla 1. Tabla de Frecuencias para la variable Número de Materias de acuerdo a los datos de
estudiantes de género femenino. Puede observarse que de 12 estudiantes, la mayor parte (8) ven 4
materias en este semestre.
Promedio
Tabla 2. Tabla de Frecuencias para la variable Horas de Estudio de acuerdo a los datos de
estudiantes de género femenino. Puede observarse que el 33.3% de estudiantes estudia la materia
Cálculo de una variable un tiempo promedio de entre 5,31 y 7,6 horas semanales, mientras que
apenas el 8.3% y el 16.7% estudian en promedio 3 o menos horas y de 9.91 a 12.2 horas semanales
respectivamente.
Horas de Estudio
Tabla 3. Tabla de Frecuencias para la variable Promedio de acuerdo a los datos de estudiantes de
género femenino. Puede observarse que el promedio para la materia de interés de la mayoría de
estudiantes (41,7%) se encuentra entre 6.61 y 7.7.
Horas de Sueño
Tabla 4. . Tabla de Frecuencias para la variable Promedio de acuerdo a los datos de estudiantes de
género femenino. Se aprecia que el 33.3% de estudiantes duerme en promedio de 6,35 a 7,12
horas diarias y apenas un 16,7% duerme 4 o menos horas diarias.
Datos Estadísticos
Tabla 5. Medidas de orden, dispersión y posición de las variables analizadas de estudiantes de género
femenino.
TABLA DE FRECUENCIAS (HOMBRES)

Número de Materias
Tabla 6. Tabla de Frecuencias para la variable Número de Materias de acuerdo a los datos de estudiantes de
género masculino. Puede observarse que de 25 estudiantes el 64% ve 4 materias en este semestre.
Promedio
Tabla 7. Tabla de Frecuencias para la variable Promedio de acuerdo a los datos de estudiantes de género
masculino. Puede observarse que de 25 estudiantes el 32% tiene un promedio entre 6.83 y 7.56.
Horas de sueño
Tabla 8. Tabla de Frecuencias para la variable Horas de Sueño de acuerdo a los datos de estudiantes
de género masculino. Puede observarse que de 25 estudiantes el 40% (la mayoría) duerme entre 4,71
y 7,4 horas diarias.
Horas de Estudio
Tabla 9. Tabla de Frecuencias para la variable Horas de Estudio de acuerdo a los datos de
estudiantes de género masculino. Puede observarse que de 25 estudiantes el 32% (la mayoría)
estudia entre 4,71 y 5,4 horas a la semana la materia de interés.
Datos Estadísticos:
Tabla 10. Medidas de orden, dispersión y posición de las variables analizadas de estudiantes de género
masculino.
HISTOGRAMAS (MUJERES)
Número de Materias
Figura 9. Histograma para la Variable Número de materias con los datos de

estudiantes mujeres.
Promedio
Figura 10. Histograma para la Variable Promedio con los datos de

estudiantes mujeres. Se aprecia que la mayoría de estudiantes tiene un
promedio entre 4 y 5.
Horas de Estudio
Figura 11. Histograma para la Variable Horas de Estudio con los datos de
estudiantes mujeres.
Horas de Sueño
Figura 12. Histograma para la Variable Horas de Sueño con los datos de estudiantes
mujeres.
HISTOGRAMAS (HOMBRES)
Número de Materias
Figura 13. Histograma para la Variable Número de Materias con los datos de
estudiantes del género masculino.
Promedio
Figura 14. Histograma para la Variable Promedio con los datos de estudiantes del
género masculino.
Horas de Estudio
Figura 15. Histograma para la Variable Hora de Estudio con los datos de estudiantes
del género masculino.
Horas de sueño
Figura 16. Histograma para la Variable Número de Horas de Sueño con los datos de
estudiantes del género masculino.
TABLAS DE CONTINGENCIA
Género - Horas de Estudio
Tabla 11. Tabla de Contingencia para la variable nominal género y ordinal horas de estudio.
Género – Horas de Sueño
Tabla 12. Tabla de Contingencia para los estudiantes por género y para el total. Para el Género Femenino se aprecia que de 12 el
16.7% duerme menos de 4 horas, mientras que la mayor parte, el 33.3% duerme entre 5 ,3 y 6 horas diarias en promedio. En cambio
para el género masculino, se tiene que de 25 el 32% duerme entre 4,68 y 5,43 horas, mientras que apenas un 4% duerme 4 o menos
horas. Y en general, de las muestra de 37 estudiantes, la mayoría (29.7%) duerme de 5,3 a 6 horas al día, mientras que apenas un
8,1% (3personas) duermen 4 horas o menos.
Género – Promedio
Tabla 13. Tabla de Contingencia para la variable nominal género y ordinal promedio. Para el Género Femenino se aprecia que
de 12 el 41,7% tiene un promedio entre 6,69 y 7,44, siguiéndole un 16.7% cuyo promedio es de 5,93 a 6,68 y un 8,3% para los
de más rangos. En cambio para el género masculino, se tiene que de 25 el 36% tiene un promedio entre 5,93 y 6,68 para la
materia de interés, mientras que apenas un 4% tiene un promedio entre 4,41 y 5,16. Y en general, de las muestra de 37
estudiantes, la mayoría (29.7%) tiene un promedio de 5,93 a 6,68 horas al día, mientras que apenas un 2,7% (2 personas)
tienen un promedio inferior o igual a 4,4.
Género – Número de Materias
Tabla 14. Tabla de Contingencia para la variable nominal género y ordinal promedio.
DIAGRAMA DE BARRAS
Género – Horas de Estudio
Figura 17. Diagrama de barras Género-Horas de Estudio. Se aprecia que

la mayoría de mujeres y hombres estudian entre 4,71 y 7,4 horas a la
semana la materia de interés.
Género – Horas de Sueño
Figura 18. Diagrama de barras Género-Horas Sueño. Se aprecia que la mayoría de

mujeres duerme entre 5,35 y 6.01 horas. Mientras que los hombres duermen
menos, con un promedio de 4,68 a 5,34 horas al día.
Género – Promedio
Figura 19. Diagrama de barras Género – Promedio. Se aprecia que el promedio

de la mayoría de mujeres está entre 6,69 y 7,44, mientras que el de la mayoría
de hombres está entre 5,93 y 6,68.
V. INTERVALOS DE CONFIANZA
Intervalos de Confianza para la Media
Toda la muestra
Hombres
Mujeres
INTERVALOS DE CONFIANZA PARA LA VARIANZA
Par cada intervalo se mantiene

 n=tamaño muestra = 37
 α= nivel de significancia=0.05
 Grados de libertad= n-1=36
Calculado en excel
Para número de materias
S2=0.234
0.154 ≤ 𝜎 2 ≤ 0.395
Interpretación:
Para el promedio
S2= 1.218
0.805 ≤ 𝜎 2 ≤ 2.055
Interpretación:
Para las horas de estudio

S2=11.114
7.349 ≤ 𝜎 2 ≤ 18.752
Interpretación:
Para las horas de sueño

S2=1.303
0.861 ≤ 𝜎 2 ≤ 2.198
VI. CONCLUSIONES
Hipótesis 1
ℎ0 : μ = 6
ℎ𝑎 : μ > 6
Estadísticas de muestra única

Desviación Media de error
N Media
estándar estándar
Horas de sueño Diarias 37 5,905 1,1416 ,1877
Prueba de muestra única

Valor de prueba = 6
95% de intervalo de confianza
Diferencia de
t gl Sig. (bilateral) de la diferencia
medias
Inferior Superior
Horas de sueño Diarias -,504 36 ,617 -,0946 -,475 ,286
C: Como el Valor P es mayor que 0.1 entonces no se rechaza ℎ0
Hipótesis 2
ℎ0 : μ = 5
ℎ𝑎 : μ < 5
Estadísticas de muestra única

N Media
estándar estándar
Número de materias 37 4,35 ,484 ,080
Prueba de muestra única

Valor de prueba = 5
95% de intervalo de confianza

Diferencia de
t gl Sig. (bilateral) de la diferencia
medias
Inferior Superior
Número de materias -8,152 36 ,000 -,649 -,81 -,49
C: Como el valor P es menor que 0.05 entonces rechazamos ℎ0 +
Hipótesis 3
µ= promedio de la calificación de Cálculo de una variable durante el primer
semestre del primer término 2017-2018 para los Estudiantes de la Escuela
Superior Politécnica del Litoral de la facultad de Ingeniería Mecánica y Ciencias
de la producción de la carrera de Ingeniería industrial.
x͞= estimador del promedio obtenido de la encuesta de 37 estudiantes.
ℎ0 : μ = 7
ℎ𝑎 : μ > 7
Primero hay que comprobar que proviene de una población con Distribución
Normal. Usaremos el SPSS para obtener el valor P de esta prueba Kolmogorov
Smirnoff
ℎ0 : la muestra proviene de una poblacion con distribución normal
ℎ𝑎 : negación de ℎ0
Pruebas de normalidad
a
Kolmogorov-Smirnov Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
*
Promedio de la materia ,117 37 ,200 ,960 37 ,197
*. Esto es un límite inferior de la significación verdadera.
Como el valor P es 0.20 que es mayor que 0.1 entonces no rechazo ℎ0 por lo cual la población sigue una
Distribución normal y podemos utilizar la prueba T de nuestra hipótesis
El resultado es el Siguiente
Estadísticas de Muestra Única
N Media
estándar estándar
Promedio de la materia 37 6,9924 1,10383 ,18147
Prueba de Valor
muestra única = 7
de prueba
90% de intervalo de
Valor de prueba = 5
confianza de la diferencia
95% de intervalo de confianza de

la diferencia
Diferencia de
t gl Sig. (bilateral) Diferencia de
medias Inferior Superior
t gl Sig. (bilateral)
medias
Promedio de la materia 10,979 36 ,000 1,99243 Inferior
1,6244 Superior 2,3605
-,042 36 ,967 -,00757 -,3139 ,2988
VII. BIBLIOGRAFÍA
Rodríguez L. (2007). Probabilidad y Estadística Básica para Ingenieros.

Guayaquil: Escuela Superior Politécnica del Litoral
López, P. (2013). Población, Muestra y Muestreo. Revista Punto Cero, vol. 09,
(N° 8). Recuperado desde:
http://www.scielo.org.bo/scielo.php?script=sci_arttext&pid=S1815-
02762004000100012
Barón J., Téllez F. (2013). Apuntes de Bioestadística. Recuperado desde:
https://www.bioestadistica.uma.es/baron/apuntes/ficheros/cap02.pdf

Proyecto Estadistica

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Proyecto Estadistica

Enviado por

Direitos autorais:

Formatos disponíveis

ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL

Profesor: Ing. Nadia Cárdenas Escobar

1.1. OBJETIVO GENERAL

1.2. OBJETIVOS ESPECÍFICOS

1.3. MARCO TEÓRICO

b) Población. Conjunto de individuos sobre los que se desea conocer algo

c) Muestra. Es una parte o subconjunto representativo de la población

d) Muestreo. Es el método o procedimiento utilizado para determinar los

e) Nivel de confianza. Es el porcentaje de intervalos que incluirían el

f) Porcentaje de error. Representa el grado de error que se tiene en la

g) Variabilidad. Es el porcentaje o probabilidad con que se aceptó

 Población Desconocida: se utiliza la siguiente fórmula:

 Población Conocida: se utiliza la siguiente fórmula:

Para ambos casos n es el tamaño de la muestra, Z es el nivel de

2. Con variable cuantitativa (Estimación de promedios). Esto es cuando

 Población Desconocida: se utiliza la siguiente fórmula:

 Población Conocida: se utiliza la siguiente fórmula:

Para ambos casos n es el tamaño de la muestra, Z es el nivel de

Tabla de Distribución de Frecuencias

Figura 2. Ejemplo de Histograma - Obtenido de Libro de

Medidas de Tendencia Central

Figura 4. Gráfico de Distribución T con los intervalos

Figura 5. Gráfico de Distribución Ji-Cuadrado con los

En todo caso, el intervalo calculado va a depender de:

II. INICIO DEL ESTUDIO

 Se desea saber si la media del promedio del primer parcial en la materia

3.1. DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA

Para la determinación del tamaño de la muestra (n), se utilizó la ecuación para

El cuestionario formulado presenta 6 preguntas de interés para la

ENCUESTA DIRIGIDA A LOS ESTUDIANTES DE LA CARRERA DE INGENIERÍA

Marque con una X su respuesta.

3. ¿Está cursando la materia de Cálculo de una Variable este semestre?

5. ¿Cuántas horas de estudio en promedio le dedica a la materia de Cálculo

Horas de estudio ____

6. ¿Cuántas horas de sueño en promedio tiene usted al día? Por favor,

3.3. LEVANTAMIENTO DE LA INFORMACIÓN

El levantamiento de la información se realiza de acuerdo a si se

Por ser el más sencillo en cuanto a aplicación se ha elegido el

 Cada elemento de la población tiene la misma probabilidad de

Este método también se lo conoce como sorteo, rifa o la tómbola.

Para llevar a cabo el Muestreo Aleatorio Simple cumpliendo las

2. Se utilizó la función “ALEATORIO” para obtener los 37

Figura 7. Estudiantes seleccionados para el

Una vez realizada la toma de datos, se realizó la tabulación,

IV. ANÁLISIS DE LAS VARIABLES E INTERPRETACIÓN DE

TABLAS DE FRECUENCIA (MUJERES)

TABLA DE FRECUENCIAS (HOMBRES)

Figura 9. Histograma para la Variable Número de materias con los datos de

Figura 10. Histograma para la Variable Promedio con los datos de

Figura 17. Diagrama de barras Género-Horas de Estudio. Se aprecia que

Género – Horas de Sueño

Figura 18. Diagrama de barras Género-Horas Sueño. Se aprecia que la mayoría de

Figura 19. Diagrama de barras Género – Promedio. Se aprecia que el promedio

Intervalos de Confianza para la Media

Par cada intervalo se mantiene

Para las horas de estudio

Para las horas de sueño

Estadísticas de muestra única

Prueba de muestra única

C: Como el Valor P es mayor que 0.1 entonces no se rechaza ℎ0

Estadísticas de muestra única

Prueba de muestra única

95% de intervalo de confianza

C: Como el valor P es menor que 0.05 entonces rechazamos ℎ0 +