Você está na página 1de 159

INTRODUCCION

Tomar decisiones es una actividad inherente a los gerentes en el contexto actual. El docente en ciencias
administrativas asume la gran responsabilidad de transmitir los conocimientos sustanciales que permita al
estudiante internalizar los conceptos y prácticas más elementales del conocimiento actualizado, en cada
materia curricular que estudia.

El proceso de toma de decisión cae en dos contextos; decisiones programadas y no programadas, éstas a
la vez pueden ser cualitativas y cuantitativas. En caso de la primera se basa en corazonadas, prejuicios,
intuiciones, observaciones, etc. El segundo, requiere procedimientos y técnicas matemáticas, para
recopilar, procesar y analizar los datos para convertirlas en información que precisamente constituye
insumo para la toma de decisión.

En este sentido, alcanzamos a ustedes, una compilación ESTADISTICA PARA LA INVESTIGACIÓN,


un trabajo que responde al perfil del profesional en administración en los tiempos de globalización del
mundo del negocio.

De antemano agradecemos las observaciones y sugerencias que nos hagan llegar a nuestro correo
electrónico zeusore@hotmail.com las cuales serán tomadas en cuenta para ir mejorando las próximas
publicaciones.

El autor.
INDICE
INTRODUCCIÓN
INDICE

UNIDAD I: ESTADÍSTICA
Definición
Tipos de estadística
Estadística descriptiva
Estadística inferencial
Estadística y la Investigación Científica
Variables
Población
Muestra
Muesttreo
Métodos de recolección y tabulación de datos
Observación
Encuesta
Entrevista
Cuestionario
Prueba de Hipótesis
Prueba de hipótesis
Establecimiento de hipótesis nula y alterna
Errores tipo I y tipo II
Prueba unilateral sobre la media de una población: muestra grande
Prueba Bilateral sobre la media de una población: muestra grande
Pruebas sobre media de una población: caso n ≤ 30
Pruebas sobre la proporción de una población
Cálculo de probabilidad de errores de tipo II
Determinación de tamaño de muestra para una prueba de hipótesis sobre una media población

UNIDAD II: MÉTODOS ESTADÍSTICOS PARA LA INVESTIGACIÓN ADMINISTRATIVA


T-student
Chi- Cuadrada
Análisis de varianza
Prueba de signos
Prueba de pares iguales de Wilcoxon
Valoración de Fisher y Shefle
Prueba de Manny y Whitney
Prueba de Krushal y Wallis
Regresión y correlación
Prueba de Fiedman

UNIDAD III: PROBABILÍSTICOS


Distribución discreta de probabilidad
Distribución de probabilidad binomial
Distribución de probabilidad hipergoemétrica
Distribución de probabilidad de Poisson
Distribución normal
Distribución continua de probabilidad
Distribución de probabilidad uniforme
Distribución de probabilidad exponencial

UNIDAD IV: ESTIMACIONES ESTADÍSTICAS


Estimación puntual
Distribuciones
Propiedad de estimadores puntuales
Estimaciones de intervalo de una media de la población: muestra grande
Estimación de intervalo de una media de la población: muestra pequeña
Determinación del tamaño dela muestra
Estimación del intervalo de una proporción

UNIDAD V: INFERENCIA ESTADÍSTICA


Estimación de la diferencia entre las medias de dos poblaciones: muestras independientes
Prueba de hipótesis acerca de la diferencia entre las medias de dos poblaciones
Inferencia hacer de la diferencia entre las medias de dos poblaciones: Muestras pareadas
Inferencia hacer de la diferencia entre las proporciones de dos poblaciones

BIBLIOGRAFÍA
UNIDAD I

ESTADISTICA

1.1 DEFINICIONES

 La estadística es una ciencia que comprende la recopilación, tabulación, análisis e interpretación de


los datos cuantitativos y cualitativos". Kennedy-Neville.

 "La estadística constituye una disciplina con ilimitadas posibilidades de aplicación en diversos
campos de la actividad humana". H. B. Christensen.

 "Estadística es un grupo de técnicas o metodología que se desarrollaron para la recopilación,


presentación y análisis de los datos y para el uso de tales datos." Neter-Waserman.

 "La Estadística es la ciencia que se ocupa de la recopilación, tabulación, análisis, interpretación y


presentación de datos cuantitativos". D. H. Besterfield.

 Es la ciencia y técnica de recolectar, organizar, presentar, analizar e interpretar datos con el


propósito de ayudar a una toma de decisión más efectiva en la gestión organizacional:
comercialización, contabilidad, control de calidad, investigación de mercado, etc.

 La estadística es la parte de la matemática que se encarga de recolectar, organizar, computar datos


con el objeto de inferir conclusiones sobre ellos.

1.2 TIPOS DE ESTADÍSTICA

1.2.1 ESTADÍSTICA DESCRIPTIVA (Medidas de Tendencia Central y de Dispersión).

El término estadística tiene su raíz en la palabra Estado. Surge cuando se hace necesario para
sus intereses cuantificar conceptos. En la mayoría de los casos esta cuantificación se hará en
función de unos fines económicos o militares. El estado quiere conocer censo de personas, de
infraestructura, de recursos en general, para poder obtener conclusiones de esta información.

Actualmente la estadística es una ciencia. No es ya una cuestión reservada al estado. Podríamos


decir que se encuentra en la totalidad del resto de ciencias. La razón es clara: por una parte la
estadística proporciona técnicas precisas para obtener información, (recogida y descripción de
datos) y por otra parte proporciona métodos para el análisis de esta información.

De ahí el nombre de estadística descriptiva, ya que el objetivo es, a partir de una muestra de
datos (recogida según una técnica concreta), la descripción de las características más
importantes, entendiendo como características, aquellas cantidades que nos proporcionen
información sobre el tema de interés del cual hacemos el estudio.

Realiza el estudio sobre la población completa, observando una característica de la misma y


calculando unos parámetros que den información global de toda la población.

Procedimiento estadístico que emplea métodos para organizar, resumir y presentar datos de
manera informativa:
Ejemplo 1: Supongamos que contamos con 500 alumnos en la Escuela de Formación
Profesional de Administración de Empresas y, queremos hacer un estudio
estadístico sobre su altura.

Un método sería pasar clase por clase y medirlos a todos, esto nos podría llevar un
tiempo considerable pero sería la forma más exacta de hacer dicho estudio,
aunque es fácil encontrarnos con ausencias y tendríamos que volver varios días y
pasar lista para conseguir la estatura de todo el alumnado. Una vez que tengamos
todos los datos en nuestro poder los resultados los obtendríamos mediante
Estadística descriptiva.

Otra posibilidad podría ser pasar clase por clase, decirles a los alumnos y alumnas
que anoten su estatura en un papel y recogerlos todos. También así tendríamos un
estudio de Estadística descriptiva, aunque seguramente menos fiable que con el
método anterior, pues casi con toda seguridad, y lo digo por experiencia, algunos
alumnos escriban su estatura a cálculo y otros, con ganas de bromas, muy por
encima o muy por debajo de la realidad.

Ejemplo 2: Sondeo de opinión sobre las preferencias electorales encontró que, de 1,000
electores encuestados; 22% votarán por el candidato A, 19% por candidato B y
11% por el candidato C.
La estadística “22%”, “19%” y “11%” describen el número de cada 1,000
electores votarán por A, B y el C.

Ejemplo 3: Sondeo de opinión arroja que 25% de una población de 2,000 consumidores de un
producto de una empresa, saben sobre la calidad y las bondades alimenticias del
producto que consumen.

La estadística “25%” describe el número de cada 2,000 consumidores saben sobre


la calidad del producto que consumen.

Ejemplo 4: Según el Rector de la UNSCH, los decanos de las Facultades reportan 9 problemas
por cada 300 estudiantes relacionados con la deficiencia en el rendimiento
académico de los estudiantes.

La estadística “9” describe el número de problemas por cada 500 estudiantes.

Ejemplo 5: El Sr. Numérico Buena Vista, jefe de control de calidad de la empresa


embotelladora de aguas gaseosas “El Sabrosito”, reporta 5 botellas defectuosas de
cada 1,000 durante el año 20...

La estadística “5” describe el número de botellas defectuosas por cada 1,000


botellas.

1.2.2 ESTADÍSTICA INFERENCIAL.

Realiza el estudio descriptivo sobre un subconjunto de la población llamado muestra y,


posteriormente, extiende los resultados obtenidos a toda la población.

Método de deducir o extraer una consecuencia, una decisión, estimación, predicción o


generalización sobre una población, con base en una muestra.
Una población es un conjunto de todos los posibles individuos, objetos o medidas de interés
que se selecciona para una toma de decisión. Una muestra es una porción, o parte de la
población de interés para contrastar una hipótesis.

Ejemplo 1: Supongamos que contamos con 500 alumnos en la Escuela de Formación


Profesional de Administración de Empresas y, queremos hacer un estudio
estadístico sobre su altura.

Otra posibilidad sería escoger una muestra, es decir un grupo de por ejemplo 50
personas, hacer el estudio descriptivo sobre ellas y después generalizarlo a toda la
Escuela de Formación Profesional de Administración con Estadística inferencial.
En este caso, comprobaríamos por una parte que cuanto mayor sea la muestra más
trabajo tendremos, pero más fiable será el resultado final y por otra, que la
elección de la muestra debe hacerse de manera que permita también fiarnos del
resultado obtenido.

Ejemplo 2: Dos empresas radiales de la Ciudad de Ayacucho monitorean su popularidad de sus


programas, contratando a una empresa encuestadora para que muestreen las
preferencias de sus radios oyentes.

Ejemplo 3: El jefe de control de calidad de una empresa elegirá una muestra (parte) de los
productos para verificar la calidad de todos los productos.

Ejemplo 4: Un gerente de Marketing recaba opiniones, a partir de una muestra de clientes, para
verificar el nivel de satisfacción, con respecto a la calidad y precio del producto.

Ejemplo 5: El gerente de la Cooperativa Santa María Magdalena recaba opinión de una muestra
de los socios que acuden a las ventanillas de atención, para obtener información
sobre la calidad del servicio y atención de los trabajadores que atienden en este
servicio.

1.3 ESTADISTICA E INVESTIGACIÓN CIENTÍFICA

En el desarrollo de la ciencia en general y en especial en el de las ciencias empresariales, el


conocimiento de la metodología estadística es un arma imprescindible para la obtención, análisis e
interpretación de todos los datos que proceden de las observaciones sistemáticas o de
experimentaciones proyectadas específicamente para conocer los efectos de uno o barios factores que
intervienen en los fenómenos bajo estudio. La estadística permite probar hipótesis planteadas por el
experimentador, determina procedimientos prácticos para estimar parámetros que intervienen en
modelos matemáticos y así construir fórmulas empíricas, etc.
No existe investigación, proceso o trabajo encaminado a obtener información cuantitativa en general,
en la que la estadística no tenga una aplicación. La estadística no puede ser ignorada por ningún
investigador, aún cuando no tenga ocasión de emplear la Estadística Aplicada en todos sus detalles y
ramificaciones. Es una característica común en los experimentos, en muy diversos campos de la
investigación, que los efectos de los tratamientos experimentales varían de un ensayo a otro, cuando
se repiten. Esta variación introduce ciertos grados de incertidumbres en cualquiera de las
conclusiones que se obtienen de los resultados.
La estadística ha ayudado al investigador en proyectos muy variados en el campo empresarial. La
Estadística cuando se usa adecuadamente, hace más eficientes las investigaciones, es aconsejable que
todos los investigadores se familiaricen con las técnicas y conceptos básicos de esta ciencia tan útil.
El papel de la estadística en la investigación es, entonces, funcionar como una herramienta en el
diseño de investigaciones, en el análisis de datos, y en la extracción de conclusiones a partir de ellos.
Escasamente podrá preverse un papel mayor y más importante. De utilidad en las investigaciones, la
Estadística únicamente va precedida por las Matemáticas y el sentido común, de los cuales se deriva.
Indicadores estadísticos compilados permiten elaborar índices relativos importantes para evaluar y
orientar la gestión de las empresas e instituciones del país. A sus efectos, la compilación de datos
provenientes de sistemas estadísticos provee a los administradores y especialistas de toda una serie de
elementos a tener en cuenta en la toma de decisiones, permite un monitoreo constante de la actividad,
la posibilidad de establecer comparaciones sobre el desempeño de tal o más cual sistema o unidad de
información específica a través de series cronológicas, etc. Indudablemente, la computación ha
venido a jugar un papel muy importante, tanto en la recopilación como en el procesamiento de los
datos estadísticos, encontrándose lo suficientemente extendida en los sistemas de información
existentes, lo que ha permitido darle un vuelco cualitativo a estas actividades, fundamentalmente en
la prestación de servicios sobre la labor estadística y en la preparación de productos.

1.4 VARIABLES

Es la característica que estamos midiendo.

Existen dos categorías o tipo de variables:

1.4.1 Variable cualitativa: Son aquellas que toman un número limitado de modalidades. A cada
modalidad corresponde una categoría de individuos; estas categorías forman una partición de la
población. Este tipo de variables representan una cualidad, característica o atributo que clasifica
a cada caso en una de varias categorías. La situación más sencilla es aquella en la que se
clasifica cada caso en uno de dos grupos (hombre/mujer, enfermo/sano, fumador/no fumador).
Son datos dicotómicos o binarios. Como resulta obvio, en muchas ocasiones este tipo de
clasificación no es suficiente y se requiere de un mayor número de categorías (color de los ojos,
grupo sanguíneo, profesión, etc.).

En el proceso de medición de estas variables, se pueden utilizar dos escalas:

 Escalas nominales o categóricas: ésta es una forma de observar o medir en la que los datos
se ajustan por categorías que no mantienen una relación de orden entre sí (color de los ojos,
estado civil sexo, rubio, morenos, profesión, presencia o ausencia de un factor de riesgo o
enfermedad, etc.).

 Escalas ordinales: en las escalas utilizadas, existe un cierto orden o jerarquía entre las
categorías (grado de educación, grado académico, niveles laborales, tiempo de experiencia,
modalidad laboral, etc.).

1.4.2 Variable cuantitativa: Son las variables que pueden medirse, cuantificarse o expresarse
numéricamente: edad, peso, ingreso, rendimiento, nº. de hijos, etc. Esta a su vez la podemos
subdividir en:

a) Variable discreta, una variable que teóricamente puede tomar cualquier valor entre dos
valores dados se denomina variable discreta. Es decir, cuando sólo toma valores que
corresponden con los números naturales, pero no adopta los comprendidos entre dos de
ellos. Se obtiene a través de una operación de conteo y no admite seccionamiento (decimal),
ya que representa solo cantidades exactas. No admiten todos los valores intermedios en un
rango. Suelen tomar solamente valores enteros.

Ejemplos:

- Número de participantes en una capacitación


- Número de trabajadores
- Cantidad de productos
- Cantidad de oficinas
- Cantidad de empresas
- Cantidad de instituciones
- Cantidad de alumnos
- Cantidad de consumidores o clientes
- Cantidad de proveedores
- Cantidad de maquinarias
- La cantidad de socios de una Cooperativa
- El número de habitantes en la ciudad de Ayacucho
- Cantidad de clientes que acuden diariamente a un Banco
- Resultados de una encuesta, con opción de respuesta de Si, No.

b) Variable continúa, se presenta cuando se puede tomar cualquier valor real entre un
intervalo, es decir; son aquellas variables que toman todos los valores comprendidos entre
dos de ellos. Se reconoce cuando elegidos dos valores cualquiera, existe una cantidad
infinita de valores posibles ubicados entre ellos, por más cercanos que sean, que puede
tomar la variable. la que puede tomar los infinitos valores de un intervalo. En muchas
ocasiones la diferencia es más teórica que práctica, ya que los aparatos de medida dificultan
que puedan existir todos los valores del intervalo.

Ejemplos:

- Peso, estatura, distancias, calificaciones


- El intervalo de tiempo en que acuden los socios de la Cooperativa
- El tiempo que dura una publicidad no gravada
- El tiempo de llamadas telefónicas que recibe una recepcionista de una oficina.
- El tiempo de atención en caja de una entidad financiera
- El volumen de agua que consume diariamente la Ciudad de Ayacucho.

1.4.3 Variable Independiente: Es aquella que es controlada en forma sistemática por el


investigador. En la mayor parte de los experimentos, el científico está interesado en determinar
el efecto que tiene una variable A sobre alguna o más variables, el experimentador controla los
niveles de la variable A y mide los efectos que posee sobre las demás variables. Su
manipulación puede realizarse en dos o más grados: Presencia – ausencia de la variable
independiente. Ejemplo: Calidad de alimentación de los alumnos.

1.4.4 Variable Dependiente: A diferencia de la variable independiente, ésta no se manipula, sino


que es medida por el investigador para determinar el efecto o la influencia de la variable
independiente sobre ella. Por ejemplo: Rendimiento académico de los alumnos.

1.4.5 Variable Interviniente: Son los factores que pueden afectar la relación entre variables y la
investigación. Por ejemplo: El horario de clases, el nivel económico, el dominio del tema por
parte del profesor, la capacidad de concentración de los alumnos, los recursos didácticos, entre
otras.

1.5 POBLACIÓN
El concepto de población en estadística va más allá de lo que comúnmente se conoce como tal. Una
población se precisa como un conjunto finito o infinito de personas u objetos que presentan
características comunes.
"Una población es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales
intentamos sacar conclusiones". Levin & Rubin (1996).
"Una población es un conjunto de elementos que presentan una característica común". Cadenas
(1974).
Ejemplo:
Los miembros del Colegio de Licenciados en Administración, las Instituciones públicas de
Ayacucho, los trabajadores de la UNSCH, cantidad de productos en un lote de producción, cantidad
de libros en una biblioteca, etc.
El tamaño que tiene una población es un factor de suma importancia en el proceso de investigación
estadística, y este tamaño vienen dado por el número de elementos que constituyen la población,
según el número de elementos la población puede ser finita o infinita. Cuando el número de
elementos que integra la población es muy grande, se puede considerar a esta como una población
infinita, por ejemplo; el conjunto de todos los números positivos. Una población finita es aquella que
está formada por un limitado número de elementos, por ejemplo; el número de estudiante de la
Escuela de Formación Profesional de Administración, cantidad de docentes de la EFPAE, etc.
Cuando la población es muy grande, es obvio que la observación de todos los elementos se dificulte
en cuanto al trabajo, tiempo y costos necesarios para hacerlo. Para solucionar este inconveniente se
utiliza una muestra estadística.
Es a menudo imposible o poco práctico observar la totalidad de los individuos, sobre todos si estos
son muchos. En lugar de examinar el grupo entero llamado población o universo, se examina una
pequeña parte del grupo llamada muestra.

1.6 MUESTRA
"Se llama muestra a una parte de la población a estudiar qué sirve para representarla". Murria R.
Spiegel (1991).
"Una muestra es una colección de algunos elementos de la población, pero no de todos". Levin &
Rubin (1996).
"Una muestra debe ser definida en base de la población determinada, y las conclusiones que se
obtengan de dicha muestra solo podrán referirse a la población en referencia", Cadenas (1974).
Ejemplo;
El estudio realizado a 50 miembros del Colegio de Licenciados en Administración de Ayacucho.
El estudio de muestras es más sencillo que el estudio de la población completa; cuesta menos y lleva
menos tiempo. Por último se aprobado que el examen de una población entera todavía permite la
aceptación de elementos defectuosos, por tanto, en algunos casos, el muestreo puede elevar el nivel
de calidad.
Una muestra representativa contiene las características relevantes de la población en las mismas
proporciones que están incluidas en tal población.
Los expertos en estadística recogen datos de una muestra. Utilizan esta información para hacer
referencias sobre la población que está representada por la muestra. En consecuencia muestra y
población son conceptos relativos. Una población es un todo y una muestra es una fracción o
segmento de ese todo.

1.7 MUESTREO
GENERALIDADES.- Una empresa cualquiera, sin importar su tamaño y naturaleza, enfrenta una
serie de situaciones de decisión como las siguientes:

- Control de calidad de sus productos


- Necesidad de la población relacionado con el producto ofertado
- Tasa de crecimiento de la población (histórico, actual y futuro)
- Nivel de ingreso de la población (demanda real y demanda potencial)
- Tendencias de gasto del segmento de la demanda
- Tiempo de consumo del producto (meses, años)
- Ciclo operativo empresarial
- Costo mínimo de operación (capital de trabajo) de la empresa
- Etc.

El campo de aplicación de muestreo es muchísimo, pero de diferentes modalidades: por ejemplo;


elaborar el perfil de todos los estudiantes de la UNSCH, cantidad de preferencias de voto de un
candidato del total de electores registrado en el país, tiene diferentes formas de estudiar.

Así también, hacer un estudio de todos los elementos en estos casos (población) es casi imposible
(costo, tiempo, procedimiento, etc.), entonces se requiere sistematizar la información para posibilitar
su estudio. La forma de sistematizar es extraer grupos (muestras) representativas de entre todos los
elementos de la población con el objeto de estudiarlas y que los resultados infieran los valores y las
características de toda la población en forma objetiva y racional.

Esto no es más que el procedimiento empleado para obtener una o más muestras de una población; el
muestreo es una técnica que sirve para obtener una o más muestras de población.

Este se realiza una vez que se ha establecido un marco muestral representativo de la población, se
procede a la selección de los elementos de la muestra aunque hay muchos diseños de la muestra.

N
n -p, Pn, sólo estiman los

p estima
(=)
Xn valores y características de la
población, porque (n) sólo
contiene una parte de la
población.
- ¿Qué tan buenos estimadores
(=) Pn podemos ser, entonces? ...
utilizamos procedimientos
PN  E Estimación estadísticos.

Al tomar varias muestras de una población, las estadísticas que calculamos para cada muestra no
necesariamente serían iguales, y lo más probable es que variaran de una muestra a otra.
Ejemplo;
Consideremos como una población a los estudiantes de la Escuela de Formación Profesional de
Administración de la UNSCH, determinando por lo menos dos caracteres ser estudiados en dicha
población;
 Provenientes de Colegios Estatales
 Visión Empresarial.

TIPOS DE MUESTREO:
Existen dos métodos para seleccionar muestras de poblaciones:
a) MUESTREO NO ALEATORIO O DE JUICIO.- Una muestra seleccionada por muestreo de
juicio se basa en la experiencia de alguien con la población. Algunas veces una muestra de juicio
se usa como guía o muestra tentativa para decidir cómo tomar una muestra aleatoria más adelante.
Las muestras de juicio evitan el análisis estadístico necesario para hacer muestras de probabilidad.
Ejemplo: Selección de periodistas a personalidades para que expresen su opinión sobre un suceso
general, “creyendo” que son los más versados para emitir algún juicio u opinión técnica
especializada.

a.1) POR CONVENIENCIA (Método de muestreo no probabilística).- La muestra se


identifica por conveniencia del investigador. Se incorpora elementos en la muestra sin
probabilidades preespecificadas o conocidas de selección.

Ejemplo: a. Seleccionar voluntarios


b. Embarque de frutas (cajas para inspeccionar)
c. Plantas nativas para investigación.

Ventaja.- Fácil de selección y recolección de datos.

Desventajas.- Imposibilidad de evaluar la bondad de la muestra en función de su


representatividad de la población.

b) EL MUESTREO ALEATORIO O DE PROBABILIDAD.- En este método todos los elementos


de la población tienen la oportunidad de ser escogidos en la muestra.
N= N=X

Población infinita Población finita

b.1 MUESTREO ALEATORIO SIMPLE PARA POBLACIONES FINITAS.- Una muestra


aleatoria simple de tamaño (n), de una población finita de tamaño (N), es una muestra
seleccionada de tal manera que cada muestra posible de tamaño (n) tenga la misma
probabilidad de ser seleccionada. Es decir, se selecciona uno por uno los elementos de la
muestra, de tal modo que cada uno de los elementos que quedan en la población tenga la
misma probabilidad de ser seleccionadas.

N=X

Población finita

Ejemplo: Al Director de personal de la Universidad Nacional de San Cristóbal de Huamanga


se le ha asignado la tarea de elaborar el perfil de los 640 trabajadores
administrativos. La característica por identificar son las competencias laborales
para iniciar un cambio organizacional.

Definiendo a los 640 trabajadores como la población a estudiar, se puede


determinar el grado de estudio, los programas de capacitación y los cargos
ocupados para cada trabajador consultando los registros de file personal que tiene la
institución.

Es este caso, elaborar el perfil general conllevaría estudiar a cada uno de los
trabajadores, no imposible pero costoso en tiempo y dinero. Entonces utilizamos el
proceso muestral; en este caso n = 100.

SOLUCION

i) n = 100 ¿Quiénes deben constituir n?

ii) Enumerar de 1 a 640 a cada trabajador de acuerdo al mes, año de ingreso y


orden alfabético de los apellidos.

iii) Utilizando la tabla de números aleatorios 4352

 640 = 3 dígitos

 Entonces, si empezáramos en la celda (1,1) de la tabla de números


aleatorios, los seleccionados serían: 632 – 715 – 998 – 671 – 744 – 511
– 021 - ... hasta completar a n = 100; pero descartando los valores
mayores a 640.

NOTA 1: La selección puede empezarse en cualquier parte de la tabla y en


cualquier dirección.

NOTA 2: En el proceso de selección de esta forma, podría darse el caso que


nuevamente aparezca el número seleccionado antes de completar (n),
como se trata de seleccionar tan sólo una vez, no se vuelven a
considerar. La selección de esta forma se llama muestreo sin
reemplazo, mayor y significativamente utilizado en la práctica
empresarial

La cantidad de muestras aleatorias simples, de tamaño (n) que se


pueden seleccionar de una población es:

N
 
  N!
n  = n!( N  n)!
 
 
 

b.2 MUESTREO ALEATORIO SIMPLE PARA POBLACIONES INFINITAS.- Se considera


población infinita que se estudia, si en ella interviene un proceso dinámico que haga
imposible el listado o el conteo de cada elemento de la población, por lo que es imposible el
uso de la tabla de números aleatorios.

Entonces, como no se puede enumerar los elementos de la población infinita, debemos


emplear un proceso distinto para seleccionar la muestra.

N=

Población infinita

Ejemplo: Se desea estimar el nivel de satisfacción de los clientes de la pollería “Wallpa


Sua”, entre las 5 p.m. y 8 p.m. de los días viernes, que es el horario de mayor
concurrencia. La población sería todos los posibles clientes, cuyo listado es
imposible, por lo que es una población infinita.

En este caso, cómo seleccionar (n =?) de (N =  )

SOLUCION

Una (n) aleatoria simple de una N =  debe satisfacer las siguientes condiciones:

1. Cada elemento seleccionado proviene de la misma población.


2. Cada elemento se selecciona en forma independiente.
3. Tiene que emplearse el criterio del investigador para determinar la cantidad óptima.

c) ALEATORIO ESTRATIFICADO (Método de muestreo probabilística).- Primero de divide a


los elementos de la población en grupos llamados estratos, de tal manera que cada elemento de la
población pertenece a uno y sólo a un estrato.
E. ALTO S. EDUC. R. NORTE n Aleatorio simple

E. MEDIO S. AGRIC. R. CENT. n Aleatorio simple

E. BAJO S. INDUST R. SUR


n Aleatorio simple

Dividir: varones y mujeres, sexo, edad

En los estratos se toman una muestra aleatoria simple de cada uno de ellos. El valor del
muestreo aleatorio estratificado depende de cuan homogéneas sean los elementos dentro de los
estratos, por tanto, varianzas pequeñas.

Ejemplo: Se quiere estudiar los niveles de colesterol sérico en personas mayores de 45 años con
cardiopatía isquémica que concurren a determinado centro de salud asistencial. Para ello se
tiene en cuenta la variable sexo como de estratificación, conociendo que el 70% de dicha
población es de sexo masculino.

Se decide tomar una muestra de 120 personas. Proporcional: 70% masculino (84) y 30%
mujeres (36).

Ventajas:
- Aumento de la precisión sobre el estudio
- Estimación separada para cada estrato
- Bajos costos de muestreo

Desventajas:
- Es necesario un marco para cada estrato

b) CONGLOMERADO (Método de muestreo probabilística).- Primero, se divide, los elementos


de la población en conjuntos separados llamados conglomerados. Cada elemento de la
población pertenece a uno y sólo a un grupo. Segundo, se toma una muestra aleatoria simple de
conglomerados. Todos los elementos dentro del conglomerados se asemejan entre sí, al
muestrear una pequeña cantidad de conglomerados se obtendrá buenos estimadores de los
parámetros poblacionales.
POBLACION
ii) Mejor resultado se obtiene
cuando los conglomerados son
diferenciados.
CONG. 1 CONG. 2 CONG. 3 iii) Los conglomerados se
pueden muestrear por aleatorio
simple o aleatorio estratificado.
iv) Ejemplo: manzanas urbanas de
una ciudad.
n
Aleatorio simple
Ventajas:
- Reduce costos
- En caso que no exista una lista de elementos dela población

Desventajas:
- Las inferencias que se hacen en dicho muestreo no son tan confiables comolas del Muestreo
Aleatorios.
- Menor precisión en las estimaciones.

c) SISTEMÁTICO (Método de muestreo probabilística).- En algunos casos (poblaciones grandes),


es tardada la selección de una muestra aleatoria simple cuando se determina primero un número
aleatorio y después se busca en la lista de elementos de la población hasta encontrar el
elemento correspondiente. Por ejemplo, se desea muestrear (n = 100) de una población de
50,000 personas, podríamos muestrear, entonces, un elemento de cada:
N
50,000
i) = 500 es el intervalo para seleccionar al azar
100
n uno de los primeros 100 elementos de la lista de toda
la población.
50,000 100 ii) Seleccionar al azar uno de los primeros de los 500
elementos de la lista de la población; por ejemplo, el
(1) entonces el siguiente tendrá que ser ...

1 - 500 - 1001 - 1501 .....


iii)
 +500,  +500,  + 500  +500 .......
Así, hasta completar los 100 elementos de n.

1.8 DETERMINACIÓN DE LA MUESTRA

Ahora veremos el asunto que debe tener la muestra para obtener una estimación de una proporción
poblacional con determinado nivel de precisión.

2
 
 Z   P1  P 
  P1  P    
E   Z   
 n =  2 2
 2  n  E

- Para ello es necesario que el investigador precise el margen de error E deseado.


- En la mayoría de los casos, E es 0.10 o menor.
- También el usuario especifica el nivel de confianza, y con él el valor correspondiente de Z 
2
- Debido a que se desconoce la proporción poblacional P, la fórmula requiere un valor de
planeación para P. En la práctica, este valor de planeación se puede elegir mediante uno de los
procedimientos siguientes:

1.- Usar la proporción muestral de una muestra anterior de las mismas unidades.
2.- Llevar a cabo un estudio piloto para seleccionar una muestra preliminar de unidades. La
proporción muestral a partir de esta muestra se puede usar como valor de planeación para P.
3.- Usar el juicio o un “estimado mejor” del valor de P.
4.- Si no se aplica alguna de las alternativas, usar P = 0.50.
Ejemplo: Tomando los usuarios de ESSALUD – Ayacucho. ¿Qué tan grande debe ser la muestra si
el responsable de la encuesta quiere estimar la proporción poblacional con margen de error
de 0.025 y con nivel de confianza de 95%.

Datos:
n =?
E = 0.025
N. C. = 0.85
P = 0.48

i)  = (1 - .095) = 0.05

ii) = 0.025
2
iii)0.5000 – 0.025 = 0.475 (buscar en la tabla Z) = 1.96

iv) n =
1.962 0.481  0.48 = 1,534.18  1,534 usuarios
0.0252
Entonces, el tamaño de la muestra mínimo bebería ser de 1,534 usuarios para llenar el requisito de
margen de error.

FÓRMULA GENERAL PARA DETERMINAR LA MUESTRA

Para poblaciones fintas:

Z 2 PQN
n 
( N  1)(e) 2  Z 2 PQ
n = Muestra
Z2 = Varianza (tabla de Gauss 1.96, nivel de confianza = 95%)
E = Error de estimación (5%)
N = Tamaño de la población
p = Probabilidad que salga variable independiente (0.5 ≈ 50%)
q = Probabilidad que salga variable independiente (0.5 ≈ 50%)

Para población infinita:

Z 2 PQ
n
(e) 2  Z 2 PQ

n = Muestra
Z2 = Varianza (tabla de Gauss 1.96, nivel de confianza = 95%)
E = Error de estimación (5%)
p = Probabilidad que salga variable independiente (0.5 ≈ 50%)
q = Probabilidad que salga variable independiente (0.5 ≈ 50%)
1.9 MÉTODOS DE RECOLECCIÓN Y TABULACIÓN DE DATOS

Es importante destacar que los métodos de recolección de datos, se puede definir como: al medio a
través del cual el investigador se relaciona con los participantes para obtener la información necesaria
que le permita lograr los objetivos de la investigación.

De modo que para recolectar la información hay que tener presente:


a) Seleccionar un instrumento de medición el cual debe ser válido y confiable para poder aceptar los
resultados
b) Aplicar dicho instrumento de medición
c) Organizar las mediciones obtenidas, para poder analizarlos

Dentro de los métodos para la recolección de datos están:

1.9.1 Observación:

Es el registro visual de lo ocurre es una situacional real, clasificando y consignando los


acontecimientos pertinentes de acuerdo con algún esquema previsto y según el problema que se
estudia.

Al igual con los otros métodos, previamente a la ejecución de la observación el investigador


debe definir los objetivos que persigue, determinar su unidad de observación, las condiciones
en que asumirá la observación y las conductas que deberán registrarse.

Cuando se decide utilizarla hay que tomar en cuenta ciertas consideraciones. Como método de
recolección de datos, debe ser planificado cuidadosamente para que reúna los requisitos de
validez y confiabilidad. Se le debe conducir de manera hábil y sistemática y tener destreza en el
registro de datos, diferenciando los aspectos significativos de la situación y los que no tienen
importancia.

También se requiere habilidad para establecer las condiciones de manera tal que los hechos
observables se realicen en la forma más natural posible y sin influencia del investigador u otros
factores. Cuando se decide usar este método es requisito fundamental la preparación cuidadosa
de los observadores, asegurándose así la confiabilidad de los datos que se registren y
recolecten.

Posibles errores con el uso del método de observación. Sobre el uso del método de
observación, Quinteros comenta que, “las condiciones de una investigación puede ser
seriamente objetables si el diseño de la misma no se ha tomado en cuenta los posibles errores
de observación”

Estos errores están relacionados con:


 Los Observadores
 El instrumento utilizado para la observación
 El fenómeno observado

Respecto a los errores relacionados con el observador, estos se asocian al hecho de la


participación de otras personas, además del investigador, en el proceso de la observación de los
hechos o fenómenos en estudio. Esta situación puede conducir a una falta de consistencia de los
resultados, ya que los observadores pueden diferir en la cuantificación y registro que se haga de
los aspectos observados. El problema se suscita por la falta de una definición operacional y
precisa de la manera en que será medida y observada la variable y el registro de tales
observaciones, siendo necesario tomar precauciones para asegurar no solo que la observación
sea correcta, sino también que el registro de los hechos reúna esas condiciones. Conviene que
haya instrucciones escritas y verbales que orienten al observador sobre cómo se llevara a cabo
todo el proceso y que haya demostración y practica de las observaciones que se realicen.

También se considera que según el papel que ajusta el observador se puede incurrir en mayores
o menores errores; este papel puede ser el de observador no participante o participante.

La observación participante implica que el investigador o el responsable de recolectar los datos


se involucren directamente con la actividad objeto de la observación, lo que puede variar desde
una integración total del grupo o ser parte de éste durante un periodo. Algunos errores que
suelen cometerse están relacionados con las emociones del observador, ya que al involucrarse
en la situación pierde la objetividad en la observación y en el registro, análisis e interpretación
de los hechos o fenómenos.

La observación no participante ocurre cuando el investigador no tiene ningún tipo de relaciones


con los sujetos que serán observados ni forma parte de la situación en que se dan los fenómenos
en estudio. En esta modalidad, al no involucrarse el investigador, los datos recogidos pueden
ser más objetivos, aunque, por otro lado, al no integrarse al grupo puede afectar el
comportamiento de los sujetos en estudio y los datos que se observan podrían no ser tan reales
y veraces.

Los errores referentes al instrumento de observación se relacionan con los desaciertos en que se
incurre en su elaboración y lo que se desea medir. Esto se evita con una definición operacional
y libre de ambigüedades e imprecisiones de las variables en estudio, especificando en el
instrumento los criterios o indicadores de la medición de tales variables.

La especificidad de ese instrumento está relacionada con el problema, objetivos y forma en que
se va a hacer la observación. Una de esas formas es la denominada observación simple, no
regulada o no controlada, en la que solo se tienen unos lineamientos generales para la
observación sobre los aspectos del fenómeno que le investigador tienen interés en conocer. La
otra forma es la sistemática, regulada o controlada, en la que se dispone de un instrumento
estandarizado o estructurado para medir las variables en estudio de una manera uniforme.

El primero se usa mas en estudios exploratorios y el segundo esta dirigido a quienes desean
probar hipótesis en que se debe especificarse claramente qué se observara, cómo se observara y
cómo se hará el registro de datos.

Los errores relacionados con el objeto que se observa se dan cuando los aspectos que deben ser
conocidos de las unidades o fenómenos de observación no se presentan en igualdad de
condiciones para todos ellos, ya sea porque varíen las circunstancias en que se observa el
fenómeno o a la propia variabilidad del sujeto en estudio. A manera de ejemplo, se puede citar
que si existe interés en evaluar el desempeño de un agente de salud en las zonas rurales de las
regiones sanitarias, puede ser que la situación donde labore una gente sea diferente en una u
otra región, ya sea por carencia o disposición de equipos y materiales u otros factores. La
variación de circunstancias de las regiones sanitarias puede conducir a errores de medición, de
análisis o interpretación de los hechos observados. La variabilidad en el sujeto se daría ante la
situación de que unos agentes de salud tengan mayor experiencia que otros o que hayan
egresado recientemente de un programa educativo; estos últimos probablemente tendrán menos
destreza en el desempeño de su labor.
Por lo tanto, es necesario buscar mecanismos para que las unidades en estudio estén en
igualdad de condiciones durante esa medición y que se definan las características del fenómeno
que se pretende observar, procurando que en la muestra esos elementos reúnan características
similares.

En general, el método de observación es sumamente útil en todo tipo de investigación:


descriptiva, analítica y experimental. En el área de investigación educacional, social y
psicológica, es un método de mucha utilidad, en particular cuando se desea conocer aspectos
del comportamiento: relaciones maestro-alumno, el desempeño de los agentes de salud,
relación del uso de ciertas tecnologías educativas y grado de aprendizaje cognoscitivo y
práctico del personal de salud.

1.9.2 La entrevista

Es la comunicación establecida entre el investigador y el sujeto de estudiado a fin de obtener


respuestas verbales a las interrogantes planteadas sobre el problema propuesto.

Se estima que este método es más eficaz que el cuestionario, ya que permite obtener una
información más completa. A través de ella el investigador puede explicar el propósito del
estudio y especificar claramente la información que necesita, si hay una interpretación errónea
de la pregunta permite aclararla, asegurando una mejor respuesta. Best afirma “es también
posible buscar la misma información por distintos caminos en diversos estadios de la
entrevista”, obteniéndose así una comprobación de la veracidad de las respuestas.

Como técnica de recolección de datos la entrevista tiene muchas ventajas; es aplicable a toda
persona, siendo muy útil con los analfabetas, los niños o con aquellos que tienen limitación
física u orgánica que les dificulte proporcionar una respuesta escrita. También se presta para
usarla en aquellas investigaciones sobre aspectos psicológicos o de otra índole sonde se desee
profundizar en el tema, según la respuesta original del consultado, ya que permite explorar o
indagar en la medida que el investigador estime pertinente.

Hay dos tipos de entrevista: la estructurada y la no estructurada, la primera se caracteriza por


estar rígidamente estandarizada, replantean idénticas preguntas y en el mismo orden a cada uno
de los participantes, quienes deben escoger la respuesta en 2, 3 o más alternativas que se les
ofrecen. Inclusive los comentarios introductorios y finales se formulan de la misma manera en
todas las situaciones. Para orientar mejor la entrevista se elabora un formulario que contenga
todas las preguntas. Sin embrago, al utilizar este tipo de entrevista el investigador tiene limitada
libertad de formular preguntas independientes generadas por la interacción personal.

Algunas ventajas que presenta este tipo de entrevista son:


 La información es mas fácil de procesar, simplificando el análisis comparativo
 El entrevistador no necesita ser entrenado arduamente en la técnica
 Hay uniformidad en el tipo de información obtenida.

Pero también tiene desventajas, tales como:

 Es difícil obtener información confidencial


 Se limita la posibilidad de profundizar en un tema que emerja durante la entrevista.
La entrevista no estructurada es más flexible y abierta, aunque los objetivos de la investigación
rigen a las preguntas, su contenido, orden profundidad y formulación se encuentra por entero en
manos del entrevistador. Si bien el investigador, sobre las bases del problema, los objetivos y
las variables, elabora las preguntas antes de realizar la entrevista, modifica el orden, la forma de
encauzar las preguntas o su formulación para adaptarlas a las diversas situaciones y
características particulares de los sujetos de estudio.

Este tipo de entrevista es muy útil en los estudios descriptivos y en las fases de exploración
para el diseño del instrumento de recolección de datos.

Las ventajas de este método son:


 Es adaptable y susceptible de aplicarse a toda clase de sujetos en situaciones diversas
 Permite profundizar en los temas de interés
 Orienta a posibles hipótesis y variables cuando se exploran áreas nuevas.

Entre las desventajas se cita:


 Se requiere más tiempo
 Es más costosa por la inversión de tiempo con los entrevistadores
 Se dificulta la tabulación de datos
 Se requiere de mucha habilidad técnica para obtener la información y mayor conocimiento
del tema.

Aun con esas desventajas y dada la utilidad de la entrevista, en sus dos formas, todo
investigador debe familiarizarse con su uso, ya que es probable que la aplique en cualquier tipo
de investigación.

1.9.3 Cuestionario

Es el método que utiliza un instrumento o formulario impreso, destinado a obtener repuestas


sobre el problema en estudio y que el investido o consultado llena por sí mismo.

El cuestionario puede aplicarse a grupos o individuos estando presente el investigador o el


responsable del recoger la información, o puede enviarse por correo a los destinatarios
seleccionados en la muestra.

Debido a su administración se puede presentar problema relacionados con la cantidad y calidad


de datos que pretende obtener para el estudio. Algunos problemas asociados con el envío de los
cuestionarios podrían ser: que no fuese devuelto; los consultados pueden evadir la respuesta a
alguna pregunta o no darle la importancia necesaria a las respuestas proporcionadas. Por ello y
otros factores más, el instrumento que se use para la recolección de datos debe ser objeto de
una cuidadosa elaboración.

Algunas ventajas del cuestionario son: su costo relativamente bajo, su capacidad para
proporcionar información sobre un mayor número de personas en un periodo bastante breve y
la facilidad de obtener, cuantificar, analizar e interpretar los datos.

Dentro de las limitaciones de este método figuran las siguientes: es poso flexible, la
información no puede variar ni profundizarse, si el cuestionario es enviado por correo se corre
el riesgo de que no llegue al destinatario o no se obtenga respuesta de los encuestados; además,
resulta difícil obtener una tasa alta de compleción del cuestionario. Debido a esa posible
pérdida de información se recomienda cuando se use este método una muestra más grande de
sujetos de estudio.
En general, en el proceso de recolección de datos para una investigación, estos métodos e
instrumentos y fuentes suelen combinarse; cada una con sus ventajas y desventajas, sus
características propias y la información que se requiera, dan flexibilidad para que el
investigador determine su uso apropiado según el estudio a realizar.

1.9.4 Experimento

Método en el cual las variables pueden ser manipuladas en condiciones que permiten la reunión
de datos, conociendo los efectos de los estímulos recibidos y creados para su apreciación. En el
experimento existe un control directo sobre un factor delos que se va analizar. La
experimentación exige seleccionar grupos pareados de sujetos, someterlos a tratamientos
distintos, controlar las variables y comprobar si las diferencias observadas son significativas.
La finalidad de la investigación experimental es descubrir las relaciones causales, descartando
para ello las explicaciones alternas de los resultados. El método experimental suministra los
datos más convincentes si se aplican los controles adecuados. En la medida en que el diseño y
la ejecución del experimento excluyan otras hipótesis que expliquen los mismos resultados, el
gerente de investigación y el de mercadotecnia estarán seguros de la veracidad de las
conclusiones.

1.10 PRUEBA DE HIPÓTESIS

1.10.1 PRUEBA DE HIPÓTESIS

Es la parte de la Estadística Inferencial en la que el estadístico toma decisiones


basadas en la probabilidad, elige modelos y verifica hipótesis sobre los modelos seleccionados
o de sus parámetros.

Hipótesis Estadístico, es un supuesto o alguna afirmación acerca de la población


(modelo de distribución) o sus parámetros.

Una prueba de hipótesis, es una afirmación o contrastación de una hipótesis


estadístico es un procedimiento para decidir si se acepta o se rechaza una hipótesis estadística.

1.10.2 ESTABLECIMIENTO DE HIPÓTESIS NULA Y ALTERNA

La Hipótesis Nula, denotada por Ho, es la primera afirmación la que se va ha


someter a prueba para ser aceptada o rechazada. La Hipótesis Alterna, denotada por HA, es
aquella que se acepta cuando la hipótesis nula es rechazada.

Para aceptar o rechazar una hipótesis nula debemos efectuar una partición adecuada
del dominio de la distribución muestral, en dos regiones mediante un punto C, denominado
punto crítico: la región de rechazo ( R ) y la región de aceptación (A).
A R
C
Reg. de Aceptación Región de Rechazo

A. PRUEBA DE HIPÓTESIS DE INVESTIGACION

Ejemplo: Supongamos que un grupo de estudiantes de EFPAE-UNSCH, actualmente


reciben las clases con la estrategia didáctica tradicional “Lección Magistral”
alcanzando un rendimiento académico promedio de 12.5. Un grupo de docentes
ha implementado un nuevo sistema de enseñanza didáctica, con la finalidad de
mejorar el rendimiento académico. Para evaluar el nuevo sistema se toman
algunas asignaturas en las que se evaluará y controlará, sometiéndose a varias
pruebas. El objetivo del nuevo sistema es demostrar que efectivamente aumenta
el rendimiento académico mayor a 12.5; esto es  >12.5. Una hipótesis de
investigación como la presente se debe formular y proponer como una hipótesis
alternativa:

Ho :   12.5
HA :   12.5

Investigación (n) Conclusión:

i) No se puede rechazar Ho (o = 12.5); el estadístico no


puede decir que el nuevo sistema es mejor
ii) Se puede rechazar H0 (o  12.5) el estadístico puede
inferir que HA:   12.5, es verdadera.

B. PRUEBA DE VALIDEZ DE UNA AFIRMACIÓN

Ejemplo: Un fabricante de mermeladas manifiesta que sus envasados de un litro contienen


640 mililitros de fresa. Para comprobar la validez de la afirmación del fabricante
se seleccionan una muestra de envases de un litro para medir su contenido.

SOLUCION

i) La afirmación del fabricante se supone verdadera, amenos que la prueba


demuestre lo contrario.
ii) La enunciación de las hipótesis es:

H₀ :   640
HA :   640

iii) Si después de la contrastación los resultados son:

n = H₀, No se puede rechazar, es decir, no se puede dudar de la afirmación del


fabricante.
n  H₀, Se rechaza, se infiere HA :   640 es verdadera, por tanto, la
afirmación del fabricante es incorrecta porque los envases se llenan con menor
cantidad a 640 mililitros de fresa. Es necesario tomar acciones correctivas.

En general, una prueba de hipótesis referente a los valores de una media de población  debe
asumir una de las tres formas siguientes:

H₀ :    H₀ :    H₀ :   
HA :    HA :   HA :  

110.3 ERRORES TIPO Y TIPO II

La hipótesis nula y alternativa son aseveraciones sobre la población que compiten entre sí. La
hipótesis nula H₀ es verdadera o lo es la hipótesis alternativa HA, pero no ambas. En el caso
ideal, el procedimiento de prueba de hipótesis debe conducir a la aceptación de H₀ cuando sea
verdadera y al rechazo de HA cuando HA sea verdadera. Desgraciadamente no siempre son
posibles las conclusiones correctas. Como las pruebas de hipótesis se basan en información de
muestras, debemos considerar la posibilidad de errores.

Condición de la
población
H₀ HA
Decisión Verdadera Verdadera

No hay error (Verdadero Error Tipo


Aceptar H₀
positivo) II (β o falso negativo)
Error Tipo I No hay error
Aceptar HA
(α o falso positivo) (Verdadero negativo)

Ejemplo: Las hipótesis del índice académico:


H₀ = 12.5
HA  12.5
E1 = Rechazar H₀ cuando ésta es verdadera. Los decisores digan que el nuevo sistema
mejora el rendimiento académico H₀ ( ≥ ) cuando en realidad el nuevo sistema
no es mejor que actual.

E2 Aceptar H₀ cuando es falsa. El decisor diga o concluya de que el nuevo sistema no


es mejor que el actual ( = ) cuando en realidad sí mejora el rendimiento
académico.

En la práctica, la persona que efectúa la prueba de hipótesis específica la máxima


probabilidad permisible, llamada nivel de significancia para la prueba, de cometer un
error de tipo I. Se acostumbra los valores de 0.05 y 0.01 para el nivel de significancia.

1.10.4 PRUEBA UNILATERAL SOBRE LA MEDIA DE UNA POBLACIÓN: MUESTRA


GRANDE

Ejemplo: La etiqueta de ½ litro de agua gaseosa dice que ese envase contiene 500 ml. Se
quiere comprobar esa aseveración mediante una prueba de hipótesis. El interés es
detectar botellas incompletas de lo que afirma el fabricante.

SOLUCION

Paso 1: Estableciendo H₀ y HA apropiadas:

H₀ :   500 ml. la etiqueta es correcta


HA :   500 ml. la etiqueta es incorrecta

i) Si los datos muestrales indican que no se puede rechazar H₀, no se tomará


ninguna acción contra el fabricante.
ii) Si los datos muestrales indican que se puede rechazar H₀, el fabricante
tendrá pruebas estadísticas para inferir hipótesis alternativa HA :   500 ml.
es cierta.
iii) Suponiendo que se seleccionan n = 50 botellas. ¿Cuánto es el intervalo de
variación de las botellas que pueden contener   500 ml. aceptables?

- Asumiendo  = 500 ml. y de acuerdo a los datos históricos  = 5 ml.,


entonces:


x = x = 5
= 0.71
n 50

 = 500
Probar:

H₀ :   500 m. l.
HA :   500 m. l

Requiere especificación de la probabilidad (nivel de significancia = )


máxima permisible de incurrir en el error I, cuando la hipótesis nula es
cierta como una igualdad.

Para el EJEMPLO: El investigador plantea: si  = 500 hay una probabilidad


de 99% de no llevar a cabo ninguna acción en contra del fabricante. Si bien
no desea acusarla falsamente de no llenar correctamente su envase, está
dispuesto a conformarse con una probabilidad de 1% de caer en ese error.

Por tanto:  = 0.01 máxima permisible de incurrir en un error tipo I.


 = 0.01 x = x = 5
= 0.71
n 50

X
 = 500
Se rechaza H₀ No se rechaza H₀

a) Uso de la Prueba Estadística de X si está en Región de Rechazo o Aceptación

Z = Distribución de probabilidad normal estándar


x  o X = Media muestral
Zc =
  = Desviación estándar poblacional
n n = Tamaño de la muestra

Entonces: Z t = 0.5000 – 0.01 = 0.4900 (buscar en la tabla Z) = - 2.33


 = 0.01 Se rechaza H₀ sí Z  -2.33

Se rechaza H₀  = 500 X

x  o
Zc = Nota: Cuando la región de rechazo está sólo

en un lado de distribución de muestreo,
n se dice prueba de hipótesis unilateral.

 = 0.01

2.33 0

Se rechaza H₀

Suponiendo X = 498 m. l. ¿Está el valor de X = 498 en la región de rechazo?

498  500
Zc = = - 2.83
5
50

Comparando Z t = - 2.83 (Z calculado) con Z = -2.33 (valor crítico o Z tabla)

La regla es:
Zc > Zt : Se rechaza H₀ :   500 y se acepta HA :   500
Zt > Zc ; Se rechaza HA :   500 y se acepta la H₀ :   500

Entonces: Zc = -2. 83  Zt = - 2.33, por tanto, se rechaza la H₀ :   500 y se acepta


HA :   500, por lo que hay que tomar alguna acción correctiva contra el productor.
Zc = -2.83

-.2.33 0

Se rechaza H₀

a) Empleo de los valores P.- Es otro método empleado para llegar a la conclusión de la
prueba de hipótesis, basada en una probabilidad del valor de P. Se supone que la
hipótesis nula es verdadera, el valor de P es la probabilidad de obtener un resultado de
la muestra que sea al menos tan importante como el que se observa.

i) El valor de P es la probabilidad de que Z sea


menor que – 2.83.
ii) Por medio de la tabla de distribución de
Zc = -2.83 probabilidad normal estándar: Z = -2.83 (buscar
en la tabla Z) = 0.4977

-.2.33 0

Se rechaza H₀

iii) Por tanto, P = 0.5000 – 0.4977 = 0.0023

iv) Este valor P indica una probabilidad reducida de obtener una media muestral tan
pequeña como X = 498 cuando H₀ es verdadera.

La regla es:
Rechace H₀ si P  

Entonces: como (P = 0.0023)  ( = 0.01) se rechaza H₀ :   500 y se acepta


HA :   500

NOTA: El método de estadístico de prueba como el del valor de P siempre


producirá la misma conclusión de prueba de hipótesis. La selección de prueba
depende de la preferencia del estadístico.
Ejemplo: Sí X = 499

x  o 499  500
Zc = Zc = = - 1.41 no está en la región de rechazo
 5
n 50

(Zc = -1.41)  (Zt = - 2.33); se acepta HA:   500 y se rechaza HO:   500

La regla es:

Zc  Zt : Se rechaza HA y se acepta H₀
Zc  Zt : Se acepta HA y se rechaza H₀

1.10.5 PRUEBA BILATERAL SOBRE LA MEDIA DE UNA POBLACIÓN: CASO MUESTRAS


GRANDES.

A) USANDO X

Ejemplo: Con la tecnología actual “Pentium IV” el promedio de socios atendidos en la


ventanilla No. 4 de la Cooperativa Santa María Magdalena no sobrepasan a más
de 30 personas. Sabiendo que la nueva tecnología en computadores ya no es
digital, sino son tecnología que procesa el dictado, que puede permitir atender
tranquilamente en promedio a 30 personas, que es la exigencia exacta de la
Cooperativa Santa María Magdalena.

SOLUCION

i) Planteamos la Hipótesis, suponiendo que la nueva computadora satisfaga la


exigencia de la cooperativa.
H₀ :  = 30
HA :   30 : Hay la Probabilidad que sea  ó  a 30

Suponiendo:

 = 0.01 Por condición de bilateralidad, la exigencia es exactamente 30, entonces,


 ó  a 30, la hipótesis H₀ debe ser rechazada.
n = 50

 0 .0
ii) Región de rechazo bilateral = = 0.005, tal como:
2 2

iii) N. C. = 1-  = 1 – 0.01 = 0.99  2 = 0.495 (buscar en la tabla Zt) =  2.57;


valor crítico en los extremos de la cola de la probabilidad de distribución
normal.
 0.01  0.01
= = 0.005 = = 0.005
2 2 2 2

-.2.57 0 2.57

Se rechaza H₀ Se rechaza H₀

Regla de Rechazo:

Rechace H₀ sí Zc  -2.57 ó Zc  2.57

iii) Suponiendo que con una muestra de 40 computadoras se obtuvo X = 28 socios


atendidos, desviación estándar S = 5 atención determinamos el valor estadístico
de prueba de hipótesis:

X  28  30
Zc = = Zc = = - 2.53
s 5
n 40

Conclusión: rechazar H₀: porque Zc (-2.53)  Zt (-2.57), es decir, las


computadoras no cumplen con las exigencias de la Cooperativa Santa María
Magdalena.

B) USANDO P

i) X = 28
Z = -2.53 (buscar en la tabla Z) = 0.4945. Entonces, 0.5000 – 0.4945 = 0.0055 = P
Zt =  2.57

ii) P = ? (qué valor para P?)

P = 0.0055 x 2 = 0.011

Regla:

Rechazar H₀ si P 
2

Aceptar H₀ si P >
2


Si:  = 0.01  = 0.005
2

P (0.011)  (0.005), por tanto, no se rechaza la H₀
2
C) RELACION ENTRE LA ESTIMACIÓN POR INTERVALO Y LA PRUEBA DE
HIPÓTESIS

i) Cuando n  30; Nivel de confianza = 1 - , además, cuando es conocido 


x  Z
2
n
ii) Cuando no se conoce  sino y se estima a partir de S

S
x  Z
2 n

iii) La configuración de la hipótesis acerca del valor de un parámetro poblacional:

H₀ :  = ₀ ₀ = Media de la población supuesto


HA :  

iv) La región de no rechazo para H₀ comprende todos los valores de la media X que están
entre los errores estándar - Z  y + Z  de ₀.
2 2


₀  Z ; ₀  Z
s
2
n 2
n

REGLA:
Si el intervalo contiene el valor ₀ , no rechace
H₀. En caso contrario rechace H₀

Ejemplo:
Datos: H₀ :  = 30 i)  = 1 – 0.95 = 0.05 (/2 =0.025  0.5000 – 0.025 = 0.475)
Buscando en la tabla, Z = 1.96.

HA :   30 ó,   2 = 0.95  2 = 0.475 (buscar en la tabla Z)


N. C. = 95% Z = 1.96
n = 40

X = 28 ii) ₀  Z
2
n
5
=5 28  1.96
40
28  1.55

26.45  ₀  29.55
iii) Conclusión ₀ = 30 no está comprendido en el
intervalo, por tanto, rechazar la H₀

1.10.6 PRUEBAS SOBRE LA MEDIA DE UNA POBLACIÓN: CASO N  30

i) Cuando se conoce 
X  o
Z=

n

ii) Cuando  se estima a partir de S

X  o ( Xi  X ) 2
t= Donde S =
S n 1
n

Ejemplo: Se ha solicitado a 20 pasajeros de la Empresa de Transportes Molina Unión,


que califiquen la calidad de servicio en los siguientes términos:

0 No opina
0 Pésimo
1 Regular
2 Bueno
3 Muy bueno
4 Excelente

El calificativo que obtenga un promedio de 3 ó más se considera servicio superior. Los


indicadores de respuesta son las siguientes: 4, 3, 2, 5, 3, 2, 3, 3, 4, 3, 4, 2, 5, 3, 2, 2, 2,
3, 4 y 2. Determinar si la media de la población de calificación es mayor a 3.

SOLUCION

X I 4  3  ...  2
i) X = = = 3.05
n 20

( X i  X ) 2
S= = 0.99  1.0
n 1

ii) Suponiendo:


= 0.05 (nivel de significancia)
2

iii) Las hipótesis serían:

H₀ :   3
HA :   3

iv) tn –1,  = t20 –1, 0.05 = t19, 0.05  1.729

REGLA DE RECHAZO:
Sí. tc  tt. Acepte HA y Rechace H₀
Sí: tt  tc: Acepte Ho y Rechace HA

Entonces:
X  o
tc = S
tc = 3.051  3 = 0.224

n 20

tc (0.224)  tt (1.729)  se acepta H₀, la calificación es menor a 3.

PRUEBA BILATERAL.- Un fabricante de mermeladas debe llenar sus recipientes con


un peso medio de  = 350 onzas, con el debido cuidado de que no sea más o menos de
esta medida. Para controlar este proceso se evalúa periódicamente una muestra aleatoria
de 10 recipientes. Las muestras tienen los siguientes contenidos: 350.02, 350.22, 249.82,
349.92, 350.22, 350.32, 350.12, 349.92, 349.98 y 350.05

SOLUCION
i) H₀ :  = 350
HA :   350

X I 350.02  ...  350.05


ii) X = = = 350.059
n 10

( X i  X ) 2
iii) S = = 0.16
n 1

iv)  = 0.05 , = 0.025 (nivel de significancia)
2

v) tn –1, = t9, 0.025 =   2. 262
2

-2.262 0 2.262

Se rechaza H₀ Se rechaza H₀
REGLA DE RECHAZO:
Rechace H₀ sí tc , < tt

Entonces:
X  o  350
tc = S
tc = 350.059
16
= 1.17

n 10

tc (1.17) está en la región de aceptación. Por tanto, se acepta la H₀

1.10.7 PRUEBAS SOBRE LA PROPORCION DE UNA POBLACION

Empleando los símbolos P para indicar la proporción poblacional y P₀ para representar


determinado valor supuesto de dicha proporción, las tres formas de una prueba de
hipótesis acerca de una proporción poblacional son las siguientes:

H₀: P  P₀ H₀: P  P₀ H₀: P  P₀


Ha: P  P₀ Ha: P  P₀ Ha: P  P₀

Prueba unilateral Prueba bilateral

La prueba de hipótesis respecto a una proporción de la población se basa en la


diferencia entre la proporción de la muestra las pruebas se aparecen mucho a los de las
pruebas de hipótesis respecto a una media de población. La única diferencia es que usan
la proporción de la muestra y su desviación estándar  p para determinar el estadístico
de prueba.

Ejemplo:

DATOS:
P = 0.35 de productos buenos
n = 120
Después de una capacitación
P = 0.38
Se desea saber el efecto de la capacitación para mejorar la calidad

Pq .35 x0.65
i) H₀: P  P₀ ii)  p = = = 0.0435
n 120
Ha: P  P₀

P1  P0
Z=
Pq
n

ii) Si  = 0.05  Zt 0.05, 120  Zt = 1.658


0.38  0.35
iii) Zc  Zc = = 0.69
0.0435
REGLA DE RECHAZO:
Rechace H₀ sí Zc  1.658

v) Cómo Zc < Zt  No se rechaza la H₀, es decir, después de capacitación no aumentó


la calidad de la proporción de productos de calidad.

vi) P  Z 0.69, 00 (tabla Z)  0.2580  0.5000 – 0.2580 = 0.2420 = 24.20%

Unilateral Inferior Unilateral Superior Bilateral


H₀: P  P₀ H₀: P  P₀ H₀: P  P₀
Ha: P  P₀ Ha: P  P₀ Ha: P  P₀

-
- Z 0 0 Z - Z/2 Z/2

Se rechaza H₀ Se rechaza H₀ Se rechaza H₀

NOTA: en todos los casos se rechaza H₀ si el valor de P< 

1.10.8 CÁLCULO DE PROBABILIDAD DE ERRORES DE TIPO II

Datos: - Vida útil de un producto  = 120 horas


-  = 12 horas
- n = 36
-  = 0.05

Entonces:

i) H₀:   120 ii) Si X = 118


Ha:   120

118  120
iii) Z = = -1.0 iv) -1.0 (buscar en la tabla Z) = 0.3413
12
36

iv) 0.5000 – 0.3413 = 0.1587 = 15.87% es la probabilidad de cometer error de tipo II.

1.10.9 DETERMINACION DE TAMANO DE MUESTRA PARA UNA PRUEBA DE


HIPÓTESIS SOBRE UNA MEDIA DE POBLACIÓN.

Si H₀:   ₀
Ha:   ₀
La parte superior de la figura, es la distribución muestral de X cuando H₀ es verdadera y
 = ₀. Observe que el nivel de significancia , especificado por el usuario, determina la
región de rechazo de la prueba. Sea C el valor crítico tal que X < C determina la región
de rechazo para la prueba. Si Z representa el valor de Z que corresponde a un área de 
en la cola de la distribución de probabilidad normal estándar, C se calcula mediante la
siguiente ecuación:

C = ₀ - Z para:
n

X cuando
Distribución muestral de
H₀ es verdadera y  = ₀

Se rechaza H₀

₀


P =
n
X cuando
Distribución muestral de
H₀ es verdadera y  a < ₀

C

C = a + Z para la figura anterior
n

Igualando las dos ecuaciones:

 
₀ - Z = a + Z
n n

₀ - a =
Z  Z  

n
Z   Z  
O  a 

n=
Z  Z   2
2

O  a 2
Leyenda:

Z = Valor de Z que origina un área de  en la cola de una distribución normal estándar


Z = Valor de Z que origina un área de  en la cola de una distribución normal estándar
 = Desviación estándar de la población
₀ = Valor de la media de población en la hipótesis nula
a = Valor de la media de población usada para el error de tipo II

NOTA: En una prueba de hipótesis bilateral, use la n con Z/2 en vez de Z

Ejemplo: Considerando el ejemplo del punto anterior:

Datos:

i) H₀:   120
Ha:   115
ii) Aseveraciones:

1) De error de tipo I: si la vida útil promedio del producto es  = 120, estoy


dispuesto a aceptar una probabilidad de  = 0.05 de rechazar el embarque.
2) De error tipo II: si la vida útil promedio del producto es 5 horas menos que la
especificación ( = 115), estoy dispuesto a arriesgar una probabilidad de  = 0.10
de aceptar el embarque.

iv) Z0.05  tabla 1.645 = 0.5000 – 0.05 = .4500 (buscando en la tabla)


Z0.10  tabla 1.282 = 0.5000 – 0.10 = .4000 (buscando en la tabla)

v) n =
1.645  1.2822 122 = 49
120  1152
EJERCICIOS DE REPASO

1.- Un artículo reciente indica que la edad media de las computadoras es igual o mayor a 10
años, con desviación estándar de 2. Después de contrastar una muestra de 18
computadoras, la media es de 9,98 años. Desarrolle la prueba de hipótesis con nivel de
riesgo 0.01.

2.- Con respecto a la información del problema anterior, se realizó otra prueba estadística con
20 muestras arrojando como resultado; media = 8.89 y desviación estándar 3. Determine la
prueba de hipótesis.

3.- Con los datos del ejercicio 2 determine el valor de P.

4.- Una cadena de tiendas de descuento expide su propia tarjeta de crédito. El gerente de esta
función desea averiguar si el saldo insoluto (sin pagar) medio mensual es mayor que $ 400.
El nivel de significancia se fija en 0.05. Una revisión aleatoria de 172 saldos insolutos
reveló que la media muestral es $407, y que la desviación estándar de la muestra vale $ 38.
¿Debería concluir el funcionamiento de crédito que la media poblacional es mayor que $
400, o bien es razonable suponer que la diferencia de $7 (obtenida de $407 - $400 = $7) se
debe al azar? ¿Cuál es el valor de P?

5.- La industria de muebles “Arte Moderno” produce un conjunto de muebles de madera. La


producción semanal de juego de comedor, se distribuye normalmente, con una media de
200 y una desviación estándar de 16. Recientemente, debido a la expansión del mercado,
se han introducido nuevos métodos de producción y se han contratado más empleados. El
promotor quisiera saber si ha habido un cambio total en la producción semanal de juego de
comedor. Para ello se plantea un nivel de significancia de 0.01, muestra de 50 y una media
de 203.5.

6.- Tomando el ejercicio 5, y si n = 25 y S = 9, cual es la variación del resultado.

7.- Suponga que en la próxima temporada 2 empresas, para seguir en el mercado, deben
absorber al menos 35% de los consumidores. La empresa A está interesada en evaluar la
oportunidad que tiene de lograr posicionarse, y planea la realización de una encuesta que
incluya 2,000 consumidores a nivel regional. ¿Cuál es la probabilidad de posicionamiento
de la empresa A, considerando un nivel de riesgo 0.05 y que en una investigación muestral
760 dijeron ser consumidores de la empresa A? ¿Cuál es el varo de P?
UNIDAD II

MÉTODOS ESTADÍSTICOS PARA LA INVESTIGACIÓN


EN CIENCIAS EMPRESARIALES

2.1 T-STUDENTE (Se usa cuando n ≤ 30, proveniente de N pequeño)

En probabilidad y estadística, la distribución t (de Student) es una distribución de probabilidad que


surge del problema de estimar la media de una población normalmente distribuida cuando el
tamaño de la muestra es pequeño. Ésta es la base de la popular prueba t de Student para la
determinación de las diferencias entre dos medias muestrales y para la construcción del intervalo de
confianza para la diferencia entre las medias de dos poblaciones. La distribución t surge, en la
mayoría de los estudios estadísticos prácticos, cuando la desviación típica de una población se
desconoce y debe ser estimada a partir de los datos de una muestra.

Esta distribución tiene la característica de que puede ser usada en aquellos casos en los que el tamaño
de muestra esta limitado, debido a las características del experimento a realizar.

Por ejemplo. En la industria es común encontrarse con productos que debido a los materiales y/o
proceso son sumamente caros y para realizar la prueba es necesario destruirlos.

En estos casos el tamaño de la muestra debe ser pequeño cinco a ocho pares.

Una limitación en la aplicación de este estadístico es que la población de la que se toma la muestra
tiene una distribución normal.

Técnicamente se puede describir la prueba t de Student como aquella que se utiliza en un modelo en
el que una variable explicativa (var. independiente) dicotómica intenta explicar una variable
respuesta (var. dependiente) dicotómica.

La prueba t de Student como todos los estadísticos de contraste se basa en el cálculo de estadísticos
descriptivos previos: el número de observaciones, la media y la desviación típica en cada grupo. A
través de estos estadísticos previos se calcula el estadístico de contraste experimental. Con la ayuda
de unas tablas se obtiene a partir de dicho estadístico el p-valor. Si p<0,05 se concluye que hay
diferencia entre los dos tratamientos

Ejemplo:

1) En un trabajo de investigación, en un programa de salud para niños en edad escolar se considera


que el peso medio neto de la tableta de cierto medicamento debe ser de 30 mg. Para revisar el peso
de las tabletas a utilizarse se pesó en forma aleatoria una muestra de 10 tabletas. Las mediciones
fueron: 28, 30, 31, 32, 26, 30, 31, 29, 28 y 39. Con nivel de significancia de 0.01 ¿se puede
concluir que el peso medio por tableta no se mantiene en su valor apropiado?

Solución

i) Datos:
n = 10
µ = 30
α = 0.01
X=?
S=?

ii) Cálculo de X y S:

X I 28  ...  30
ii) X = = = 29.5
n 10

( X i  X ) 2
iii) S = = 1.78
n 1

iv)  = 0.01 , = 0.005 (nivel de significancia)
2

iii) Planteamiento de hipótesis:


H₀: 1 = 30; El peso de las tabletas se mantiene en su peso normal.
Ha: 1 ≠ 30; El peso de las tabletas no se mantienen en su peso normal.

iv) Determinación de tc y tt

X  o
tc = S
tc = 291.5,78 30 = - 0.84

n 1 9

tt = tn-1, α/2 t9, α = 0.005


3.25

v) Regla de decisión:

tc > tt : Se rechaza la H₀ y se acepta Ha


tc < tt : Se acepta la H₀ y se rechaza Ha
tc = tt : Se rechaza la H₀ y se acepta Ha

Entonces:

Respuesta al caso:

Como tc (- 0.84) < tt (3.25) Se rechaza la HA y se acepta HO; es decir, que el


peso de las tabletas se mantiene en su peso normal, a un nivel de significancia de
 = 0.01.
2) Una Fábrica de aguas gaseosas asegura que la botella tamaño personal contiene 500ml. Los
estudiantes de la Escuela de Formación Profesional de Administración de Empresas analizan
una muestra de 25 botellas y encuentran un contenido medio de 450 ml. con una desviación
estándar de 100ml. ¿Rechazaría Ud. la afirmación de la Fábrica de aguas gaseosas? Use un
nivel de significancia de 0.05.

SOLUCIÓN

i) Datos:
µ = 500
X = 450
S = 100
n = 25
α = 0.05

ii) Planteamiento de hipótesis

H₀: 1 = 2; Las botellas tamaño personal contiene 500ml.


Ha: 1  2; Las botellas tamaño personal contiene 450ml

La prueba es de una sola cola, ya que sólo interesa determinar aceptar o rechazar la
afirmación del fabricante. La desigualdad de la hipótesis alternativa hacia la región de
rechazo en la cola izquierda de la distribución.

Porque tiene que probarse que X = 450 es < que µ de la fábrica

iii) Calculando t:
X  o  500
tc = S
tc = 450100 = - 2.45

n 1 24

iv) Determinando t tabla:

tt = tn-1, α/2 t24, α = 0.025

2.0639

tc = -2.45 µ = 500
tt = - 1.711
v) Estrategias de decisión:

Cuando:

tc > tt : Se rechaza la H₀ y se acepta Ha


tc < tt : Se acepta la H₀ y se rechaza Ha
tc = tt : Se rechaza la H₀ y se acepta Ha

Respuesta al caso:

Como tc (-2.45) > tt (-1.711) Se rechaza la H₀ y se acepta Ha; es decir, se rechaza la


afirmación de la fábrica de aguas gaseosas. En otras palabras, las botellas tamaño
personal contienen 500 ml. de aguas gaseosas.

3) Se aplicaron test de desempeño laboral a 20 trabajadores en dos instituciones. El promedio de la


institución A fue de 60 y la desviación típica 10; en la institución B el promedio fue de 68 y la
desviación típica 8.
a) Compruebe la hipótesis de que no existe ninguna diferencia entre las medias, con un nivel de
significación de 0.10.
b) Compruebe la hipótesis de que en la institución “b” es mayor el rendimiento promedio, con alfa
0.05.

SOLUCIÓN
a)
i) Datos:
na = nb = 20
µa = 60
µb = 68
σa = 10
σb = 8
αa = 0.10
αb = 0.05

ii) Planteamiento de hipótesis

H₀: 1 ≠ 2; Existe diferencia de medias de evaluación de desempeño en las instituciones


investigadas.
Ha: 1 = 2; No existe ninguna diferencia entre las medias de evaluación de desempeño
laboral en las instituciones investigadas

La hipótesis alternativa no indica ninguna dirección, por lo que se trata de una prueba
de dos colas.

iii) Calculando tc:


 a  b 60  68
tc = tc =  2.794
 2
 2
10 2 8 2
 
a b

na nb 20 20
iv) Determinando t tabla:

tt = tn-1, α/2 , t19, 0,05

1.73

tc = -2.794 0
tt = 1.73

v) Estrategias de decisión:
Como tc (-2.794 < tt (2.09) se acepta la H₀ y se rechaza la Ha; es decir, que no
existe diferencia entre las medias de evaluación de desempeño laboral en las
instituciones investigadas.
b)
i) Datos: (Idem)

ii) Planteamiento de hipótesis

H₀: 1 = 2; No existe ninguna diferencia de desempeño laboral en las dos instituciones
investigadas
Ha: 1 < 2; En la institución “b” es mayor el rendimiento laboral promedio.

iii) Calculando tc:


 a  b 60  68
tc = tc =  2.794
 2
 2
10 2 8 2
 
a b

na nb 20 20
iv) Determinando t tabla:

tt = t n-1, α/2 , t19, 0.025

2.09
tc = -2.794 0
tt = 2.09
vi) Estrategias de decisión:
Como tc (-2.794) < tt (2.09) se acepta la H₀ y se rechaza la Ha; es decir, que no
existe diferencia entre las medias de evaluación de desempeño laboral en las
instituciones investigadas.

4) En un programa de capacitación se encontró que el tiempo medio que necesitaron 18 mujeres


para aprender fue de 25 horas con una desviación típica de 3 horas; mientras que el tiempo
medio de aprendizaje para 15 varones fue de 28 horas, con una desviación típica de 4 horas.
Compruebe la hipótesis de que las mujeres aprenden más rápidamente que los varones, con un
nivel de significancia de 0.01.

i) Datos:

n1 = 18
n2 = 15
µ1 = 25
µ2 = 28
σ21 = 3
σ22 = 4
α = 0.01
ii) Planteamiento de hipótesis

H₀: 1 = 2; El tiempo promedio de aprendizaje entre las mujeres y varones es igual

Ha: 1 < 2; El tiempo promedio de aprendizaje de las mujeres es más rápido que de los
varones.

iii) Calculando tc:


 a  b 25  28
tc = tc =  2.40
 2
 2
32 4 2
 
a b

na nb 18 15

iv) Determinando t tabla:


El grado de libertad es igual al número total de elementos muestreados menos el número de
muestras (18 +15 -2 = 31)
tt = t n-1, α/2 , t 31, α/2, = 0.005

2.7440

v) Estrategias de decisión:

tc = -2.40
tt = 2.7440

Como tc (-1.915) < tt (2.576) se acepta la H₀ y se rechaza la Ha; es decir, el tiempo


promedio de aprendizaje de las mujeres es más rápido que de los varones, a un nivel
de significancia de 0.01.


2.2 CHI CUADRADO TABLA DE CONTINGENCIA O INDEPENDENCIA ( )

La prueba chi-cuadrado es una forma de contrastes de hipótesis que sirve para comprobar
afirmaciones acerca de las funciones de probabilidad (o densidad) de una o dos variables aleatorias.

Esta prueba no pertenece propiamente a la estadística paramétrica pues no establecen suposiciones


restrictivas en cuanto al tipo de variables que admiten, ni en lo que refiere a su distribución de
probabilidad ni en los valores y/o el conocimiento de sus parámetros.

Se aplica básicamente cuando queremos averiguar si dos variables (o dos vías de clasificación) son
independientes estadísticamente o cuando queremos comprobar la independencia de frecuencias entre
dos variables aleatorias, X e Y.

Las hipótesis contrastadas en la prueba son:

 Hipótesis nula: X e Y son dependientes o influyentes.


 Hipótesis alternativa: X e Y no son dependientes o influyentes

El estadístico de prueba se basa en las diferencias entre la Oi y Ei y se define como:

Grados de libertad = (f – 1) (c -1) = al número de filas de la tabla de contingencias menos 1 por el


número de columnas de la tabla de contingencias menos 1.
La regla de decisión:

Sí:  C2 Calculada es > que  t2 Tabla, se acepta la  A o se rechaza la  O


Sí:  C2 Calculada es < que  t2 Tabla, se acepta la  O o se rechaza la  A
Ejemplo:

1) En un test de desempeño laboral, con opciones de respuesta, de


falso o verdadero, un trabajador contestó correctamente 60
preguntas de un total de 100. Si se desea probar que el trabajador
conocía la materia examinada. ¿Cómo se plantearía las hipótesis?
¿El trabajador habría contestado sin saber la materia? Tomar la
decisión usando un nivel de significancia de 0.05.

SOLUCIÓN
a) Sin aplicar la corrección:
i) Planteamiento de hipótesis

Ha: El trabajador contestó sin saber la materia


Ho: El trabajador respondió sabiendo la materia

O E (O - E) (O - E)² (O - E)²/E
Correctas 60 50 10 100 2
incorrectas 40 50 -10 100 2
4
 =4
2
C

ii) Calculando  t2 (tabla);  t2  2n1 , 

 221 ,0.05 12 ,0.05

 t2 (tabla) 0.05

1 3.841

iii) Estrategias de decisión:

Cuando:

 C2 =  t2 , Se acepta la Ha
 C2 <  t2 , Se rechaza la Ha
 C2 >  t2 , Se acepta la Ha

Respuesta al caso:
Como:  C2 >  t2 , Se acepta la Ha, y se rechaza la Ho, es decir, el trabajador
contestó sin saber la materia, a un nivel de significancia de
0.05.
b) Aplicando la corrección:

O E (O - E) ((O - E) - 0.05)² ((O - E)- 0.05)² /E


Correctas 60 50 10 90.5 1.81
incorrectas 40 50 -10 90.5 1.81
3.62
 = 3.62
2
C

i) Calculando  t2 (tabla);  t2  2n1 , 

 221 ,0.05 12 ,0.05

 t2 (tabla) 0.05

1 3.841

ii) Estrategias de decisión:

Como:  C2 (3.62) <  t2 (3.841), se acepta la Ho, y se rechaza la Ha, es decir, el


trabajador respondió sabiendo la materia, a un nivel de significancia de 0.05.

2) En una investigación, cuya diseño fuera:

“MOTIVACIÓN INTRINSECA Y LA REMUNERACIÓN, DE LOS TRABAJADORES DE


LA UNIVERSIDAD NACIONAL SAN CRISTÓBAL DE UAMANGA

a) Formulación del problema


¿Existe relación de dependencia entre la motivación intrínseca y la remuneración, en el
nivel de desempeño laboral de los trabajadores de la Universidad Nacional de San
Cristóbal de Huamanga?

b) Objetivo
Demostrar la relación de dependencia entre la motivación intrínseca y la remuneración, en
el nivel de desempeño laboral de los trabajadores de la Universidad Nacional de San
Cristóbal de Huamanga.

c) Hipótesis
Existe una relación de dependencia entre la motivación intrínseca y la remuneración, en el
nivel de desempeño laboral de los trabajadores de la Universidad Nacional de San
Cristóbal de Huamanga.
d) El ítem principal podría haber sido de la siguiente forma:

En su opinión, ¿Existe relación de dependencia entre la motivación intrínseca y la remuneración


para buen desempeño laboral de los trabajadores de la Universidad Nacional de San Cristóbal de
Huamanga?

MA A I ED MD

Hay dependencia (HD)

No hay dependencia (NHD)

LEYENDA:
HD = Hay dependencia
NHD = No hay dependencia
MA = Muy de acuerdo
A = Acuerdo
I = Indiferente
ED = En desacuerdo
MD = Muy en desacuerdo

SOLUCIÓN

a) Planteamiento de hipótesis
  = Existe relación independiente entre la motivación intrínseca y la remuneración, para
buen desempeño laboral de los trabajadores de la Universidad Nacional de San Cristóbal de
Huamanga.
  = Existe una relación de dependencia entre la motivación intrínseca y la
remuneración, para buen desempeño laboral de los trabajadores de la Universidad
Nacional de San Cristóbal de Huamanga.

Tabulación de respuestas: n = 240 trabajadores

MA A I ED MD

IIIIIIIIII
Hay IIIIIIIIII
IIIIIIIIII IIIIIIIIII -.- IIIIIIIIII
dependencia IIIIIIIIII
IIIIIIIIII
IIIIIIIIII

IIIIIIIIII
IIIIIIIIII IIIIIIIIII
IIIIIIIIII
No hay IIIIIIIIII IIIIIIIIII
IIIIIIIIII IIIIIIIIII IIIIIIIIII
dependencia IIIIIIIIII IIIIIIIIII
IIIIIIIIII
IIIIIIIIII IIIIIIIIII
IIIIIIIIII
IIIIIIIIII

b) Consolidación de cantidades o datos observados:

MA A I ED MD TOTAL
Hay dependencia 10 20 10 -.- 40 80
No hay dependencia 40 10 10 30 70 160
TOTAL 50 30 20 30 110 240

c) Cálculo de valores esperados:


MA A I ED MD
Hay dependencia 16.67 10 6.67 10 36.67
No hay dependencia 33.33 20 13.3 20 73.3

PRIMERA FILA:

50 x80 30 x80
Celda (1,1) =  16.67 , Celda (1,2) =  10
240 240

20 x80 30 x80
Celda (1.3) =  6.67 , Celda (1.4) =  10
240 240

110 x80
Celda (1.5) =  36.67
240

SEGUNDA FILA:

50 x160 30 x160
Celda (2,1) =  33.33 , Celda (2,2) =  20
240 240

20 x160 30 x160
Celda (2.3) =  13.33 , Celda (2.4) =  20
240 240

110 x160
Celda (2.5) =  73.33
240

d) Tabulación de datos observados (o) y esperados (e) para determinar (  C2 ):

O E (O - E) (O - E)² (O - E)²/E
HD – MA 10 16.67 -6.67 44.49 2.67
HD – A 20 10 10 100 10
HD – I 10 6.67 3.33 11.09 1.66
HD – ED 0 10 -10 100 10
HD – MD 40 36.67 3.33 11.09 0.30
NHD –MA 40 33.33 6.67 44.49 1.33
NHD – A 10 20 -10 100 5
NHD – I 10 13.33 -3.33 11.09 0.90
NHD – ED 30 20 10 100 5
NHD – MD 70 73.33 -3.33 11.09 0.15
37.01

 C2 = 37.01

CALCULANDO  t2 (tabla)
Grado de libertad: (Qf = 2) (Qc = 5) = (2 - 1) (5- 1) = 4

 t2 =  24 , 0.05 = 9.488

e) Resultado y decisión:

 0.05
= = 0.025, 4 grados de libertad
2 2

Región de rechazo Región de aceptación

9.488 37.01

Cómo (  C2 CALCULADO = 37.01) > (  t2 TABLA = 9.488)

Se acepta la hipótesis  A y se rechaza la  O ; Es decir, existe una relación

dependiente entre la motivación intrínseca y la remuneración, para buen


desempeño laboral de los trabajadores de la Universidad Nacional de San
Cristóbal de Huamanga, al nivel de significancia de 0.05.

3) En una investigación, cuya diseño fuera:


ANEXO Nº 03
MATRIZ DE CONSISTENCIA
INFLUENCIA DE CLIMA LABORAL EN LA INTELIGENCIA EMOCIONAL DE LOS TRABAJADORES EN LAS INSTITUCIONES PÚBLICAS DE AYACUCHO
Tipo de Investigación: Aplicada Nivel de Investigación: Descriptivo – Correlacional Diseño de Investigación: Descriptivo

PROBLEMA OBJETIVOS HIPÓTESIS VARIABLES, MARCO METODOLOGÍA UNIVERSO Y MUESTRA


CATEGORÍAS E TEÓRICO
INDICADORES
PROBLEMA GENERAL GENERAL HIPOTESIS GENERAL UNIVERSO
VAR. INDEPENDIENTE CLIMA LABORAL METODO DE
¿Cómo influye el clima Sistematizar los aspectos El clima laboral influye (X) Conjunto de percepciones INVEST. 6.000 Trabajadores en las Instituciones Públicas de Ayacucho.
laboral en la inteligencia relevantes del clima laboral que significativamente en la inteligencia globales (constructo personal y
emocional de los influyen en la inteligencia emocional de los trabajadores psicológico) que el individuo Descriptivo POBLACIÓN
CLIMA LABORAL
trabajadores nombrados y emocional de los trabajadores nombrados y contratados por tiene de la organización, reflejo Cuanto cualitativas
contratados por servicios nombrados y contratados por servicios personales en las CATEGORÍAS de la interacción entre ambos; Inductivo 4,876 trabajadores entre nombrados y contratados por servicios
personales en las servicios personales en las instituciones públicas de la ciudad lo importante es cómo percibe Deductivo personales de las Instituciones Públicas de Ayacucho
instituciones públicas de la Instituciones Públicas de la de Ayacucho. Desarrollo un sujeto su entorno, sin tener Análisis
Ciudad de Ayacucho? ciudad de Ayacucho organizacional en cuenta cómo lo percibe Síntesis MUESTRA
HIPOTESIS ESPECIFICOS otros; por tanto, es más una
INDICADORES: dimensión del individuo que de
PROBLEMAS DISEÑO DE La muestra de determinó aplicando la siguiente fórmula:
ESPECÍFICOS ESPECÌFICOS a) La cualidad directiva influye  Cualidad directiva la organización. INVEST. (1.96) 2 (0.5)(0.5)(4876)
explícitamente en la integridad  Carrera profesional n  356
a) Analizar la influencia de la aplicada.  Trabajo en equipo INTELIGENCIA EMOCIONAL Descriptivo (4876)(0.05) 2  (1.96) 2 (0.5)(0.5)
cualidad directiva en la  Recursos tangibles La inteligencia emocional es la
a) ¿De qué manera la integridad aplicada.  Prestaciones capacidad de comprender TÉC. DE INVEST. PRUEBA DE ESTADÍSTICA DE CONTRASTE DE HIPÓTESIS
cualidad directiva influye sociales emociones y conducirlas, de tal
b) Explicar la influencia de las b) Las políticas de carrera
 2 cuadrada (Tabla de contingencias con nivel de
en la integridad manera que podamos utilizarlas Análisis documental
profesional influye Aplicación de
aplicada? políticas de carrera VAR. DEPENDIENTE para guiar nuestra conducta y Encuesta
evidentemente en el

(Y) nuestros procesos de
profesional en el conocimiento emocional. confianza de 95% y = 0.05) cuyo estadígrafo es:
pensamiento, para producir
b) ¿De qué modo las INTELIGENCIA
conocimiento emocional. mejores resultados. Incluye las INST. DE
políticas de carrera EMOCIONAL
c) El trabajo en equipo influye habilidades de: percibir, juzgar INVESTIG.
profesional influye en el c) Determinar la influencia de y expresar la emoción con
positivamente en la aptitud CATEGORÍAS
conocimiento precisión; contactar con los
trabajo en equipo en la emocional. Formato de fichas
emocional? Competencia laboral sentimientos o generarlos para
aptitud emocional. Bibliográficas Grados de libertad = (r – 1) (c -1)
d) Las características de los facilitar la comprensión de uno Cuestionario
d) Establecer la influencia de mismo o de otra persona;
c) ¿En qué medida el recursos tangibles influye INDICADORES: La regla de decisión:
las características de los
trabajo en equipo influye efectivamente en la profundidad  Integridad aplicada entender las emociones y el
 C2  t2 Tabla, se acepta la   o se rechaza la   .
recursos tangibles en la
en la aptitud emocional? profundidad emocional.
emocional.  Conocimiento conocimiento que de ellas se
Sí: Calculada es < que
emocional deriva y regular las mismas
e) Verificar la influencia de las para promover el propio
e) Las políticas de prestaciones  Aptitud emocional
d) ¿De qué forma las
políticas de prestaciones
sociales en la alquimia
sociales influye manifiestamente  Profundidad crecimiento
intelectual.
emocional e Sí:  C2 Calculada es > que  t2 Tabla, se acepta la   o se rechaza la   .
características de los en la alquimia emocional. emocional
emocional.
recursos tangibles  Alquimia emocional
influye en la profundidad
emocional?

e) ¿En qué medida las


políticas de prestaciones
sociales influye en la
alquimia emocional?
SOLUCIÓN
CONTRASTACIÓN Y CONVALIDACIÓN DE HIPÓTESIS
Análisis y aplicaciones de  2 cuadrada (Tabla de contingencias con nivel de

confianza de 95% y  = 0.05) cuyo estadígrafo es:

Para establecer si efectivamente la variable: Clima Laboral influye en la Inteligencia


Emocional de los trabajadores nombrados y contratados por servicios personales en las
Instituciones Públicas de la Ciudad de Ayacucho, hemos procedido de la siguiente
manera:

A) CUALIDAD DIRECTIVA (X 1 ) E INTEGRIDAD APLICADA (Y 1 )

i) PLANTEAMIENTO DE HIPÓTESIS:
  = La cualidad directiva no influye explícitamente en la integridad
aplicada.
  = La cualidad directiva influye explícitamente en la integridad aplicada.

ii) TABULACIÓN Y CONSOLIDACIÓN DE DATOS OBSERVADOS:

Consolidación de frecuencias de respuestas sobre la influencia o no del clima


laboral en la inteligencia emocional de los trabajadores:

S CS AV MPV N TOTAL
Influye 16 21 91 103 46 277
No influye 8 17 24 17 13 79
TOTAL 24 38 115 120 59 356

LEYENDA:
S = Siempre
CS = Casi siempre
AV = A veces
MPV = Muy pocas veces
N = Nunca
I = Influye
NI = No Influye

iii) CÁLCULO DE VALORES ESPERADOS:

PRIMERA FILA:

24 x 277 38 x 277
Celda (1,1) =  18.67 , Celda (1,2) =  29.57
356 356
115 x 277 120 x 277
Celda (1.3) =  89.48 , Celda (1.4) =  93.37
356 356

59 x 277
Celda (1.5) =  45.91
356

SEGUNDA FILA:

24 x79 38 x79
Celda (2,1) =  5.33 , Celda (2,2) =  8.43
356 356
115 x79 120 x79
Celda (2.3) =  25.52 , Celda (2.4) =  26.63
356 356

59 x79
Celda (2.5) =  13.09
356

S CS AV MPV N
Influye 18.67 29.57 89.48 93.37 45.91
No influye 5.33 8.43 25.52 26.63 13.09

iv) TABULACIÓN DE DATOS OBSERVADOS (O) Y ESPERADOS (E)


PARA DETERMINAR (  C2 ):

O E (O - E) (O - E)² (O - E)²/E
S–I 16 18.67 -2.67 7.13 0.38
CS – I 21 29.57 -8.57 73.44 2.48
AV – I 91 89.48 1.52 2.31 0.03
MPV – I 103 93.37 9.63 92.74 0.99
N–I 46 45.91 0.09 0.01 0.00
S – NI 8 5.33 2.67 7.13 1.34
CS – NI 17 8.43 8.57 73.44 8.71
AV – NI 24 25.52 -1.52 2.31 0.09
MPV – NI 17 26.63 -9.63 92.74 3.48
N – NI 13 13.09 -0.09 0.01 0.00
17.51
 : Calculada = 17.51
2
C

CALCULANDO  t2 (tabla)

a) Grado de libertad: (Qf = 2) (Qc = 5) = (2 - 1) (5- 1) = 4

b)  t2 =  24 , 0.05 = 9.488
v) RESULTADO Y DECISIÓN:

 0.05
= = 0.025, 4 grados de libertad
2 2

Región de rechazo Región de aceptación

9.488 17.51

Cómo (  C2 CALCULADO = 17.51) > (  t2 TABLA = 9.488)

SE ACEPTA LA   ; Es decir, la cualidad directiva influye


explícitamente en la integridad aplicada, al nivel de significancia de 0.05.

B) CARRERA PROFESIONAL ((X 2 ) Y CONOCIMIENTO EMOCIONAL


(Y 2 ))
i) PLANTEAMIENTO DE HIPÓTESIS:
  = Las políticas de carrera profesional no influye evidentemente en el
conocimiento emocional.
  = Las políticas de carrera profesional influye evidentemente en el
conocimiento emocional

ii) CONSOLIDACIÓN DE DATOS OBSERVADOS:

S CS AV MPV N TOTAL
Influye 14 26 84 102 46 272
No influye 6 19 26 18 15 84
TOTAL 20 45 110 120 61 356

iii) CÁLCULO DE VALORES ESPERADOS:

S CS AV MPV N
Influye 15.28 34.38 84.04 91.69 46.61
No influye 4.72 10.62 25.96 28.31 14.39
iv) TABULACIÓN DE O Y E:

O E (O - E) (O - E)² (O - E)²/E
S–I 14 15.28 -1.28 1.64 0.11
CS – I 26 34.38 -8.38 70.22 2.04
AV – I 84 84.04 -0.04 0.00 0.00
MPV – I 102 91.69 10.31 106.30 1.16
N–I 46 46.61 -0.61 0.37 0.01
S – NI 6 4.72 1.28 1.64 0.35
CS – NI 19 10.62 8.38 70.22 6.61
AV – NI 26 25.96 0.04 0.00 0.00
MPV – NI 18 28.31 -10.31 106.30 3.75
N – NI 15 14.39 0.61 0.37 0.03
14.06

 C2 : Calculada = 14.06

CALCULANDO  t2 (tabla)

a) Grado de libertad: (Qf = 2) (Qc = 5) = (2 - 1) (5- 1) = 4

b)  t2 =  24 , 0.05 = 9.488

v) RESULTADO Y DECISIÓN:

 0.05
= = 0.025, 4 grados de libertad
2 2

Región de rechazo Región de aceptación

9.488 14.06
7.519
.488

Cómo (  C2 CALCULADO = 14.06) > (  t2 TABLA = 9.488)

SE ACEPTA LA   ; Es decir, las políticas de carrera profesional influye


evidentemente en el conocimiento emocional, al nivel de significancia de
0.05.
C) TRABAJO EN EQUIPO (X 3 ) Y APTITUD EMOCIONAL (Y 3 )

i) PLANTEAMIENTO DE HIPÓTESIS:
  = El trabajo en equipo no influye positivamente en la aptitud emocional.

  = El trabajo en equipo influye positivamente en la aptitud emocional.

ii) CONSOLIDACIÓN DE DATOS OBSERVADOS:

S CS AV MPV N TOTAL
Influye 11 18 98 120 22 269
No influye 13 14 19 24 17 87
TOTAL 24 32 117 144 39 356

iii) CÁLCULO DE VALORES ESPERADOS:

S CS AV MPV N
Influye 18.13 24.18 88.41 108.81 29.47
No influye 5.87 7.82 28.59 35.19 9.53

iv) TABULACIÓN DE O Y E:

O E (O - E) (O - E)² (O - E)²/E
S–I 11 18.13 -7.13 50.84 2.80
CS – I 18 24.18 -6.18 38.19 1.58
AV – I 98 88.41 9.59 91.97 1.04
MPV – I 120 108.81 11.19 125.22 1.15
N–I 22 29.47 -7.47 55.80 1.89
S – NI 13 5.87 7.13 50.84 8.66
CS – NI 14 7.82 6.18 38.19 4.88
AV – NI 19 28.59 -9.59 91.97 3.22
MPV – NI 24 35.19 -11.19 125.22 3.56
N – NI 17 9.53 7.47 55.80 5.86

34.64

 C2 : Calculada = 34.64

CALCULANDO  t2 (tabla)

a) Grado de libertad: (Qf = 2) (Qc = 5) = (2 - 1) (5- 1) = 4

b)  t2 =  24 , 0.05 = 9.488
v) RESULTADO Y DECISIÓN:

 0.05
= = 0.025, 4 grados de libertad
2 2

Región de rechazo Región de aceptación

9.488 34.64
14.06
Cómo (  C2 CALCULADO = 34.64) (  2 TABLA
>7.519
.488 t
= 9.488)

SE ACEPTA LA   ; Es decir, el trabajo en equipo influye


positivamente en la aptitud emocional, al nivel de significancia de 0.05.

D) RECURSOS TANGIBLE (X 4 ) Y PROFUNDIDAD EMOCIONAL (Y 4 )

i) PLANTEAMIENTO DE HIPÓTESIS:

  = Las características de los recursos tangibles no influye efectivamente en


la profundidad emocional.
  = Las características de los recursos tangibles influye efectivamente en la
profundidad emocional.

ii) CONSOLIDACIÓN DE DATOS OBSERVADOS:

S CS AV MPV N TOTAL
Influye 6 25 75 103 14 223
No influye 17 33 29 36 18 133
TOTAL 23 58 104 139 32 356

iii) CÁLCULO DE VALORES ESPERADOS:

S CS AV MPV N
Influye 14.41 36.33 65.15 87.07 20.04
No influye 8.59 21.67 38.85 51.93 11.96
iv) TABULACIÓN DE O Y E:

O E (O – E) (O - E)² (O - E)²/E
S–I 6 14.41 -8.41 70.73 4.91
CS – I 25 36.33 -11.33 128.37 3.53
AV – I 75 65.15 9.85 97.02 1.49
MPV – I 103 87.07 15.93 253.76 2.91
N–I 14 20.04 -6.04 36.48 1.82
S – NI 17 8.59 8.41 70.73 8.23
CS – NI 33 21.67 11.33 128.37 5.92
AV – NI 29 38.85 -9.85 97.02 2.50
MPV – NI 36 51.93 -15.93 253.76 4.89
N – NI 18 11.96 6.04 36.48 3.05
39.26
 C2 : Calculada = 39.26

CALCULANDO  t2 (tabla)

a) Grado de libertad: (Qf = 2) (Qc = 5) = (2 - 1) (5- 1) = 4

b)  t2 =  24 , 0.005 = 9.488

v) RESULTADO Y DECISIÓN:

 0.05
= = 0.025, 4 grados de libertad
2 2

Región de rechazo Región de aceptación

9.488 39.26
34.64
14.06
Cómo (  C2 CALCULADO = 39.26) > (  t TABLA
2
7.519 = 9.488)
.488

SE ACEPTA LA   ; Es decir, las características de los recursos tangibles


influye efectivamente en la profundidad emocional, al nivel de significancia
de 0.05.

E) PRESTACIONES SOCIALES (X 5 ) Y ALQUIMIA EMOCIONAL (Y 5 )

i) PLANTEAMIENTO DE HIPÓTESIS:
  = Las políticas de prestaciones sociales no influye manifiestamente en
alquimia emocional.
  = Las políticas de prestaciones sociales influye manifiestamente en
alquimia emocional.

ii) CONSOLIDACIÓN DE DATOS OBSERVADOS:

S CS AV MPV N TOTAL
Influye 22 29 86 98 18 253
No influye 16 27 23 26 11 103
TOTAL 38 56 109 124 29 356

iii) CÁLCULO DE VALORES ESPERADOS:

S CS AV MPV N
Influye 27.01 39.80 77.46 88.12 20.61
No influye 10.99 16.20 31.54 35.88 8.39

iv) TABULACIÓN DE O Y E:

O E (O - E) (O - E)² (O - E)²/E
S–I 22 27.01 -5.01 25.10 0.93
CS – I 29 39.8 -10.8 116.64 2.93
AV – I 86 77.46 8.54 72.93 0.94
MPV – I 98 88.12 9.88 97.61 1.11
N–I 18 20.61 -2.61 6.81 0.33
S – NI 16 10.99 5.01 25.10 2.28
CS – NI 27 16.2 10.8 116.64 7.20
AV – NI 23 31.54 -8.54 72.93 2.31
MPV – NI 26 35.88 -9.88 97.61 2.72
N – NI 11 8.39 2.61 6.81 0.81
21.57

 C2 : Calculada = 21.57

CALCULANDO  t2 (tabla)
a) Grado de libertad: (Qf = 2) (Qc = 5) = (2 - 1) (5 - 1) = 4

b)  t2 =  24 , 4, 0.005 = 9.488
v) RESULTADO Y DECISIÓN:

 0.05
= = 0.025, 4 grados de libertad
2 2

Región de rechazo Región de aceptación

9.488
21.57
39.26
Cómo (  C CALCULADO = 21.57) > (  t TABLA
2 2 34.64
14.06= 9.488)
7.519
SE ACEPTA LA  ; Es decir, las políticas de

.488 prestaciones sociales
influye manifiestamente en alquimia emocional, al nivel de significancia
de 0.05.

2.3 ANÁLISIS DE VARIANZA (ANOVA = ANDEVA = ANVA)

Casi siempre se introduce el tema del análisis de la varianza como respuesta a la


necesidad de utilizar una técnica de comparación de más de dos grupos, es decir
como un método para comparar más de dos tratamientos: si disponemos de medidas
cuantitativas continuas, que se puede suponer como procedentes de una distribución
de probabilidad normal, y queremos comparar dos grupos -dos tratamientos-, la
prueba estadística que se utiliza es un contraste de medias basado en la t de Student,
y cuando se dispone de más de dos grupos, la prueba a emplear es el análisis de la
varianza. Personalmente, aunque el enfoque es adecuado, me parece que refleja solo
una parte del interés de la técnica, ideada no sólo para analizar los datos sino también
para planificar los experimentos, y creo más apropiado hablar de que el análisis de la
varianza es un procedimiento estadístico que nos permite dividir la variabilidad
observada en componentes independientes que pueden atribuirse a diferentes causas
de interés.

En el planteamiento más simple de análisis de la varianza tenemos una variable


numérica cuantitativa (resultado), y queremos determinar en qué medida se puede
atribuir la variabilidad de ésta a otra variable cualitativa nominal que vamos a
denominar factor. Estamos hablando por tanto de análisis de la varianza para un solo
factor, que puede tener 2 o más categorías o niveles.

Este factor, cuyo posible efecto sobre la variable medida queremos analizar, puede
tener unos niveles fijos, por ejemplo el nivel educativo alcanzado por los sujetos que
intervienen (sin estudios, estudios primarios, secundarios, formación universitaria), y
hablamos entonces de modelo de efectos fijos; o bien puede tratarse de una muestra
procedente de un conjunto de niveles más amplio, como puede ser por ejemplo el
caso de un estudio en el que se seleccionan varios hospitales y se analiza las posibles
diferencias entre hospitales. Entonces lo denominamos modelo de efectos
aleatorios. En el análisis de la varianza de 1 factor es mucho más frecuente el
modelo de efectos fijos.

Ejemplo 1

Se está aplicándose 5 metodologías diferentes para mejorar el servicio de calidad en


un Banco de la Ciudad de Ayacucho y los puntajes a una misma prueba se reportan
en el siguiente cuadro:

1 2 3 4 5
37 29 49 40 50
40 33 47 38 46
46 34 42 49
31 39
41

¿Existe alguna evidencia de que alguno de los métodos es mejor?

SOLUCIÓN

i) DATOS:

a = Existen 5 tratamientos
N = n1 ≠ n2 ≠ n3 ≠ n4 ≠ n5
i) Procedimientos de cálculo
t=∑y 2
ij : i = 1, 2, 3,… 5. Columnas. J = 1, 2, 3,…5 filas
A = ∑( y12j  y 22 j  y32 j  y 42 j  y 52 j )/n; si los datos son completos, caso contrario
dividir cada columna por la cantidad de n.

CF = (∑ yij ) 2 / n
Leyenda:
t = Tratamiento
A = Total tratamiento
CF = Factor de corrección

a) Sumar las columnas

1 2 3 4 5
37 29 49 40 50
40 33 47 38 46
46 34 42 49
31 39
41
123 127 96 200 145 691
b) Calcular el valor de:
t = ∑ ( 37 2
 40 2  46 2  29 2  33 2  34 2  ……+ 49 2 ) = 28,769

2
127 2 96 2 200 2 145 2
A = ∑ ( 123     ) = 28,691.58
3 4 2 5 3
2
CF = (691) = 28,087.12
17

c) Planteamiento de hipótesis

  : No existe evidencia de que alguno de los métodos es mejor

  : Existe evidencia de que alguno de los métodos es mejor

d) Fuente de Varianza:

Grado de Cuadrado F
Suma de cuadrados
libertad medio Calculada
(S:C)
(G.L.) (CM) (Fc)
(a-1) (A-CF) 604.46/4 =
÷ tratamientos (5-1) = 4 28691.58 -28087.12 = 151.115 151.115/6.452 =
604.46
Dentro de (N-a) (T –A) 77.42/12 = 23.42
tratamientos (17-5) = 12 28769 – 28691.58 = 77.42 6.452

f C = 23.42

f t (tabla) = f  ( a 1), ( N a )

ft = f 0.05,(514),(17512)

f t (tabla) 4

12 3.26

a) Estrategia de decisión

Cuando: f C > f t , Se acepta la HA y se rechaza la H₀


Cuando: f C < f t , Se acepta la H0 y rechaza la HA
RESPUESTA:

Como: f C (23.42) > f t (3.26), Se acepta la HA y se rechaza la H₀, es


decir, que si existe diferencia en los métodos de capacitación y los
puntajes.

Ejemplo 2

Se desea comparar a tres médicos en relación con la duración del internado de sus
pacientes que se sometieron a cierto procedimiento quirúrgico menor sin
complicaciones. Se seleccionó una muestra de 8 pacientes para cada médico y se
observaron los tiempos de hospitalización después de la intervención.

Médicos
A B C
4 4 5
5 5 3
5 4 3
4 3 3
6 4 3
6 5 3
4 3 4
5 3 5

¿Existe diferencia entre los médicos, según el tiempo de permanencia de sus


pacientes? Use 99% de confiabilidad.

SOLUCIÓN
i) DATOS:

N=8
α = 0.01
a=3

ii) Sumatoria de columnas y filas pertinentes

A B C
4 4 5
5 5 3
5 4 3
4 3 3
6 4 3
6 5 3
4 3 4
5 3 5
Y ij
39 31 29 99
 Y ij2 195 125 111 431
(Yij)
2
1521 961 841 3323
iii) Planteamiento de hipótesis

  : µ1 = µ2 = µ3
  : Existe al menos una diferencia

iv) Fuente de Varianza:


G. L. = (a-1) = (3-1) = 2
a(n – a) = 3(8-3) = 15

S.C = T = 431
A = 3323/8 = 415.375
CF = (99)2 /8 x 3 = 408.375

Grado de Suma de F
Cuadrado medio
Fuente de varianza libertad cuadrados Calculada
(CM)
(G.L.) (S:C) (Fc)
÷ tratamientos 2 (A-CF) = 7 7/2 = 3.5
Dentro de 3.5/0.744 = 4.704
21 (T –A) = 15.625 15.625/21 = 0.744
tratamientos

f C = 4.704

f t (tabla) = f ( a1), a ( n1)

ft = f 0.01,(312), 3(8121)

f t (tabla) 2

15 6.36

v) Estrategia de decisión

Como: f C (4.704) < f t (5.78), Se acepta la H0 y se rechaza la HA, es decir,


no existe diferencia entre la conclusión de los médicos, como se puede
decir también, los 3 médicos son iguales.
2.4 PRUEBA DE SIGNOS

Dada la muestra aleatoria simple de tamaño n, (x1, x2, ..., xn), extraída de una
población con distribución continua, se quiere contrastar si su mediana es igual a
cierto valor dado de antemano, designado por med.

Es importante insistir en que no se acepta para la realización del test otra hipótesis
que no sea la continuidad de la distribución poblacional. La hipótesis nula que se
contrasta es:

H0: "la mediana de la población es med" frente a la alternativa:


H1: "la mediana de la población es diferente de med".

El estadístico a calcular es:

T = n° de casos en los que xi - med > 0, siendo i = 1, 2, ..., n.

Ejemplo 1

Se quiere saber si existe influencia del grupo en el rendimiento de exámenes; primer


examen individual y segundo examen en grupo.

1er. Examen 2do Examen

15.5 14.5
9.5 15.0
18.0 14.5
18.6 15.0
16.7 14.5
8.8 14.5
9.5 14.5
14.5 14.5
15.2 15.0
14.4 14.5
11.2 15.0
9.5 15.0
11.8 14.5
12.0 15.0
14.0 14.5
10.5 15.0
8.2 14.5
15.0 15.0
12.0 15.0
13.8 15.0
14.8 15.0
15.0 15.0
17.8 15.0
18.5 15.0

SOLUCIÓN

i) Determinación de signos:

1er. Examen 2do Examen Prueba de signos


15.5 14.5 -
9.5 15.0 +
18.0 14.5 -
18.6 15.0 -
16.7 14.5 -
8.8 14.5 +
9.5 14.5 +
14.5 14.5 0
15.2 15.0 -
14.4 14.5 +
11.2 15.0 +
9.5 15.0 +
11.8 14.5 +
12.0 15.0 +
14.0 14.5 +
10.5 15.0 +
8.2 14.5 +
15.0 15.0 0
12.0 15.0 +
13.8 15.0 +
14.8 15.0 +
15.0 15.0 0
17.8 15.0 -
18.5 15.0 -

ii) Datos:
n = 24 – (3 ceros) = 21
(+) = 14
(-) = 7
Probabilidad que sea (+) o negativo (-):
p = 0.5
q = 0.5
Xi = q de (+) (-0.5) = 14 – 0.5 = 13.5

iii) Planteamiento de hipótesis:

  : No existe influencia del grupo en las calificaciones

  : Existe influencia del grupo en las calificaciones


iv) Indicadores a calcular

  np   21x0.5  10.5
  npq   21x0.5x0.5  2.29
xi   13.5  10.5
c  c   1.31
 2.29
 t   (1 ) / 2 t   (10.0) / 2  0.475  1.96

v) Estrategia de decisión

Cuando: Z C > Z t , Se acepta la HA y se rechaza la H₀


Cuando: Z C < Z t , Se acepta la H0 y se rechaza la HA

Rpta para el caso:

Como: Z C (1.31) < Z t (1.96), Se acepta la H0 y se rechaza la HA, es decir,


no existe influencia del grupo en las calificaciones.

Ejemplo 2

Para evaluar dos entidades bancarias de la ciudad de Ayacucho, se seleccionaron al


azar 17 usuarios, a éstos se les solicitó que califiquen con valores de 1 y 2; 1 si no es
de su preferencia y 2 si es de su preferencia. A continuación se presentan los
resultados de la opinión de los usuarios en forma de rango:

Usuarios Banco A Banco B


1 2 1
2 2 1
3 1 2
4 2 1
5 2 2
6 1 2
7 2 1
8 2 1
9 1 2
10 2 1
11 1 2
12 1 2
13 2 1
14 1 2
15 2 1
16 2 1
17 2 1
a) Probar que la preferencia es la misma para ambos Bancos con un nivel de
significancia de 0.01
b) Probar la hipótesis de que El Banco A es mejor que el Banco B con un nivel de
significancia de 0.01.

SOLUCIÓN

a. Probar que la preferencia es la misma para ambos Bancos con un nivel de


significancia de 0.01

Usuarios Banco A Banco B Signos


1 2 1 -
2 2 1 -
3 1 2 +
4 2 1 -
5 2 2 0
6 1 2 +
7 2 1 -
8 2 1 -
9 1 2 +
10 2 1 -
11 1 2 +
12 1 2 +
13 2 1 -
14 1 2 +
15 2 1 -
16 2 1 -
17 2 1 -

i) Datos:
n = 17 – (1 cero) = 16
(+) = 6
(-) = 10
p = 0.5
q = 0.5

ii) Planteamiento de hipótesis:

 O : La preferencia es distinta para ambos Bancos

 A : La preferencia es la misma para ambos Bancos

iii) Indicadores a calcular

  np   16 x0.5  8.0
  npq   16 x0.5x0.5  2.0
xi   5.5.  8
c  c   1.25
 2.0
 t   (1 ) / 2 t   0.50.05  0.45  1.65

iv) Estrategia de decisión

Como: Z C (-1.25) < Z t (1.65), Se acepta la H0 y se rechaza la HA, es decir,


la preferencia de los dos Bancos es la misma.

b) Probar la hipótesis de que El Banco A es mejor que el Banco B con un nivel de


significancia de 0.01.

SOLUCIÓN
i) Prueba de signos:

Usuarios Banco A Banco B Signos


1 2 1 +
2 2 1 +
3 1 2 -
4 2 1 +
5 2 2 0
6 1 2 -
7 2 1 +
8 2 1 +
9 1 2 -
10 2 1 +
11 1 2 -
12 1 2 -
13 2 1 +
14 1 2 -
15 2 1 +
16 2 1 +
17 2 1 +

ii) Planteamiento de hipótesis:

  : La preferencia de los 2 Bancos es la misma.

  : El Banco A tiene mayor preferencia


ii) Indicadores a calcular

  np   16 x0.5  8.0
  npq   16 x0.5x0.5  2.0
xi   9.5.  8
c  c   0.75
 2.0
 t   (1 ) / 2 t   0.50.01  0.49  2.33

Estrategia de decisión

Como: Z C (0.75) < Z t (2.33), Se acepta la H0 y se rechaza la HA, es decir,


la preferencia es la misma para ambos Bancos.

2.5 LA PRUEBA DE PARES IGUALES DE WILCOXON

Este modelo estadístico corresponde a un equivalente de la prueba t de Student, pero


se aplica en mediciones en escala ordinal para muestras dependientes.

Cuando el tipo de medición no cumpla con los requisitos que la prueba t de Student
exige, la de Wilcoxon es una alternativa de aceptable eficacia para contrastar
hipótesis. El método es aplicable a muestras pequeñas, siempre y cuando sean
mayores que 6 y menores que 25. Las muestras grandes deben ser mayores a 25 y
éste se debe transformar en valor de Z, para conocer la probabilidad de que aquella
sea o no significativa.

Dicha prueba estadística consiste en sumar los rangos de signo frecuente; por ello, no
se tiene una ecuación o fórmula, como se observa en otras pruebas estadísticas.

Se utiliza cuando:

 Trabaja con datos de tipo ordinal.


 Establece diferencias de magnitudes (+ y -).
 Dirección.

Prueba de dos colas: No se sabe en que dirección se pueden dar las diferencias.
Prueba de una cola: Si sabemos en que dirección están las diferencias.

 Dos muestras apareadas.


 Establece las diferencias .
 Con muestras grandes (> 25) se intenta lograr la distribución normal (se utiliza la
prueba Z).
Pasos:

1. Arreglar las observaciones pareadas y obtener las diferencias de cada pareja.


2. Arreglar las diferencias en función de rangos como valores absolutos, sin importar
el signo, pero de manera que los rangos conserven el signo correspondiente a la
diferencia.
3. Obtener la sumatoria de los rangos cuyo signo es el menos frecuente, por ejemplo:
si el signo es +, se considerará para efectuar sumatorias; sin embargo, la sumatoria
mencionada finalmente pierde el signo.
4. Si se trata de muestras pequeñas, comparar el valor obtenido con los valores
críticos de la tabla de Wilcoxon.
5. Distribuir las muestras mayores que 25 bajo la curva normal y, por tanto, calcular
el valor Z, en referencia al cual se debe consultar la probabilidad de diferir con
respecto al promedio en la tabla de probabilidades asociadas.
6. Decidir si se acepta o rechaza la hipótesis.

Ejemplo 1

Se quiere saber, si existe influencia del grupo en el rendimiento exámenes, con α =


0.01

1er. Examen 2do Examen


15.5 14.5
9.5 15.0
18.0 14.5
18.6 15.0
16.7 14.5
8.8 14.5
9.5 14.5
14.5 14.5
15.2 15.0
14.4 14.5
11.2 15.0
9.5 15.0
11.8 14.5
12.0 15.0
14.0 14.5
10.5 15.0
8.2 14.5
15.0 15.0
12.0 15.0
13.8 15.0
14.8 15.0
15.0 15.0
17.8 15.0
18.5 15.0
SOLUCIÓN

i) Determinación de signos rango:

1er. 2do Prueba de


|≠s| Rangueo
Examen Examen Signos
15.5 14.5 - 1 -5
9.5 15.0 + 5.5 18.5
18.0 14.5 - 3.5 - 12.5
18.6 15.0 - 3.6 - 14
16.7 14.5 - 2.2 -7
8.8 14.5 + 5.7 20
9.5 14.5 + 5.0 17
14.5 14.5 0 0.0 -.-
15.2 15.0 - 0.2 - 2.5
14.4 14.5 + 0.1 1
11.2 15.0 + 3.8 15
9.5 15.0 + 5.5 18.5
11.8 14.5 + 2.7 8
12.0 15.0 + 3.0 10.5
14.0 14.5 + 0.5 4
10.5 15.0 + 4.5 16
8.2 14.5 + 6.3 21
15.0 15.0 0 0.0 -.-
12.0 15.0 + 3.0 10.5
13.8 15.0 + 1.2 6
14.8 15.0 + 0.2 2.5
15.0 15.0 0 0.0 -.-
17.8 15.0 - 2.8 -9
18.5 15.0 - 3.5 - 12.5

iii)Cálculo de de rangos (cantidad de valores en |≠s|:

0.1 (1) = 1
0.2 (2) = 2+3 = 5/2 = 2.5
0.5 (1) = 4
1.0 (1) = 5
1.2 (1) = 6
2.2 (1) = 7
2.7 (1) = 8
2.8 (1) = 9
3.0 (2) = 10 +11 =21/2 = 10.5
3.5 (2) = 12+13 = 25/2 = 12.5
3.6 (1) = 14
3.8 (1) = 15
4.5 (1) = 16
5.0 (1) = 17
5.5 (2) = 18+19 = 37/2 = 18.5
5.7 (1) = 20
6.3 (1) = 21

iv) Planteamiento de hipótesis

  : No existe influencia del grupo en las calificaciones

  : Existe influencia del grupo en las calificaciones

v) Cálculo de indicadores:

n = 21
(-) = 7
(+) = 14
vi) Determinado: tC ; tt

t C = ∑(-) = en la parte de rangueo = 62.5

t t = t , n
Tabla: valores críticos
tt = t 0.01, 21 de la prueba de rangos
y signos de Wilcoxon

t t (tabla) 0.01

21 43

vii) Estrategia de decisión

Cuando: t C > t t , Se acepta la HA y se rechaza la HO


Cuando: t C < t t , Se rechaza HA y se acepta la HO

Rpta. para el caso:

Como: t C (62.5) > t t (43), Se acepta la HA y se rechaza la HO, es decir,


existe influencia del grupo en el rendimiento de exámenes, con α =
0.01.

NOTA: Cuando n > 25 se recurre a la siguiente fórmula:


n(n  1) 21(21  1)
Media: ET = ET =  115.5
4 4

n(n  1)(2n  1) 21(21  1)(2 * 21  1)


Gt = Gt = = 28.77
24 24

t c  ET 62.5  115.5
Zc = Zc = = - 1.84 = │1.84│
Gt 28.77

Calculando Zt = Z0.5 –α = Z0.5 – 0.01 = 0.49 (buscando el tabla) = 2.33

Decisión:

Como: Z C (1.84) > Z t (2.33), Se acepta la HA y se rechaza la HO, es decir,


existe influencia del grupo en las calificaciones.

Ejemplo 2

Se imparte un curso de redacción a 22 secretarias, en primera clase se aplicó una


prueba de entrada que mide la capacidad para redactar. Después de 6 semanas de
clase se aplica una segunda prueba. Se quiere saber si el curso ayudó a mejorar la
capacidad de redacción de las secretarias. Use α = 0.01.

1er. 2do
Examen Examen
72 74
70 72
68 69
67 68
73 72
71 73
72 72
70 74
69 68
70 73
68 69
72 70
69 68
66 69
73 74
71 73
70 70
72 74
70 68
69 71
72 75
73 76

SOLUCIÓN

i) Determinación de signos rango:

1er. 2do Prueba de


|≠s| Rangueo
Examen Examen Signos
72 74 + 2 11.5
70 72 + 2 11.5
68 69 + 1 4
67 68 + 1 4
73 72 - 1 -4
71 73 + 2 11.5
72 72 0 0 -.-
70 74 + 4 20
69 68 - 1 -4
70 73 + 3 17.5
68 69 + 1 4
72 70 - 2 -11.5
69 68 - 1 -4
66 69 + 3 17.5
73 74 + 1 4
71 73 + 2 11.5
70 70 0 0 -.-
72 74 + 2 11.5
70 68 - 2 -11.5
69 71 + 2 11.5
72 75 + 3 17.5
73 76 + 3 17.5

ii) Cálculo de indicadores:

n = 22
(-) = 5
(+) = 20

iii) Planteamiento de hipótesis

  : El curso no ayudó a mejorar la capacidad de redacción de las secretarias.

  : El curso ayudó a mejorar la capacidad de redacción de las secretarias

iv) Determinado: tC ; tt
t C = ∑(-) = en la parte de rangueo = 35

t t = t , n
Tabla: valores críticos
tt = t 0.01, 20 de la prueba de rangos
y signos de Wilcoxon

t t (tabla) 0.01

20 38

v) Estrategia de decisión

Como: t C (35) < t t (38), Se rechaza la HA y se acepta la HO, es decir, el curso


no ayudó a mejorar la capacidad de redacción de las secretarias

2.6 VALORACIÓN DE FISHER – SHEFLE

Esta prueba estadística se utiliza frecuentemente como alternativa, cuando no se


puede aplicar la ji cuadrada de Pearson. Es un procedimiento más eficaz en la escala
nominal con dos muestras independientes. La razón de esto se basa en que se calcula
directamente la probabilidad de una serie de arreglos de frecuencias observadas en
una tabla de contingencia de 2 X 2, dada en una distribución hipergeométrica.

La ecuación para calcular la probabilidad exacta de Fischer y Yates es la siguiente:

Pasos.

1. Arreglar las frecuencias observadas en una tabla de contingencia 2 X 2.

+ -
Muestra I A B
Muestra II C D

2. Obtener los totales de las hileras (A + B) y (C + D) y de las columnas: (A + C) y


(B + D), así como el gran total (GT).
3. Obtener los valores factoriales de los totales de hileras y columnas y después
multiplicarlos.
4. Calcular los factoriales del gran total y multiplicar éste por todos los factoriales de
cada casilla de la tabla de contingencia.
5. Dividir el primer valor de producto de factoriales entre el segundo. Este resultado
es la probabilidad exacta de Fischer y Yates.
6. Decidir si se acepta o rechaza la hipótesis, en función de la probabilidad.

Ejemplo 1

Un investigador reúne una muestra de 15 sujetos con problemas de obesidad. Elige al


azar a 7 pacientes para ensayar una nueva técnica terapéutica para bajar de peso, y a
los 8 restantes les aplica una técnica usada regularmente para el mismo efecto.

Planteamiento de la hipótesis.

 Hipótesis alterna (Ha). Existe mayor frecuencia de perder peso al aplicar la nueva
técnica terapéutica, en comparación con lo observado al aplicar una técnica usada
regularmente.
 Hipótesis nula (Ho). Las diferencias observadas en las dos técnicas terapéuticas se
deben al azar.

Nivel de significación.

Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.

Zona de rechazo

Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.

Aplicación de la prueba estadística.

El valor de probabilidad calculado es menor que el nivel de significación (0.05).

Decisión.
En virtud de que la probabilidad exacta de Fischer y Yates es menor
que 0.05, cae en el nivel de significación; por lo tanto, se acepta Ha y
se rechaza Ho.
Interpretación.

La nueva técnica terapéutica es significativamente efectiva para el tratamiento de la


obesidad, a un nivel de confianza de p = 0.03.

Ejemplo 2

Se desea comparar a tres médicos en relación con la duración del internado de sus
pacientes que se sometieron a cierto procedimiento quirúrgico menor sin
complicaciones. Se seleccionó una muestra de 8 pacientes para cada médico y se
observaron los tiempos de hospitalización después de la intervención.

Médicos
A B C
4 4 5
5 5 3
5 4 3
4 3 3
6 4 3
6 5 3
4 3 4
5 3 5

¿Existe diferencia entre los médicos, según el tiempo de permanencia de sus


pacientes? Use 99% de confiabilidad.

SOLUCIÓN
vi) DATOS:
N=8
α = 0.01
a=3

vii) Sumatoria de columnas y filas pertinentes

A B C
4 4 5
5 5 3
5 4 3
4 3 3
6 4 3
6 5 3
4 3 4
5 3 5
Y ij
39 31 29 99
 Y ij2 195 125 111 431
(Yij)
2
1521 961 841 3323

viii) Planteamiento de hipótesis


  : µ1 = µ2 = µ3

  : Existe al menos una diferencia


ix) Fuente de Varianza:
H. L. = (a-1) = (3-1) = 2
a(n – 1) = 3(8-1) = 21
S.C = T = 431
A = 3323/8 = 415.375
CF = (99)2 /8 x 3 = 408.375
Grado de F
Suma de cuadrados Cuadrado medio
Fuente de varianza libertad Calculada
(S:C) (CM)
(G.L.) (Fc)
÷ tratamientos 2 (A-CF) = 7 7/2 = 3.5
Dentro de 3.5/0.744 = 4.704
21 (T –A) = 15.625 15.625/21 = 0.744
tratamientos

f C = 4.704

f t (tabla) = f ( a1), a ( n1)

ft = f 0.01,(312), 3(8121)

f t (tabla) 2

21 5.78

x) Estrategia de decisión

Como: f C (4.704) < f t (5.78), Se acepta la H0 y se rechaza la HA, es decir,


no existe diferencia entre la conclusión de los médicos, como se puede
decir también, los 3 médicos son iguales.
2.7 PRUEBA DE MANNY Y WHITNEY

Esta prueba estadística es útil cuando las mediciones se pueden ordenar en escala
ordinal (es decir, cuando los valores tienden a una variable continua, pero no tienen
una distribución normal) y resulta aplicable cuando las muestras son independientes.
Este procedimiento es una buena alternativa cuando no se puede utilizar la prueba t
de Student, en razón de no cumplir con los requisitos que esta prueba exige.

La fórmula es la siguiente:

Donde:
U1 y U2 = valores estadísticos de U Mann-Whitney.
n1 = tamaño de la muestra del grupo 1.
n2 = tamaño de la muestra del grupo 2.
R1 = sumatoria de los rangos del grupo 1.
R2 = sumatoria de los rangos del grupo 2.

Pasos:

1. Determinar el tamaño de las muestras (n1 y n2). Si n1 y n2 son menores que 20, se
consideran muestras pequeñas, pero si son mayores que 20, se consideran
muestras grandes.
2. Arreglar los datos en rangos del menor al mayor valor. En caso de que existan
ligas o empates de rangos iguales, se deberán detectar para un ajuste posterior.
3. Calcular los valores de U1 y U2, de modo que se elija el más pequeño para
comparar con los críticos de U Mann-Whitney de la tabla de probabilidades
asociadas con valores pequeños como los de U en la prueba de Mann-Whitney.
4. En caso de muestras grandes, calcular el valor Z, pues en estas condiciones se
distribuye normalmente.
5. Decidir si se acepta o rechaza la hipótesis.

Ejemplo 1: Para muestras pequeñas:

Después de un programa de capacitación a 9 funcionarios de la Municipalidad


Provincial de Huamanga por 2 métodos diferentes, se obtuve el siguiente resultado:

Método A 16 18 5 6 12 15 12 14 11
Método B 16 12 15 4 3 11 8 15 14

Se quiere saber si existe diferencia de métodos, aun nivel de significancia de 0.05.

SOLUCIÓN

i) Planteamiento de hipótesis

Ho: µ1 = µ2 No hay ninguna diferencia entre los 2 métodos

Ha: µ1 ≠ µ2 Existe diferencia entre los dos métodos


ii) Ordenando y rangueando los resultados:

Rangueo 3 4 6.5 9 9 11.5 14 16.5 18 ∑ = 91.5


Método B 5 6 11 12 12 14 15 16 18
Método A 3 4 8 11 12 14 15 15 16
Rangueo 1 2 5 6.5 9 11.5 14 14 16.5 ∑ = 79.5
Cálculo adicional:

3 (1) = 1
4 (1) = 2
5 (1) = 3
6 (1) = 4
8 (1) = 5
11 (2) = 6 +7 = 13/2 = 6.5
12 (3) = 8 +9 +10 = 27/3 = 9
14 (2) = 11 + 12 = 23/2 = 11.5
15 (3) = 13 +14 +15 =42/3 = 14
16 (2) = 16+17 = 33/2 = 16.5
18 (1) = 18

iii)Calculando Uc

n1 (n1  1) 9(9  1)
U1 = n1n2 +  R1 = 9*9 +  91.5 = 34.5 (escogido *)
2 2

n2 (n2  1) 9(9  1)
U1 = n1n2 +  R2 = 9*9 +  79.5 = 46.5
2 2

(*Para comparar con Ut se escoge el que arroje menor valor como resultado)

iv) Calculando Uα,n1, n2 : (Tabla A5iv)

Uα,n1,n2 = U0.05, 9,9 = 17

v) Estrategia de decisión

Uc ≤ Uα Se acepta la Ha (Para todo valor de probabilidad (α) igual o menor que 0.05, es
decir, se acepta Ha y se rechaza Ho.

Uc > Uα Se acepta la Ho (Para todo valor de probabilidad (α) mayor que 0.05, se
acepta Ho y se rechaza Ha.

Rpta: para el caso:

Como: Uc > Uα se acepta la Ho es decir no hay ninguna


diferencia entre los dos métodos.
Ejemplo 2:

Un experimentador utiliza dos métodos para enseñar a leer a un grupo de 10 niños de


6 años, quienes ingresan por primera vez a la escuela. El experimentador quiere
demostrar que el procedimiento ideado por él es más efectivo que el tradicional; para
ello, mide el desempeño en la lectura en función de la fluidez, comprensión, análisis
y síntesis.

El plan experimental preliminar consiste en elegir al azar tanto una muestra de 10


niños como el método por utilizar.

Elección de la prueba estadística. El modelo experimental tiene dos muestras


independientes. Las mediciones revelan que no se satisfacen los requisitos para
utilizar una media aritmética, en razón de que uno de los valores en cada muestra se
aleja demasiado de las demás; por lo tanto, no corresponde a una escala de intervalo,
de manera que se decide usar una escala ordinal.

Planteamiento de la hipótesis.

Ho: Las diferencias observadas entre las calificaciones de ejecución de lectura


mediante los dos métodos se deben al azar.

Ha: Las calificaciones de ejecución de lectura, según el método de enseñanza del


experimentador son más altas y diferentes que las observadas en el método
tradicional.

Dos métodos diferentes aplicados en dos grupos de niños.

Aplicación de la prueba estadística

De acuerdo con los paso, las observaciones se deben ordenar en rangos del menor al
mayor.

Rangos de lectura de la tabla anterior.

Calculamos la U.
De los dos valores de U calculados, se elge el más pequeño (4) y se comparan con
los valores críticos de U Mann-Whitney.

En caso de que el valor de U calculado no se localice en las tablas correspondientes,


se transformará en la fórmula siguiente:

U = n1n2 - U'

En esta fórmula, U' corresponde al valor más alto.

Decisión.
A la probabilidad del valor U de Mann-Whitney, calculado anteriormente,
corresponde 0.048, el cual es más pequeño que el nivel de significancia; por lo tanto,
se acepta Ha y se rechaza Ho.

Interpretación.
Entre las calificaciones de la ejecución de lectura mediante los dos métodos de
enseñanza existe una diferencia significativa a un nivel de probabilidad de error
menor que 0.05; es decir, aun cuando las muestras son pequeñas, las calificaciones
más altas mediante el método diseñado por el experimentador señalan más
efectividad, con la probabilidad de equivocarse de 0.048 para aceptarlo.

Ejemplo 3: Para muestra pequeña donde n1 y n2 son de tamaño diferente

Método A 15 14 15 15 16 14 17 12 15 12
Método B 16 15 15 15 16 14 14

Se quiere saber si existe diferencia de métodos, aun nivel de significancia de 0.05.

SOLUCIÓN

i) Planteamiento de hipótesis

Ho: µ1 = µ2 No hay ninguna diferencia entre los 2 métodos

Ha: µ1 ≠ µ2 Existe diferencia entre los dos métodos


ii) Ordenando y rangueando los resultados:

Rangueo 1.5 1.5 4.5 4.5 10 10 10 10 15 17 ∑ = 84


Método A 12 12 14 14 15 15 15 15 16 17
Método B 14 14 15 15 15 16 16
Rangueo 4.5 4.5 10 10 10 15 15 ∑ = 69
Cálculo adicional:
12 (2) = 1+2 = 3/2 = 1.5
14 (4) = 3+4+5+6 = 18/4 = 4.5
15 (7) = 7+8+9+10+11+12+13 = 70/7 = 10
16 (3) = 14+15+16 = 45/3 = 15
17 (1) = 17

iii)Calculando Uc

n1 = 7
n2 = 10
n1 (n1  1) 10(10  1)
U1 = n1n2 +  R1 = 10*7 +  84 = 41
2 2

n2 (n2  1) 7(7  1)
U1 = n1n2 +  R2 = 10*7 +  69 = 29
2 2

iv) Calculando Uα,n1, n2 : (Tabla A5iv)

Uα,n1,n2 = U0.05,10,7 = 14

v) Estrategia de decisión

Como: Uc (29) > Uα (14) no hay ninguna influencia entre los


dos métodos, a nivel de significancia de 0,05.

Ejemplo 4: Para muestra es mayor a 25 y donde n1 y n2 pueden ser iguales o de


un tamaño diferente:

El experimentador previo, entusiasmado por las observaciones preliminares, decide


aumentar el tamaño de las muestras. En este estudio tiene 10 niños con el método
tradicional y 25 mediante el procedimiento ideado por él. Los datos del nuevo
estudio se muestran en la tabla más adelante.

Elección de la prueba estadística.

El diseño experimental tiene dos muestras independientes. Las mediciones en esta


condición quizá no impidan utilizar una prueba paramétrica, sin mebargo, para fines
de aprendizaje, se decide utilizar una escala ordinal y continuar con la prueba de U
de Mann-Whitney.

Planteamiento de la hipótesis.

 Hipótesis alterna (Ha). Las calificaciones aportadas por el método reciente, ideado
por el experimentador, son diferentes y con valores más altos.
 Hipótesis nula (Ho). Las diferencias entre las calificaciones dadas por ambos
métodos se deben al azar.

Población de niños de 6 años a los cuales se les aplicó dos métodos de enseñanza.

Aplicación de la prueba estadística.


Primero ordenamos los rangos de todas las observaciones.

Dirección de las ligas o empates y el tamaño de estas.

Calculamos la U.
Tomando en cuanta los pasos, nos menciona que cuando la muestra es mayor que 25,
se distribuye normalmente, por lo cual se determina el valor Z para conocer la
probabilidad. Esto se calcula como sigue:

Donde:
Z = valor estadístico de la curva normal.
U = cualquier valor de U calculado (ya sea U1 o U2).
= valor promedio de U.
U = desviación estándar de U.

Calculamos el valor promedio de U ( ):

La desviación estándar de U de determina de la forma siguiente:

Donde:
U = desviación estándar de U.
n1 y n2 = tamaño de la muestra de los
grupos 1 y 2.
N = tamaño total de la muestra (la suma de
n1 y n2).
Li = sumatoria de las ligas o empates.

El cálculo de Li se realiza de la siguiente manera:

Una vez obtenida la sumatoria de Li, se detemrina la desviación estándar de U (U)


mediante la expresión siguiente:

Una vez calculados los parámetros necesarios, se obtiene el valor Z conforme la


siguiente fórmula:
Para obtener la probabilidad del valor Z de 1.95, se debe consultar la tabla de tamaño
de la muestra en función de los valores d y buscar la hilera 1.9, en cuya columna 0.05
se localiza el número 0.0256, que corresponde a la probabilidad del valor de U con
respecto al promedio. Esto quiere decir que es menor que el nivel de significancia.

Decisión.
A la cifra de Z de 1.95 le corresponde una probabilidad menor que 0.05, por lo cual
se acepta Ha y se rechaza Ho (tabla de probabilidades asociadas en valores extremos
como los de 2 en la distribución normal).

Interpretación.
El experimentador, al aumentar su muestra, confirma la investigación preliminar con
una muestra pequeña, con lo cual da a entender que los resultados logrados con el
método ideado por él son diferentes de los obtenidos con el método de enseñanza de
lectura tradicional; además, este último revela calificaciones más bajas y es menos
efectivo que el otro.

La efectividad del método ideado por el experimentador se traduce en mayor fluidez


de la lectura, mejor comprensión y análisis y síntesis superior, en razón de que las
calificaciones finales son consecuencia de estas condiciones.

2.8 PRUEBA DE KRUSHAL Y WALLIS

En estadística, la prueba de Kruskal-Wallis (de William Kruskal y W. Allen


Wallis) es un método no paramétrico para probar si un grupo de datos proviene de la
misma población. Intuitivamente, es idéntico al ANOVA con los datos reemplazados
por categorías. Es una extensión de la prueba de la U de Mann-Whitney para 3 o más
grupos.

Ya que es una prueba no paramétrica, la prueba de Kruskal-Wallis no asume


normalidad en los datos, en oposición al tradicional ANOVA. Si asume bajo la
hipótesis nula que los datos vienen de la misma distribución. Una forma común en
que se viola este supuesto es con datos heterocedásticos.

Método
1. Ordenar todos los datos de la muestra de menor a mayor, y asignar al menor un
rango de 1, al segundo un 2, y así hasta el n-ésimo. Si existen datos que se repiten,
se asigna el rango promedio a cada uno de ellos (si existen cuatro datos idénticos
que ocupan los rangos 11, 12, 13 y 14, se les asigna un rango de 12,5 a los
cuatro).

2. El estadístico está dado por:, donde:


o ng es el número de observaciones en el grupo g
o rij es el rango (entre todas las observaciones) de la observación j en el
grupo i
o N es el número total de observaciones entre todos los grupos

o es el promedio de rij.

Note que el denominador de la expresión para K es exactamente

2
12 Rj
Luego la fórmula general es: HC =   3( N  1)
N ( N  1) n j

3. Se puede realizar una corrección para los valores repetidos dividiendo K por:

Donde G es el número de grupos de diferentes rangos repetidos, y ti es el número


de observaciones repetidas dentro del grupo i que tiene observaciones repetidas
para un determinado valor. Esta corrección hace cambiar a K muy poco al menos
que existan un gran número de observaciones repetidas.

4. Finalmente, el p-value es aproximado por . Si algún ni es


pequeño ( < 5) la distribución de K puede ser distinta de la chi-cuadrado.

Ejemplo 1

Le empresa maravilla siglo XXI, recluta y contrata personal para su equipo gerencial
en tres universidades diferentes.

Se dispone de las calificaciones de desempeño en muestras independientes de cada


una de las universidades.

Se dispone de calificaciones de 10 aspirantes de la Universidad A, 7 de Universidad


B y 11 de la Universidad de 11.

La calificación de cada gerente está en escala de 0 a 20. El límite superior es la


máxima nota.

Copiar la tabla
Universidad A Universidad B Universidad C
12 14 14
12 14 14
14 15 15
14 15 15
15 15 15
15 16 16
15 16 16
15 16
16 17
17 17
17

Determinar si las tres Universidades son idénticas en cuanto a las evaluaciones


de desempeño.

SOLUCION
i) Planteamiento de hipótesis
  : Las tres Universidades no son idénticas en cuanto a las evaluaciones de
desempeño.
  : Las tres Universidades son idénticas en cuanto a las evaluaciones de
desempeño.

ii) Ordenando los datos en forma ascendente,, asignado rangos correspondientes


y sumando los rangos de las columnas:

 Cálculo adicional

12 (2) = 1+2 = 3/2 = 1.5


14 (6) = 3+4+5+6+7+8 = 33/6 = 5.5
15 (10) = 9+10+11+12+13+14+15+16+17+18 = 135/10 = 13.5
16 (6) = 19+20+21+22+23+24 = 129/6 = 21.5
17 (4) = 25+26+27+28 = 106/4 = 26.5

UA RANGUEO UB RANGUEO UC RANGUEO


12 1.5 14 5.5 14 5.5
12 1.5 14 5.5 14 5.5
14 5.5 15 13.5 15 13.5
14 5.5 15 13.5 15 13.5
15 13.5 15 13.5 15 13.5
15 13.5 16 21.5 16 21.5
15 13.5 16 21.5 16 21.5
15 13.5 ∑ 94.5 16 21.5
16 21.5 17 26.5
17 26.5 17 26.5
∑ 116 17 26.5
∑ 195.5
iii) Calculando Hc

n1 = 10
n2 = 7
n3 = 11
N = 28

2
12 Rj
Hc =   3( N  1)
N ( N  1) n j

12 116 2 94.5 2 195.5 2


Hc = (   )  3(28  1)  3.09
28(28  1) 10 7 11

iv) Calculando X 2 (Tabla A3):


X 2 = X 02.05,(31)  X 02.05, 2  5.99

v) Estrategia de decisión:

Hc < X 2 Se acepta la HO, y se recha la Ha, es decir, que la µ1 = µ2 = µ3 = … = µi


son iguales

Hc > X 2 Se acepta la HA y se rechaza la Ho, es decir, que las µ1 ≠ µ2 ≠ µ3 ≠ … ≠


µi no son iguales

Rpta:

Como: Hc (3.09) < X 2 (5.99), Se acepta la HO, y se recha la Ha, es decir, que el
promedio de las notas es igual en las 3 Universidades.

2.9 REGRESION Y CORRELACIÓN


Cuando tratamos con muestras bivariantes cuantitativas, es decir, con muestras
donde en cada unidad estadística se observan dos características cuantitativas de X i
Y; por ejemplo, peso y talla. Se trata de estudiar la asociación entre las dos variables
conocida también como asociación o correlación lineal simple.

El análisis de regresión consiste en emplear métodos que permitan determinar la


mejor relación funcional entre dos o más variables concomitantes (o relacionadas), y
el análisis de correlación, el grado de asociación de las mismas. Es decir; no sólo se
busca una función matemática que exprese de que manera se relacionan, sino
también con que precisión se puede predecir el valor de una de ellas si se conoce los
valores de las variables asociadas.

La primera forma del estudio de la asociación entre las variables X i Y es la


REGRESIÓN, que consiste en determinar una relación funcional ente ellas, con el
fin de que se pueda predecir el valor de una variable en base a la otra. La variable
que se va predecir se denomina (dependiente) y la variable que es la base de la
predicción, variable independiente.

La segunda forma del estudio de la asociación entre las variables X i Y, es


denominada CORRELACIÓN, que consiste en determinar la variación conjunta de
las variables, su grado de relación, y su sentido (positivo o negativo). La medida de
grado de relación se denomina coeficiente o índice de correlación.

X Y
Causa Efecto

Variable independiente Variable dependiente

Cuando la tendencia es creciente, la línea de regresión es (+) en cuanto a su


pendiente (m = +):

m=+

Cuando la tendencia es decreciente, la línea de regresión es (-) en cuanto a su


pendiente (m = +):

m=-

ESTRATEGIA DE DECISÓN:

a. Si r se acerca más a cero (0), no existe relación o correlación en la variable


independiente (X) y la variable dependiente (Y).
b. Si r se acerca más a uno (1), si existe relación o correlación en la variable
independiente (X) y la variable dependiente (Y).

Ejemplo 1:

En un estudio de la relación entre la publicidad por radio y las ventas de un producto,


durante 10 semanas se han recopilado los tiempos de duración en minutos de la
publicidad por semana (X), y el número de artículos vendidos (Y), resultando:
X Y
20 50
30 73
30 69
40 87
50 108
60 128
60 135
60 132
70 148
80 170

a) Trazar el diagrama de dispersión, e indicar la tendencia


b) Calcular la recta de regresión con el fin de predecir las ventas
c) Calcular el coeficiente de correlación
d) Si en la novena semana se incrementara la publicidad en 5 minutos, determine en
cuanto se estima se incrementen las ventas.

SOLUCIÓN

a) Trazando el diagrama de dispersión:

1. Buscando el primer punto técnico de la línea de regresión:

X Y XY X Y
20 50 1000 400 2500
30 73 2190 900 5329
30 69 2070 900 4761
40 87 3480 1600 7569
50 108 5400 2500 11664
60 128 7680 3600 16384
60 135 8100 3600 18225
60 132 7920 3600 17424
70 148 10360 4900 21904
80 170 13600 6400 28900
ΣX = 500 ΣY = 1100 ΣXY = 61800 ΣX² = 28400 ΣY² = 134660

X i 20  30  30  40  ...  80 500
X     10 (para eje X)
x n 10 10

Yi 50  73  69  87  ...  170 1100


Y     110 (para eje Y)
x n 10 10
2. Buscando el segundo punto técnico de la línea de regresión:

Y  a  bx

nxy  (y )(x)


b
nx 2  (x) 2
x 2 y  (x)(xy )
a
nx 2  (x) 2

(28400)(1100)  (500)(61800) 340,000


a   10
10(2840)  (500) 2 34,000

10(61800)  (1100)(500) 68000


b  2
10(28400)  (500) 2 34000

Entonces: Y  a  bx

110  a  2(50)
110 100  a
a = 10
Y  10  10 x

b) Cálculo de la recta de regresión con el fin de predecir las ventas:


Y  10  10 X

180
170
160
150
140
130
120
110

90

80

100

70

60
50
40
30
20
10
10 20 30 40 50 60 70 80 90 100

Existe una relación positiva entre el número de artículos vendidos y el tiempo


de publicidad semanal por radio.

c) Cálculo del coeficiente de correlación:

nxy  (x)(y )
r
nx 2

 (x) 2 ny 2  (y) 2 

(10)(61,800)  (500)(1100)
r  0.998 altamente positivo
(10)(28,400)  (500) (10)(134,660)  (1100) 
2 2

Como r ≥ 0.5, entonces existe alta correlación entre las horas de publicidad (X)
y el número de artículos vendidos (Y).

d) El valor estimado de las ventas en la novena semana es:

Y 9  10  2(70)  150
Si en la 9na semana se incrementara el tiempo de publicidad en 5 minutos,
entonces, la venta estimada sería:

Sí Xi incrementa en k, entonces la fórmula es:  Yi = bk

Sí Xi incrementa  5, entonces  Yi = 2(5) = 10

RPTA: 150 +10 = 160

Ejemplo 2:

Se supone que se puede establecer cierta relación lineal entre las exportaciones de un
país y la producción interna de dicho país. En el caso del Perú, tenemos los datos
anuales (expresados en millones de soles) para tales variables correspondientes al
quinquenio 2005-2009 en la siguiente tabla:

AÑOS PRODUCCIÓN EXPORTACIÓN


2005 52.654 10.420
2006 53,972 11.841
2007 57.383 14.443
2008 61.829 16.732
2009 65.381 18.760

a) Hallar el coeficiente de correlación


b) Calcular el coeficiente de regresión
c) Trazar la línea de regresión

SOLUCIÓN

a) Trazando el diagrama de dispersión:

1. Buscando el primer punto técnico de la línea de regresión:

X Y XY X2 Y2
52.654 10.420 548.654680 2772.443716 108.576400
53,972 11.841 639.082452 2912.976784 140.209281
57.383 14.443 828.782669 3292.808689 208.600249
61.829 16.732 1034.522828 3822.825241 279.959824
65.381 18.760 1226.547560 4274.675161 351.937600
291.219 72.196 4277.532257 17075.72959 1089283354

X i 52.654  53.972  ...  65.381 291.219


X     58.2438
x n 5 5
Y 10.420  11.841  ...  18.760 72.196
Y  i    14.4392
x n 5 5

2. Buscando el segundo punto técnico de la línea de regresión:

Y  a  bx
nxy  (y )(x)
b
nx 2  (x) 2
x 2 y  (x)(xy )
a
nx 2  (x) 2
(17075.72959)(72.196)  (291.219)(4277.532257)
a  12855974.85
5(17075.70604)  (291.219) 2
5(4277.532257)  (72.196)(291.219)
b  220726.6767
5(17075.72959)  (291.219) 2

Entonces:

Y  a  bx
14.4392  a  220726.6767(58.2438
14.4392  12855960.41  a
a = 12855974.84
Y  12855974.84  220726.6767 x

b) Cálculo de la recta de regresión:

Y  12855974.84  220726.6767 X

19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
10 20 30 40 50 60 70 80 90 100

Existe una relación positiva entre la producción y las exportaciones.


e) Cálculo del coeficiente de correlación:

nxy  (x)(y )
r
nx 2

 (x) 2 ny 2  (y) 2 

(5)(3639146819)  (237.301)(72.196)
r  noesposiblecalular
(5)(84808.506)  (291.219) (5)(1089283354)  (72.196) 
2 2

Ejemplo 3:

En un nuevo proceso artesanal de fabricación de cierto artículo que está implantado,


se ha considerado que era interesante ir anotando periódicamente el tiempo medio
(medido en minutos) que se utiliza para realizar una pieza (variable Y) y el número
de días desde que empezó dicho proceso de fabricación (variable X). Con ello, se
pretende analizar cómo los operarios van adaptándose al nuevo proceso, mejorando
paulatinamente su ritmo de producción conforme van adquiriendo más experiencia
en él. A partir de las cifras recogidas, que aparecen en la tabla adjunta, se decide
ajustar una función exponencial que explique el tiempo de fabricación en función del
número de días que se lleva trabajando con ese método.

X 10 20 30 40 50 60 70
X 35 28 23 20 18 15 13

Desde el correspondiente ajuste propuesto, se pide que determine:


a) Hallar el coeficiente de correlación
b) Calcular el coeficiente de regresión
c) Trazar la línea de regresión

Ejemplo 4

Proyectar la Oferta de un cierto producto tomando en cuenta los datos obtenidos en el


estudio de mercado, ver cual de los métodos o curvas de proyección se ajusta mejor a la
nube de puntos y determinar la Oferta para los próximos diez años.

Año Tiempo (X) Oferta (Y)

2000 1 100,000

2001 2 120,000

2002 3 140,000

2003 4 110,000

2004 5 170,000

2005 6 150,000

2006 7 180,000

2007 8 200,000

2008 9 210,000

2009 10 200,000

Se observa un comportamiento exponencial

d) Hallar el coeficiente de correlación


e) Calcular el coeficiente de regresión
f) Trazar la línea de regresión.

Ejemplo 5

Una compañía de seguros considera que el número de vehículos (y) que circulan por
una determinada autopista a más de 120 km/h , puede ponerse en función del número
de accidentes (x) que ocurren en ella. Durante 5 días obtuvo los siguientes
resultados:

Accidentes (Xi) 5 7 2 1 9
Número de vehículos (Yi) 15 18 10 8 20

a) Calcula el coeficiente de correlación lineal.


b) Si ayer se produjeron 6 accidentes, ¿cuántos vehículos podemos suponer que
circulaban por la autopista a más de 120 km / h?
c) ¿Es buena la predicción?

SOLUCIÓN

Construimos una tabla, teniendo en cuenta que la frecuencia absoluta es uno.


Debemos conocer la media aritmética de las dos variables, las varianzas, las
desviaciones típicas y la covarianza.

Media aritmética Varianza Covarianza


2 2
fi x Y x y x.y
1 5 15 25 225 75
1 7 18 49 324 126
1 2 10 4 100 20
1 1 8 1 64 8
1 9 20 81 400 180
5 24 71 160 1113 409
2.10 PRUEBA DE FRIEDMAN

En estadística la prueba de Friedman es una prueba no paramétrica desarrollado


por el economista Milton Friedman. Equivalente a la prueba ANOVA para dos
factores en la versión no paramétrica, el método consiste en ordenar los datos por
filas o bloques, reemplazándolos por su respectivo orden. Al ordenarlos, debemos
considerar la existencia de datos idénticos.

Sea una tabla de datos Método


1. Donde m son las filas (bloques) y n las columnas (tratamientos). Una vez
calculado el orden de cada dato en su bloque, reemplazamos al tabla original con
otra donde el valor rij es el orden de xij en cada bloque i.

2. Cálculo de las varianzas intra e inter grupo:

o ,

o
3. El estadístico viene dado por .
4. El criterio de decisión es

Ejemplo 1:

Un investigador desea comparar los niveles de memoria en niños de 4, 6, 8, 10 y 12


años después de 3 diferentes tratamientos.

Elección de la prueba estadística

El modelo experimental tiene tres o más muestras dependientes.

Planteamiento de la hipótesis.

 Hipótesis alterna (Ha). Hay diferencia significativa en niños de 4, 6, 8, 10 y 12


años, después de aplicar 3 diferentes tipos de tratamiento.
 Hipótesis nula (Ho). No hay diferencia significativa en niños de 4, 6, 8, 10 y 12
años, después de aplicar 3 diferentes tipos de tratamiento.

Nivel de significación.

Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.

Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.

Escala = 0 - 20
Aplicación de la prueba estadística.

Transformamos los valores en rangos de acuerdo con la prueba de Friedman, en


función de las hileras. Al valor más bajo le corresponde el rango 1, respetando el
orden hasta el dato que tiene la cifra más alta.

Rango1 = 8
Rango2 = 9
Rango3 =13

Calculamos la X2r de Friedman.

Se utiliza la tabla N para pruebas pequeñas.

Con tres columnas y cinco hileras se compara el valor calculado de X2r de Friedman
con la tabla correspondiente de distribución de probabilidad. Las cifras aproximadas
al estadístico calculado 2.8 = 0.367.

Decisión.
Como el valor de X2r calculado es igual a 2.8, la probabilidad es de 0.367, esto indica
que es menor que el nivel de significancia, por lo cual, se acepta Ha y se rechaza Ho.

Interpretación.
Aceptada Ha, se acepta que entre los tres tratamientos existen distintos grados de
memoria adquirida. Se distingue notoriamente que el tratamiento A es menos eficaz,
con respecto a los otros dos tratamientos. Por otro lado, el tratamiento B ofrece
mayores ventajas para la adquisición de memoria.
UNIDAD III

MODELOS PROBABILÍSTICOS IMPORTANTES

3.1 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD

La distribución de probabilidad de una variable aleatoria describe cómo se


distribuyen las probabilidades de los diferentes valores de la variable aleatoria. Para
una variable discreta X, la distribución de probabilidad se describe mediante una
función de probabilidad, representada por f(x).

La función de probabilidad define la probabilidad de cada valor de la variable


aleatoria.

Ejemplo 1: Una industria de muebles desea determinar la cantidad y la probabilidad


de venta en un día cualquiera, a partir de los siguientes datos: durante
90 días de operación, en 15 días no se vendieron muebles, en 30 se
vendieron 3 muebles; en 8, 1, en 12, 2, en 15, 4, en 10, 6. Determine la
cantidad y la probabilidad que venda en un día cualquiera.

SOLUCION

a) Distribución de probabilidad

Q muebles X No. de días de venta Dist. Disct. de Prob. f(x)

0 15 15/90 = 0.1667
1 8 8/90 = 0.0889
2 12 12/90 = 0.1333
3 30 30/90 = 0.3333
4 15 15/90 = 0.1667
6 10 10/90 = 0.1111
1.0000

Rpta: La mayor cantidad y probabilidad que la tienda venda en un día


cualquiera es de 3 muebles con 33.33% de probabilidad. La
probabilidad que venda 3 muebles un día cualquiera es 33.33%. Lo
mínimo que pueda vender es de 1 mueble con probabilidad de
8.89%. Probabilidad de que venda 3 o más muebles en un día
cualquiera es 0.6111 (61.11%).

La probabilidad para cualquier variable discreta, debe satisfacer 3


condiciones:

F(x)  0 n = número de valores


que puede
f(x) = 1 asumir la variable
aleatoria.
f(x) = 1/n
b) Valor esperado y varianza

b.1) Valor esperado (media).- Es una medida de localización central (o


tendencia central) de una variable. La ecuación matemática del valor
esperado de una variable aleatoria discreta X es la siguiente:
E(x) =  = Xf(x)
X f(x) E(x) =  = Xf(x)
0 15/90 = 0.1667 0.0000
1 8/90 = 0.0889 0.0889
2 12/90 = 0.1333 0.2667
3 30/90 = 0.3333 0.9999
4 15/90 = 0.1667 0.6668
6 10/90 = 0.1111 0.6666
1.0 2.6889

Rpta:

i) 2.6889 muebles por vender diariamente


ii) 2.6889 x 30 días mes = 80.967 muebles a vender mensualmente

b.2 Varianza.- Es un promedio ponderado de las desviaciones de una


variable aleatoria respecto a su promedio, elevadas al cuadrado, los
factores de ponderación son las probabilidades. Variabilidad de un
conjunto de datos.

2 2
 =  ( x -  ) f(x)


2 2
(X - ) (x-) ( x -  ) f(x)

0 – 2.6889 = -2.6889 7.2302 7.2302 x 0.1667 = 1.2053


1 – 2.6889 = -1.6889 2.8524 2.8524 x 0.0889 = 0.2536
2 – 2.6889 = -0.6889 0.4746 0.4746 x 0.1333 = 0.0633
3 – 2.6889 = 0.3111 0.0968 0.0968 x 0.3333 = 0.0323
4 – 2.6889 = 1.3111 1.7190 1.7190 x 0.1667 = 0.2865
6 – 2.6889 = 3.3111 10.9634 10.9634 x 0. 1111= 1.2180
3.059


2
= 3.059

b.3 Desviación estándar.-

S=  ; S 3.059 = 1.75 en promedio la venta de muebles


difieren de la media en 1,75 ventas..
Ejemplo 2: La ventanilla No. 3 de la Cooperativa Santa María
Magdalena atendió durante 30 días del mes de .......... del
año ......, con la siguiente distribución de atención: 5 días
atendió a 16 socios, 8 días a 20 socios, 10 días a 21
socios, 7 días a 25 socios. ¿Cuál es la mayor cantidad y
probabilidad que la ventanilla No. 3 atienda cualquier día
del mes? ¿Cuál es la menor cantidad y probabilidad de
atención en un día cualquiera?

SOLUCION
i) Distribución de probabilidad

Q: socios X días de atención f(x)


16 5 5/30 = 0.1667
20 8 8/30 = 0.2667
21 10 10/30 = 0.3333
25 7 7/30 = 0.2333
1.0000
Rpta:
i) La mayor cantidad de socios que atendería la ventanilla No. 3 es
de 21 socios con una probabilidad de 33.33% en un día
cualquiera.
ii) La menor cantidad de socios que atendería la ventanilla No. 3,
en un día cualquiera del mes es de 16 socios con probabilidad de
16.67%.

ii) Valor esperado  = Xf(x)


X f(x) E(x) =  =
Xf(x)

16 0.1667 2.6672
20 0.2667 5.3340
21 0.3333 6.9993
25 0.2333 5.8325
20.8330
Rpta:
i) 20.8330 socios por atender diariamente
ii) 20.8330 x 30 días mes = 624.99 = 625 socios atendidos
mensualmente

2 2
iii) Varianza.  =  ( x -  ) f(x)
(X -  )
2 2
(x -  ) ( x -  ) f(x)
16 – 20.8330 = -4.8330 23.3579 23.3579 x 0.1667 = 3.8938
20 – 20.8330 = -0.8330 0.6939 0.6939 x 0.2667 = 0.1851
21 – 20.8330 = 0.1670 0.0279 0.0279 x 0.3333 = 0.0093
25 – 20.8330 = 4.1670 17.3639 17.3639 x 0.2333 = 4.0510
8.1392
 = 8.1392
2

iv) Desviación estándar S

S =  ; S 8.1392 = 2.85 En promedio, la atención en la


ventanilla No. 3 difiere de la media
en 2,85 socios.
Ejemplo 3: Los estudiantes de la EFPAE – UNSCH, durante los 10
semestres académicos de estudio normal aprueban las
asignaturas con la siguiente distribución: 2 cursos en 2
semestres, 4 cursos en 2 semestres, 5 cursos en 3
semestres, 6 cursos en 2 semestres y 7 cursos en 1
semestre. Se desea saber la cantidad de curos y su
probabilidad que el promedio de estudiantes aprueben en
un semestre cualquiera. ¿Cuál es la cantidad y la
probabilidad que aprueben menos de 5 cursos? y ¿5 o
más cursos?

SOLUCION

i) Distribución de probabilidad

Q: socios X días de atención f(x)


2 2 2/10 = 0.2
4 2 2/10 = 0.2
5 3 3/10 = 0.3
6 2 2/10 = 0.2
7 1 1/10 = 0.1
 10

Rpta:
i) La mayor cantidad de cursos que aprobaría el promedio de los
estudiantes de EFPAE es 5 cursos con probabilidad de 30%.
ii) Que apruebe menos de 5 cursos es de 40%.
iii) Que apruebe 5 o más es 60%.

ii) Valor esperado  = Xf(x)

X f(x) E(x) =  = Xf(x)


2 0.2 0.4
4 0.2 0.8
5 0.3 1.5
6 0.2 1.2
7 0.1 0.7
4.6
Rpta:

i) 4.6 Cursos aprobados por semestre


ii) 4.6 x 10 = 46 cursos aprobados en los 10 semestres.

2 2
iii)Varianza.  =  ( x -  ) f(x)

(X -  )
2 2
(x-) ( x -  ) f(x)

2 – 4.6 = -2.6 6.76 6.76 x 0.2 = 1.352


4 – 4.6 = -0.6 0.36 0.36 x 0.2 = 0.072
5 – 4.6 = 0.4 0.16 0.16 x 0.3 = 0.048
6 – 4.6 = 1.4 1.96 1.96 x 0.2 = 0.392
7 – 4.6 = 2.4 5.76 5.76 x 0.1= 0.576
2.44

2
= 2.44

iv) Desviación estándar S

S=  ; S 2.44 = 1.562 En promedio, aprobar los cursos cada


semestre defiere de la media
en 1.562.

3.2 DISTRIBUCIÓN DE PROBABILIDAD BINOMIAL

Es una distribución discreta de probabilidad que tiene muchas aplicaciones. Se


relaciona con un experimento de etapas múltiples que llamamos binomial.

n n
   
  x ( n x )
  n!
F(x) =   P (1- p) ;   =
x x x!(n  X )!
   
   
   

a) Propiedades

1.- El experimento consiste en una sucesión de n intentos o ensayos idénticos


2.- En cada intento o ensayo son posibles dos resultados. A uno llamamos éxito y
al otro fracaso.
3.- La probabilidad de un éxito, representada por P, no cambia de un intento o
ensayo a otro. En consecuencia, la probabilidad de un fracaso, representada
por 1-P, no cambia de un intento a otro.
4.- Los intentos o ensayos son independientes

Ejemplo 1: Un agente vendedor sin experiencia, visitará un día cualquiera de la


próxima semana a 10 hogares para ofrecer un producto. Su preocupación
es vender en todos los hogares visitados. Supongamos que le interesa la
cantidad de ventas en los 10 hogares. ¿Tiene este experimento las
propiedades de un experimento binomial? ¿Cuál es la variable aleatoria
de interés?

SOLUCION

1.- El experimento consiste en 10 intentos (visitas) idénticos, y cada


intento implica ofrecer el producto en un hogar.
2.- Son posibles dos resultados para cada intento: vender o no vender.
Podemos asignar que vender el producto es un éxito y no vender el
producto un fracaso.
3.- La probabilidad de vender y probabilidad de no vender son iguales
para cada intento, siendo P = 0.5 y 1-P = 0.5
4.- Los intentos son independientes porque el resultado de cualquier
intento no es afectado por lo que sucede en los demás intentos.
5.- En consecuencia, la variable aleatoria de interés es la cantidad de
ventas en los 10 intentos: 0, 1, 2, ... , 10.

Ejemplo 2: Si consideramos la información del ejemplo anterior (1), con el agregado:


de acuerdo con su experiencia el vendedor sabe que la probabilidad que
un hogar visitada compre el producto es de 0.30. Comprobar si se
satisfacen las propiedades de un experimento binomial.

SOLUCION

1. Idem
2. Idem
3. La probabilidad de una compra y no compra son iguales para cada
visita, siendo P = 0.30, 1- P = 0.70.
4. Las visitas son independientes, por que las familias se seleccionan
aleatoriamente.
5. Idem la variable aleatoria.

Ejemplo3: Una tienda que vende muebles está preocupado en la decisión de compra
de las 6 personas que ingresan a la tienda. De acuerdo con su experiencia,
el vendedor de la tienda estima que la probabilidad de que cualquier
persona que ingresa a la tienda compre es de 0.15. ¿Cuál es la
probabilidad que 3 de las siguientes 6 personas que ingresen a la tienda
hagan una compra?

n n
   
  x ( n x )
  n!
F(x) =  x  P (1- p) ;   =
x x!(n  x)!
   
   
   

SOLUCION

0 6
Ningún cliente haga la compra f(x = 0) =
6!
0.15 0.85 = 0.377
0!6!

1 5
Exactamente un cliente haga la compra f(x =1) =
6!
0.15 0.85 = 0.399
1!5!
2 4
Exactamente 2 clientes hagan la compra f(x =2) =
6!
0.15 0.85 = 0.176
2!4!

Exactamente 3 clientes hagan la compra f(x =3) =


6!
0.153 0.85 3
= 0.041
3!3!

Exactamente 4 clientes hagan la compra f(x =4) =


6!
0.15 4 0.85 2
= 0.0055
4!2!

Exactamente 5 clientes hagan la compra f(x=5) =


6!
0.155 0.85 1
= 0.0004
5!1!

Exactamente 6 clientes hagan la compra f(x=6) =


6!
0.15 6 0.85 0 = 0.000011
6!0! 1.00000

El valor esperado y varianza para distribución de probabilidad binomial:

Valor esperado  E(x) =  = np  np = 6 x 0.15 = 0.90

Varianza   2 = np (1 – p)   2 = 6 x 0.15(1- 0.15) = 0.765

Desviación estándar   = np(1  p) = 6 x0.15(1  0.15) = 0.8746

Ejemplo 4: Un supervisor de control de calidad está preocupado de la cantidad de


unidades defectuosas en un lote de 50 productos. Los datos históricos
arroja que un producto cualquiera resulte defectuosa tiene una
probabilidad de 2%. ¿Cuál es la probabilidad que 5 unidades de las 50
que conforman el lote resulten con defecto?

Datos:
n = 50
X=5
P = 2%
(1-P) = 98%
f(x=5) =
50!
0.025 0.9845 = 0.0027  0.27%
5!45!

3.3 DISTRIBUCIÓN DE PROBABILIDAD HIPERGOEMÉTRICA

Con la distribución hipergeométrica, los intentos no son independientes, ya que la


probabilidad de éxito cambia de un intento a otro. Se usa para calcular la
probabilidad de que, en una muestra aleatoria de n artículos, seleccionados sin
reemplazo, obtengamos X elementos identificados como éxito y n – X
identificados como fracaso. Para que suceda esto debemos obtener X éxitos de los r
en la población, y n – X fracasos de los N – r de la población.

r   N  r
   
  
x n  x 
F(x) = ---------------------------------
N
 
n 

F(x) = Probabilidad de x éxitos en n intentos


n = Número de intentos
N = Número de elementos en la población
r = Número de elementos identificados como éxito en la población

N
 
 n  = Representa la cantidad de formas en que se puede seleccionar una

muestra de tamaño n de una población de tamaño N.


 r
  = Representa la cantidad de maneras en que se puede seleccionar X
 x
éxitos de un total de r éxitos de la población
N  r
  = Representa la cantidad de maneras en que se pueden seleccionar
n  x 
n – x fracasos de un total de N – r fracasos en la población.

r
r = Exitos
X = Exitos

n – x = Fracasos
N – r = Fracasos

Ejemplo 1: La Municipalidad Provincial de Huamanga desea seleccionar 4


funcionarios de los 12 con que cuenta, para que asistan a un curso
de capacitación a la ciudad de Lima los funcionarios están
formados de 7 mujeres y 5 varones. El problema consiste
determinar la probabilidad de seleccionar 4 mujeres al azar.

Datos:
n=4
N = 12
r=7
X = 4 mujeres sean seleccionadas.

N =12 n=4

r=7
X=4

n-x = 0
N-r = 5

7 5  7!   5! 
       
 4 0  4!3!  5!0!
F(4) = ------------- = ----------------- = 0.071
12  12! 
   
4   4!8!

Ejemplo 2: El Alcalde decide que deben viajar 6 personas manteniendo las 4


mujeres.
Datos:
n=6
N = 12
r=7
X = 4 mujeres sean seleccionadas.

7 5  7!   5! 
       
 4  2  4!3!  2!3!
F(6) = ------------- = ----------------- = 0.38
12  12! 
   
6   6!6!

Ejemplo3: A un Hotel de la ciudad de Ayacucho acuden 15 posibles clientes


diariamente, 8 se quedan a alojarse y los 7 restantes no. ¿Cuál es la
probabilidad de que en una muestra aleatoria de tamaño 5, 3 no se
alojen?

Datos:
n=5
N = 15
r=7
X = 3 no se alojen

 7  8   7!   8! 
       
3   2  3!4!  2!6!
F(3) = ------------- = ----------------- = 0.33
15  15! 
   
5   5!10!

3.4 DISTRIBUCIÓN DE PROBABILIDAD DE POISSON

Se usa con frecuencia para estimar la cantidad de ocurrencia en determinado intervalo


de tiempo o espacio.

Propiedades:

1. La probabilidad de una ocurrencia es igual en 2 intervalos cualesquiera de igual


longitud
2. La ocurrencia o no ocurrencia en cualquier intervalo es independiente de la
ocurrencia o no en cualquier otro intervalo.
F(x) = probabilidad de x ocurrencias en un
intervalo.
 x e   = Valor esperado o cantidad promedio
F(x) = ; e = 2.71828 de ocurrencias en un intervalo
X! e = 2.71828
X = 1,2,3, ........ aleatoria discreta.

Ejemplo1: El gerente de la Cooperativa Santa María Magdalena está interesado en el


número de llegadas a las ventanillas de caja, durante un periodo de 60
minutos en las mañanas de los días hábiles. El análisis de datos históricos
arroja que en promedio llegan 18 personas en 1 hora. Desea saber la
probabilidad que lleguen 10 en 60 minutos.

18 e 18
10

a) F(10) = = 0.015
10!

1815 e 18
b) F(15) = = 0.079  7.86%
15!

18 5 e 18
c) F(5) = = 0.00024  0.024%
5!
La probabilidad que exactamente llegue 10 personas en 60
minutos es de 0.015  1.5%
Ejemplo 2: Un operador de moto taxi está interesado en la cantidad de pasajeros que
suben a su unidad, durante 4 horas de recorrido diario. De acuerdo con
un sondeo empírico suben 15 personas en 1 hora. Desea saber la
probabilidad que exactamente 10 personas ocupen u servicio en 1 hora.

15 e 15
10
Es la probabilidad que exactamente 10
F(10) = = 0.04861  4.86% personas ocupen su servicio en una hora.
10!

3.5 DISTRIBUCIÓN NORMAL


Permite tener una descripción de los resultados probables obtenidos mediante el
muestreo. Tiene variedad de aplicaciones prácticas: altura y peso de las personas,
puntuaciones de examen, mediciones científicas, precipitaciones, etc.

a) Función de densidad:
1
x e ( xu ) / 2
2 2
F(x) =
 2
99.21%
95.44%
68.26

 = media
 = desviación estándar
 = 3.14159
Desviación 
e = 2.71828

 -3  - 2  -1   +1  +2  +3

Características:

1. La familia completa de distribuciones de probabilidad normales se diferencia


por su (µ) y su desviación estándar (ơ)
2. El punto más alto de la curva normal es la media, que también es la mediana y
la moda de la distribución.
3. La media de la distribución puede ser cualquier valor numérico: negativo, cero
o positivo.

-10 0 20
4. La distribución de probabilidad normal es simétrica, y su forma a la izquierda
de la media es una imagen especular de la forma a la derecha de la media. Las
colas, es decir, los extremos o los lados de la curva se prolongan al infinito en
ambas direcciones y, teóricamente, nunca tocan el eje horizontal.

5. La desviación estándar determina el ancho de la curva. A valores mayores de la


desviación estándar se tienen curvas más anchas y bajas, que muestran una
mayor disposición en los datos. A continuación vemos dos distribuciones
normales con el mismo promedio, pero con distintas desviaciones estándar.
=5

 = 10

6. Las probabilidades para la variable aleatoria normal están dadas por áreas bajo
la curva. El área total bajo la curva para la distribución de probabilidad normal
es 1 ( esto se cumple para todas las distribuciones continuas de probabilidad).
Debido a que la distribución es simétrica, el área total bajo la curva a la
izquierda de la media es 0,50 y el área total bajo la curva a la derecha de la
media es 0.50.

7. El porcentaje de valor en algún intervalos de uso común es:

a. 68.26% de los valores de una variable aleatoria normal están dentro de más
o menos una desviación estándar de su media.
b. 95.44% de los valores de una variable aleatoria normal están dentro de más
o menos dos desviaciones estándar de su media.
c. 99.72% de los valores de una variable aleatoria normal están dentro de más
o menos tres desviaciones estándar de su media.

2.5.1 Distribución de Probabilidad Normal Estándar.- Cuando una variable aleatoria


admite una media (µ) cero (0) y desviación estándar (ơ = 1). Los cálculos de
probabilidad con cualquier distribución normal se llevan a cabo determinando
las áreas bajo la gráfica de la función de densidad de probabilidad. Para
determinar la probabilidad de que una variable normal esté dentro de un
intervalo específico, debemos calcular el área bajo la curva normal en ese
intervalo. Para la distribución de probabilidad normal estándar se han
determinado las áreas bajo la curva normal, y se muestran en tablas para
calcular las probabilidades.

Ejemplo 1: P(0.00  Z  1.00) = ?

P(0.00  Z  1.00) = ?

Utilizando la tabla Z:
1.0
 P(0.00  Z  1.00) = 0.3413
0.00

Ejemplo 2: P(0.00  Z  1.27) = ?

P(0.00  Z  1.27) = ?

0 1.27

Utilizando la tabla Z:

1.2
 P(0.00  Z  1.27) = 0.3980
0.07
Ejemplo 3: P(- 2.5  Z  2.5) = ?

P(- 2.5  Z  2.5) = ?

-2.5 0 2.5

Utilizando la tabla Z:

2.5
 0.4938; P(-2.5  Z  2.5) = 0.4938 x 2 = 0.9876
0.00

Ejemplo 4: P(- 2.75  Z  2.75) = ?


P(- 2.75  Z  2.75) = ?

Z Z

-2.75 0 2.75

Utilizando la tabla Z:

2.7
0.4970; P(- 2.75  Z  2.75) = 0.4970 x 2 = 0.9940
0.05

Ejemplo 5: P(Z  1.49) = ?

P(Z  1.49) = ?

0 1.49

0.5 0.5

1.00
Utilizando la tabla Z:

1.4
 P(Z  1.49) = 0.4319
0.09

Entonces: P(Z  1.49) = 0.5000 – 0.4319 = 0.0681

Ejemplo 6: P(Z  - 0.50) = ?

P(Z  - 0.50) = ?

1 0.5 0 1.49

Utilizando la tabla Z:
0.5
 P(Z  - 0.50) = 0.1915
0.00

Entonces: P(Z  - 0.50) = 0.5000 + 0.1915 = 0.6915

Ejemplo 7: P(1.00  Z  1.58) = ?

P(1.00  Z  1.58) = ?

0 1 1.58

Utilizando la tabla Z:

1.0
 0.3413
0.00

1.5
 0.4429
0.08
Entonces: P(1.00  Z  1.58) = 0.4429 - 0.3413 = 0.1016

Ejemplo 8: Determinar el valor de Z tal que la probabilidad de obtener un


valor mayor sólo sea de 0.10. ¿Cuál es el valor de Z?

Probabilidad o área = 0.1000

i) 0.5000 – 0.1000 = 0.4000 (buscar en la tabla).


ii) Utilizando la tabla Z:

1.2
 Valor aproximado a 0.4000 = 0.3997 
P(Z  1.28) 0.08

Ejemplo 9: Determinar el valor de Z tal que la probabilidad de obtener un


valor menor sólo sea de 0.5571.

Probabilidad o área = 0.5000


0 0.55571

Entonces: 1.000 – 0.5571 = 0.4429 (buscar en la tabla)  P(Z


 1.58)

Ejemplo 10: Un Ingeniero mecánico acaba de implementar una planta de


cambio de combustión para motores de vehículos gasolineras a
gas. Como el servicio es nuevo, el ingeniero cree que la garantía de
Km recorridos será un factor importante en la demanda del
servicio. Entonces, antes de entrar con fuerza a esta política de
servicio el ingeniero desea saber acerca de Km que durará el gas de
18 libras.
De acuerdo con otras experiencias se estima que el
promedio de Km recorridos es de 120 Km y su desviación estándar
50 km. ¿Qué porcentaje de galones de gas se puede esperar que
sobrepasen 150 Km?
SOLUCION

i) Cuando nos encontramos con una distribución normal con media


(µ) y desviación estándar (ơ); primero convertimos a una
distribución normal estándar y luego utilizamos la tabla
correspondiente.

ii) La fórmula para cualquier variable aleatoria normal (x) con


media (µ) y desviación (ơ) es:
X 
Z=

iii)

P(X  150) = ?
120 150

a. Cuando X = 150

150  120
Z= = 0.6
50

b) Buscar 0.6 en la tabla

0.6
 0.2257
0.00

P(X  150) = 0.5000 – 0.2257 = 0.2743 es la probabilidad de


que X sea mayor de 150 km. El 27.43% de los galones durará
más de 150 Km.

3.6 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD

3.6.1 DISTRIBUCIONES DE PROBABILIDAD UNIFORME.- Siempre que la


probabilidad sea proporcional a la longitud del intervalo, la variable tiene
distribución uniforme.

Ejemplo: El tiempo de viaje de la Empresa Molina Unión de la Ciudad de


Ayacucho a Lima es en el intervalo de 8 a 12 horas.
P(x) = ab
P (a  X  b)
A b
1
f(x) = ; para a  X  b Intervalo de
tiempo (b –a ) ba

1
Aplicando A x H  f(x) = (b – a) ; para a 
ba
X b

b) ¿Cuál es la probabilidad de que el viaje se haga entre 8 y 11


horas?

i) Ancho del intervalo 11 – 8 = 3


1
( )
12  8
1 1
Función densidad =
12  8 4
1 3
ii) P(8  X  11) = 3 ( )= = 0.75 ( 11 – 8) = 3
4 4

Valor esperado:

(a  b) (8  11)
Ve =  = = = 9.5 horas de viaje
2 2

Varianza:

(b  a) 2 (11  8) 2
2  = 2  = 0.75
12 12

Desviación estándar:

(b  a) 2 (11  8) 2
   0.866 minutos
12 12

c) ¿Cuál es la probabilidad de que el viaje se haga entre 9 y 10


horas?
i) Ancho del intervalo 10 – 9 = 1

1 1
Función densidad =
12  8 4
1 1
ii) P(9  X  10) = 1 ( )= = 0.25
4 4
d) ¿Cuál es la probabilidad que el viaje se haga entre 10 y 12
horas?

i) Ancho del intervalo 12 – 10 = 2

1 1
Función densidad =
12  8 4
1 2
ii) P(10  X  12) = 2 ( )= = 0.5
4 4

e) ¿Cuál es la probabilidad que el viaje se haga entre 8 y 9 horas?

i) Ancho del intervalo 9 – 8 = 1


1 1
Función densidad =
12  8 4

1 1
ii) P(8  X  9) = 1 ( )= = 0.25
4 4

3.6.2 DISTRIBUCIONES DE PROBABILIDAD EXPONENCIAL.- Una


distribución continua de probabilidad que es útil para describir el tiempo que
se tarda en realizar una actividad es la distribución de probabilidad
exponencial. Usado para describir cosas tales el tiempo entre llegadas de
clientes de un banco, comercio, restaurantes, hoteles, distancia de defectos en
la carretera, proceso de producción, etc.
x
1
i) Función de densidad f(x) = (e)  ; para X  0,   0

iii) Distribución exponencial: probabilidades acumuladas

X

P( X  X 0 ) = 1- e

Ejemplo: Sí X = tiempo que demora un cliente en caja de un banco


Sí el tiempo promedio para la atención es 2 minutos ()

Entonces: Cuál es la probabilidad que la atención sea de 1.5 minutos o menos.

1 . 5

P( X  1.5) = 1- e 2
= 0.5276 (52.76%  53%) es la
probabilidad que la atención a un cliente dure 1.5 minutos.

EJERCICIOS DE REPASO
1.- Identifique Ud. los siguientes enunciados si corresponde a Estadística Descriptiva o
Inferencial:

a. El analista de crédito de la Cooperativa Santa María Magdalena determina que de


los 10,000 socios prestatarios el 15% son morosos.

b. Un fabricante de alimentos balanceados muestrea a un grupo de clientes para


recabar información sobre la calidad de nutrientes que contiene su producto.

c. De los 75,00 habitantes de la ciudad de Huamanga 51.5% son mujeres, 32%


jóvenes de 12 a 20 años y 12% niños.

d. La dirección de EFPAE determinó los factores de bajo rendimiento de los


estudiantes a partir de un estudio del 25% de ellos.

e. De todos los problemas empresariales, el 80% son generados por la alta dirección,
en cualquiera empresa.

f. De una selección de 100 productos, de una lote 10,000 unidades, 5% resultó con
defectos significativos

2.- Un ofertante de terrenos desea vender 5 lotes en forma sucesiva; es decir, una tras
otra. ¿Cuántos resultados experimentales posible tiene el vendedor?

3.- Un supervisor de obras desea optimizar la ejecución del proyecto. El flujo del
proyecto se divide en 3 etapas: estudio, implementación y ejecución. Los tiempos
promedios históricos en actividades similares arrojan la siguiente información; la
fase de estudio 2,3 meses, 2da. Etapa 5, 6 meses y la 3era. etapa de ejecución 11 y
12 meses. ¿Cuántos resultados experimentales admite el problema? ¿Cuánto es el
tiempo máximo y mínimo de ejecución del proyecto?

4.- La EFPAE desea seleccionar 3 estudiantes de 5 que constituyen del tercio superior
en índice académico, para que puedan asistir al CADE 2006. ¿Cuántas formas de
seleccionar existen sin orden alguna?

5.- Si la Dirección de EFPAE tomase la decisión de selección basándose en orden de


mérito. ¿Cuántos resultados experimentales existen?
UNIDAD IV

ESTIMACIONES

4.4 ESTIMACIÓN PUNTUAL.- Es el procedimiento de calcular un parámetro de


población mediante una característica de la muestra, que se denomina estadístico de
la muestra o media poblacional

EJEMPLO: De los 380 alumnos de la EFPAE – UNSCH se han seleccionado 10


alumnos, cuyas tallas y aprobación de índice académico se muestra en
la siguiente tabla:

i)
Xi I. A. i) x =
x i
=
n
1.61  1.72  ...  1.80
= 1.71
10
X1 = 1.61 A
X2 = 1.72 D
X3 = 1.79 D
X4 = 1.60 A
X5 = 1.66 D
X6 = 1.69 D
X7 = 1.70 A
X8 = 1.74 D
X9 = 1.79 D
X10 = 1.80 A

 X  x
2
0.047
ii) S  i
= = 0.072
n 1 10  1
NOTA: (n -1) Factor de corrección, cercano a 1; cuando la Población es finita grande y se estudia muestra (n) pequeño

Cálculo previo:

1.61 – 1.71 =  0.12 = 0.01


1.72 – 1.71 = = 0.0001 0.012
. .
. .
. .
1.80 – 1.71 = 0.09 = 0.0081
2

0.047

Proporción poblacional que tiene índice académico aprobado:

A = 4
D = 6
4 6
Índice aprobado: p = = 40% Índice desaprobado: p =
10 10
= 60%

NOTA:
X = Promedio muestral estimador puntual de  poblacional
S = Desviación estándar muestral puntual estimador de la desviación
poblacional 
p = Proporción muestral estimador puntual de la proporción P
poblacional.
4.1 DISTRIBUCIONES MUESTRALES

X = 1.71 X = 1.69
10 X =X 10 10
S = 0.072 S = 0.065
S =Y
p = 40% p = 43%
p = Z

Primera Segunda n selección


Selección Selección

A partir de la segunda selección no se tiene los mismos elementos que las


anteriores, tampoco iguales estimadores puntuales.

Supongamos que hemos seleccionado 5 veces, entonces:

Muestreo X S P
1 1.71 0.072 40%
2 1.69 0.065 43%
3 1.70 0.060 41%
4 1.72 0.059 44%
5 1.69 0.075 59%

Frecuencia
relativa
1.71 1 0.2
1.69 2 0.4
1.70 1 0.2
1.72 1 0.2
5 1.0

Distribución Distribución
Distrib.
Muestral Muestral
Muestral
X S
P
Las distribuciones muestrales puntuales tienen el comportamiento de
distribución normal cuando se aplica distribuciones de frecuencia de X a partir de
muestra de tamaño (ni), por ejemplo; 10 de los 380 alumnos. Porque los extremos se
alejan del promedio general.

4.2 DISTRIBUCION MUESTRAL DE MEDIA X .- El procedimiento estadístico más


común es usar la media de la muestra X para hacer inferencia acerca de una media
de la población. La distribución de probabilidad de todos los valores posibles de la
media de la muestra X se llama distribución muestral de la media de la muestra X .

i) Valor esperado( X ).- Distintas muestra aleatorias simples dan como resultado
varios valores de la media de la muestra X .
E X = Valor esperado de X

EX =   = Media de la población

ii) Desviación estándar de X

 X = Desviación estándar de la distribución muestral X


 = desviación estándar de la población
n = Tamaño de la muestra
N = Tamaño de la población

a) Para población finita b) Para población infinita

N n    
X =   X =
N 1  n  n

N n
 = Factor de corrección, cercano a 1; cuando la población es
N 1
finita grande y se estudia muestra (n) pequeño


 Usar para calcular desviación estándar de X , siempre que:
n

1.- La población sea infinita

2.- La población sea finita y que el tamaño de la muestra sea menor o


n
igual que 5% (  0.05) de la población.
N
n N n   
3.- En caso ( > 0.05) se debe usar   para poblaciones
N N 1  n 
finitas en cálculo de  X .

   X Es un error estándar de la muestra

4.3 DISTRIBUCIONES MUESTRALES DE P .- En los aspectos de gestión de negocios


y la economía empresarial se usa la proporción muestral P para hacer inferencias
estadísticas sobre la proporción poblacional P. Podemos predecir que en cada
repetición del proceso obtendremos un valor distinto de la proporción de una muestra
P . La distribución de probabilidad para todos los valores posibles de la proporción
muestral P se llama distribución muestral de la proporción muestral P .

i) Valor esperado de P
EP  = Valor esperado de P
EP = P P = Proporción poblacional

ii) Desviación estándar de P

a) Población finita b) Población infinita

N  n P(1  P) p(1  P)
P = P =
N 1 n n

Si la población es finita y Si la población es finita y


n n
> 0.05 usar (a)  0.05 usar (b).
N N
 La distribución muestral de P se puede aproximar con una distribución de
probabilidad normal, siempre que el tamaño de la muestra sea grande.

 Se puede considerar que el tamaño de la muestra es grande cuando se


cumplen las dos condiciones siguientes:

np  5
n(1-P)  5
4.4 PROPIEDADES DE LOS ESTIMADORES PUNTUALES


X
n
 S

P

  Estadístico de muestra o estimador puntual de  (muestra)

Parámetro poblacional de interés

a) INSESGADEZ.- Si el valor esperado del estadístico de muestra es igual al


parámetro poblacional que se estima, se dice que ese estadístico
es un estimador insesgado del parámetro poblacional.
E = 
b) EFICIENCIA.- En general, preferiríamos usar un estimador puntual con la menor
desviación estándar, porque tiende a proporcionar estimación más
cercana al parámetro poblacional.

c) CONSISTENCIA.- Un estimador puntual es consistente si sus valores tienden a


acercarse al parámetro de población conforme se incrementa
el tamaño de la muestra. En otras palabras, un tamaño
grande de muestra tiende a proporcionar un mejor estimador
puntual que un tamaño pequeño.

UNIDAD IV

ESTIMACIONES ESTADÍSTICAS

3.1 ESTIMACIONES DE INTERVALO DE UNA MEDIA DE LA POBLACIÓN:


MUESTRA GRANDE

Cómo usar una muestra aleatoria simple para obtener una estimación del
intervalo de una media poblacional.
PRIMER CASO: n  30, se conoce  poblacional

Olva Currier Ayacucho, es una empresa de servicios de comunicación


rápida. El servicio al cliente en la forma de recepción y entrega de mensajes
oportunamente es importante para el éxito y garantía operativa de la empresa.

El equipo de control de calidad utiliza una encuesta de servicio al cliente


para medir su satisfacción respecto a su sistema de servicio. Cada mes, se envía un
cuestionario a una muestra aleatoria de clientes que demandaron su servicio el mes
anterior. A los clientes se les pide que completen un cuestionario que califica el
servicio. Cada respuesta se convierte en una puntuación de satisfacción que varía de
0 a 5 (0 = no opina, 1 = muy mala, 2 = mala, 3 = regular, 4 = buena y 5 = muy
buena). Con base en cada encuesta mensual, se calcula una puntuación muestral
promedio de satisfacción del cliente. Esta puntuación se emplea como estimador
puntual de la puntuación de satisfacción poblacional promedio para todos los
clientes de Olva Currier. La media muestral da al gerente una medida oportuna de la
calidad de servicio. Si empiezan a surgir bajas puntuaciones de satisfacción al
cliente, se puede tomar acciones correctivas inmediatas.

Las encuestas mensuales anteriores de servicio mostraron que la


desviación estándar de las puntuaciones de satisfacción se estabilizó en un valor  =
20. La encuesta más reciente de satisfacción fue para una muestra de n = 100, cuya
puntuación de satisfacción promedio muestral, es de x = 82 que proporciona una
estimación puntual de la media poblacional.

SOLUCION

1.- ERROR MUESTRAL.- Siempre que se usa media de muestra para inferir un
estimador puntual de una media poblacional, la pregunta es: ¿Qué tan buena es
la estimación? ¿ x ?

Em =  x - .  Valor absoluto

En la práctica no se puede determinar el valor del error muestral, porque


no se conoce exactamente la media de la población (). Sin embargo, la
distribución de muestreo de ( x ) se puede usar para hacer declaraciones de
probabilidad del error de muestreo.

i) Sí:
n = 100
 = 20

x= x Desviación estándar de la distribución muestral x . Promedio de
n
variabilidad de los datos con respecto a su media
Cómo están distribuidos los
 valores de x respecto a , esta
x= x= 20
=2 distribución da información
n 100 proporciona la base para un
enunciado de probabilidad acerca
del error de muestreo.

 x

ii) Si usamos la tabla de áreas de la distribución de probabilidad normal estándar,


vemos que 95% (coeficiente de confianza) de los valores de una variable
aleatoria con distribución normal quedan dentro de una distancia igual a 
1.96 desviación estándar de la media.

Se queremos los valores de x


con 95% empleamos la tabla de
Dist. Muestral de x 95% x=2 Z de distribución normal: 0.95 
2 = 0.4750; se busca en el
interior de la tabla Z este valor y
relacionamos la fila y columna
obteniendo el valor 1.96.
Entonces 1.96 x 2 = 3.92
-3,92  3.92

CONCLUSIÓN:

1.- Que 95% de las medias muestrales que se pueden obtener mediante un
tamaño de muestra n = 100 estarán dentro de  3.92 de la media
poblacional.
2.- Hay una probabilidad de 0.95 de que la media de una muestra origine un
error muestral de 3,92 o menos.
3.- Este enunciado de probabilidad es una declaración de precisión acerca
del error del muestreo que puede existir para Olva Currier si se usa la
media de una muestra aleatoria simple de n = 100 para estimar la media
poblacional. El valor 3,92, que proporciona un límite superior del error
de muestreo, se conoce como margen de error.

Sí: N. C. = 98% = 0.98  2 = 0.49 2.33 x 2 = 4.66

98%
- 4.66  4.66

CASO: CON MUESTRAS GRANDES DONDE SE SUPONE QUE SE CONOCE ( )

Si:
n = 100
 = 20
x = 82

i) Cómo se puede usar la declaración de precisión para construir una estimación del
valor del intervalo de confianza de una media poblacional.
ii) Una estimación del intervalo de una media poblacional toma la forma siguiente:

x  Margen de error

Con declaraciones de precisión de 0.95 de probabilidad el margen de error es 3.92,


entonces:

x  M.e.

Dist. Muestral de x 95% x=2

-3,92  3.92

82  3.92

Nivel de confianza de 95% da una estimación del intervalo de la media


poblacional:
82 – 3.92 = 78.08 límite inferior
82 + 3.92 = 85.92 límite superior

78.08    85.92 es el intervalo de la media poblacional.


Suponiendo: n1, n2, n3

98%


3.92 3.92
Posibilidad aceptada
x

x
Posibilidad no aceptada
x

El procedimiento general para estimar el intervalo de una media


poblacional siempre que se tenga una muestra grande (n  30) y se supone que se
conoce la desviación estándar poblacional es el siguiente:

i) (1-Ic )coeficiente de confianza = 

       
x   Z     Z   valor de Z que origina un área de en
 ii)
  2
 2  n  2
la cola o extremo superior de la distribución de
probabilidad normal estándar

Ejemplo:
Nivel de confianza = 95%
 = (1 - 0.95) = 0,05

 0.05
= = 0.025* * 0.5000 – 0.025 = 04750; buscar en la tabla z =
2 2
1.96

ENTONCES: x  Z
2
n

20
82  1.96
100

82  3.92
Por tanto:

i) El margen de error es 3.92


ii) El intervalo de confianza es 78.08    85.92
iii) Olva Currier, puede tener una confianza de 95% de que la
puntuación de satisfacción promedio de la población está
entre 78.08 y 85.92

Sí nivel de confianza 90%:

20
82  1.645 82  3.29; 3.29 margen de error
100

78.71    85.29

CASO: MUESTRAS GRANDES CON (  ) ESTIMADA MEDIANTE (S).- En la


realidad muchas veces no se conoce la desviación estándar poblacional (
). En consecuencia, se usa la desviación estándar de la muestra ( S ) para
estimar ( ). En el caso de muestras grandes (n  30), el teorema del límite
central y el hecho de que la desviación estándar de la muestra (S) dé una
buena estimación de ( ), cuando el tamaño de la muestra se vuelve grande,
permite usar el procedimiento siguiente, para construir una estimación del
intervalo de una media poblacional.

S
x  Z S = Desviación estándar de la muestra
2
n

Ejemplo: En una fábrica textil se hicieron observaciones en una sección de 400


telares, en tiempos al azar durante tres periodos del día, durante 20 días
para determinar el número de telares trabajando.

365 362 352 371 365


364
369 361 360 362 364
374
366 350 360 374 364
347
371 357 365 367 366
340
365 355 361 359 362
359
353 364 349 359 362
359
366 366 356 370 369
367
362 353 361 362 366
348
358 356 358 366 373
354
369 368 366 364 360
367

Constrúyase un intervalo de confianza de 95% de la media poblacional


de número de telares trabajando.

21708
i) x = ------------- = 361.8  362
60

ii) S = 6.870

iii) 0.95  2 = 0.4750 (buscando en la tabla Z  ) = 1.96


2

iv) 362  1.74 Entonces: 1.74 es el margen de error


362 – 1.74 = 360.26  360 límite inferior
362 + 1.74 = 363.74  364 límite superior

360    364

Por consiguiente, podemos tener un nivel de confianza de 95% de que los


telares trabajando están entre 360 y 363.

3.2 ESTIMACION DE INTERVALO DE UN PROMEDIO POBLACIONAL:


CASO DE MUESTRA PEQUEÑA.

Cómo determinar una estimación de intervalo de una media poblacional


para el caso de muestras pequeña ( n  30 ). Cuando se tiene una muestra pequeña,
la distribución de muestreo de x depende de la distribución de la población. Los
procedimientos de estimación de intervalos que se describen a continuación se basan
en la suposición de que la población tenga una distribución normal. Si esta
suposición resulta adecuada, la metodología de esta sección se puede usar para
calcular una estimación del intervalo de una media poblacional. Sin embargo, si esta
suposición no es adecuada, se recomienda aumentar el tamaño de muestra a n  30 a
fin de usar los procedimientos para muestras grandes de la sección anterior.

En el caso de muestras pequeñas, empezamos con la situación donde se


supone que se conoce la desviación estándar de la población (). Después
consideramos el caso donde la desviación estándar de la población () se estima
mediante la desviación estándar de la muestra S.

a). Caso de muestras pequeñas ( n < 30) donde se supone que se conoce el valor
de ().

x  Z Ejercicio igual que la anterior
2
n
b). Caso de muestras pequeñas en que () se estima mediante S

Suponiendo que la población tiene una distribución normal. Si no existe


una base para suponer que se conoce la desviación estándar de la población  se
utiliza la desviación estándar de la muestra S, para estimar . En estas
condiciones, procedimiento de estimación de intervalo se basa en una
distribución de probabilidad conocida como distribución t.

La distribución t es una familia de distribuciones de probabilidad


similares, con una distribución t se especifica que depende de un parámetro
conocido como grados de libertad. La distribución t con un grado de libertad
es única, así como la distribución t con dos grados de libertad, con tres grados de
libertad, etc. a medida que aumenta la cantidad de grados de libertad, la
diferencia entre la distribución t y la distribución de probabilidad normal
estándar se hace muy pequeña.

Distribución normal estándar

Distribución t con 20 grados de libertad

Distribución t con 10 grados de libertad

0 Z, t

Observe que una distribución t con más grados de libertad tiene


menos variabilidad y se parece cada vez más a la distribución de probabilidad
normal estándar. También observe que el promedio de la distribución t es cero.

Usamos un subíndice en t para indicar el área en la cola superior de


la distribución t. Así como usamos Z  , usaremos t0.025 (con nivel de confianza
2

95%) para indicar un área de 0.025 en la cola superior de la distribución t. En


general, usaremos la notación t para representar un valor de t que define un
2

área de la cola superior de la distribución t.
2

2

0 t
2

NOTA: Utilizar la tabla de la distribución t para áreas de cola superior.

b.1 Estimación del intervalo de un promedio de población: caso de muestras


pequeñas (n < 30) con  estimada mediante S.
Suponiendo, que la población tiene una distribución de probabilidad
normal:

s
x  t S = Desviación estándar de la muestra (1- ) = Nivel de
confianza
n
2

t = Valor de t que da un área en el extremo derecho de la
X i 2
2
X = distribución t
n
(n – 1) = Grados de libertad que tiene que ver con el uso de S

X i x 
2 como estimador de la  poblacional
S=
n 1

Los grados de libertad indican la cantidad de elementos de información


independientes que intervienen en el cálculo de X i  X  . Esos n
2

elementos son los siguientes: X 1 X , X 2 X , X 3 X ... X n  X . Para


cualquier conjunto de datos X i  X  = 0. Así, sólo (n – 1) de los valores
de X I X son independientes: esto es, si conocemos n-1 de los valores, el
valor que resta se puede determinar con exactitud por la condición de que la
suma de los X I X debe ser cero. Así (n-1) es la cantidad de grados de
libertad asociada con X i  X  y, por consiguiente, el número de grados
2

de libertad para la distribución t en la:


s
x  t
2
n

Ejemplo: El Director de una escuela de adiestramiento para choferes “XY”,


desea contar con un programa asistido por computador. Se espera
que con el método se reduzca el tiempo y precisión necesaria para
el adiestramiento. Para evaluarlo el director pide una estimación
del tiempo promedio de adiestramiento necesario con el programa
asistido por computador. La información convencional con que
cuenta es la siguiente:
Aspirante Días de adiestramiento Aspirante Días de adiestramiento
01 52 11 54
02 44 12 58
03 55 13 60
04 44 14 62
05 45 15 63
06 59 16 45
07 50 17 46
08 54 18 63
09 62 19 54
10 46 20 59

SOLUCION

52  44  55  ...  59 1,075
i) X =   53.75  54 Estimación Puntual del
20 20
tiempo promedio de
adiestramiento.

ii) S =

 52  54  44  54  55  54  ...  59  54
2 2 2 2
 = 6.89  7
20  1
días de desviación estándar muestral

iv) Determinado una estimación del intervalo del promedio poblacional con
95% de confianza (suponiendo que la población de tiempos de
adiestramiento tiene una distribución de probabilidad normal):

 Distribución t
 n – 1  20 –1 = 19 grados de libertad
 Entonces:
 = 1 - 0.95 = 0.05  2 = 0.025 (buscar en la tabla t)

0.025
= 2.093
19

s
x  t
2
n

 7 
54  2.093  
 20 

54  3.276

- 50.474 57.276
c). El papel de distribución poblacional: cuando n > 30 y no se conoce la
distribución poblacional:

Si se conoce:


() entonces x  Z
2
n

s
(s) entonces x  Z
2
n

3.3. DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA

En caso de muestras grandes, donde se supone que se conoce el valor de


(), la estimación de intervalo de la media poblacional está dada por:

 
x  Z Donde Z  = margen de error
2
n 2
n
Entonces, una vez seleccionada el nivel de confianza (1 -  ), y
conociendo el valor de (), podemos determinar el tamaño de (n) que se necesita
para cualquier margen de error:


E = Z
2
n

Z 
2
n =
E
2
 
 Z    2
 
n =  2 2
NOTA: Para usar la fórmula anterior, el valor Ede E es el margen de error que el
usuario está dispuesto a aceptar y el valor de Z  es consecuencia directa de
2
nivel de confianza que se usa para determinar la estimación del intervalo.
Aunque se debe tomar en cuenta la preferencia del usuario, lo que se
escoge con más frecuencia es el 95% de confianza, Z 0.025 = 1.96. Además
se requiere un valor de la desviación estándar de la población (). En la
mayoría de los casos se desconoce (). Sin embargo, podemos aplicar esa
ecuación si contamos con el valor preliminar o valor de planeación de ().
En la práctica se puede optar por uso de los siguientes procedimientos:

1.- Usar la desviación estándar muestral de una muestra previa de las


mismas unidades, o de otras parecidas.
2.- Usar un estudio piloto para seleccionar una muestra preliminar de
unidades. La desviación estándar muestral de ella se puede usar como el
valor de planeación de ().
3.- Usar el juicio de una “mejor estimación” del valor de (). Por ejemplo,
podríamos comenzar estimando los valores máximos y mínimos de los
datos en la población. La diferencia entre ellos proporciona una
estimación del rango de los datos. Por último, se sugiere tomar el rango
dividido entre cuatro como una aproximación de la desviación estándar
para contar con un valor de planeación aceptable para ().

Ejemplo: En un estudio previo un propietario de moto taxis en la ciudad de


Ayacucho, investigó el beneficio de la renta de moto taxis y encontró que
el beneficio promedio de renta es S/. 35 por día. El propietario quisiera
otro estudio a fin de estimar el beneficio de la renta promedio para una
nueva flota. Para ello, el propietario propone que el beneficio promedio
poblacional de la renta diaria se debe estimar con un margen de error de
dos (2) y un nivel de confianza de 95% la desviación estándar para el
beneficio de la renta diaria fue de 10 soles.

Datos:
Me = 2
N. C = 95%
 = 1- 0.95 = 0.05  2 = 0.025 = 0.5000 – 0.0250 = 0.4750 (buscar en la
tabla) = Z 0.025 = 1.96
 = 10

2
 
 Z    2
  1.962 102
n =  22 n = = 96.04  96 elementos muestrales
E 22

3.4 ESTIMACION DEL INTERVALO DE UNA PROPORCION.- Una proporción


muestral (s) es un estimador insesgado de una proporción poblacional (P), y que para
muestras grandes, la distribución muestral de P se puede aproximar con una
distribución de probabilidad normal.

P1  P 
Distribución muestral p  donde coeficiente de confianza = (1- )
n

De P
2
Z  P P Z  P
2 2

(1- ) = coeficiente de confianza


Estimación del intervalo de una proporción de la población:

  P1  P  
P   Z    debe conocerse P

 2  n 


Z  = Valor de Z que origina un área de en la cola extremo
2
2
superior de la distribución de probabilidad normal estándar.

Ejemplo: La Gerencia de ESSALUD – Ayacucho realizó una encuesta de 1,000


usuarios de esta institución para conocer cómo consideran el trato que
realizan en los consultorios de parte de los médicos. En las encuestas se
encontró que 480 usuarios estuvieron satisfechos con el tipo de atención
en los consultorios médicos.

Datos:
n = 480
P = 480 1,000 = 0.48
N. C. = 95%

i)  = 1 - 0.95 = 0.05  2 = 0.025; 0.5000 – 0.025 = 0.475 (buscar en


la tabla Z), entonces = 1.96
ii)
  P1  P  
P   Z  



 2  n 

0.481  0.48
0.48 = 1.96 = 0.033097  3.10%
1,000
margen de error

El margen de error permisible:

- 0.449 0.48 0.511

45% 48% 51%

EJERCICIOS DE REPASO

1.- Se desea conocer el intervalo de confianza al 99%. Los datos provienen de una
distribución normal con una varianza de 144. Se toma una muestra de 15 sujetos en
los que se obtienen una media de 84.3% ¿Cuál es el intervalo de confianza de ?
2.- Se extrajo una muestra aleatoria de 64 estudiantes que sufrían gastritis y se determinó
para cada uno, la duración de la hospitalización. Se encontró que la duración media
de hospitalización fue de 8.25 días. Si se sabe que la duración estándar de la
población es de 3 días. Hallar el intervalo de confianza al 90%, 95%, 99% para .

3.- Se condujo una encuesta con el fin de estudiar las prácticas sanitarias dentales de 300
estudiantes entrevistados, 123 dijeron que regularmente se sometieron a una revisión
dental 2 veces al año. Con 95% de confianza halle el intervalo de confianza para la
proporción en la población de los alumnos que se sometieron a la revisión dental.

4.- 200 pacientes que sufrían cierta enfermedad fueron divididos al azar en dos grupos
iguales. Del primer grupo, quienes recibieron el tratamiento estándar 78 se
recuperaron en un plazo de 3 días. De los otros 100 quienes fueron tratados por medio
de un nuevo método, 90 se recuperaron en 3 días. Los médicos desearon estimar la
diferencia verdadera entre las proporciones de quienes se recuperaron en 3 días.
Hallar el intervalo de confianza al 90% para P1 – P2.

5.- Se ha tomado una muestra aleatoria de n = 18, el valor medio para la característica en
un estudio es 50.15, con desviación estándar 0.4. Obtener un intervalo de confianza
de 0.99 para .

6.- Se hacen 11 mediciones del diámetro de una esfera y dá como media 4.05 y una
desviación estándar de 0.4. Construir un intervalo del 90% para estimar la media
poblacional.

7.- En una encuesta se dice que el valor de planeación para la proporción poblacional P es
de 0.35. ¿De qué tamaño se debe tomar la muestra para obtener un intervalo de
confianza de 95% y con margen de error igual a 0.05?

8.- ¿De qué tamaño se debe tomar una muestra para tener 95% de confianza de que el
margen de error para la estimación de una proporción poblacional sea de 0.03?
Suponga que no dispone de datos históricos para establecer un valor de planeación
para P.

9.- ¿De qué tamaño debe ser la muestra para poder tener 95% en que error muestral es de
0 o menor? Suponga que la desviación estándar de la población es de 25.

UNIDAD IV

INFERENCIA ESTADÍSTICA

4.1 ESTIMACION DE LA DIFERENCIA ENTRE LAS MEDIAS DE DOS


POBLACIONES: MUESTRAS INDEPENDIENTES.

Consideremos que kola Real en la Ciudad de Ayacucho tiene un conjunto de


la población que consume ente producto (Lamemos P1) y en la Ciudad de Huancayo
de la misma manera (llamemos P2). En cuanto a la preferencia de sabor varía entre
estas dos ciudades, debido a muchos factores: edad, clima, educación, ingreso, etc.
un investigador de mercado desea analizar la diferencia entre las edades de los
consumidores en cada ciudad, con los siguientes datos:
n1 = 35, 36, 37, 34, 36, 38, 32, 33, 35, 35, 37, 38.
n2 = 39, 32, 31, 33, 34, 29, 28, 32, 33, 35, 34, 33
a) Estimación puntual

N1 = Ayacucho N2 = Huancayo
 =?  = ?
n1 =? n1 = ?
X =? X =?

i) Se selecciona n1, n1 4n forma aleatoria


ii) n1 es independiente de n2.
iii) Las n1 y n2 pueden ser de tamaños diferentes.

E. P. = D1   2  X 1 - X 2

35  36  ...  38
i) X 1 =  35.50
12

S 1  1.883

39  32  ...  33
ii) X 2 =  32.75
12

S 2  2.8324
iii) D    35.50  32.75  2.75 Años. La edad promedio de los consumidores
1 2

de Ayacucho es mayor que de los de


Huancayo.

b) Distribuciones muestrales de X 1 - X 2 .- Estimación interválica de la diferencia


entre dos medias poblacionales.

b.1) Valor Esperado


V. E. (X1X 2 )
 1  2
b.2) desviación Estándar.
 12  22
X 1X2
 
n1 n2

n1  muestraaleatoriasimpledeP1
n2  muestraaleatoriasimpledeP2
 12  desviaciones tan dardeP1
 2 2  desviaciones tan dardeP2

c) Estimación interválica de 1  2 : caso muestra grande

c.1) Cuando (n1  30 yn2  30) y se conoce  1 y 2

X1 - X 2  Z  X Usar nivel de confianza a criterio del


1X2
2
investigador.

c.2 Cuando (n1  30 yn2  30) y se conoce  1 y 2 se estiman mediante S1 yS 2

X1 - X 2  Z S X Usar nivel de confianza a criterios del


1X2
2
investigador

2 2
S1 S
S X1  X 2   2
n1 n2

Ejemplo 2:

n1  12
n2  12
S1  1.883
2

S 2  2.8324
2

(1.883) 2 (2.8324) 2
i) Entonces: S X 1  X 2   = 0.982
12 12

ii) Sí nivel de confianza 95%. Entonces, α = 1. N. C. = 1- 0.95 = 0.05

a. Para Z   Z 0.05  Z 0.025  0.5000  0.025  0475(buscarenlatabla )  1.96


2 2

b. Para Z   Z 0.95  0475(buscarenlatabla )  1.96


2 2
iii) X - X  Z S X1  X 2
2
35.50 – 32.75  (1.96) (0.982)
2.75  1.9472

0.825284 1  2 4.67472

d) Estimación de intervalo de 1  2 : caso Muestra {muestra pequeña).- estimación


del intervalo de la diferencia de las medias de dos poblaciones cuando los tamaños
de una o ambas muestras menores a 30, n 1  y / on2  30

d.1 Cuando:

1. Ambas poblaciones tienen distribuciones normales


2. Las varianzas de las poblaciones son iguales (  1   2 )
2 2

V. E. (X1X 2 )
 1  2

 12  22 1 1
X 1X2
    2(  ); como  12   2 2   2 no
n1 n2 n1 n2
necesitamos estimaciones diferentes para  1 y 2
2 2

d.2 Estimador combinado de  2

(n1  1) S1  (n2  1) S2
2 2
S2 
n1  n2  2

d.3 Estimador puntual de  X 1  X 2 =  1   2 2


2 2

1 1
S X1  X 2  S2(  )
n1 n2

d.4 Estimación del intervalo con  1 y 2 estimados mediante S1 y S2

X- X  t S X 1  X 2 Grado de libertad = n1  n2  2
2
Coeficiente de confianza = 1- α

Ejemplo 1: Los siguientes datos corresponde a un estudio de muestreo sobre el nivel


de avance en metros al día, que realizó un residente de obras de 2
cuadrillas de obreros que trabajan en un proyecto de apertura de zanja
para una irrigación, obteniéndose los siguientes resultados:
n1  10.00, 9.90, 11.00, 10.50, 9.98, 9.20, 10.01, 10.50, 10.98, 9.99,
11.00, 10.95
n2  11.00, 10.00, 10.45, 10.55, 9.97, 9.99, 10.00, 10.68, 10.45, 11.00

Con estos datos el residente de obras desea determinar un intervalo de


confianza de 90% para la diferencia entre las medias de las muestras de
trabaja.

SOLUCION
i) n1  12
n2  10

10  9.90  ...  10.95


X1=  10.3342
12

S1  0.58

11  10  ...  11
X2=  10.41
10

S2  0.41

ii) Determinación combinada de ơ

(n  1) S1  (n2  1) S2
2 2
S  12
;
n1  n2  2
(12  1)(0.58)2  (10  1)(0.41)2
S2   0.261
12  10  2

iii) Estimación de la desviación estándar de  X 1  X 2

1 1 1 1
S X1  X 2  S2(  ) ; S X 1  X 2  (0.261)(  )  0.22
n1 n2 12 10

iii) Determinando la distribución t

a) Grado de libertad = n 1  n2 = 12 + 10 – 2 = 20
b)  = 1 – 0.09 = 0.10
c) t  , 20; t  , 20
2 2

iv) Determinado el intervalo.


X1 - X 2  t S X 1  X 2
2

10.3342 - 10.41  (1.725) (0.22)


- 0.0758  0.795
- 0.4553 a 0.3037

RPTA: La diferencia entre las medias de avance de metrajes de las dos


cuadrillas es de – 0.4553 a 0.3037 metros.

NOTA: Cuando la diferencia sea cero, se interpreta como una


indicación de que no tenemos la evidencia suficiente para
afirmar que la media de las poblaciones es diferente.

Ejemplo 2: Examinemos los resultados que corresponden a dos muestra aleatorias


independientes tomadas de dos poblaciones.

n1  50 n2  35
X  13.6 X  11.6
S1  2.2 S 2  3.0

a) ¿Cuáles es la estimación puntual de la diferencia entre las dos medias


de población?
b) Determine un intervalo de confianza de 90% la diferencia entre las
dos medias poblaciones.
c) Determine un intervalo de confianza de 95% de esa diferencia.

Ejemplo 3: Se cuenta con los datos de la tabla siguiente, que corresponden a dos
muestras aleatorias independientes tomadas de dos poblaciones.
Muestra 1 Muestra 2

10 7 8 7
12 7 8 4
9 9 6 9

a) Calcule las dos medias muestrales


b) Determine las dos desviaciones estándar de las muestras
c) ¿Cuál es la estimación puntual para la diferencia entre las dos medias
de población?
d) ¿Cuál es la estimación combinada de la varianza poblacional?
e) Determine un intervalo de confianza de 95% para la diferencia entre
las dos medias de población.

Ejemplo 4: Una constructora de viviendas “Casa Bonita”, a nivel nacional, suministra


los datos sobre el costo de los proyectos más frecuentes de remodelación
de vivienda. Algunos datos de las muestras de los costos, en miles de
soles, para dos clases de remodelación son:

Cocina Recámara Principal

1.80 2.29
2.64 2.48
1.97 2.69
2.30 1.78
1.97 2.46
1.69 2.10
2.18 2.36

a) Determine una estimación puntual de la diferencia entre las medias


poblacionales de los costos de las dos clases de remodelación.
b) Determine un intervalo de confianza de 90% para la diferencia entre
las dos medias poblacionales.

7.2 PRUEBAS DE HIPÓTESIS ACERCA DE LA DIFERENCIA ENTRE LAS


MEDIAS DE DOS POBLACIONES: MUESTRAS INDEPENDIENTES.

A) CUANDO n 1  30, n 2  30: Muestra grande

Ejemplo 1: Como parte de un estudio para evaluar las diferencias en los niveles
educativos entre dos programas de capacitación, se aplicó un examen común.
Las calificaciones del examen son uno de los factores principales para evaluar
diferencias de la calidad entre los programas. Los resultados obtenidos son las
siguientes:
97 83 91 64 66 91
84
90 84 87 85 83 78
85
94 76 73 72 74 87
85
79 82 92 64 70 93
84
78 85 64 74 82 89
59
87 85 74 93 82 79
62
83 91 88 70 75 84
91
89 72 88 79 78 65
83
76 86 74 79 99 78
80
84 70 73 75 57 66
76
i) n1 = 30

97  83  91  ...  73
X =  82. 5
30
 2  64
 8
ii) n2 = 30

64  66  91  84  ...  76
X =  78 5
40
 2  100
  10

NOTA: es esta prueba nos interesa determinar si las medias de las dos poblaciones son
distintas.

a) Planteamiento de hipótesis: suponiendo que no hay diferencia entre  1 y  2

H 0  1   2  0 Si la evidencia de la muestra conduce al rechazo de esta hipótesis, la


conclusión sería de que las medias son distintas, lo cual indica que hay una
H a  1   2  0 diferencia en la calidad de los programas, lo que amerita una investigación
para encontrar las razones de esa diferencia.

b) Prueba Estadística

( X  X )  ( 1   2 ) (82.5  78)(0)
Z ZC 
1  2
2 2
82 102
 
1 2 30 40
NOTA: Si se desconoce los valores  1 y 2 podemos usar las desviaciones
estándar muestral S1 yS 2 para calcular el estadístico de prueba.

c) Toma de Decisión.

Valor ZT  ?

Si   0.05   0.025  Z   0.025 , entonces, 0.5000 – 0.025 = 0.475
2 2
(tabla) = 1.96

R.R = 0.025 R.R. = 0.025


- 1.96 0 1.96

REGLA:
RECHACE H 0 Sí: Z < - 1.96 ó Z > 1.96

RESPUESTA: Cómo Zc  2.09  Zt  1.96 rechazar H 0 , los


dos programas difieren en calidad.

d) Valor de P

Sí Z = 2.09 (buscar en la tabla) = 0.4817

V p = 0.5000 – 0.4817 = 0.0183  V p = 2 (0.0183) = 0.0366

e) Toma de Decisión:
REGLA:
RECHACE H 0 Sí: P < 

 = 0.05
 P <  = Se rechaza H 0
P = 0.0366

B) CUANDO n 1 < 30, n 2 < 30: Muestra Pequeña

Se emplea: t con n 1 + n 2 - 2 grados de libertad, 1   2


Ejemplo: Los siguientes datos a un nuevo programa de computo que se ha
desarrollado para ayudar a los analista de sistemas a reducir el
tiempo requerido para diseñar, desarrollar e implementar un sistema
de información. Para evaluar las ventajas del nuevo sistema se
selecciona una muestra aleatoria de 24 analistas de sistema. A cada
analista se le proporciona especificaciones para un sistema hipotético
de información, y a 12 de ellos se les pide producir el sistema usando
la tecnología actual. Alos otros 12 se les capacita primero en el uso
del nuevo paquete y, a continuación, se les pide usarlo para producir
el sistema de información. Los 24 analistas terminan el estudio y
obtienen los resultados siguientes:

Tecnología actual Nueva Tecnología

300 276
280 222
344 310
385 338
372 200
360 302
288 317
321 260
376 320
290 312
301 334
283 265

El investigador a cargo del proyecto de evaluación del nuevo programa


espera demostrar que el paquete permite un menor tiempo promedio de
terminación del proyecto.

a) Planteamiento de hipótesis: suponiendo que no hay diferencia entre  1 y  2

H 0  1   2  0 Se busca evidencia para rechazar H 0


H a  1   2 0 Hipótesis del investigador

b) Calculando el Estimador Combinado  2

i) n 1 = 12
300  280  ...  283
X =  325 5
12
S 2  1,600
S  40

iii) n 2 = 12
276  222  ...  265
X =  288 5
12
S 2  1,936
S  44

c) Calculando el estimador combinado  2 (Se sup one 1   2


2 2

(n1  1) S1  (n2  1) S2 (12  1)(40)2  (12  1)(44)2


2 2
S2    1,768
n1  n2  2 12  12  2

d) Prueba Estadística (tc)


( X 1  X 2 )  ( 1   2 ) (325  288)  (0)
tc  tC   2.16
1 1 1 1
S2(  ) 1,768(  )
n1 2 12 12

e) Calculo de t tabla


Sí:   0.05   0.025  Z   0.025 , entonces, 0.5000 – 0.025 = 0.475
2 2
(tabla) = 1.96

Región de Rechazo

0 1.96

REGLA:
RECHACE H 0 Sí: Tc > 1.96

f) Toma de Decisión


Como:   0.05   0.025  Z   0.025 , entonces, 0.5000 – 0.025 =
2 2
0.475 (tabla) = 1.96

Por tanto: tc  tt  serechzalaH o


7.3 INFERENCIAS ACERCA DE LA DIFERENCIA ENTRE LAS MEDIAS DE DOS
POBLACIONES: MUESTRAS PAREADAS.

Ejemplo: Una empresa manufacturera tiene dos métodos con los que sus obreros
pueden realizar una tarea de producción. Para maximizar la producción,
la empresa desea identificar el método con la menor media del tiempo
de terminación por unidad. Sea  1 la media del tiempo de terminación
para el método 1 y  2 la correspondiente para el método 2.

La tabla siguiente engloba los datos acerca de los tiempos de


terminación para seis (06) trabajadores tomados como muestra.

Trabajador Tiempo terminación Tiempo término


 1 (minuto)  2 (minuto)
1 6.0 5.4
2 5.0 5.2
3 7.0 6.5
4 6.2 5.9
5 6.0 6.0
6 6.4 5.8

SOLCUCION

a) Calculando diferencia de tiempos:

1 2 Diferencia de
tiempos d i
6.0 5.4 0.6
5.0 5.2 - 0.2
7.0 6.5 0.5
6.2 5.9 0.3
6.0 6.0 0.0
6.4 5.8 0.6

b) Planteamiento de hipótesis: suponiendo que no hay diferencia entre


1 y  2

H 0 : 1    0
H A : 1  2  0

En el diseño con muestras pareadas se prueban los dos métodos de


producción bajo condiciones similares ( es decir, con los mismos
obreros): por consiguiente, este diseño conduce con frecuencia, aun
menor muestral que el diseño con muestras independientes.
c) Calculando la media y la desviación estándar

d i 0.6  (0.2)  0.5  0.3  0.0  0.6


d = d =  0.30
n 6

(d1  d ) 2 (0.6  0.30)2  (0.2  0.30)2  ...  (0.6  0.30)2


Sd  = = 0.335
n 1 5

d) Prueba Estadística

Considerando nivel de confianza 95%. Entonces,


  1  N.C.  1  0.95  0.05 ,

Grados de libertad: n – 1 = 6 –1 = 5
t c  t5 ,  tc  t50.025  2.571
2

d  d 0.30  0
tc  tc   2.194
Sd 0.335
n 6

e) Toma de Decisión

REGLA:
RECHACE H 0 Sí: Tc < - 2.571 ó > 2.571

R. Rechazo Región de Rechazo

- 2.571 0 2.571

Como: (tc  2.194)  (tt  2.571) no se rechaza H o : que los dos


tiempos de terminación no son distintas.

e) Estimación interválica de la diferencia entre las dos medias


poblacionales.

Sd
d  t  ( )
2
n
0.335
0.30  2.571( )
6

0.30  0.352
 0.052    0.652

- 0.052 0 0.652

NOTA: Sí: n  30 usar Z

7.4 INFERENCIAS ACERA DE LA DIFERENCIA ENTRE LAS PROPORCIONES DE


DOS POBLACIONES
Ejemplo: La cooperativa Santa María Magdalena esta interesado en compararla
calidad de trabajo que se realizan en las dos agencias principales: Huanta y
Huancayo. Al seleccionar muestras aleatorias de evaluación de créditos,
elaboradas en cada oficina, y verificar la exactitud de las estimaciones, la
empresa podría estimar la proporción de evaluaciones con error preparados
en cada oficina.

Las muestras aleatorias simples e independientes de los cálculos de


las evaluaciones de crédito en las agencias dieron los siguientes datos:

HUANTA HUANCAYO
n 1 = 250 n 2 = 300
EE  35 EE  27

SOLUCION

A) CALCULANDO LA ESTIMACIÓN DE INTERVALO DE p1  p2

a) Calculando las proporciones

35
P1   0.14
250

27
P2   0.09
300

b) Estimación puntual o valor esperado

. p1  p2  0.14  0.09  0.05 . La Agencia de Huanta tiene una tasa


de error de 0,05 ó 5% mayor que de
Huancayo.
c) Desviación estándar

P1 (1  P1 ) P2 (1  P2 )
 P p  
N1 N2
Cuando sec onocelaspr oporciones
poblaciona les

p1 (1  p1 ) p 2 (1  p 2 )
SP  p  
n1 n2
Cuando sec onoce p1  p 2
0.24(0.86) 0.09(0.91)
S P p   = 0.0275
250 300

d) Coeficiente de confianza

Cc = 1 -  = 1 – 0.95 = 0.05

 0.025
2

e) Intervalo de confianza

p1  p2  ( Z  )( S p1  p2 )
2

Para : n1 (1  P1 ) yn2 (1  P 2 )  5
on1 , n2  30

p1  p2  (t g .l ., )( S p1  p2 )
2

cuandon1 (1  p1 ) y (1  p2  5o
n1 , n2  30

i) Z   Z 0.025  0.5000  0.025  0.4750(tabla )  1.96


12

ii) p1  p 2  ( Z  )(S p1  p z )
2

0.14 – 0.09  (1.96) (.0275)


0.05  0.0539
 0.0039  p  0.1039 Es el intervalo de la diferencia
entre tasas de errores en las dos
agencias

B) PRUEBA DE HIPÓTESIS HACER DE p1  p2

Objetivo: Determinar si las proporciones de errores son distintas entre


las dos agencias.

a) Planteamiento de hipótesis: suponiendo que no hay diferencia entre


1 y  2

H 0  P1  P2  0
H a  P1  P2  0
b) Prueba estadística
Zt  ?
  1  0.95  0.05

 0.025  0.5000  0.025  0.4750(tabla )  1.96 Z t
2
Zc = ?

( p1  p 2 )  ( p1  p2 ) ( p1  p 2 )  ( p1  p2 )
Zc  Zc 
 p p
1 2 ó S p1  p 2

1 1
SP p  p(1  p)(  )
n1 n2
CuandoP1  p2

n1 p1  n2 p 2
p
n1  n2

250(0.14)  300(0.09)
p  0.113  (1  p)  0.887
250  300

1 1
S P  p  0.113(0.887)(  )  0.02
250 300

(0.14  0.09)  (0)


Zc   1.845
0.0271
c) Toma de Decisión

REGLA:
RECHACE H 0 Sí: Zc > Zt

Entonces, como (Zc = 1.845) < (Zt = 1.96) se acepta la H 0 : las


proporciones de los errores no son distintas entre las dos agencias.

d) Calculando valor de P

Zc = 1.845  1.85 (buscando en la tabla) = 0.4678

Vp = 0.5000 – 0.4678 = 0.0322


Vp = 2(0.0322) = 0.0644

REGLA:
RECHACE H 0 Sí: Vp < 

Entonces: (P = 0.0644) > ( = 0.05) se acepta la H 0 : que no hay


diferencia en las proporciones
de los errores de evaluación
entre las agencias.

BIBLIOGRAFÍA

1. Alea, V.; Maqueda, I.; Muñoz, C.; Viladomiu, N. (2001) Estadística para las
ciencias sociales: cuestiones tipo test, editorial AC, Madrid.
2. Arnaldos García, F. et al. (2003) Estadística descriptiva para economía y
administración de empresas, editorial Thomson-Paraninfo, Madrid.
3. Canavos, G. C. (1995) Probabilidad y Estadística: Aplicaciones y Métodos, editorial
Mc Graw-Hill, Madrid.
4. Carey, P.; Berk, K. N. (2001) Análisis de Datos con Microsoft Excel, editorial
Thomson – Paraninfo, Madrid.
5. Casas Sánchez, J. M. (2000) Estadística I. Probabilidad y distribuciones, Centro de
Estudios Ramón Areces, Madrid.
6. Castillo Manrique, M. I.; Guijarro Garvi, M. (2005) Estadística Descriptiva y cálculo
de probabilidades, editorial Pearson – Alhambra, Madrid.
7. De Groot, M. H. (1988) Probabilidad y Estadística, editorial Addison-Wesley,
México.
8. Esteban García, J. et al. (2006) Estadística descriptiva y nociones de probabilidad,
editorial Thomson – Paraninfo, Madrid.
9. Fernández, H.; Guijarro, M.; Rojo, J.M.; Sanz, J.A. (1994) Cálculo de
Probabilidades y Estadística, editorial Ariel, Barcelona.
10. García Barbancho, A. (1981) Ejercicios de estadística descriptiva para economistas,
editorial Ariel, Barcelona.
11. Garido Yserte, R.; de Lucio Fernández, J.; Mañas Alcón, E.; Peinado Gracia, M. L.
(2003) Análisis del entorno económico de la empresa, editorial Pirámide, Madrid.
12. Llorente Galera, F.; Marín Feria, S.; Torra Porras, S. (2000) Métodos Probabilísticos
para la Empresa, editorial Centro de Estudios Ramón Areces, Madrid.
13. López Ortega, J. (2003) Problemas y ejercicios de probabilidad, editorial Tébar, Madrid.
14. Martín-Pliego López, F. J. (1992) Curso práctico de estadística económica, editorial
AC, Madrid.
15. Martín-Pliego López, F. J. (2004) Introducción a la Estadística Económica y
Empresarial, editorial Thomson-Paraninfo, Madrid.
16. Martín-Pliego López, F. J.; Montero Lorenzo, J. M., Ruiz-Maya Pérez, L. (2006)
Problemas de Probabilidad, 2ª edición, editorial Thomson-Paraninfo, Madrid.
17. Martín-Pliego López, F. J.; Ruiz-Maya Pérez, L. (2006) Fundamentos de
Probabilidad, 2ª edición, editorial Thomson-Paraninfo, Madrid.
18. Martín-Pliego, F. Javier y Ruiz-Maya, Luis: Fundamentos de Probabilidad. Editorial
19. Martín-Pliego, F. Javier, Ruiz-Maya, Luis y Montero, J. María: Problemas de
Probabilidad. Editorial Thomson, 2006.
20. Martín-Pliego, F. Javier: Introducción a la estadística económica y empresarial.
Teoría y práctica. Editorial Thomson, 2004.
21. Montero Lorenzo, J. M. (2007) Estadística Descriptiva, editorial Thomson-
Paraninfo, Madrid.
22. Montero Lorenzo, J.M. (2007) Problemas resueltos de Estadística Descriptiva para
Ciencias Sociales, 6ª edición, editorial Paraninfo CENGAGE Learning
23. Mures Quintana, M. J. (2003) Problemas de estadística descriptiva aplicada a las
ciencias sociales, editorial Pearson – Alambra, Madrid.
24. Newbold, P. (1997) Estadística para los negocios y la Economía, 4ª Edición,
editorial Prentice-Hall, Madrid.
25. Peña, D. (1991) Estadística. Modelo y Métodos, editorial Alianza Universidad,
Madrid. Rohatgi,
26. Peña, D. (2004) Fundamentos de Estadística, editorial Alianza Universidad, Madrid.
27. Pérez López, C. (2003) Estadística. Problemas resueltos y aplicaciones, editorial
Pearson - Prentice-Hall, Madrid.
28. Piñole Villar, R.; Moreno Sanz, A.; Caballero Carbonell, A. (2002) Análisis de datos y
probabilidad: Excel como instrumento de cálculo, editorial Civitas, Madrid.
29. Ruiz-Maya Pérez, L. (1989) Problemas de estadística, editorial AC, Madrid.
30. Sanz Lara, J. A.; Bedate Centeno, A.; González Fernández, J. (1996) Problemas de
estadística descriptiva empresarial, editorial Ariel, Barcelona.
31. Spiegel, M. (2002) Estadística, 3ª edición, colección Schaum, editorial McGraw-Hill,
Madrid.
Thomson, 2006.
32. Torra Porras, S. (2000) Principios de estadística descriptiva aplicada a la empresa,
Centro de Estudios Ramón Areces, Madrid.
33. Uña Juárez, I. (2003) Lecciones de Estadística Descriptiva, editorial Thomson –
Paraninfo, Madrid.
34. Uña Juárez, I.; Tomeo Perucho, V.; San Martín Moreno, J. (2003) Lecciones de
cálculo de probabilidades, editorial Thomson-Paraninfo, Madrid.
35. Uriel, E.; Muñiz, M. (1993) Estadística económica y empresarial. Teoría y problemas,
editorial AC, Madrid.

Você também pode gostar