Escolar Documentos
Profissional Documentos
Cultura Documentos
LA ESTADISTICA
Es una ciencia con tanta antigedad como la escritura, y es por s misma auxiliar de
todas las dems ciencias.
NOTA: Sin embargo para que el uso de la estadstica sea adecuado, es necesario trabajar
con muchos datos, porque el uso de pocos datos puede dar lugar a interpretaciones no
consistentes.
el
nacimiento
de
Cristo
suceda
uno
de
estos
Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicols Coprnico,
Galileo, Neper, William Harvey, Sir Francis Bacon y Ren Descartes, hicieron grandes
operaciones al mtodo cientfico, de tal forma que cuando se crearon los Estados Nacionales
y surgi como fuerza el comercio internacional exista ya un mtodo capaz de aplicarse a los
datos econmicos.
Los eruditos del siglo XVII demostraron especial inters por la Estadstica Demogrfica como
resultado de la especulacin sobre si la poblacin aumentaba, decreca o permaneca
esttica.
reyes
que
necesitaban
conocer
las
riquezas
A finales del siglo XIX, Sir Francis Gaston ide el mtodo conocido por
Correlacin, que tena por objeto medir la influencia relativa de los factores
sobre las variables. De aqu parti el desarrollo del coeficiente de correlacin
creado por Karl Pearson y otros cultivadores de la ciencia biomtrica como J.
Pease Norton, R. H. Hooker y G. Udny Yule, que efectuaron amplios
estudios sobre la medida de las relaciones.
al
desarrollo
del
clculo
de
probabilidades,
Colbert
puramente descriptiva. Sus tres principales representantes son Graunt, Petty (autor de la
famosa Aritmtica Poltica) y Halley.
Chaptal, ministro del interior francs, publica en 1801 el primer censo general de poblacin,
desarrolla los estudios industriales, de las producciones y los cambios, hacindose
sistemticos durante las dos terceras partes del siglo XIX.
3.- Tercera Fase: Estadstica y Clculo de Probabilidades:
El clculo de probabilidades se incorpora rpidamente como un
instrumento de anlisis extremadamente poderoso para el estudio de
los fenmenos econmicos y sociales y en general para el estudio de
fenmenos cuyas causas son demasiados complejas para
conocerlos totalmente y hacer posible su anlisis.
CRONOLOGIA DE LA ESTADISTICA
poca
Grecia
antigua
Siglo XVII
Siglo XVII
Siglo XIX
Siglo XX
Contribuidor
Filsofos
Graunt, Petty
Pascal, Berno
DMoire,
Curva normal, regresin aplicada sobre estudios de astronoma
Laplace, Gauss
Quetelet
Galton
Pearsons
Gossett
(Student)
Fisher
Wilcoxon
Siglo XX
Kruskal Wallis
Spearman
Kendall
Tukey
Dunnett
Keuls
Contribucin
10
11
12
III. EJERCICIOS
En los ejemplos siguientes identifique los elementos indicados en el recuadro:
3.2. Un estudio de 300 hogares en un pueblo sureo revelo que 20 por ciento tiene al
menos un hijo en edad escolar.
Poblacin
Muestra
Unidad de Anlisis
Variable de estudio
3.3. Varias veces durante el da un ingeniero de control de calidad, en una fbrica textil,
selecciona diferentes muestras de metros cuadrados de telas, las examina y registra el
nmero de imperfecciones que encuentra.
Poblacin
Muestra
Unidad de Anlisis
Variable de estudio
13
3.4. Un investigador mdico examina los efectos de un agente cancergeno en las ratas.
Tres semanas despus de inyectado el agente en una rata, el investigador realiza una
intervencin quirrgica para extraer y pesar los tumores.
Poblacin
Muestra
Unidad de Anlisis
Variable de estudio
3.5. Un gerente desea conocer si aquellos trabajadores que reciben 25 das de vacaciones
son ms productivos durante el ao, que los que reciben solo 15 das. El gerente
selecciona una muestra de 40 trabajadores y registra su rendimiento laboral.
Poblacin
Muestra
Unidad de Anlisis
Variable de estudio
14
3.7. En cierta universidad el decano de un colegio al hacer los preparativos para una
presentacin de consejeros, necesita conocer el promedio del nmero de estudiantes
por clase. El decano descubre que:
En una muestra de 20 grupos, el nmero promedio de
estudiantes por grupo es de 77.
En un estudio acerca de toda la universidad, el
promedio por grupo resulta en 84.
3.9. Un fisilogo est interesado en el ndice de latidos cardiacos por persona, despus de
ciertas cantidades de ejercicio. Est interesado en lo siguiente:
El ndice ms elevado de latidos cardiacos de 100
personas despus de ejercicios vigorosos.
El ndice de latidos cardiacos promedio de todas las
personas, antes de realizar ejercicios.
15
19 20 puntos
Excelente
17 18,5 puntos
Muy bueno
14 16,5 puntos
Bueno
11 14,5 puntos
Regular
Menos de 11
Malo
(4 ptos)
Estadstica:
..
b)
Poblacin:
..
c)
Muestra:.
..
d)
Dato:
..
16
4.2. La estadstica que se ocupa de interpretar los resultados obtenidos con las tcnicas
descriptivas, para tomar decisiones se denomina.......................................... (1Pto)
4.3. Es la caracterstica medible o descrita mediante un valor o atributo de un elemento en
estudio... (1Pto)
(2 ptos)
b) Falso
Justifique su respuesta.
.
.
(1Pto)
a)
b)
c)
d)
e)
b)
c)
d)
e)
17
6.2. VILA ACOSTA, R., (2001). Estadstica Elemental. Estudios y Ediciones RA- Lima Per.
6.3. BERENSON LEVINE, (1996). Estadstica Bsica en Administracin. 6ta edicin. Edith. PHH
S. A. Mxico.
6.4. FREUND, John y MANNING SMITH, Richard, (1999). Estadstica. 6ta edicin Edith. Prentice
Hall Hispanoamericana S.A.- Mxico.
6.6. MILLER, Irwin y FREUND, John E., 1995. Probabilidad y Estadstica para Ingenieros Edit.
Prentice Hall Hispanoamericana S.A. Mxico.
6.7. MOYA, Rufino, (1991). Estadstica Descriptiva. Editorial San Marcos- Lima- Per.
6.8. WEBSTER, A. y otros, (2000). Estadstica Aplicada a los Negocios y a la Economa. 3era
edicin Edith. McGraw-Hill Companies, Inc. Santa Fe de Bogot- Colombia.
Fuentes electrnicas:
http://www.eumed.net/cursecon/libreria/drm/index.htm
18
Sesin 2
Variables y Escalas de Medicin
Recoleccin de datos
CAPACIDADES
1.
2.
3.
4.
ACTITUDES
1. Valora la importancia que tiene la clasificacin de las Variables Estadsticas; segn
las diferentes escalas de medicin en la investigacin cientfica.
2. Asume una actitud reflexiva para identificar las tcnicas e instrumentos de
recoleccin de datos adecuados.
3. Valora la importancia que tienen las tcnicas e instrumentos a utilizar en la de
recoleccin de datos como parte fundamental del proceso estadstico.
4. Asume una actitud reflexiva, crtica, creativa y participativa en la realizacin de las
actividades de aprendizaje.
CONTENIDO
Variables. Clasificacin. Escalas de Medicin.
Recoleccin de Datos. Tcnicas e Instrumentos.
19
VARIABLES
DEFINICION:
caractersticas
Cada rasgo o aspecto de una poblacin constituye una variable. La edad de unas personas,
su sexo, color de su piel, nacionalidad, su nivel de motivacin, niveles de ansiedad, el
nmero de nacimientos, nmero de matrimonios, frecuencia de suicidios, estatura, peso,
niveles de inteligencia, actitudes, entre muchas otras.
Las variables pueden adquirir diferentes valores o clasificarse en diferentes categoras segn
la naturaleza o tipo de estudio que se lleve a cabo. Entre stas tenemos las siguientes
clasificaciones:
20
VARIABLES
TIPOS
INDEPENDIENTES
Es la variable que se manipula con la intencin de observar cambios en otra
variable (var. Dependiente)
DEPENDIENTES
Aquella en la que se observa cambios por efectos producidos por algn estimulo
(var. Independientes)
VAR. CUALITATIVA
POR SU
NATURALEZA
DISCRETA
VAR. CUANTITATIVA
Cuando los datos que se estudia son
nmeros y es posible operarlas
aritmticamente
SEGN EL
NUMERO DE
VARIABLES
21
EJEMPLOS
CONTINUA
Cuando adopta cualquier valor dentro de un
rango especifico.
edad,
nmero de das
cantidad hijos
longitud,
superficie, volumen,
peso, tiempo, dinero
UNIDIMENSIONAL
Cuando se estudia una sola variable o muchas, pero en forma independiente
La edad, El rendimiento
La autoestima, El estado Civil
BIDIMENSIONAL
Cuando se estudia dos variables al mismo tiempo, para ver la relacin entre
ellas
MULTIDIMENSIONAL
Cuando se estudia ms de 2 variables al mismo tiempo.
DEPARTAMENTO DE INVESTIGACIN
ESTADSTICA GENERAL
ESCALAS DE MEDICIN
Es una sucesin de medidas que permite organizar datos en orden jerrquico y mediante un
esquema especfico para asignar nmeros o smbolos con el objeto de designar
caractersticas de una variable (Ary, Jacobs, Razavieh, 1984). La taxonoma ms conocida
sobre las escalas de medicin las presenta Stevens (1951) quien las clasifica en nominales,
ordinales, de Intervalos y de razn. A continuacin veamos los cuatro tipos de escalas de
medicin.
a. Nominales
b. Ordinales
c. De Intervalo
d. De razn
DICOTOMICAS
TRICOTOMICAS
MULTITOMICAS
ESCALAS NOMINALES
Las escalas nominales son aquellas donde se clasifican a los elementos
en categoras cualitativamente distintas.
Consiste simplemente en agrupar objetos en clases o asignar las
personas de acuerdo a alguna cualidad una vez que los objetos o
personas posean caractersticas comunes que lo hagan pertenecer a
una categora.
Se pueden utilizar nmeros en las escalas nominales, pero estas solo
como
etiquetas,
nunca
se
utilizarn
para
llevar
cabo
los
- 22 -
ESCALAS ORDINALES
Escala ordinal = Nominal + Orden
Las escalas ordinales son las que clasifican a las personas, eventos u
objetos en una posicin con relacin a cierto atributo, pero sin indicar la
distancia que hay entre las posiciones.
Cuando se asignan nmeros es slo para indicar el orden de las
posiciones de lo que se est clasificando. Por ejemplo, el cuadro de
meritos del curso de Estadstica.
En este nivel tambin se definen varias categoras, pero adems de
mostrar un ordenamiento existe una relacin de mayor o menor que
entre ellas.
Las etiquetas, smbolos o nmeros asignados si indican jerarqua,
aunque no es posible conocer la magnitud de la diferencia entre cada
una de las categoras
Con las escalas ordinales tampoco se pueden llevar a cabo las
operaciones aritmticas de suma, resta, multiplicacin y divisin. La
diferencia que puede haber entre unas personas u objetos en este tipo
de escala no necesariamente constituye unidades iguales o absolutas
que puedan utilizarse para determinar si el que tiene un segundo lugar
posee el doble valor que el que queda en cuarta posicin. Por ejemplo,
en un evento atltico de una carrera que no haya sido cronometrada,
podemos saber quin lleg primero, segundo y tercer lugar, pero no
podemos saber con precisin la velocidad entre un corredor y otro. La
diferencia que hay entre el primero y el segundo no necesariamente es
igual a la que hubo entre el segundo y el tercero.
- 23 -
ESCALA DE INTERVALO
Esta escala mide las variables de manera numrica
Los nmeros de esta escala permiten establecer distancias entre 2
individuos.
Las operaciones aritmticas de suma o resta son perfectamente
realizables y significativas, no siendo la multiplicacin o divisin (no
tienen significados)
El cero es un valor que no indica ausencia de la caracterstica (es decir
es relativo) y es colocado en algn lugar de la escala. Ejemplo: la
Temperatura, donde el cero no implica la ausencia de temperatura
Ejemplo2: La escala de inteligencia posee un punto 0, pero nunca se va
a encontrar a un ser humano con cero de inteligencia.
- 24 -
CARACTERISTICAS
Se clasifican las
Nominal
personas, eventos u
objetos en categoras
Denominaciones religiosas,
partidos polticos, nombres
de objetos, pinturas,
movimientos literarios.
LIMITACIONES
No se pueden precisar
diferencias cuantitativas
entre las categoras.
Restringida para
en una carrera,
Identificar diferencias
puntuaciones de una
diferencias en cantidad
nivel de popularidad de
u objetos.
unidades de igual
Temperaturas (Celsius y
Razones no tienen
de la escala es arbitrario
calendario, escala de
cero es establecido
y no refleja la ausencia
inteligencia.
convencionalmente
Se clasifican u ordenan
las
Ordinal
USOS/EJEMPLOS
personas, objetos y
eventos en determinada
posicin
Escala que posee
Intervalo
del atributo.
Ninguna, excepto que su
Escala que posee un
Razn
uso se supedita
mayormente a medir
cualidades fsicas ms
que para la medicin de
aspectos psicolgicos.
- 25 -
TIPO DE
ESCALA DE LA
DESCRIPCION
VARIABLE
Cualitativa (nominal
Variables
u ordinal)
pictograma
individuales
Cuantitativa
(Intervalo
o razn)
Frecuencias acumuladas
Cualitativa con
cualitativa
Asociacin entre
variables
Cualitativa con
Tablas de contingencia
Grficos de barras
cuantitativa
Cuantitativa con
cuantitativa
- 26 -
de cada entrada
-
Recta de regresin
TIPO DE
ESCALA DE LA
DESCRIPCION
VARIABLE
Variables
Nominales
individuales
Ordinales
Muestras grandes
mediana poblacional
-
con distribucin
Asociacin entre
variables
poblacional.
normal
Muestras
pequeas sin
distribucin normal
- 27 -
mediana poblacional.
-
TIPO DE
ESCALA DE
DESCRIPCION LA VARIABLE
Independientes Nominal
(sin control de
factores de
confusin)
Ordinal
Independientes Razn
Nominal
Dependientes
con bloques o
igualacin de
atributos
Ordinal
Razn
- 28 -
Prueba de Fisher
Prueba X2
Calculo del riesgo relativo
Modelos logsticos y logartmicos lineales
Prueba U de Mann Whitney (dos poblaciones)
Prueba de Kruskall Wallis (2 o ms
poblaciones)
Modelos logartmicos lineales
Prueba t-student (dos poblaciones)
Anlisis de varianza para la prueba F (ms de
2 poblaciones) seguida de la prueba de
medias de Tukey, Dunkan, etc.
Prueba de logrank para comparar sobreviva.
Regresin mltiple
Prueba de McNemar.
Mtodo de Mantel Haenzel
Prueba de X2 para cada bloque
Modelo logsticos y logartmicos lineales.
Prueba de Friedman
Prueba de Wilcoxon para rangos sealados
Modelos logartmicos lineales
Prueba t apareada
Anlisis de varianza para prueba F con 2
criterios de clasificacin con prueba de Tukey
Regresin mltiple
RECOLECCION DE DATOS
La recoleccin de datos proporciona la materia prima para el proceso estadstico. La
veracidad de los resultados depende de la calidad de los datos que se recolecten. A menudo
esta actividad de recoleccin es la que consume mayor tiempo y costo, por lo que es lgico
concluir que es muy importante planearla y ejecutarla adecuadamente.
La recoleccin de datos implica tres actividades:
o
FUENTES DE INFORMACION
Una fuente de informacin es el lugar, la institucin, la persona donde estn
los datos que se necesitan para la investigacin.
Los datos pueden reunirse a partir de fuentes de informacin existentes o pueden obtenerse
mediante encuestas y estudios experimentales diseados para conseguir nuevos datos. Las
fuentes de informacin pueden ser:
Primarias
Informacin que se obtiene
directamente de la Unidad
de observacin
Fuentes de datos
internos.
aquellas que la empresa puede
obtener y explorar por sus
propios medios y recursos sin
necesidad de acudir a terceros
Fuentes de datos
externos
Informacin que estn situadas
fuera de la empresa cuya
informacin puede obtenerse a
travs de diferentes medios
- 29 -
Secundarias
Informacin elaborada a base de
datos de las fuentes primarias
Reportes Financieros,
Reporte de operaciones,
planificacin, reportes
especiales, etc
Informes, Anlisis o
comparaciones sobre reportes
anteriores de la empresa
Informes de Estudio de
mercado, estudio de
posicionamiento,
Reportes del INEI
ENCUESTA
ENTREVISTA
OBSERVACIN
ANLISIS DOCUMENTAL
- 30 -
La encuesta
La entrevista
El Anlisis documentario
1. LA OBSERVACION
Es el registro visual de lo que ocurre en una situacin real, clasificado y consignando
los datos de acuerdo con algn esquema previsto y de acuerdo al problema que se
estudia.
VENTAJAS
DESVENTAJAS
agudeza
cualitativos.
Se
observan
caractersticas
Tambin
conductas,
Puede
ser
utilizada
en
los
Demanda
gran
cantidad
de
cualquier
ver
tiempo.
actividades,
para
fenmenos estudiados.
Al momento de la interpretacin
realidad.
- 31 -
TIPOS DE OBSERVACION
CLASES
TIPOS
CARACTERISTICAS
El
investigador
se
involucra
total
investigacin.
grupo.
Nivel de
Pueden
intervenir
las
emociones
del
investigador.
participacin
El investigador no se involucra en la
actividad objeto de estudio.
Observacin
NO
Participante
Segn la
Observacin
forma de
Directa
registrar la
conducta
Observacin
Indirecta
Segn la
Planificacin
Simple o No
estructurada
propuesta.
de la
usada
para
estudios
exploratorio
observacin
Sistemtica
o
Estructurada
- 32 -
Fundamentalmente
2. LA ENTREVISTA
Es la comunicacin interpersonal establecida entre el investigador y el sujeto de
estudio a fin de obtener respuestas verbales a las interrogantes planteadas sobre el
problema propuesto.
VENTAJAS
TIPO DE ENTREVISTAS
1. ENTREVISTA ESTRUCTURADA
El entrevistador no requiere
DESVENTAJAS
Limitada
la
gran entrenamiento.
profundizar
Informacin uniforme.
determinado.
Difcil
en
obtener
confidencial.
- 33 -
posibilidad
un
de
aspecto
informacin
2. ENTREVISTA NO ESTRUCTURADA
DESVENTAJAS
Adaptable y aplicable
de
sujetos en diversas
toda
clase
situaciones.
palabra.
Permite
profundizar
en
temas
los
de
Orienta
posibles
hiptesis y variables
inters.
cuando se exploran
reas nuevas.
del tema.
- 34 -
El entrevistador debe:
3. LA ENCUESTA
VENTAJAS
DESVENTAJAS
en un perodo breve.
respuestas.
Menores
requerimientos
de
personal capacitado.
Resulta
cuestionarios
introduce el encuestador.
contestados.
Se
deben
muestras.
- 35 -
difcil
obtener
completamente
obtener
grandes
4. ANALISIS DOCUMENTARIO
III. EJERCICIOS
3.1. De los siguientes incisos, cules representan variables discretas y cules variables
continuas?
a) El nmero de acciones vendidas por da en la bolsa de valores.
b) Las temperaturas registradas cada media hora en un observatorio.
c) El tiempo de vida de bateras de equipos celulares con cmara y MP3.
d) El ingreso anual de los profesores universitarios.
e) La longitud de 1000 tornillos producidos por una fbrica.
3.2. Establece una correspondencia entre las variables indicadas y la clasificacin que se
muestra a continuacin:
VARIABLES
CLASIFICACION
A
Cualitativa Nominal.
Dependiente, independiente
Bidimensional.
Cuantitativa discreta
Unidimensional.
Cualitativa Ordinal.
Cualitativa, cualitativa
Bidimensional.
Cuantitativa continua
Razn.
1 El peso y la talla
2
- 36 -
DEPARTAMENTO DE INVESTIGACIN
ESTADSTICA GENERAL
3.4. Proporciona una definicin operacional en cada uno de los siguientes casos:
a) Un buen trabajador
b) Un bonito da
d) Tiempo de estudio
f) Un buen estudiante
3.5. Un investigador que est estudiando hbitos de consumo le pregunta a cada vigsima
persona que entra en un supermercado acerca del nmero de veces que va de
compras semanalmente
a) Si la persona encuestada responde 2, esta respuesta es una muestra, variable,
medida estadstica, parmetro o dato? La respuesta es un valor cuantitativo o
cualitativo?, porqu?
b) A la persona encuestada tambin se le pregunta por su edad, estado civil
3.6. Propn las tcnicas e instrumentos que se podran utilizar en la recoleccin de datos
para responder las preguntas que se presentan a continuacin y explica la razn de su
eleccin.
a)
b)
- 37 -
c)
d)
e)
6)
2) Gnero
7)
4) Cuntas
8)
horas a la semana
divertirse?
9)
tipo de trabajo?
utiliza?
10)
- 38 -
ACTIVIDADES DE REFORZAMIENTO
4.1. Propn la tcnica e instrumento de recoleccin de datos que se podran utilizar para
lograr los siguientes objetivos.
Objetivos
Tcnicas
Instrumentos
4.2. Algunos de los objetivos especficos de una investigacin para analizar la satisfaccin
de los clientes de un restaurante son: (a) Describir el perfil de los clientes, (b) Evaluar
la atencin del personal, segn la opinin de los clientes, (c) Determinar la opinin de
los clientes sobre la calidad de la comida, (d) Conocer la opinin de los clientes sobre
la infraestructura, (e) Identificar las razones por las que los clientes prefieren el
restaurante. Elabora un cuestionario estructurado y codificado, considerando por lo
menos dos preguntas para cada objetivo.
39
REFERENCIAS BIBLIOGRFICAS
1.
VILA ACOSTA, R., (2001). Estadstica Elemental. Estudios y Ediciones RA- Lima
Per.
2.
3.
4.
5.
6.
MOYA, Rufino, (1991). Estadstica Descriptiva. 1era edicin Editorial San MarcosLima- Per.
7.
40
MUESTREO
I. DEFINICIONES PRELIMINARES:
UNIDAD DE ANLISIS:
Para seleccionar una muestra, primero se define la Unidad de Anlisis que puede ser un
cliente, un votante, una organizacin, un libro contable, un peridico, un hospital, un paciente,
etc. Esta definicin nos permite identificar Quien va ha ser medido, Quien nos va ha dar la
informacin y por lo tanto precisar claramente el problema a investigar y los objetivos de la
investigacin.
POBLACION OBJETIVO:
Una vez que se ha definido la unidad de anlisis se procede a delimitar la poblacin que va a
ser estudiada y sobre la cual se pretende generalizar o inferir los resultados. Entonces, una
poblacin es el conjunto de todas las unidades de estudio que concuerdan con una serie de
especificaciones o caractersticas. Para seleccionar la muestra debe delimitarse la poblacin
identificando sus caractersticas o variables de inters a fin de determinar los parmetros
poblacionales. En algunos casos, la delimitacin de una poblacin no slo depende de los
objetivos del estudio, sino de otras razones prcticas. Las poblaciones tienen que ser
especificadas en contenido, lugar y tiempo.
MUESTRA:
La muestra es un subconjunto de elementos que pertenecen a una poblacin de estudio. Para
seleccionar una muestra debemos de tener presente el tipo de muestreo a utilizar: muestreo
probabilstica y el muestreo no probabilstico. Se tiene que definir la variable de inters, para
que en funcin de esta se sepa qu tipo de muestreo utilizar. Luego calcular el tamao de
muestra y finalmente seleccionar las unidades de anlisis.
41
MUESTREO
Es una TCNICA ESTADSTICA por la cual se realizan inferencias a la poblacin examinando
solo una parte de ella, sta parte recibe el nombre de
Desventajas:
Costo reducido
Mayor rapidez
Claridad
B. TECNICAS NO PROBABILISTICAS
Muestreo aleatorio
Muestreo sistemtico
El muestreo intencional
A. TECNICAS PROBABILISTICAS
MUESTREO ALEATORIO:
Escoge al azar los miembros de la poblacin hasta completar el tamao muestral previsto.
En teora se enumeran previamente todos los elementos y de acuerdo con una tabla de
nmeros aleatorios se van escogiendo.
El procedimiento puede darse con o sin reemplazos y esta condicin afectar posteriormente el
anlisis.
a. Sin reposicin:
Cuando un elemento es seleccionado y puede volver a ser seleccionado, se dice que hacemos
un muestreo aleatorio con reemplazamiento o con reposicin. Generalmente recibe el nombre
de muestreo aleatorio simple. (m.a.s.)
b. Con reposicin:
En caso de que el elemento no vuelva a formar parte de la poblacin de manera que no puede
volver a ser seleccionado se dice que se ha obtenido la muestra mediante un muestreo
aleatorio sin reposicin o reemplazamiento. En algunos libros, este mtodo recibe tambin el
nombre de muestreo irrestrictamente aleatorio.
42
MUESTREO SISTEMATICO:
En la poblacin (N) se elige el primer elemento al azar.
Luego los dems se escogen cada cierto intervalo (k), hasta completar el tamao muestral (n).
El tamao del intervalo (k) se calcula as: k = N/n
MUESTREO ESTRATIFICADO:
Considera que al interior del universo existen estratos (subgrupos internamente homogneos
pero cualitativa y cuantitativamente diferentes entre s), y que no se cumple la condicin de
seleccin aleatoria pues los miembros del grupo mayoritario tienen una mayor probabilidad de
ser seleccionados en la muestra.
B. TECNICAS NO PROBABILISTICAS
MUESTREO POR CUOTAS:
Tambin denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un
buen conocimiento de los estratos de la poblacin y/o de los individuos ms "representativos" o
"adecuados" para los fines de la investigacin. Mantiene, por tanto, semejanzas con el
muestreo aleatorio estratificado, pero no tiene el carcter de aleatoriedad de aqul.
MUESTREO A JUICIO:
Se busca seleccionar a individuos que se juzga de antemano tienen un conocimiento profundo
del tema bajo estudio, por lo tanto, se considera que la informacin aportada por esas personas
es vital para la toma de decisiones.
43
BOLA DE NIEVE:
Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y as hasta
conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen
estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos,
etc.
44
Hacer
un Censo
La poblacin
est bien
definida
?
Es posible
observar toda la
poblacin?
NO
Definir
La
poblacin
Las observaciones
pueden atribuirse
a los miembros la
poblacin
Variable
Cualitativa
Muestreo
Representativo
para estimar una
Proporcin
Variable
Cuantitativa
Muestreo
Representativo
para estimar una
Media
NO
Observar
una Muestra
De que naturaleza
es el parmetro
que se
quiere estimar
?
a. Un nivel de confianza: Que es adoptado por el investigador, el cual puede ser 90%,
95% o 99% y que origina el valor de Z.
b. El error de estimacin (E): Que tambin es fijado por el investigador
c. La desviacin estndar varianza: que son valores que se obtienen por estudios
anteriores, por la muestra piloto o por la distribucin de la poblacin.
d. El Tamao de la poblacin (N): Que generalmente no se conoce.
45
a. Un nivel de confianza: Que es adoptado por el investigador, el cual puede ser 90%,
95% o 99% y que origina el valor de Z.
b. El error de estimacin (E): Que tambin es fijado por el investigador
c. La proporcin poblacional (P): que son valores que se obtienen por estudios
anteriores, por la muestra piloto y si no se conoce asumir p=0.5.
d. El Tamao de la poblacin (N): Que generalmente no se conoce.
VARIABLE
(Cuando no se conoce N)
(Cuando se conoce N)
Cuantitativa
(Proporcin
(Promedio
Poblacional)
Poblacional)
Z 2 P(1 - P)
n0 =
E2
POBLACION INFINITA
POBLACION FINITA
Cualitativa
n=
Z 2 P(1 - P) N
E 2 ( N - 1) + Z 2 P(1 - P)
n0 =
n=
Z 2S 2
E2
Z 2S 2 N
E 2 ( N - 1) + Z 2 S 2
46
47
CASOS
CASO N 01: (Cuando se conoce la varianza)
En un estudio realizado en la Minera Barrick se obtuvo que el
promedio de horas extras por trabajador es de 3.3 hrs., con una
varianza de 4.18 hrs2. Si en el presente ao cuenta con 120
trabajadores, los cuales registran sus horas extras en tarjetas de
control. Determinar el tamao de muestra necesario para estimar el
promedio de horas extras diarias con un error del 10% del promedio
y una confianza del 95%.
48
CASO N 06:
Se desea determinar una muestra representativa para conocer la opinin en contra de la
poblacin acerca de la explotacin del Cerro Quilish-Cajamarca. Se aplic una muestra piloto
a 20 de los 10000 cajamarquinos, obtenindose los siguientes datos. Cul es el tamao de
muestra con un 95% de confianza y un error del 2%?
49
Grupo
Tamao de muestra
A favor
En contra
Indecisos
Total
20
CASO N 07:
Se desea estimar la proporcin de jvenes de la ciudad de Trujillo
que hacen uso de Internet como mnimo una hora diaria con un 95%
de confianza. De estudios anteriores se conoce que P=0.70 y se
desea un E = 5%. Suponiendo que N = 1500. Cual debe ser el
tamao de muestra.
CASO N 08:
El administrador del Restaurante El Romano desea saber que proporcin de sus ClientesTuristas estn inconformes con las atenciones recibidas durante su estada en Trujillo. De
que tamao debe ser la muestra si se considera E=0.05, nivel de confianza del 95% y no se
dispone de alguna otra informacin?
CASO N 09:
50
Sesin 4
Organizacin de los datos:
Tablas y Grficos Estadsticos
CAPACIDADES
1. Construye e Interpreta los diferentes tipos distribuciones de frecuencias.
2. Presenta adecuadamente los cuadros estadsticos.
3. Construye e interpreta los grficos de acuerdo a las normas tcnicas del INEI
ACTITUDES
1. Valora la importancia que tiene la distribucin de frecuencias y los grficos como
CONTENIDO
51
CUADROS ESTADISTICOS
I.
CUADRO ESTADISTICO
Un cuadro estadstico es un arreglo ordenado de filas y columnas, de datos estadsticos
o caractersticas relacionadas, con el objeto de presentar adecuadamente informacin
estadstica. (Ejemplo: las tablas del BCR, INEI). Deben ser diseados de tal forma que el
lector pueda dirigirse fcilmente al cuadro.
lectura, comparacin e
interpretacin
III. VENTAJAS:
52
Ejemplo:
Cuadro N 1
53
INTERVENCIONES EN DELITOS
TOTAL
DPTO LA
RESTO
PAIS
23681
1296
109112
6669
8531
7736
4247
15081
1483
314
924
179074
LIBERTAD
2137
1
7793
21
424
17
--6
6
36
10467
PAIS
21544
1295
101319
6648
8107
7719
4247
15081
1451
308
888
168607
Cuadro sobrecargado
54
55
Donde:
EJEMPLO
Simples
Acumuladas
# hijos
fi
hi
Fi
Hi
0 hijos
f1 = 6
6/13 =
46.1%
F1 = f1 = 6
H1 =F1/N =
46.1%
1 hijos
f2 = 4
4/13 =
30.8%
F2 = f1+f2 =10
H2 =F2/N =
76.9%
2 hijos
f3 = 3
3/13 =
23.1%
F3 = f1+f2+f3 =13
H3 =F3/N =
100%
13
100%
Total
56
GRAFICOS ESTADISTICOS
I.
LEYENDA:
57
58
59
10
8
6
4
2
0
10
20
30
40
f 9
8
B) POLIGONO DE FRECUENCIAS
6
5
2
1
frecuencias correspondientes.
0
5
15
35
25
45
F 90
80
El polgono de
Frecuencias acumuladas se
llama OJIVA
70
60
50
40
30
20
10
0
1
60
C) GRAFICO DE BARRAS
Estos grficos constituyen una herramienta adecuada para comparar los tamaos
relativos de cantidad que se distribuyen en el espacio.
Ejemplo:
de una ciudad.
f
LUGAR
TURISTICO
A
B
C
D
TOTAL
N DE
PERSONAS
40
20
30
15
105
45
40
35
30
25
20
15
10
5
0
A
D) GRAFICO CIRCULAR
Sirve para representar la divisin de un todo en las partes que lo constituyen. El
crculo total es dividido en partes por medio del trazado de radios, segn los grados
del ngulo correspondiente.
Ejemplo: La siguiente tabla muestra la situacin acadmica de un grupo de
estudiantes al final de un ciclo acadmico
CONDICION
APROBADO
DESAPROBADO
INHABILITADO
RESERVA DE MAT
TOTAL
N DE
ESTUD
35
8
5
2
50
%
70
16
10
4
100
INHABILITADO;
10
RESERVA DE
MAT; 4
DESAPROBADO;
16
APROBADO; 70
61
EJEMPLOS
IV.
62
Escasez de datos
No uso de la identificacin.
EJERCICIOS
1.
Frec.
ocupacin
Absoluta
Relativa
(min)
20 30
30 40
16
40 50
12
50 60
60 70
70 80
TOTAL
45
Relativa
Absoluta
simple
acumulada acumulada
2.
3.
63
84
47
74
57
42
35
50
85
81
60
65
53
54
68
85
65
52
35
33
71
74
65
77
45
73
55
91
61
41
40
59
65
60
76
64
69
48
55
78
94
67
47
88
89
77
73
66
98
66
70
4.
0 2 5 0 3 1 8 0 3 1 1
Segundo mes 9 2 4 0 2 9 3 0 1 9 8
a) Construir la distribucin de frecuencias relativas y la de frecuencias
relativas acumuladas
b) Representar ambas distribuciones en un grafico comparativo
c) Qu proporcin de personas no compraron nunca dicha marca?
d) Qu porcentaje de consumidores adquirieron dicha marca menos de 5
veces?
5.
de bibliotecarias o
1 10 2
5 3
2 2 5 3 3 8 12 3 2 2 5 4 1 5 8 6 6 1 3 15 16 6 7
12
64
1.59
1.63
1.62
1.65
1.61
1.59
1.51
1.62
1.62
1.53
1.49
1.57
1.54
1.53
1.59
1.58
1.57
1.47
1.64
1.55
1.59
1.53
1.56
1.53
65
a)
20.8
22.8
21.9
22.0
20.7
20.9
25.0
22.2
22.8
20.1
23.3
20.9
22.9
23.5
19.5
23.7
23.6
19.0
25.1
25.0
21.3
21.5
19.9
24.2
24.1
19.8
23.9
22.8
23.9
19.7
21.1
20.9
21.6
22.7
25.3
20.3
23.1
20.7
19.5
23.8
21.8
24.3
22.5
21.2
23.8
23.8
20.7
24.2
24.2
24.1
b)
c)
Determina
48
66
21
28
30
46
38
69
50
90
38
21
35
92
53
53
21
27
52
55
50
48
35
36
52
45
24
28
31
39
46
61
81
46
a)
b)
c)
d)
66
3 6 2 3 3 1 4 5 2 4 3 1 2 4 4 5 3 1 2 4 1 4 8
1 2 3 4 5 2 7 2 3 5 3 4 4 3 4 3 6 2 1 3 6 4 5
3 2 4 3 2 4 5 3 7 1 3 4 3 4 1 3 7 3 2 1 3
Organiza los datos en una distribucin de frecuencias considerando las
frecuencias absolutas simples (fi) y los porcentajes simples.
k = 6 redondeado a
dcimos.
b)
k=8 redondeado a
centsimos.
12. Cuando se les pidi clasificar la destreza que se requiere para obtener una
alta calificacin en un nuevo juego de computadora como principiante,
aprendiz, competidor, maestro o experto, 45 evaluadores respondieron de la
manera siguiente: experto, maestro, maestro, competidor, experto, maestro,
maestro, maestro, experto, aprendiz, maestro, maestro, maestro, maestro,
experto, maestro, competidor, maestro, maestro, principiante, experto,
competidor, maestro, maestro, experto, experto, maestro, maestro, maestro,
competidor, competidor, experto, maestro, experto, experto, experto,
competidor, maestro, maestro, y experto. Ahora:
Construye una tabla que indique las frecuencias correspondientes a estas
clasificaciones de la destreza que se requiere para obtener una calificacin
alta.
67
Mes de julio
40.00 380.00 18.00 43.00 47.50 30.00 434.08 16.00 62.50
37.00 98.50
4.80 235.00 97.50 490.00 147.00 235.50 124.00
30.00 16.15 200.00 60.00 22.50 30.00 45.00 490.00 413.00
90.62 55.00 86.00 188.80 32.50 307.40 92.00 140.00
5.70
Mes de agosto
95.00 390.30 49.10 29.19
76.00
4.20 18.50 88.50
35.00 78.00 82.00 356.70
50.00 117.50 50.00 300.00
17.20
88.00
86.00
3.00
93.00 160.00
70.00 48.00
6.20 14.10
12.00 13.00
b)
Construye
ACTIVIDAD EN CLASE
Recolecta la siguiente informacin de los alumnos del aula.
Edad
Genero Talla
Peso
Estado
Numero de
civil
hermanos
1.
2.
Hacer las tablas de frecuencia de Edad, genero, talla, Peso, Estado Civil, #
Hermanos
3.
68
nominales y los lmites reales de siete clases en que se podran agrupar estos
pesos.
(3 ptos)
(3 ptos)
4.3. Las marcas de clase de una distribucin del nmero de asaltos registrados
diariamente en una delegacin de polica son 4, 13, 22, 31 y 40. Encuentra: a) los
lmites de clase nominales, b) los lmites reales.
(2 ptos)
4.4. Para agrupar las ventas que varan entre $10.00 y $60.00, un dependiente utiliza
las clasificaciones siguientes: $10.00-19.99, $20.00-35.99, $35.00-49.00 y $50.0059.99. Explica las dificultades que se tendran al utilizar estas clases. (2 ptos)
4.5. Una compaa de computadoras recibi un pedido urgente del mayor nmero de
computadoras domsticas que pudiera entregar en un perodo de tiempo de seis
meses. Los expedientes de la compaa ofrecen las siguientes entregas diarias:
(5 ptos)
69
22
65
65
57
55
50
65
77
73
30
62
54
48
65
79
60
63
45
51
68
79
83
33
41
49
28
55
61
65
75
55
75
39
87
45
50
66
65
59
25
35
53
a) Agrupa estas cifras de entrega diaria en una distribucin que tenga las clases
20-29, 30-39, 40-49,.., 80-89.
b) Cules son los lmites reales o fronteras de clase?
c) Calcula las frecuencias absolutas acumuladas y porcentuales acumuladas
menos que y mayor que. Interpreta las frecuencias de la segunda y quinta
fila.
(5 ptos)
20.8
22.8
21.9
22.0
20.7
20.9
25.0
22.2
22.8
20.1
25.3
20.7
22.5
21.2
23.8
23.3
20.9
22.9
23.5
19.5
23.7
20.3
23.6
19.0
25.1
25.0
19.5
24.1
24.2
21.8
21.3
21.5
23.1
19.9
24.2
24.1
19.8
23.9
22.8
23.9
19.7
24.2
23.8
20.7
23.8
24.3
21.1
20.9
21.6
22.7
frecuencias simples y
frecuencias porcentuales
acumuladas menor que y mayor que, utilizando una amplitud de clase de 0.8
minutos.
b) Halla los lmites reales de clase de la distribucin.
70
1.
0 - 1,9
15
2 - 3,9
26
4 - 5,9
6 - 7,9
20
13
8 - 9,9
6
2.
Ganancias
$5.000 o menos
$5.001 - $10.000
$10.001 - $15.000
$15.001 - $20.000
$20.001 - $30.000
$30.001 - $40.000
$40.001 - $50.000
ms de $50.000
71
Frecuencias
2
12
11
33
32
20
13
7
GNERO
TIPO DE
INGRESO
Total
MASCULINO
FEMENINO
26
16
42
61.9%
38.1%
100.0%
28.6%
25.0%
27.1%
16.8%
10.3%
27.1%
34
22
56
60.7%
39.3%
100.0%
37.4%
34.4%
36.1%
21.9%
14.2%
36.1%
31
26
57
54.4%
45.6%
100.0%
34.1%
40.6%
36.8%
20.0%
16.8%
36.8%
91
64
155
Total
58.7%
41.3%
100.0%
100.0%
100.0%
100.0%
58.7%
41.3%
100.0%
72
REFERENCIAS BIBLIOGRFICAS
1.
VILA ACOSTA, R., (2001). Estadstica Elemental. Estudios y Ediciones RA- Lima
Per.
2.
3.
4.
5.
6.
MOYA, Rufino, (1991). Estadstica Descriptiva. 1era edicin Editorial San MarcosLima- Per.
73
Sesin 6
Medidas Estadsticas:
Tendencia Central Posicin - Dispersin
CAPACIDADES
1. Realiza clculos bsicos utilizando las frmulas,
conjunto de datos.
ACTITUDES
1. Valora la importancia que tienen las medidas de tendencia central y los cuantiles en la
las tareas y trabajos asignados, asumiendo una posicin reflexiva y crtica hacia los
resultados obtenidos.
CONTENIDO
Medidas de Tendencia Central. Media Aritmtica, Mediana y Moda. Cuantiles. Valores
Atpicos y Extremos.
74
MEDIDAS ESTADISTICAS
En numerosas ocasiones, en vez de trabajar con todos los datos, es preferible disponer de
una o ms medidas descriptivas que resumen los datos de forma cuantitativa. Se trata, de
resumir en unos cuantos valores la informacin ms importante y til contenida en un
conjunto de datos, haciendo ms fcil la comprensin y la comparacin de las diversas
caractersticas de las poblaciones o muestras.
VI. DEFINICIN
Las medidas estadsticas son medidas de resumen que se calculan a partir de una
muestra y que describen ciertos aspectos de una serie o distribucin de datos para
poder tener un mejor conocimiento de la poblacin
VII. FINALIDAD
Las medidas estadsticas pretenden "resumir" la informacin de la "muestra" para poder
tener as un mejor conocimiento de la poblacin
75
a.
MUESTRA
Media ponderada
X
Xp
La Mediana
La Moda
me
mo
Me
Mo
76
POBLACION
):
1.1. LA MEDIA ARITMTICA O PROMEDIO ( o
Es el valor representativo de una poblacin o conjunto de datos
Tambin se llama Esperanza matemtica, valor medio o promedio aritmtico
Se obtiene sumando todos los valores de los datos observados y se divide entre el
nmero total de ellos.
Solo es aplicable para el tratamiento de datos cuantitativos.
Existen dos formas de trabajar con los datos: sin agruparlos o agrupndolos en
tablas de frecuencias.
Formulas de clculo de la media aritmtica:
Datos sin
Agrupar
Datos
Agrupados * fi
77
POBLACION (N)
MUESTRA (n)
Xi
=
N
Xi
=
n
.
.
=
=
N
n
55
55
41
25
55
55
55
41
41
57
37
40
31
58
58
45
36
43
43
n
xi
36 25 ... 58 43 907 . 0
x i 1
45 . 35
n
20
20
n es impar
Datos no
agrupados
Valor que est en la mitad
de la serie ordenada
Datos
Agrupados
(TABLAS)
78
1
= + [ 2
]
1
2)
Me
50%
+ +1
2
5 + 6 850 + 850
=
= 850
2
2
79
Xi:
2.9, 1.4, 1.2, 3.4, 1.3, 2.5, 1.6, 1.8, 2.3, 1.5, 1.0
50%
50%
= +1 = 11+1 = 6 = 1.6
2
PROPIEDADES DE LA MODA
80
DESVENTAJAS DE LA MODA
En muchas series de datos no hay moda porque ningn valor aparece ms de una
vez.
En algunas series de datos hay ms de una moda, en este caso uno podra
preguntarse cul es el valor representativo de la serie de datos?
CLCULO
= + [
1
( 1 ) + ( +1 )
= + [
Donde: =
1
]
1 + 2
1
USO ADECUADO DE LA MEDIA, MEDIANA Y MODA.De las tres medidas de tendencia central, se observa que:
81
4) La moda no es muy usual, pero se emplea cuando se quiere conocer el valore que
se presenta ms frecuentemente.
b. MEDIDAS DE POSICION
Qi = LI + c [
Formula:
in
Fj1
4
Fj Fj1
2, 3, 4, 5, 6, 7, 9
Q1 Q2
o
82
Q3
1, 2, 3, 4, 5, 6, 7, 9
2.5
Q1
4.5
Q2
6.5
Q3
FI
[ 50 60 )
[ 60 70 )
10
18
[ 70 80 )
16
34
[ 80 90 )
14
48
[ 90 100 )
10
58
[ 100 110 )
63
Total
63
Cuartil 1 (Q1)
Q1 = 60 + 10 [
Cuartil 2 (Q2)
Q1 = 70 + 10 [
163
4
= 15.75
15.75 8
] = 67.75
18 8
263
4
= 31.5
31.5 18
] = 78.44
34 18
Formula:
in
Fj1
10
Di = LI + c [
Fj Fj1
83
in
Fj1
100
Pi = LI + c [
Formula:
Fj Fj1
EJEMPLO:
Suponga que se han registrado 20 observaciones referentes a los ingresos
semanales del jefe de hogar de un determinado distrito. De la informacin muestral
obtenida calcule el cuatil1, decil 8 y percentil 97:
36
55
55
41
25
55
55
55
41
41
57
37
40
31
58
58
45
36
43
43
Solucin:
Seguimos el siguiente procedimiento:
1. Ordenar la serie en forma ascendente
2. Definir la posicin de los cuartiles, deciles y percentiles siguiendo la formula
correspondiente.
3. Luego
Cuartil1
Ordenando los datos de forma ascendente:
25 31 36 36 37 40 41 41 41 43 43 45 55 55 55 55 55 57 58 58
37
5.25
6.0
84
40
17.0 55
Po lo tanto D8: 55.0
85
c. MEDIDAS DE DISPERSIN
Rango
Coeficiente
de Variacin
Medidas
de
Dispersin
Varianza
Desviacin
estndar
Son indicadores estadsticos que representan cuan dispersas se encuentran los datos de
la variable, sealndonos el grado de concentracin de los mismos con respecto al
promedio de la distribucin.
86
DATOS HETEROGENEOS
DATOS HOMOGENEOS
Rango
Varianza
S2
Desviacin estndar
3.1. RANGO:
POBLACION
R
R = Max - Min
18
28
18
Rango = 28 - 16
16
=
26
19
20
21
18
12
aos.
87
POBLACION
DATOS SIN
AGRUPAR
DATOS
AGRUPADOS
i 1
S2
Y . f
i
i 1
n 1
S
2
Y x . f
ABREVIADA
X
i 1
i 1
x x
N
N
MUESTRA
i 1
n 1
N
2
i
X
i 1
2
i
n 1
Donde:
Xi
valores de la variable X
Yi
tamao de la poblacin
tamao de la muestra
2
S2
Varianza poblacional
Varianza muestral
88
S S2
Ene
Feb
Mar
Abr
May
Jun
Jul
Agos
Produccin:
100
130
90
120
100
140
110
98
Si el CV 33%
Si el CV > 33%
C.V .
Donde:
89
*100%
c.v.
S
*100 %
X
C.V.
c.v
=
=
=
516.20 respectivamente.
500
63.25
500
516.20
C.V.
Luego el mejor proyecto es:
EJEMPLO:
Suponga que se han registrado 20 observaciones referentes a los ingresos
semanales del jefe de hogar de un determinado distrito. De la informacin muestral
obtenida calcule el Rango, varianza muestral, desviacin estndar y el coeficiente
de variacin
36
55
55
41
25
55
55
55
41
41
57
37
40
31
58
58
45
36
43
43
Solucin:
Rango:
Varianza muestral:
Para calcular VARIANZA para datos sin agrupar, trabajamos con la formula:
90
n
2
( xi x )
(36 45.38)2 (25 45.38)2 ... (58 45.38)2 (43 45.38)2 1882.55
2
i
99.08
s
20 1
19
n 1
= 2 = 99.08 = 9.95
Coeficiente de variacin:
Para calcular el coeficiente de variacin para datos sin agrupar, trabajamos con
la formula:
91
EJERCICIOS:
A.- CIENCIAS ECONOMICAS Y CONTABLES
1. La empresa A tiene 100 empleados, con su sueldo promedio mensual por empleado de $
250. La empresa B tiene 200 empleados con un sueldo promedio mensual de $ 240.
a. Cul es el sueldo promedio mensual de las dos empresas en conjunto?
b. Si las dos empresas se agrega una tercera con 50 empleados y un sueldo
promedio mensual por empleado de $ 300, Cul es el sueldo promedio para las
tres empresas en conjunto?
2. El ingreso medio mensual de los 16,500 obreros de una compaa es de S/. 116.00 y de
los 12,900 empleados de esta compaa es de S/. 148.00. Si los obreros reciben una
aumento del 20% sobre sus ingresos ms una bonificacin de S/. 50.00 por condiciones
de trabajo y los empleados reciben un aumento del 30% ms S/. 60.00 por refrigerio.
Cul es el ingreso promedio de todos los trabajadores de la compaa despus del
aumento?
92
fi
14
18
19
5
Xi
fi
1200
16
1400
23
1600
17
1800
41
2000
32
2200
21
6. Establezca, con base estadstica, en cul de las siguientes empresas el salario est
repartido de forma ms equitativa.
Empresa A
n de personas
15
20
30
20
15
93
salario
percibido
(S/.)
800
1000
1200
1500
7500
Empresa B
n de personas
salario
percibido (S/.)
10
30
35
24
1
800
1000
1200
1500
7500
laboratorio.
PESOS
20-25
26-31
32-37
38-43
44-49
TOTAL
fi
5
9
15
10
6
fi
7
23
70
135
27
94
N de
pacientes
0-10
300
10-20
500
20-30
400
30-40
500
40-60
300
13
11
10
16
18
12
13
20
10
17
10
16
14
18
fi
10, 15)
15, 20)
20, 25)
25, 30)
30, 35)
95
C.- INGENIERIA:
1. En una investigacin agrcola en el Valle de Chancay se determin la produccin total en
(kilogramos), de un cierto cultivo, el cual fue sembrado en 20 parcelas experimentales.
Los resultados fueron:
Produccin en Kg:
40, 35, 38, 40, 41, 37, 41, 38, 20, 25, 33, 27, 25, 28, 44, 22, 29, 36
correctamente
2. La
distribucin
de
establecimientos
industriales,
segn su produccin mensual (en millones
de soles), es la siguiente
Calcular:
a. El promedio de produccin
b. La produccin mediana
PRODUCCION
Menos de 5
5 a 10
10 a 25
25 a 50
50 a 100
100 a 250
250 a 500
500 a ms
ESTABLECIMIENTOS
39
19
14
12
9
4
2
1
c. La produccin ms frecuente
3. En cada uno de las sgtes. Tablas determinar las medidas descriptivas que se te pide.
Media, Mediana, moda y sus interpretaciones.
a. Cantidad en litros de insecticida que se necesita para la fumigacin de las plagas
segn por nro. de terrenos de cultivo
MEDICIONES
1.2- 2.6
2.7-4.1
4.2-5.6
5.7-7.1
7.2-8.6
TOTAL
96
fi
7
23
70
135
27
b. Sueldos en soles que se les paga a los trabadores que realizan siembra y riego
en los cultivos de Chavimochic
SUELDO fi
240-364
13
365-489
76
490-614
18
615-739
740-864
TOTAL
4. Se presenta el nro. frutos maduros hallados cada dos semanas en una huerta de cultivos.
2
5. Se tiene en cuenta el nro. de sembros de arroz por valles de la costa peruana fue lo
sgte:
sembro
1
2
3
4
5
TOTAL
97
fi
3
7
10
5
10
Calcula:
a) El promedio, mediana, moda e interpreta
cada estadgrafo.
b) Realiza una grfica correspondiente de acuerdo al tipo
de variable.
19
20
21
22
23
24
Nmero de das
a. Cuntos das hizo por encima de 21C? Cuntos por debajo de 23C?
b. Cuntos das hizo la temperatura mxima?
c. Calcula la media, la moda y la mediana.
7. El siguiente cuadro muestra la distribucin de la renta anual (en miles de soles) en que
incurren 50 viviendas:
18.85 21.55 24.25 26.95 29.65 32.35 35.05
Marca de
Clase
N
Viviendas
de
11
11
8. Una
compaa
servicios
de
requiere
un
los
Prueba
tcnico
57
55 54 52 62 55 59
80
40 62 72 46 80 40
Puntaje
obtenido por A
presentados, se han seleccionado
Puntaje
2 candidatos: A y B, los cuales
obtenido por B
renen los requisitos mnimos requeridos.
Para decidir cual de los 2 se va a contratar, los miembros del Jurado deciden tomar 7
pruebas a cada uno de ellos.
a. Halle e interprete la media, mediana y moda de los dos candidatos.
b. Estadsticamente Cul de los candidatos debe ser contratado? Fundamente su
respuesta
98
D.- EDUCACION:
1. Se realiza una estadstica en dos centros de enseanza, uno pblico y otro privado,
referente a la nota global del bachillerato de cada uno de los alumnos que van a acudir a
los exmenes de selectividad. Las distribuciones de frecuencias son las siguientes:
Centro privado
Nota global de Frecuencias
cada alumno.
Centro pblico
Nota global de
Frecuencias
cada alumno.
250
5,5
10
6.5
15
7.5
20
8.5
30
9.5
15
150
100
20
Se pide:
a. A la vista de la tabla, te sugiere algn comentario de especial importancia. Cul
es el motivo de que los datos se presente en dos tablas de diferente tipo?
b. Estudiar las diferentes medidas de tendencia central (promedios) en las dos
distribuciones. En cada distribucin cul te parece ms representativo? por
qu?
c. Indique cual es la nota mediana de cada grupo.
NIVEL DE GASTO ()
N DE JVENES
0-5
5-10
11
10-15
16
15-20
22
estudiantes universitarios.
20-25
25-30
99
Frecuencia absoluta
21-25
16
26-30
20
31-35
30
36-40
42
41-45
22
46-50
29
51-55
23
56-60
18
Se pide calcular la
mediana, moda y media.
2
3
5
8
12
17
19
20
18
18
19
17
16
17
20
15
20
18
15
15
16
17
15
17
100
6. Se tiene que:
A
22
24
26
28
fi
10
N alumnos
101
SEGUNDA UNIDAD
102
Sesin 8 y 9
Regresin Lineal Simple
Correlacin
CAPACIDADES
1. Establece el tipo de relacin entre variables cuantitativas utilizando diagramas de
dispersin.
2. Calcula e interpreta los coeficientes de la ecuacin de regresin lineal simple.
3. Construye relaciones funcionales lineales simples y realiza predicciones
4. Calcula e interpreta el coeficiente de correlacin.
5. Calcula e interpreta el coeficiente de determinacin para regresin simple..
ACTITUDES
1.
2.
Asume una actitud reflexiva, crtica y creativa al aplicar los mtodos y tcnicas
Estadsticas de regresin y correlacin al anlisis de relaciones de causa-efecto
CONTENIDO
Regresin Lineal Simple. Diagrama de Dispersin. Correlacin. Coeficiente de
Correlacin de Pearson. Coeficiente de Determinacin. Interpretaciones.
103
Con frecuencia, las variables que constituyen una distribucin bidimensional muestran un
cierto grado de dependencia entre ellas. Un ejemplo de esta relacin aparece en la relacin
de peso y altura: aunque no existe una ley causal que relacione ambas variables, en
trminos estadsticos se aprecia una dependencia entre ellas (cuando aumenta la altura,
suele hacerlo tambin el peso). Esta dependencia se refleja en la nube de puntos que
representa a la distribucin, de modo que los puntos de esta grfica aparecen condensados
en algunas zonas.
En tales casos, se pretende definir una ecuacin de regresin que sirva para relacionar las
dos variables de la distribucin. La representacin grfica de esta ecuacin recibe el nombre
de lnea de regresin, y puede adoptar diversas formas: lineal, parablica, cbica,
hiperblica, exponencial, etc.
Anlisis de regresin
104
REGRESIN LINEAL
Cuando la lnea de regresin se asemeja a una recta (regresin lineal), puede ajustarse a
esta forma geomtrica por medio de un mtodo general conocido como mtodo de los
mnimos cuadrados. La recta de ajuste tendr por ecuacin:
= 0 + 1
Vamos a llamar a X: VARIABLE INDEPENDIENTE o EXPLICATIVA, y a la otra la
llamaremos Y: VARIABLE DEPENDIENTE o EXPLICADA.
Donde los coeficientes 0 y 1 se calculan teniendo en cuenta que:
).
1 Clculo de 1:
2 Clculo de 0:
()
Donde:
= =1 :
Media Aritmtica de Y.
= =1 :
105
Media Aritmtica de X.
CORRELACIN (r)
El coeficiente de correlacin (r) mide el grado de relacin lineal (intensidad) de la relacin
entre dos variables cuantitativas. El coeficiente r puede tomar valores entre -1.00 y 1.00.
Bsicamente, esta informacin se refiere a dos caractersticas de la relacin lineal: la
direccin o sentido y la cercana o fuerza.
Correlacin
nula
Correlacin
perfecta
negativa
-1
0
Fuerte
Negativa
Dbil
Negativa
Dbil
Positiva
Correlacin
perfecta
Positiva
Fuerte
Positiva
Es importante notar que el uso del coeficiente de correlacin slo tiene sentido si la
relacin a analizar es del tipo lineal. Si sta no fuera no lineal, el coeficiente de
correlacin slo indicara la ausencia de una relacin lineal ms no la ausencia
de relacin alguna.
(, )
=
( )( )
Donde:
= =1
= =1 2
= =1 2
106
(
=1 )(=1 )
Suma Cruzada de X e Y.
(
=1 )
Suma de Cuadrados de X.
Suma de Cuadrados de Y.
(
=1 )
Correlacin Nula
107
EL COEFICIENTE DE DETERMINACION R2
El coeficiente de determinacin, r2 - la proporcin de la variacin total en la variable
dependiente Y que est explicada por o se debe a la variacin en la variable independiente
X. El coeficiente de determinacin es el cuadrado del coeficiente de correlacin, y toma
valores de 0 a 1.
108
2 % = (2 ) 100
Donde:
R: Coeficiente de Correlacin.
EJERCICIOS
Despus de haber ledo la bibliografa bsica propuesta en el punto 2.1, resuelve los
siguientes ejercicios:
1.
Para cada uno de los siguientes conjuntos de datos bivariantes graficar sus
correspondientes diagramas de dispersin de puntos. Qu tipo de relacin
funcional, cree usted, se podra ajustar mejor a los datos?, Por qu?
2.
a)
X
Y
5
2
10 8 19
7 13 14
14
15
19 15 15
16 10 5
25 20
7 10
b)
X
Y
3
16
6
5
14 12
4
18
2
3
11 11
4
20
c)
X
Y
6
10
2
1
4
16 14 10
1
16
3
4
1
13 11 15
3
2
14 14
d)
X
Y
6
8
14 15 18
11 16 17
10
11
16 14 12
14 13 10
18 17
14 18
1
8
7
5
20
5
4
12
109
8, 6
6, 10
8, 14
14, 12
16, 12
Reduccin de horas de
12
16
20
24
sueo (X)
a) Grafica el diagrama de dispersin de puntos.
b) Encuentra la recta de mnimos cuadrados apropiada para estos datos.
c) En el diagrama de dispersin de puntos, grafica la recta de mnimos
cuadrados.
d) Interpreta los coeficientes de regresin.
3.
41
54
63
54
48
46
62
61
64
71
publicidad
Ventas
semanales
110
4.
12
11
12
15
14
16
15
18
16
15
17
5.
y2 = 455.86.
6.
Para los puntajes de ansiedad (X) y de aptitud acadmica (Y) de diez postulantes
a un trabajo se han obtenido los siguientes resultados: x = 847, x2 = 71927,
y = 446, y2 = 20058, xy = 37615.
a) Halla la recta de regresin de mnimos cuadrados que se ajusta a estos datos.
Interpreta la pendiente.
111
7.
Se ha tomado una muestra de 16 ventas de una casa comercial. Para cada venta
se han observado el precio de venta (X) y la cantidad vendida (Y) y se han obtenido
los siguientes resultados: x = 77.9,
y = 749,
SCxy = - 489.89.
a) Halla la recta de regresin de mnimos cuadrados.
b) Interpreta la pendiente.
c) Pronostica la cantidad vendida para precios de venta de X=3 y x=5.
d) Calcula e interpreta el coeficiente de determinacin.
8.
4.8
4.3
3.3
4.3
112
3.9.
9.
15
25
30
40
60
113
10.
11.
Calificacin
en examen
14
18 16
12
10
15
17
11
08
12
12
14 15
10
11
12
12
11
10
11
Calificacin
promedio
114
12.
13.
Semana
6.2
6.7
7.5
8.5 11.5
9.5
12.2
9.8
25
82
100
95
110
130
135
Precio
(miles)
120
115
14.
119,8 125,4 136,6 148,8 158,9 170,9 183,9 207,2 223,0 272,2
(m2)
Consumo
(kw-hrs)
1180 1170 1260 1490 1570 1710 1800 1840 1960 1950
15.
260
650
(US$./noche)
N Habitac
943
750
700
700
580
500
Ocupadas
a) Representa grficamente para comprobar que existe cierta dependencia lineal
entre las variables.
b) Halle la ecuacin de la recta de regresin del precio sobre el nmero de
habitaciones.
c) Cuntas habitaciones se llenaran a US$1500?
116
16.
77
78
79
80
81
82
83
84
85
86
Ahorro
1.9
1.8
2.0
2.1
1.9
2.0
2.2
2.3
2.7
3.0
Renta
20.5
20.8
21.2
21.7
22.1
22.3
22.2
22.6
23.1
23.5
17.
de
rpidas
comidas 2
72,6
82,6
74,8
67,6 62,1
consumidas
la ltima semana
Peso (Kg.)
117
18.
Edad
Presin
56
42
72
36
63
47
55
49
38
42
14,8
12,6
15,9
11,8
14,9
13,0
15,1
14,2
11,4
14,1
19.
20.
92
92
96
100
102
102
106 106
121
143
Rendimiento
1,7
2,3
1,9
2,0
1,5
1,7
1,6
1,0
0,3
1,8
118
21.
N Hmos
22.
119
Ingestin
Absorcin
Caso N
Ingestin
Absorcin
1,4
0,7
11
2,0
1,4
1,6
1,2
12
1,4
1,1
2,1
1,6
13
1,9
1,5
1,7
1,1
14
1,8
1,3
1,8
1,3
15
1,9
1,5
2,6
2,0
16
1,6
1,4
1,5
1,2
17
1,9
1,7
2,5
1,5
18
2,1
1,7
2,7
2,4
19
1,6
1,3
10
1,8
1,5
20
1,6
1,1
23.
150
150
250
200
350
200
50
125
Costo
(miles de
pesos)
a) Haga un grfico de dispersin con los datos, verifique el supuesto de linealidad.
b) Encuentre la recta de regresin de mnimos cuadrados.
c) Interprete los valores estimados del intercepto y de la pendiente.
d) Estima cul ser el costo de reparacin de un auto que ha tenido 4 cambios de
aceite.
e) Si cambia X por Y, obtendr la misma recta de regresin?
f)
120
24.
1995
1996
1997
1998
1999
2000
2001
2002
258,6
273,6
289,7
308,9
331,0
355,0
377,1
400,4
381,7
402,2
426,5
454,3
486,5
520,2
553,3
590,3
25.
Se supone que se puede establecer cierta relacin lineal entre las exportaciones de
un pas y la produccin interna de dicho pas. En el caso de Espaa, tenemos los
datos anuales (expresados en miles de millones de pesetas) para tales variables
correspondientes al quinquenio 2002-06 en la siguiente tabla:
Ao
Produccin
Exportaciones
2002
52,654
10,420
2003
53,972
11,841
2004
57,383
14,443
2005
61,829
16,732
2006
65,381
18,760
A partir de tal informacin, y considerando como vlida dicha relacin lineal, se pide:
a) Si la produccin para el ao 2007 fue de 2.210.610 millones de pesetas, cual
sera la prediccin de las exportaciones para este ao? Qu grado de precisin
tendra dicha prediccin?
121
26.
Ingresos
1000 galletas
(pesetas)
140,3
1,5
150
165
2,5
175
200
122
27.
Enero
Febrero
Marzo
Abril
Mayo
Cuanta de la factura
55
100
118
120
142
200
500
700
800
1000
telefnica ()
Tiempo de conexin
(minutos)
De acuerdo con la informacin anterior, responda a las siguientes preguntas:
a) Suponiendo la existencia de una relacin de tipo lineal entre tiempo de conexin y
gasto telefnico, qu porcentaje de las variaciones en la cuanta de la factura
telefnica no podran ser explicadas linealmente por el tiempo de conexin a
Internet dentro de la compaa?
b) Cul sera la cuanta de la factura telefnica de la compaa de acuerdo a esta
relacin lineal si no se conectase a Internet en la empresa?
c) Cul sera el gasto telefnico estimado segn esta relacin lineal si el tiempo de
conexin a Internet fuera de 2000 minutos? Le parece aceptable tal prediccin?
Justifique su respuesta.
Se considera que un incremento del 20% en el tiempo de conexin a Internet
respecto al realizado en el mes de mayo conllevara a que la factura telefnica se
123
28.
2003
2004
2005
2006
2007
2008
2009
126
135
156
156
150
150
180
20
25
30
32,5
35
32
34
29.
2,4
5,4
5,6
8,4
10,6
13,5
15
15
11
13
15
16
a) Estime el modelo lineal que explica el peso perdido en funcin del tiempo que se
lleva siguiendo la dieta e interprete los parmetros.
b) Para el modelo estimado en el apartado anterior, descomponga la varianza total
como suma de la explicada y la no explicada por el mismo y obtenga, a partir de
tal descomposicin, el coeficiente de determinacin.
124
c) Segn el modelo considerado, qu peso esperara perder una persona que siga
la dieta durante 2 meses (8 semanas)? Y una persona que est dispuesta a
seguir la dieta durante dos aos (108 semanas)? Qu fiabilidad le otorga a cada
una de las estimaciones anteriores?
30.
(miles de euros)
Cantidad
vendida por mes
7,5
10,5
12
14
16
18
20,5
23,5
27
450
425
400
350
325
300
290
280
260
200
En una muestra de familias se han analizado las variables ahorro anual (Y) y renta
anual (X), medidas ambas en miles de euros. Los datos obtenidos han sido los
siguientes:
Ahorro
(Y)
Renta
(X)
125
1,9
1,8
2,0
2,1
1,9
2,0
2,2
2,3,
2,7
3,0
21,7
22,1
22,3
22,2
22,6
23,1
23,5
REFERENCIAS BIBLIOGRFICAS
1.
VILA ACOSTA, R., (2001). Estadstica Elemental. Estudios y Ediciones RA- Lima
Per.
2.
3.
4.
5.
6.
MOYA, Rufino, (1991). Estadstica Descriptiva. 1era edicin Editorial San MarcosLima- Per.
7.
126
TERCERA UNIDAD
ESTADISTICA INFERENCIAL
127
Sesin 11
Introduccin a las Probabilidades:
Probabilidades
Distribucin Normal
CAPACIDADES
1.
2.
3.
4.
ACTITUDES
1.
2.
CONTENIDO
Nociones de Probabilidad. Espacio Muestral. Probabilidad de un Evento.
Propiedades. Distribucin Normal.
128
PROBABILIDAD
DEFINICIONES PREVIAS:
1) Experimento Aleatorio (E) : es aquel fenmeno cuyos resultado depende del azar y
cumple ciertas caractersticas:
a)
b)
c)
Suceso 1
Suceso 2
129
EXPERIMENTO ALEATORIO
ESPACIO
EVENTOS
MUESTRAL (S)
A. Observar el lanzamiento de una moneda.
Cara, Sello
1,2,3,4,5,6
130
DEFINICIN
DE
PROBABILIDAD
SEGN
LAS
TRES
ESCUELAS
DE
Se aplica cuando todos los elementos del espacio muestral (sucesos) tienen la
misma probabilidad de ocurrir.
DEFINICIN DE PROBABILIDAD
Probabilidad de un evento =
# de resultados posibles
CLSICA
Ejemplo 1:
Se tiene el siguiente exp. Aleatorio
como
0 nA n
o sea
0 hA
131
entonces
nA
1
n
hA
nA
;
n
0 nA n
Ejemplo 1.
Se tiene informacin acerca de los cargos y el sexo del personal de cierta empresa.
Sexo
Abogado
Contador
Ingeniero
Hombres
10
Mujeres
15
TOTAL
TOTAL
Cul es la probabilidad de que al seleccionar un trabajador ste sea:
a)
b)
Abogado y mujer
c)
Mujer
d)
e)
Ejemplo 2.
Localice todos los valores de probabilidad asociados a la siguiente tabla de Carrol
que ofrece informacin sobre la hipertensin y el hbito de fumar.
No
Fumadores
Fumadores
fumadores
moderados
empedernidos
20
15
15
10
Hipertensos
No hipertensos
10
30
132
AXIOMAS DE LA PROBABILIDAD
1)
0 P A i 1
P(Ai) 0
2)
P(S ) P( Ai) 1
0.5
Sin probabilidad
De ocurrir
Tan probable
como improbable
Certeza
de ocurrir
P A P A
Entonces
133
como
P A P P A
A excluye a
P 0
PROPIEDAD 2:
COMPLEMENTO DE UN EVENTO
Veamos:
A
Como A excluye
entonces
) = P(S)
P(A) + P( ) = 1
P( )= 1 P(A) B
P A B C P A P B P C
P A B P A C P B C
P A B C
134
P B A
P A B
,
P A
0 P A 1
P(AB) = P(A)
P(BA) = P(B)
135
EJERCICIOS:
1.
Las probabilidades de que A, B y C resuelvan un cierto problema son 1/2, 3/5 y 2/3
respectivamente. Cul es la probabilidad de que el problema sea resuelto por lo
menos por uno de los tres?
2.
Una tabla de mortalidad muestra que las probabilidades de que A y B vivan 25 aos
ms son 0.9 y 0.8 respectivamente. Calcula la probabilidad que al final de 25 aos
ambos hayan muerto.
3.
estudiantes inscritos en
4.
5.
136
Reaccin
Partidaria
A favor
Neutral
Total
Se opone
Fuente:
Datos Hipotticos
NUEVO PER
120
20
20
160
PRO PER
50
30
60
140
Otros
50
10
40
100
Total
220
60
120
400
6.
7.
AB
Rh +
34%
9%
4%
38%
Rh -
6%
2%
1%
6%
137
8.
Cul es la probabilidad de que una persona tenga sangre tipo B si tiene Rh+?
Los tiempos de reemplazo de los televisores tiene una distribucin normal con una
media de 8.2 aos y una desviacin Standard de 1.1 aos. Determina la
probabilidad que un televisor seleccionado al azar tenga un tiempo de reemplazo de
menos de 7 aos.
9.
Las duraciones de los embarazos tienen una distribucin normal con una media de
268 das y una desviacin estndar de 15 das. Si estipulamos que un beb es
prematuro si nace al menos tres semanas antes de lo debido. Qu porcentaje de
bebs nacen prematuramente?
10.
Los puntajes de cociente intelectual (IQ) estn distribuidos normalmente con una
media de 100 y una desviacin estndar de 15. MENSA es una organizacin para
personas con cociente intelectual elevado, y slo acepta personas con un IQ mayor
de 131.5.
a) Si se escoge aleatoriamente a una persona, determina la probabilidad de que
satisfaga el requisito de MENSA.
b) En una regin representativa con 75 000 habitantes, cuntos son elegibles
para MENSA?
138
11.
12.
13.
PESO R.N.
BAJO
NORMAL
TOTAL
SI
30
10
40
NO
20
140
160
TOTAL
50
150
200
139
() = ( )
() =
=1
TIPO DE
GRAFICOS
140
() = ( )
=1
VARIANZA
VA. CONTINUA
( ())2 ( )
( ())2 ( )
() =
DISTRIBUCIONES DE PROBABILIDAD
Son modelos que describen la forma en que se espera que varen los resultados o probable
valores de una variable aleatoria.
Debido a que estas distribuciones tratan sobre expectativas de que algo suceda,
resulta ser modelos muy tiles para hacer inferencias y para tomar decisiones en
condiciones donde hay incertidumbre
Distribuciones Parmetricas
Distribuciones No Parmetricas
141
CONTINUAS
Distribucin Binomial
Distribucin Normal
Distribucin Poisson
Distribucin Geomtrica
Distribucin t - Student
Distribucin Hipergeometrica
Distribucin F - Senedector
142
143
CARACTERSTICAS
1. Tiene como parmetros a y
2. Su funcin de probabilidad est dada por:
f ( x)
1
e
2
1 X
, X
144
X ~ N (, 2)
7.
8. El rea bajo esta funcin o curva es 1 100%, de la misma manera se sabe que las
reas comprendidas bajo la curva normal son :
1.
= 68.3%
2. 2 = 95.5%
3. 3 = 99%
-3
-2 -1
145
1 2z
f(Z z) N 0, 1
e
2
1.
2.
f ( z)
3. La funcin de densidad de la variable estandarizada es:
1
2
5. Notacin:
Si X es v.a. continua distribuida normalmente con media y varianza 2, la denotamos
por: X N ( , 2).
146
P( x a) P(
b.
P( x a) 1 P( x a) 1 P(
c.
a.
) P( Z
x
P ( a x b) P ( x b) P ( x a ) P ( Z
) 1 P( Z
) P( Z
EJERCICIOS:
1. Determinar la probabilidad de cada una de las siguientes expresiones:
147
a) P ( Z < 1.25 )
b) P ( Z< -2.28)
c) P (Z < 0 )
h ) P ( Z > 2.43 )
4. El peso de los atletas de pruebas de medio fondo sigue una distribucin normal con media
64,3 kilos y desviacin tpica 2,3 kilos. Hallar un intervalo centrado alrededor de la media
que contenga:
a) El 68,3% de la poblacin.
b) El 95,5% de la poblacin.
c) El 99,7% de la poblacin
5. El rendimiento acadmico de los estudiantes de la UPN, tiene una distribucin normal con
media igual a 16 y varianza igual a 4. Si se selecciona un estudiante de esta Universidad,
encuentre la probabilidad de que:
a. El rendimiento sea mayor que 16
b. El rendimiento sea menor que 14
c. El rendimiento este entre 14 y 18
d. El rendimiento este entre 15.5 y 16.5
148
8. NEUMA Per, es una empresa que produce llantas para automviles en nuestro pas. La
vida til de estas llantas se distribuye aproximadamente como una normal con media y
desviacin estndar iguales a 32000 y 1000 millas respectivamente. Esta empresa quiere
exportar estas llantas por lo que empieza a hacer ciertos clculos acerca de la calidad de
estas llantas, para lo cual se hace las siguientes preguntas:
a. Cual es la probabilidad de una llanta producida por esta empresa tenga una vida til
de 31900 millas.
b. Cual es la probabilidad de una llanta producida por esta empresa tenga una vida til
desde 31000 y 33000 millas.
c. Si la empresa fija una garanta de 30000 millas. Qu porcentaje de esta produccin
necesitar ser reemplazada?
149
b. Menos de 71 Kgs.
c. Ms de 69 Kgs.
10. El tiempo requerido para realizar una pregunta de examen es una variable aleatoria cuya
distribucin es aproximadamente normal con media 12.9 minutos y una desviacin
estndar de 2.0 minutos. Cules son la probabilidades de que un alumno resuelva una
pregunta del examen en:
a. Al menos 11.5 minutos.
b. Entre 11.0 y 14.8 minutos.
c. A lo mas 12 minutos
d. Entre 10 y 13 minutos.
1.
150
Probabilidad
0.05
0.15
0.35
0.25
0.10
0.10
2.
a)
b)
c)
b)
c)
3.
0
8
1
20
2
12
3
6
4
3
5
1
RESOLVER:
a)
b)
c)
151
4.
Durante el invierno en Huancayo, el Sr. Llajaruna tiene problemas para arrancar sus
dos automviles La probabilidad que el primero arranque es 0.80 y la probabilidad que
el segundo arranque es 0.40, tambin hay una probabilidad de 0.30 de que arranquen
ambos:
a)
b)
c)
5.
6.
Se sabe que el tiempo til de un componente elctrico tiene una distribucin normal
con media 2000 horas y desviacin estndar 200 horas.
a)
b)
7.
152
REFERENCIAS BIBLIOGRFICAS:
1.
VILA ACOSTA, R., (2001). Estadstica Elemental. Estudios y Ediciones RA- Lima
Per.
2.
3.
153
4.
5.
MOYA, Rufino, (1991). Estadstica Descriptiva. 1era edicin Editorial San MarcosLima- Per.
6.
7.
154
NOCIONES DE ESTADISTICA
INFERENCIAL
155
Sesin 12
Nociones de Estadstica Inferencial:
Prueba de Hiptesis
CAPACIDADES
6. Posee nociones sobre el procedimiento para probar hiptesis estadsticas.
7. Plantea hiptesis en sus investigaciones.
8. Realiza pruebas de hiptesis estadsticas paramtricas bsicas: para una media, dos
ACTITUDES
1.
2.
CONTENIDO
1.
2.
3.
156
Inferencia
Estadistica
Muestreo
Distribuc.
Muestrales
Estimacion
Prueba de
Hipotesis
Puntual
157
Intervalo
Una
Poblacion
Dos
poblaciones
ESTADISTICA INFERENCIAL
La inferencia estadstica o estadstica inferencial es una parte de la Estadstica que
comprende los mtodos y procedimientos para deducir propiedades (hacer inferencias) de
una poblacin, a partir de una pequea parte de la misma.
ESTIMACION ESTADISTICA:
Es el conjunto de tcnicas que permiten dar un valor aproximado de un parmetro de una
poblacin a partir de los datos proporcionados por una muestra.
La estimacin se divide en tres grandes bloques, cada uno de los cuales tiene
distintos mtodos que se usan en funcin de las caractersticas y propsitos del
estudio:
158
Estimacin puntual
Estimacin bayesiana.
Estimacin Puntual: Consiste en la estimacin del valor del parmetro mediante un slo
valor, obtenido de una muestra. Por ejemplo, si se pretende estimar la talla media de un
determinado grupo de individuos, puede extraerse una muestra y ofrecer como estimacin
puntual la talla media de los individuos.
Estimacin por Intervalos
Consiste en la obtencin de un intervalo dentro del cual estar el valor del parmetro
estimado con una cierta probabilidad. Para calcular la estimacin por intervalo o Intervalo de
confianza (IC), en primer lugar se procede a:
Seleccionar
el nivel
de
nivel de error.
Un nivel de confianza del 95%, implica que 95% de todas las muestras incluye al
parmetro y solo un 5% de las muestras producir un intervalo errneo.
Cuanto mayor es el nivel de confianza se estima que el valor del parmetro este
dentro del intervalo.
Pero tambin
X-
159
X 1-/2
s
n
El error de estimacin
despejando:
Error de estimacin de
- X 1-/2
Ejemplo:
1. Se encuentra que en una dieta la concentracin promedio de vitaminas a partir de
una muestra de 36 mediciones en sitios diferentes del hospital es de 2.6 gramos
por mililitro. Suponga que la desviacin estndar de la concentracin de vitaminas
es 0.3.
a) Seale la estimacin puntual para .
b) Encuentre el intervalo de confianza al 95% para la concentracin media de
vitaminas en las dietas de dicho hospital.
c) Halle el error de estimacin de para la pregunta b.
d) Encuentre el intervalo de confianza al 99% para la concentracin media de
vitaminas en las dietas de dicho hospital.
e) Halle el error de estimacin de para la pregunta d.
Solucin:
a) La estimacin puntual para es:
160
, es decir
= 2.6 gr/ml
X 1- /2
0 .3
2.6 (1,96 )
36
Sabemos que:
#
Z
p
pq
n
pq
p Z1 / 2 *
Error de estimacin de
= = 12
161
Nivel de confianza
90%
95%
99%
162
1.645
1.96
2.576
P( x Z
2
u x Z
2
) 0.95
Ejemplo 2: Las ventas diarias de cierta oficina comercial se supone que siguen una
distribucin normal. Para estimar el volumen medio de ventas por da se realiza una muestra
de 10 das escogidos al azar, resultando que la media de las ventas de esos 10 das es S/.
100 con una desviacin tpica de S/. 4. Dar un intervalo de estimacin para el volumen medio
de ventas por da con una confianza del 95 %.
Distribucin
P( x t
2
S
S
u x t
) 0.95
n
n
2
Ejemplo 3: Se quiere obtener un intervalo de confianza para el valor de las ventas medias
por hora que se producen en un kiosco. Para ello realizamos una muestra consistente en
elegir al azar las ventas que se realizaron durante 1000 horas distintas; muestra cuyos
resultados fueron: ventas medias por hora S/. 4000, y varianza de dicha muestra S2/. 4000.
Obtener dicho intervalo con un nivel de confianza del 95.5 %.
163
P( x z
2
u x z
2
) 0.95
EJERCICIOS
Una media:
1. Una mquina llena un determinado producto en bolsas cuyo peso medio es gramos.
Suponga que la poblacin de los pesos es normal con desviacin estndar 20 gramos.
Estime mediante un intervalo de confianza del 95%, si una muestra aleatoria de 36
bolsas ha dado una media de 495 gramos
2. Se decide estimar la media del nivel de ansiedad de todos los estudiantes
preuniversitarios. Se supone que la poblacin de los puntajes de la prueba para medir la
ansiedad se distribuye normalmente con desviacin estn dar igual a 10 puntos.
3. Determinar el intervalo para con confianza del 95%, si una muestra aleatoria de
tamao 100 ha dado una media de 70 puntos.
164
4. El tiempo en, minutos que utilizan los clientes en sus distintas operaciones en un banco
local es una variable aleatoria cuya distribucin se supone normal con una desviacin
estndar de 3 minutos. Se han registrado los tiempos de las operaciones de 9 clientes
del banco resultando una media igual a 9 minutos:
a. Hallar el nivel de confianza si la estimacin de es el intervalo de 7 a 11 minutos.
b. Calcular la probabilidad de que la media de los tiempos de todas las muestras de
tamao 9 est entre 6.5 y 11.5 minutos.
1. Un fabricante afirma que el peso promedio de las latas de fruta en conserva que saca al
2. Se quiere hacer una encuesta para estimar el tiempo promedio por semana que los
nios ven televisin. Por estudios anteriores se sabe que la desviacin estndar de
dicho tiempo es de 3 horas. Con el nivel de confianza del 99%.
a. Qu tamao de muestra se debera elegir si el error de la estimacin puntual no
es superior a media hora?
3. Un fabricante produce focos cuya duracin tiene distribucin normal. Si una muestra
780,
800,
795,
790,
785,
795,
780,
810
a. Estimar la duracin media de todos los focos del -fabricante mediante un intervalo
de confianza del 95%.
b. Si la media poblacional se estima en 790 horas con una confianza del 98%,
cunto es el error mximo de la estimacin si se quiere una confianza del 98%?
165
4. El ingreso mensual de cada una de las 500 microempresas de servicios de una ciudad,
Una proporcin:
5. En un estudio socioeconmico se tom una muestra aleatoria de 100 comerciantes
informales y se encontr entre otros datos los siguientes: un ingreso medio de $600,
una desviacin estndar de $50 y slo el 30% tienen ingresos superiores a $800.
a. Estimar la proporcin de todos los comerciantes con ingresos superiores a $800,
mediante un intervalo de confianza del 98%.
b. Si la proporcin de todos los comerciantes con ingresos superiores a $800 se
estima entre 20.06% y 39.94% qu grado de confianza se utiliz?
6. Una muestra aleatoria de 400 menores de 16 aos revela que 220 consumen licor.
producidos. Para confirmar tal estimacin primero se debe escoger una muestra
aleatoria,
166
a. cuntas piezas debe tener la muestra si se quiere tener una confianza del 95%
que el error de la estimacin no ser superior a 0.047?
b. Se escoge una muestra aleatoria del tamao calculado en a), si en ella se
encuentran 40 piezas defectuosos, mediante un intervalo de confianza del 95%,
se puede inferir que la estimacin del fabricante es coherente con la
estimacin efectuada a partir de la muestra aleatoria?
167
168
PRUEBA DE HIPOTESIS
las hiptesis que formulamos lo sern lgicamente sobre la poblacin. Bien afectando a
algn parmetro de sta, lo que da origen a los contrastes paramtricos o bien a otras
caractersticas de la mismas que no lo sean estrictamente, lo que origina contrates "no"
paramtricos.La solucin estadstica del problema de contrastacin se basar en los datos
muestrales y la base estadstica (probabilstica) de la que arrancar el contraste, de algn
estadstico muestral.
CONCEPTOS BSICOS
a) Hiptesis: Es una respuesta a priori a un problema. Es una conjetura sobre el valor
concreto que tiene en realidad
b) Hiptesis Estadstica: Llamamos hiptesis estadstica a una suposicin que se hace
respecto a un parmetro poblacional. Las hiptesis estadsticas comprenden:
a. Hiptesis Alternativa: Es la cuantificacin de la hiptesis cientfica; es la que
nos interesa probar. Se denota por Ha.
b. Hiptesis Nula: Es la hiptesis que se desea contrastar. Es el supuesto
contrario de la hiptesis alternativa. Se denota por Ho. Esta hiptesis se
formula con el solo propsito de rechazarla o anularla, motivo por el cual,
recibe el nombre de hiptesis nula.
c) Estadstico De Prueba: Es un valor, determinado a partir de la informacin
muestral, que se utiliza para aceptar o rechazar la hiptesis nula.
d) Nivel de Significacin: Despus de plantear la hiptesis nula y la alternativa, el
siguiente paso es definir el nivel de significacin. Este es la probabilidad de rechazar
la hiptesis nula cuando en realidad es verdadera.
169
Decisin posible
Ho Verdadera
Ho Falsa
DECISIN CORRECTA
ERROR TIPO II
=(1-
Aceptar Ho
DECISIN CORRECTA
(1-
Rechazar Ho
Poder Estadstico
170
Estadsticos de Prueba: (z o t)
Estadsticos de Prueba para la Media de una Poblacin
Caso I: Para muestra grande (n30) y cuando te dan la varianza poblacional.
)
(
+
171
)
(
+
( + )
( ) + ( )
) ( )
(
( + )
( ) + ( )
=
+
(1 2 )
2 2
1+ 2
1 2
donde
2
2
2
2
1
[ + ]
1 2
2
2
2
2
1
2
[ ]
[ ]
1
2
+
1 1 2 1
172
[ + ]
+
+
= ( )
173
EJERCICIOS
1. Al estudiar si conviene tener o no una sucursal en la ciudad de Trujillo, la gerencia
de una gran tienda comercial de Lima, establece el siguiente criterio para tomar una
decisin: Abrir la sucursal slo si el ingreso promedio familiar mensual en dicha
ciudad es no menos de $ 500 y no abrirla en caso contrario. Si una muestra
aleatoria de 100 ingresos familiares de esa ciudad ha dado una media de $ 480.
Cul es la decisin a tomar al nivel de significancia del5%?, Se sabe que la
distribucin de los ingresos tiene una desviacin estndar poblacional es igual a $
80.
2. El gerente de ventas de una compaa afirma que sus vendedores venden
semanalmente en promedio $ 1500. Al nivel de significacin del 1% pruebe la
hiptesis del gerente versus la hiptesis del presidente de los vendedores que
afirma que el promedio de las ventas semanales es mayor, si una muestra de 36
vendedores ha dado una media igual a $ 1510. se sabe que la varianza semanal es
de $ 900.
174
entre
el
valor
de
ciertos
valores,
un
grupo
de
175
10. El presidente del PRI en 1988, basado en su experiencia, sostiene que un 95% de
los votos para las elecciones presidenciales han sido a favor de su partido. Los
partidos de oposicin levantaron una muestra de 1100 electores y encontraron que
un 87% de ellos votara por el PRI. El presidente del PRI quiere probar la hiptesis,
con un nivel de significacin de 0.05, que el 95% de los votos son para su partido.
11. Se afirma que, de todas las familias que salen de Cumana por lo menos el 30 % se
mudan a Maracaibo. Si una muestra de 600 mudanzas tomada al azar de los
registros de la Alcalda de Cumana revela que de
autorizados 153 fueron para Maracaibo, pruebe la hiptesis nula p = 0.30 contra la
hiptesis alternativa p < 30 con un nivel de significancia del 1 %.
12. Un fabricante de semiconductores produce controladores que se emplean en el
sistema elctrico de vehculos. El cliente requiere que la proporcin
de
fumaban Malboro.
Pueden considerarse que esos datos presentan evidencia suficiente para indicar
que hubo un aumento en la aceptacin del cigarrillo Malboro. Obtenga las
conclusiones del planteamiento desarrollando un contraste de hiptesis con un
nivel de significancia del 5 %.
14.
176
Valid
Frequency
Hombre
1634
Mujer
314
Total
1948
Valid
Percent
83.9
16.1
100.0
Percent
83.9
16.1
100.0
Cumulative
Percent
83.9
100.0
16. La administracin de las tiendas Oxxo cree, sobre la base de una investigacin,
que el porcentaje de hombres que visitan sus tiendas 9 o ms veces al mes
(clientes frecuentes) es mayor que el porcentaje de mujeres que hacen lo mismo.
La informacin proporcionada es:
nH 45 nM 71
PH 0.58 PM 0.42
PH PM 0.58 0.42 0.16
17. Un fabricante est por decidir entre continuar con el mtodo actual o usar un nuevo
mtodo de montaje de un producto. Cambiar el mtodo actual si, hay prueba que
evidencia que el nuevo mtodo usa menos tiempo. A fin de tomar una decisin, se
seleccion una muestra aleatoria de 10 operarios expertos y se registro el tiempo
de montajes, en minutos, que utiliz cada operario con ambos mtodos. Los datos
se resumen en la siguientes tabla:
177
Operador
10
M. Actual
10
12
13
13
14
14
15
16
M. Nuevo
11
10
11
15
12
13
12
Diferencia
-1
-1
18. El inversionista desea comparar los riesgos asociados con dos diferentes
mercados, A y B. El riesgo de un mercado dado se mide por la variacin en los
cambios diarios de precios. El inversionista piensa que el riesgo asociado con el
mercado B es mayor que el del mercado A. Se obtienen muestras aleatorias de 31
cambios de precio diario de A y de 36 para el mercado B. Se obtienen los
siguientes resultados.
Medidas Estadsticas
Mercado A
Mercado B
Promedio muestral
0.3
0.4
Desviacin muestral
0.25
0.45
19. Yahoo Internet Life patrocin encuestas en varias reas metropolitanas para
estimar la proporcin de adultos que usan internet en el trabajo (USA Today, 7 de
Mayo 2007). En los resultados se encontr que 40% de los adultos de Washington,
utilizan internet en el trabajo, en tanto que el 32 % de los adultos de San Francisco
utilizan internet en el trabajo. Si las muestras son de 240 y 250, respectivamente,
los resultados muestrales indican que la proporcin de adultos que usan internet
en el trabajo en Washington es mayor que la proporcin de San Francisco? Con
=0,05.
178
En Ciencias de la Salud
1. El doctor Jeffrey M. Barrett de Lakeland, en el estado de Florida, Estados Unidos,
report los datos correspondientes a 8 casos de prolapso del cordn umbilical Las
edades de las madres eran de 25, 28, 17, 26, 27, 22, 25 y 30 aos. Se pretende
saber si es posible concluir que la media de la poblacin de la que se supone fue
extrada la muestra es mayor a 20 aos. Sea =01.
2. Se hizo un estudio de una muestra de 25 expedientes de enfermos crnicos
atendidos como pacientes externos. El nmero medio de consultas por paciente fue
de 4.8 y la desviacin estndar de la muestra fue de 2. Es posible concluir a partir
de estos datos que la media de la poblacin es mayor que cuatro visitas por
paciente? Suponga que la probabilidad de cometer un error de tipo I es de .05.
Cules son los supuestos que se deben cumplir?
3. En una muestra de 49 adolescentes que se prestaron como sujetos para un estudio
inmunolgico, una variable de inters fue la prueba del' dimetro de reaccin de la
piel a un antgeno. La media de la muestra y la desviacin estndar poblacional
fueron eritema de 21 y 11 mm, respectivamente. Es posible concluir a partir de
estos datos que la media de la poblacin es menor que 30? Sea =0.05.
179
desviacin
180
MASCULINO
150
21
FEMENINO
200
48
Es posible concluir a partir de estos datos que en las poblaciones muestreadas
existe diferencia en las proporciones de individuos con sobrepeso?
Muestra
Media
52.5
10.5
49.6
11.2
181
Muestra
Media
15
4.75
22
3.00
s
1.0
1.5
Proporcionan estos datos la evidencia suficiente para indicar que las asistentes,
en promedio, tienen calificaciones ms que las ausentes? Sea = .05.
12. Varios investigadores desean saber si es posible concluir que dos poblaciones de
nios difieren respecto a la edad promedio en la cual pueden caminar por s solos.
Los investigadores Obtuvieron los siguientes datos (edades en meses).
Muestra de la poblacin A: 9.5, 10.5, 9.0,-9:75,10.0, 13.0, 10.0, 13.5, 10.0, 9.5,
10.0, 9.75
Muestra de la poblacin B: 12.5, 9.5, 13.5, 13.75, 12.0, 13.75, 12.5, 9.5, 12.0,
13.5, 12.0, 12.0
13. Babaian y Camps afirman que el antgeno especfico prosttico (AP), encontrado
en las clulas, ductales epiteliales de la prstata, es especfico para el tejido
prosttico y es detectable en el suero de hombres con prstata normal y en
hombres con enfermedades benignas malignas de esta glndula. Los
investigadores determinaron los valores de AEP en una muestra de 124 hombres
que se sometieron una biopsia de la prstata. Sesenta y siete hombres tenan
concentraciones elevadas de AEP (>4 ng/ml); de estos, a 46 se les diagnostic
cncer. Diez de los 57 hombres con valores de AEP 4 ng/ml tenan cncer. Con
base en estos datos, es posible concluir que, en general, los hombres con valores
elevados de AEP tienen mayor probabilidad de tener cncer de prstata? Sea
=0.01.
14. La mayora de las personas que dejan de filmar, se quejan de que al hacerlo
suben de peso. Hall y otros investigadores disearon una nueva tcnica para
prevenir que la gente suba de peso, la cual compararon contra otras condiciones
que incluan una condicin control de tratamiento estndar ideada para representar
la atencin estndar del sobrepeso inducido por dejar de fumar. Una de las
hiptesis de los investigadores era que las tasas de abstinencia de tabaco seran
mayores con la nueva tcnica que las registradas en las otras dos condiciones. De
53 individuos asignados a la nueva condicin, 11 dejaron de fumar al final de 52
182
En Ingeniera
1. Se sabe que la duracin en horas, de un foco de 75 watts tiene una distribucin
aproximadamente normal, con una desviacin estndar de 25 horas. Se toma una
muestra aleatoria de 20 focos, la cual resulta tener una duracin promedio de x =
1014 horas.
Se tiene evidencia estadstica para decir que la duracin promedio de todos los
focos de 75 watts es de 51 horas? Pruebe con un nivel de significancia de 0.05.
183
necesitan los novatos para armar su nuevo probador de circuitos es de 3 horas, con
una desviacin estndar de 0.20 horas. Un consultor desarroll un nuevo
instructivo con el fin de reducir el tiempo que necesita un armador inexperto para
montar el dispositivo. En una prueba sobre la eficacia del nuevo instructivo, 15
novatos requirieron una media de 2.90 horas para completar el trabajo. Suponiendo
que la poblacin de tiempos tiene una distribucin normal, y utilizando un nivel de
significancia de 0.05. debemos concluir que el nuevo folleto es eficaz? Determine
e interprete el valor de p para la prueba.
5. En un estudio hecho para determinar el tiempo medio necesario para el montaje de
cierta pieza de una maquina, 40 trabajadores hicieron un promedio de 42.5 minutos
con una desviacin tpica de 3.8 minutos:
Los datos arrojan evidencia para decir que el tiempo promedio de montaje de
cierta pieza es mayor de 44 minutos? Utilice = .02.
6. Se encuentra que la concentracin promedio de zinc que se saca del agua a partir
de un muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por
mililitro. Suponga que la desviacin estndar de la poblacin es 0.3. Existe
suficiente evidencia estadstica para decir que la concentracin promedio de zinc es
menor de 2.9 gramos por mililitro? Utilice = .05.
184
7. Se encuentra que la concentracin promedio de zinc que se saca del agua a partir
de un muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por
mililitro. Suponga que la desviacin estndar de la poblacin es 0.3. Existe
suficiente evidencia estadstica para decir que la concentracin promedio de zinc es
menor de 2.9 gramos por mililitro? Utilice = .02.
8. En un experimento de laboratorio 50 estudiantes de ingeniera midieron por
separado el calor especifico del aluminio, obteniendo una media de 0.2210
caloras por grados centgrado y por gramo y una desviacin estndar de .0240
Los datos arrojan evidencia suficiente para decir Ho : = .2300? .Utilice un nivel
de significancia de 0.05.
9. Una muestra aleatoria simple de 50 artculos origin una media de muestra de 32 y
una desviacin estndar muestral de 6. Con un nivel de significancia 0.10 Podemos
decir que la media de la poblacin es 34?.
10. Una compaa controla su proceso de produccin en tal forma, que se pone en
bolsitas un promedio de 20 grs. de un producto qumico. El proceso se detendr
cuando el promedio no es de 20 grs. Se tom una -muestra; aleatoria de 16
observaciones y el promedio muestra! result ser 19 grs. Debe pararse el proceso
y ajustarse? La desviacin estndar poblacional es d 2 grs. Y el nivel de
significancia escogido es de 5%.
11. Un fabricante requiere fibra de algodn con una resistencia, media a la tensin de
6,50 onzas y o = 0.25. Investig un nuevo lote de fibras mediante una muestra de
16 piezas y encontr x = 6,65 onzas. Existe evidencia de que este lote es de
resistencia mayor a la requerida?
12. Las cajas de avena llenadas por un proceso automtico deben -tener un contenido
de 160 gramos en promedio. Si no es as debe detenerse la produccin para
regular la mquina. Para el control se obtuvo el peso en gramos Xi de 10 cajas
seleccionadas al azar de esa produccin y resultaron las siguientes sumas: xi =
185
14. La empresa productora de cereales embasados para consumo directo " ENERGA"
a lanzado al mercado su nuevo producto "CRECIENDO FUERTE el cual tiene
como especificaciones un peso promedio neto de 1 kilogramo. Si un agente del
gobierno toma una muestra representativa de 8 unidades y los pesos netos fueron
los siguientes: 0.995, 0.974, 0.966, 0.9.35, 0.999, 1.06, 1.01 y 0.983 kilogramos.
Con una significacin del 5% Podra el agente ordenar se multe a la empresa
productora?
15. El productor de cierta marca de bateras para .cmara, fotogrfica dice que su
produccin tiene vida media de ms de 750. minutos. Se- prueban 20 bateras
elegidas al azar y s suministraron los siguientes resultados: 720, 759, 723, 740,
754, 725, 790, 719, 775, 700, 745, 750, 753, 730, 780, 710, 775, 728, 702, 752
Suponiendo normalidad, con estos datos podramos contrastar lo que dice el
productor, con un nivel de confianza, del 99%?
186
= .05.
el
contratista y averigua los precios que resultan ser: $34,500, $37,000, $36,000,
$35,000 y $35,500. Contradicen
=0.05
20. Segn los datos obtenidos en una encuesta del CIS sobre poltica internacional,
realizada en febrero de 2002, el 52% de los 1202 hombres entrevistados,
manifestaba prestar bastante atencin a las noticias sobre cuestiones y
acontecimientos sucedidos en otros pases, mientras que entre las 1285 mujeres
187
entrevistadas, ese porcentaje era del 50% . Puede decirse, con un nivel de
confianza del 95% , que existen diferencias significativas entre las proporciones de
hombres y mujeres bastante atentos a ese tipo de noticias? Y si contrastamos la
hiptesis aplicando un nivel de significacin de 0,01?
21. Previo a una eleccin la senadora X contrata los servicios de la compaa Y para
fijar la contienda establecida con los electores. Ella percibe con respecto a
este punto que si tiene el 45% de los votos ser nominada de cuerdo con su
estrategia de campaa. Suponiendo que la compaa contratada selecciona
una
registrados.
Cul es
la
188
En Ciencias Sociales
1. Una muestra aleatoria de 12 alumnas graduadas de una escuela secretarial
mecanografi un promedio de 79.3 palabras por minuto con una desviacin
estndar de 7.8 palabras por minuto. Se tiene evidencia estadstica para decir
que el nmero promedio de palabras mecanografiadas por todas las graduadas de
esa escuela es menor de 80 con =0.01.
189
X 68 y una varianza de
0.02.
4. Un distribuidor de libros plantea la hiptesis de que las ventas por mes promedian
S/.12, 000. Diez meses seleccionados como muestra reportan una media de S/.
11,277 y una desviacin estndar de S/. 3,772. S se utiliza un valor del 5%.
Qu puede concluir acerca de la impresin que tiene el distribuidor sobre las
condiciones del negocio? Cul es el supuesto que se debe cumplir?
190
Ensayar la hiptesis de que los estudiantes que participan en las pruebas atlticas
son ms altos que los otros. Ensaye la hiptesis al 5%.
8.
Estudiantes
1
2
3
4
5
6
7
8
9
10
191
Examen
1
(X)
80
50
78
90
75
70
62
90
95
68
Examen 2
(Y)
84
56
81
92
76
75
72
87
93
72
Estudiantes
1
2
3
4
5
6
7
8
(X)
90
85
75
78
95
95
60
83
(Y)
82
95
79
81
88
91
50
81
11. Un epidemilogo desea comparar dos vacunas. Las personas que previamente
haba recibido dichas vacunas se dividieron en dos grupos. El grupo una recibi
una dosis de refuerzo de la vacuna tipo 2. Las respuestas de los anticuerpos se
registraron dos semanas despus. Las medias, desviaciones estndar y tamao de
las muestras para los dos grupos fueron los siguientes:
Grupo
1
2
Muestra
30
49
Media
4.5
2.5
D. Estndar
2.5
2.0
Ho: 1 = 2
Ha: 1 2
El nivel de significancia es de = 0.01
192
13. Se aplica un examen a dos grupos de estudiantes de 144 nios cada uno. El grupo
A que est cerca de una fbrica tuvo una puntuacin promedio de 88 con una
varianza de 27 puntos, el grupo B que est lejos de la fbrica tuvo una puntuacin
de 90 con una varianza de 24 puntos Hay diferencia significativa en el rendimiento
promedio de los dos grupos a un nivel de significancia del 5%?.
14. Como parte de un estudio para evaluar las diferencias en los niveles educativos en
2 centros de capacitacin, se aplic un examen comn que personas que asisten a
cada centro. Las calificaciones del examen son uno de los factores principales para
evaluar diferencias de calidad entre los centros.
Resultados de las Calificaciones en el examen en los Centros de adiestramiento.
Marzo 2009.
Centro de Adiestramiento A
Centro de Adiestramiento B
n1 = 30
n2 = 40
1 = 82,5
2 = 78
1 = 8
2 = 10
193
REFERENCIAS BIBLIOGRFICAS
1.
2.
Freund J. y Manning R.; 1989, Estadstica 4ta edicin, Edit. Prentice Hall
Hispamericana S.A. Mxico ;(Pgs. 342 a 363).
3.
Miller I. y Freund J.; 1992, Probabilidad y Estadstica para Ingenieros, Edit. Prentice
Hall Hispanoamericana S.A. Mxico (Pgs. 220 a 232).
4.
5.
6.
7.
Ostle Bernard; 1985, Estadstica Aplicada, Edit. Limusa Wiley S.A. Mxico,
(Pgs. 131 a 138 y 140 a 142).
194
Sesin 14
Prueba de hiptesis sobre relacin entre
variables cualitativas: Chi-Cuadrado
CAPACIDADES
10. Aplicar la prueba Chi Cuadrada en los trabajos de aplicacin de su especialidad
11. Realizar una prueba de hiptesis que compare un conjunto observado de frecuencias
ACTITUDES
11. Valora el uso de la Chi cuadrada para probar independencia de criterios
12. Valora el uso de la Chi cuadrada como una prueba para ajustar un conjunto de datos a
CONTENIDO
195
INTRODUCCION
A estas variables tambin se les denomina factores, mientras que a las distintas
categoras de la variable se les suele denominar niveles.
Cuanto mayor sea el valor de 2, menos verosmil es que la hiptesis sea correcta. De la
misma forma, cuanto ms se aproxima a cero el valor de chi-cuadrado, ms ajustadas estn
ambas distribuciones.
Los grados de libertad gl vienen dados por :
196
La prueba X2 puede aplicarse con una sola variable para comparar valores
observados respecto a esperados, aunque su uso ms frecuente es para comparar
dos proporciones.
Simplemente diremos que los valores que toma el estadstico ji-cuadrado con un
grado de libertad corresponden a los obtenidos a una distribucin normal estandar
197
elevados al cuadrado, y que por tanto la prueba ji-cuadrado solo tiene una cola
tomando nicamente valores positivos.
Ejemplo
Supongamos que realizamos un estudio en 45 pacientes en el que deseamos estudiar la
relacin entre el hbito tabquico y EPOC diagnosticado mediante espirometra obteniendo
los resultados de la Tabla I. Podemos ver que 15 pacientes de 25 (60%) tenan EPOC dentro
del grupo de fumadores, mientras que tan solo 5 de 20 (25%) presentaron EPOC en el grupo
de no fumadores. Desde un punto de vista clnico las diferencias son importantes, pero lo
sern desde un punto de vista estadstico?
Fumador
EPOC
No
Total
No
15 (75%)
10 (40%)
25 (55,6%)
5 (25%)
15 (60%)
20 (44,4%)
Total
20 (100%)
25 (100%) 45 (100%)
Si la proporcin es distinta, tenemos en cuenta las dos posibilidades que existen: que la
proporcin de pacientes con EPOC sea ms alta o ms baja en los fumadores, por lo tanto la
prueba es bilateral o tambin denominada de dos colas.
Entonces tenemos:
198
Ho :
Ha:
Fumador
EPOC
No
Total
No
11,1 (55,6%)
13,9 (55,6%)
25 (55,6%)
8,9 (44,4%)
11,1 (44,4%)
20 (44,4%)
Total
20
25
45
X2 = 5.51
199
No padecen la
enfermedad
enfermedad
12
88
No
25
25
Fumadores
Total
Total
Emplee un nivel de confianza del 95%.
200
Componentes
Componentes
defectuosos
correctos
16
94
24
76
Total
81
Total
Determine si existe relacin entre la cantidad de componentes defectuosos y el
distribuidor que los suministra, con un = 0,01.
Sin depresin
Con depresin
38
No
31
22
Total
Total
Determinar si existe independencia entre la actividad del sujeto y su estado de nimo.
Nivel de significacin (5%).
16-34
35-55
56 a ms
Alta
12
21
Baja
18
15
Violencia
Total
Total
Indican los datos que ver violencia en la televisin depende de la edad del
televidente, a un nivel de significacin del 1%?
5. Supongamos que se quiere estudiar la posible asociacin entre el hecho de que una
gestante fume durante el embarazo y que el nio presente bajo peso al nacer. Por lo
201
No
Fumadora
43
207
No Fumadora
105
1645
Total
Total
Realice la prueba Ji-Cuadrada de independencia para determinar la existencia de
relacin o no, use un = 0,10.
No
Masculino
40
30
Femenino
10
40
Total
Total
Existe relacin entre las 2 variables presentadas? = 0,05.
202
Centro
Selva
22
32
33
No
67
10
Total
Con un nivel de significancia del 1%, existe alguna dependencia entre la regin de
procedencia y la presencia de la plaga?
Severidad de
la Condicin
AB
Ausente
543
211
90
476
Moderada
44
22
31
Severa
28
31
Total
Total
Use los resultados adjuntos para entregar una conclusin a los investigadores con un
nivel de significacin del 5%.
9. Los nios de una escuela primaria fueron clasificados en forma cruzada de acuerdo
con el grupo socioeconmico al que pertenecen y la presencia o ausencia de cierto
defecto en el lenguaje. Los resultados fueron los siguientes:
Grupo Socioeconmico
Defecto del
203
Lenguaje
Alto
Presente
Ausente
42
Medio
Medio Bajo
Bajo
24
32
27
121
138
108
Alto
Total
Total
Son compatibles estos datos con la hiptesis de que el defecto en el lenguaje est
relacionado con el grupo socioeconmico? Nivel de significacin del 2,5%.
Nivel de Conocimientos en
Total
Matemticas
Bueno
Deficiente
Tcnicas
20
60
Bachiller
15
150
Otras
25
230
Total
11. Una medicacin nueva para tratar cierta enfermedad de vacunos se compar con la
medicacin de mayor uso. Para esto se tom al azar un grupo de 300 animales que
padecan la enfermedad; a la mitad de stos, tomados al azar, se los trat con la
nueva medicacin y a los otros 150, con la medicacin tradicional. Luego de un
tiempo se analizaron nuevamente los animales con el siguiente resultado:
Tratamiento
Nuevo
204
Sin Efecto
Mejor
16
30
104
Total
Tradicional
20
42
88
Total
Considera que estos medicamentos se comportan de manera similar? Nivel de
significacin del 10%.
12. A un grupo de 350 adultos que participaron en una escuela de salud, se les pregunt
si llevaban o no una dieta. Las respuestas (por gnero) son las siguientes:
Gnero
No
Masculino
14
159
Femenino
25
152
Total
Total
Sugieren estos datos que el estar a dieta depende del sexo? Sea =0,05
205