Escolar Documentos
Profissional Documentos
Cultura Documentos
CICLO V
ADMINISTRACIN DE EMPRESAS
PROFESORESPONSABLE:
AUTOR:
DIRECTOR DE LA EUDED:
NDICE
1. PRESENTACIN
2. INTRODUCCIN A LA ASIGNATURA
3. ORIENTACIONES GENERALES DE ESTUDIO
4. TUTORAS
5. CRONOGRAMA
6. EVALUACIN
7. MEDIOS Y RECURSOS DIDCTICOS
8. OBJETIVOS GENERALES
9. MEDIOS Y RECURSOS DIDACTICOS
10. PRIMERA UNIDAD
11. SEGUNDA UNIDAD
12. TERCERA UNIDAD
13. CUARTA UNIDAD
BIBLIOGRAFA
PRESENTACIN
La presente Gua Acadmica de Estadstica para Administradores, fue desarrollado para los
estudiantes de la carrera profesional de Administracin de Empresas.
El propsito de esta gua acadmica de Estadstica para Administradores es capacitar al
estudiante en herramientas estadsticas para el anlisis de la informacin administrativa para que
el futuro profesional de Administracin de Empresas analice los diferentes entornos
empresariales, usando mtodos y tcnicas de la inferencia estadstica para la adecuada toma de
decisiones gerenciales. Este en la capacidad de disear y aplicar modelos estadsticos, que
respondan a los diferentes procesos empresariales y financieros existentes, para describir
situaciones concretas que permitan una adecuada toma de decisiones en la gestin empresarial
demostrando la capacidad de ser actor del cambio participando en forma democrtica y
responsable en los procesos de transformacin del pas y utilice los diferentes mtodos de
muestreo demostrando actitud crtica
Esta gua contiene cuatro unidades distribuidos metodolgicamente, estructurado mediante el
desarrollo de cada unidad con sus respectivos objetivos, actividades, y preguntas de
autoevaluacin.
Se espera que la presente gua constituya una gua efectiva y motive a la vez al estudio y la
dedicacin adecuada que permita el logro de los objetivos. Es claro que el estudio serio y
consciente de ninguna manera se cie a una gua, por el contrario consiste en la profundizacin
o ampliacin de los temas contenidos en esta, considerando que los conocimientos son muy
extensos. Slo a travs de la investigacin Ud. podr encontrar nuevos enfoque ms
actualizados acordes con la realidad actual.
INTRODUCCIN A LA ASIGNATURA
La asignatura de Estadstica para Administradores es un curso de formacin tecnolgica bsica
profesional para todos los estudiantes de la carrera profesional de Administracin de Empresas
que ofrece la Escuela Superior de Educacin a Distancia de la Universidad Nacional Federico
Villarreal.
Esta materia, que se estudia en el quinto ciclo de la carrera, es muy importante porque el
mundo de hoy requiere de profesionales que conozcan las herramientas estadsticas para el
anlisis de la informacin administrativa tiene como objetivo principal analizar los diferentes
entornos empresariales, usando mtodos y tcnicas de la inferencia estadstica para la adecuada
toma de decisiones gerenciales.
La presente Gua Acadmica del Participante de Estadstica para Administradores est
dividida en cuatro unidades. Cada una de ellas tiene cuatro temas, actividades y preguntas de
autoevaluacin que le permitirn poner en prctica lo aprendido. Para desarrollar eficazmente
las unidades, usted deber consultar los textos recomendados y los enlaces correspondientes
que figuran al finalizar cada tema.
En la primera unidad se presentan algunos conceptos y elementos relacionados a la
Estadstica, teora del muestreo y Distribuciones mustrale. En la segunda unidad se analiza la
informacin a travs de estimacin de parmetros, prueba de hiptesis, pruebas
paramtricas y no paramtricas. La tercera unidad trata sobre el Anlisis de regresin Lineal.
Finalmente, en la cuarta unidad vemos la importancia de la aplicacin de mtodos para calcular
los nmeros ndices.
La evaluacin tiene como propsito determinar si los participantes alcanzan los objetivos
propuestos. Para ello, se considera los siguientes criterios: interaccin a travs del chat,
participacin en los foros, presentacin de las tareas encomendadas y las evaluaciones
programadas por la Coordinacin Acadmica de la Escuela Universitaria de Educacin a
Distancia.
Esperamos que esta Gua del Participante les resulte til para lograr los objetivos planteados
en el curso de Estadstica para Administradores.
Estimados participantes:
La razn de ser de los cursos virtuales es facilitar el acceso a los programas educativos de
aquellos estudiantes cuyos horarios o situacin geogrfica no son compatibles con la formacin
presencial, sin embargo, su objetivo es muy claro: ofrecer una calidad acadmica igual o
superior a la que se brinda en los programas presenciales. Por ello, los programas virtuales se
apoyan en la ms moderna tecnologa informtica y de comunicaciones (aulas virtuales) que
permiten un alto grado de interaccin y orientacin del profesor y una elevada interrelacin
entre los estudiantes.
TUTORAS
Las tutoras se desarrollarn mediante la programacin de un calendario de tutoras. La tutora
ser presencial y virtual.
CRONOGRAMA
Tutoras presenciales
y virtuales
Horas
virtuales
Horas vdeoconferencia
semana 1
2.5
semana 2
2.5
semana 3
2.5
semana 4
2.5
UNIDAD I
UNIDAD II
EVALUACIN PARCIAL VIRTUAL UNIDADES I - II
semana 5
2.5
semana 6
2.5
semana 7
2.5
semana 8
2.5
UNIDAD III
UNIDAD IV
EVALUACIN FINAL UNIDADES III - IV
16
20
TOTAL
60 HORAS ACADEMICAS
24
EVALUACIN
(EF):
(TA): (40%)
(IV): (20%).
(40%).
El examen parcial ser virtual y se realizar en la 4ta semana del mdulo. El examen final ser
presencial y se realizar en la 8va semana del mdulo. Tambin se presentar un trabajo
monogrfico la ltima semana de clase.
El estudiante que abandona la asignatura tendr promedio 00 (cero) en el acta final, debiendo
registrar nuevamente su matrcula.
(*) Examen parcial virtual, foros, chat, otros.
Berenson, Mark L. /Levine David (2001). Estadstico para administracin. Mxico, DF:
Pearson Educacin, 2001/734p.
Crdova Zamora, Manuel. (2003). "Estadstica descriptiva e inferencial". Lima:
Moshera, 2003/495p
Leonard J. Kasmier/ Arrioja Juarez. Estadstico aplicada a la administracin y a la
economa. Mxico: Edit. McGraw- Hill. Interamericana, 2006/406p.
Lind, Douglas A./ Mason Robert D. / Marchal, William G. (2001). Estadstica para
administracin y Economa. Mxico DF: McGraw Hill, 2001
Vnculo:
En: https://www.youtube.com/watch?v=Sb3J3Eu7Jmo
https://www.youtube.com/watch?v=zGtk_Ii9VBs
http://jaguar.cgr.go.cr/content/dav/jaguar/Documentos/cgr/centro_conoc/pdfs/economia_estadistic
a/estadistica-adm.pdf
Consultar los siguientes textos y enlaces:
(Unidad II,III)
Leer de :
Berenson, Mark L. /Levine David (2001). Estadstico para administracin. Mxico, DF:
Pearson Educacin, 2001/734p.
Crdova Zamora, Manuel. (2003). "Estadstica descriptiva e inferencial". Lima:
Moshera, 2003/495p
Leonard J. Kasmier/ Arrioja Juarez. Estadstico aplicada a la administracin y a la
economa. Mxico: Edit. McGraw- Hill. Interamericana, 2006/406p.
Lind, Douglas A./ Mason Robert D. / Marchal, William G. (2001). Estadstica para
administracin y Economa. Mxico DF: McGraw.
Thomson Espaa 2006)
Vnculo:
https://www.youtube.com/watch?v=DPpSrsndLJQ
https://www.youtube.com/watch?v=AJcy4eZMwWM
https://www.youtube.com/watch?v=AJcy4eZMwWM
https://www.youtube.com/watch?v=hJysxbj8CHI
http://jaguar.cgr.go.cr/content/dav/jaguar/Documentos/cgr/centro_conoc/pdfs/economia_estadistic
a/estadistica-adm.pdf
Consultar los siguientes textos y enlaces:
Berenson, Mark L. /Levine David (2001). Estadstico para administracin. Mxico, DF:
Pearson Educacin, 2001/734p.
Crdova Zamora, Manuel. (2003). "Estadstica descriptiva e inferencial". Lima:
Moshera, 2003/495p
Leonard J. Kasmier/ Arrioja Juarez. Estadstico aplicada a la administracin y a la
economa. Mxico: Edit. McGraw- Hill. Interamericana, 2006/406p.
Lind, Douglas A./ Mason Robert D. / Marchal, William G. (2001). Estadstica para
administracin y Economa. Mxico DF: McGraw.
Vnculo:
https://www.youtube.com/watch?v=EBKnkb26AM4
http://jaguar.cgr.go.cr/content/dav/jaguar/Documentos/cgr/centro_conoc/pdfs/economia_estadistic
a/estadistica-adm.pdf
Herramientas a emplearse en plataforma virtual:
Foros,tareas, chat
Enlaces, videos, examen, pginas entre otros
Unidad IV
Plataforma virtual
OBJETIVOS
GENERALES
Disear y aplicar modelos estadsticos, que respondan a los diferentes procesos empresariales
y financieros existentes, para describir situaciones concretas que permitan una adecuada toma
de decisiones en la gestin empresarial demostrando la capacidad de ser actor del cambio
participando en forma democrtica y responsable en los procesos de transformacin del pas.
ESPECIFICOS
Conocer las nociones de las pruebas de hiptesis, y las tcnicas de regresin para resolver
problemas relacionados con los negocios.
PRIMERA UNIDAD
DISTRIBUCIONES MUESTRALES
Estimado participante:
En esta primera unidad estudiaremos sobre las distribuciones muestrales que comprende
conceptos bsicos sobre la teora del muestreo y aplicaciones en base a distribuciones
muestrales.
OBJETIVOS ESPECFICOS
96%
2.05
95.45% 95%
2.00
1.96
90% 80%
1.645 1.28
68.27%
1.00
En donde:
Z : Nivel de confianza.
: Desviacin estndar
E : Error mximo.
N : Tamao de la poblacin.
Ejemplo 1: Se quiere estimar las ventas promedio que las Empresas del Rubro de Textilera a
nivel Nacional realizan en un mes . Un estudio anterior de 10 empresas mostr que la desviacin
estndar de sus ventas es de 150 millones de soles Qu tan grande debe ser una muestra para
que la consultora tenga el 95% de confianza de que el error de estimacin es a lo ms de 40
millones de soles?
Solucin:
Entonces se necesita aproximadamente una muestra de 54 empresas para estimar las ventas
promedio con una confianza del 95% y un error mximo de 40 millones de soles
Ejemplo 2: Para el ejemplo anterior. Cunto sera el tamao de muestra si se conoce que el
total de empresas en es de 200 empresas?
Solucin:
Para ello se utilizar la frmula de tamao de muestra cuando se conoce la poblacin,
reemplazando sera:
Por lo tanto, se necesita aproximadamente una muestra de 42 empresas para estimar las ventas
promedio con una confianza del 95% y un error mximo de 40 millones de soles
Frmula para calcular el tamao de muestra para estimar p:
El tamao de muestra cuando no
se conoce la poblacin
(Poblacin infinita)
Ejemplo 1: A cuntas familias tendramos que estudiar para conocer la preferencia del
mercado en cuanto a las marcas de shampoo para beb, si se desconoce la poblacin total?
Asumamos los siguientes datos nivel de confianza 95%, una precisin (error muestral) del 3% y la
proporcin esperada de 5%.
Solucin:
Z: 1.96 (95% de confianza)
p: 0.05 (en este caso 5%) q=1p=1-0.05=0.95
e: 0.03 (3% error mximo)
Se requerir entrevistar a no menos de 203 familias para poder tener la seguridad del 95%.
Ejemplo 2: Cmo hubiera cambiado el ejemplo 1 anterior, si se desconoce la proporcin
esperada?
Solucin:
Cuando se desconoce la proporcin esperada, se tiene que utilizar el criterio
conservador (p=q=0.5=50%) Z: 1.96 (95% de confianza)
p: 0.5 (en este caso 50%) q=1p=1-0.5=0.50
e: 0.03 (3% error mximo)
Se requerir entrevistar a no menos de 1,067 familias para poder tener la seguridad del 95%.
2.2.2. Proceso de seleccin del muestreo aleatorio simple
Para seleccionar una muestra de este tipo: Enumere las unidades de la poblacin, desde 1 hasta
N. Usando la tabla de nmeros aleatorios seleccione la primera unidad para la muestra.
Continuar la seleccin excluyendo las que se repiten. En la actualidad, la generacin de nmeros
aleatorios se realiza de forma automtica a travs del software Excel: Se utiliza la siguiente
funcin= Aleatorio.entre (inferior, superior).
a. Tabla de nmeros aleatorios
La extraccin de una muestra aleatoria simple se efecta seleccionando una a una las n
unidades. La utilizacin de una tabla de nmeros aleatorios implica un mecanismo de
probabilidad muy bien diseado, de manera que garantiza estadsticamente la aleatoriedad de
sus elementos.
Supongamos que deseamos elegir dos nmeros aleatorios entre 1 y 50. Para ello podemos
utilizar pares de nmeros en la tabla y estos pueden ser adyacentes. Iniciemos en la fila 1,
columna 5: nmeros (99) y avancemos a la derecha (67), (16), (41),. El (99) y el (57) no estn
comprendidos entre 1 y 50, de manera que se descarta, el (16) y el (41) s se eligen por estar
comprendidos entre 1 y 50. Por lo tanto, los elementos elegidos seran: el 16 y el 41.
2.2.3. Muestreo Aleatorio Sistemtico
Este muestreo exige que los elementos componentes de la poblacin tengan un orden de posicin
Para obtener una muestra sistemtica se elige una muestra de tamao n y sea K el siguiente
entero despus de dividir N/n (intervalo muestral). Luego, determinamos un nmero aleatorio R
entre 1 y k, el cual determina que la muestra est formada por las unidades numeradas R, R
+ k, R+2k,....., R+ (n-1)k.
Ejemplo de aplicacin 1. Por ejemplo, para elegir una muestra de 45 estudiantes de una lista de
45,000 que estudian en la universidad, el intervalo de muestreo k es 1,000. Supongamos que el
entero aleatorio elegido sea R=597. Entonces los estudiantes numerados como 597, 1597, 2597,.,
44597 estaran en la muestra.
Ejemplo 2. A partir de una lista de 100 establecimientos de comestibles, deseamos seleccionar
una muestra probabilstica de 20 tiendas. La forma de elegir sera:
Dividir 100 entre 20, k=5.
Extraer un nmero aleatorio entre 1 y 5, supongamos R=2, el cual corresponde al primer elemento
seleccionado. Se incluye en la muestra de establecimientos numerados: 2, 7, 12, 17, 22,., 97.
2.2.4. Muestreo Aleatorio Estratificado
Si la variable que nos interesa asume distintos valores promedios en diferentes subpoblaciones.
Podramos obtener estimaciones ms precisas de las cantidades de la poblacin al tomar una
muestra aleatoria estratificada. En el siguiente grfico se puede observar el muestreo aleatorio
estratificado. Asignacin de las observaciones en los estratos:
Estrato
Muy Alto
Alto
Medio
Bajo
Total
Una estadstica muestral proveniente de una muestra aleatoria simple tiene un patrn de
comportamiento (predecible) en repetidas muestras. Este patrn es llamado la distribucin
muestral de la estadstica.
Si conocemos la distribucin muestral podemos hacer inferencia.
Distribucin muestral, es un conjunto de todos los valores posibles para un estadstico y la
probabilidad relacionada con cada valor.
1/6
200
1/6
250
2/6
300
1/6
350
Xi
K
150 200 250 250 300 350
X
250
6
Varianza De La Distribucin Mustral de las Medias Muestrales
X2
( X X )2
( X )
X2
X X2
En el caso anterior vale 64.55
N n
N 1
El teorema del lmite central es de importancia fundamental para la estadstica porque justifica el
uso de mtodos de curva normal en una gran variedad de problemas; se aplica a poblaciones
infinitas y tambin a poblaciones finitas cuando n, a pesar de ser grande, no constituye ms que
una pequea porcin de la poblacin.
Es difcil sealar con precisin qu tan grande debe ser n de modo que se pueda aplicar el
teorema del lmite central, pero a menos de que la distribucin de la poblacin tenga una forma
muy inusual, por lo regular se considera que n = 30 es lo suficientemente alto. Ntese que cuando
en realidad estamos tomando una muestra de una poblacin, la distribucin del muestreo de la
media es una distribucin normal, no obstante el tamao de n.
F(X)
Distribucin de las medias muestrales
Distribucin de valores individuales
sX
X
n
Si
n( , 2 )
X 1 , X 2 ,..., X n es una muestra aleatoria de una Poblacion (X) con distribucin normal
.Entonces X
2 /n
7
7
8
1
6
6
3
7
7
3
3
9
5
1
3
1
1
7
4
8
3
1
5
2
1
3
2
2
6
6
2
6
4
2
1
2
8
9
6
6
9
5
4
7
5
7
5
7
1
4
9
4
1
9
7
4
3
9
3
9
9
7
7
9
5
3
2
5
9
7
4
2
7
6
2
3
2
6
2
9
2
8
9
3
8
4
9
1
7
7
1
2
5
9
1
1
8
7
7
4
6
4
4
1
9
1
5
7
8
8
6
4
2
5
6
2
1
3
4
8
9
5
3
8
1
4
1
5
6
8
7
8
8
4
8
1
7
9
2
4
5
4
5
9
3
3
1
7
2
9
5
5
5
8
6
3
8
5
6
9
8
1
7
8
4
6
4
5
6
3
9
2
4
4
2
5
5
7
3
6
7
8
5
8
4.2
5.6
4.0
3.4
7.0
5.4
4.2
5.8
6.0
5.2
3.4
6.6
5.4
3.8
5.2
6.4
4.8
6.8
5.2
4.8
3.6
5.6
7.0
2.8
3.2
5.0
4.6
5.4
6.0
4.2
4.4
5.0
4.2
4.2
3.2
4.4
6.0
6.4
6.2
6.8
7.2
4.2
6.8
6.2
4.6
6.6
9
2
4
9
1
7
8
2
9
7
1
2
2
2
5
5
5
2
7
7
1
2
4
8
2
4
9
6
2
3
8
6
7
2
1
1
3
4
9
6
3
7
5
5
4
6
3
8
7
4
7
3
3
2
3
8
9
8
2
1
4
7
6
9
3
2
8
8
1
7
6.0
4.6
4.6
4.8
4.4
6.2
4.6
3.6
5.2
4.8
4.6
4.4
3.6
6.0
Histogram of Poblacion
40
Frequency
30
20
10
Poblacion
Como el P value es menor a 0.05 los datos no siguen una distribucin normal.
99.9
Mean
StDev
N
AD
P-Value
99
Percent
95
90
5.073
1.118
60
0.527
0.172
80
70
60
50
40
30
20
10
5
1
0.1
5
Muestra
Como el P value es mayor a 0.05 incluso mayor a 0.10, las medias siguen una distribucin normal.
Tomando un tamao de subgrupo de n = 10 se tiene:
PROM.
N=10
4.9
3.7
6.2
5.0
5.6
5.0
4.6
5.8
5.8
5.0
4.6
4.9
4.1
5.0
5.1
4.7
4.2
3.8
6.2
6.5
5.7
6.5
5.6
5.3
4.7
5.3
4.1
5.0
4.5
4.8
Frequency
7
6
5
4
3
2
1
0
3.5
4.0
4.5
5.0
PROM. N=10
5.5
6.0
6.5
X
/ n
Las llamadas durante un mes promediaron 150 seg. Con una desviacin estndar de 15 seg.a.
Cul es la probabilidad de que una llamada en particular dure entre 150 y 155 segundos?
155 150
Z 155
0.33
15
En tablas P(Z <= 0.33) = 0.6293 ;
150 150
Z 150
0.0
15
P(Z<=0) = 0.500
Muestra
Esta distribucin se forma al sumar los cuadrados de las variables aleatorias normales estndar.
Si Z es una variable aleatoria normal, entonces el estadstico Y siguiente es una variable aleatoria
Chi cuadrada con n grados de libertad.
P( X ,k )
2
K=5
K=50
K=25
P( X 0.05, 20 ) .05
2
.Entonces
(n 1)
S 2 n21
( X ) (s / n) tn1
( X ) (s / n)
f ( x)
K=1
K=10
K=100
k
; k 3
k 2
x
s/ n
Caiga entre dos valores especificados es igual al rea bajo la distribucin de probabilidad t de
Student con los valores correspondientes en el eje X, con n-1 grados de libertad
Ejemplo:
La resistencia de 15 sellos seleccionados aleatoriamente son: 480, 489, 491, 508, 501, 500, 486,
499, 479, 496, 499, 504, 501, 496, 498
Cul es la probabilidad de que la resistencia promedio de los sellos sea mayor a 500?. La media
es 495.13 y la desviacin estndar es de 8.467.
t = -2.227 y el rea es 0.0214
495.13 500
2.227
8.467 / 15
4.1.3. Distribucin F
Surge de dividir dos ji-cuadradas independientes
F=(W/u)/(Y/v)
[(u v) / 2]u / v 2 x ( u / 2 ) 1
u
(u / 2)[v / 2][ x 1]( k v ) / 2
v
x (0, )
u
f ( x)
u=10
u=20
v=5
v=20
ACTIVIDADES RECOMENDADAS
SEGUNDA UNIDAD
Estimado participante:
En esta segunda unidad estudiaremos Estimacin de parmetros y prueba de hiptesis, pruebas
no paramtricas y no paramtricas.
OBJETIVOS ESPECFICOS
ESTIMACIN DE PARMETROS
Las razones para efectuar una estimacin en una poblacin, en lugar de estudiarla directamente,
pueden ser: que el tamao de la poblacin sea infinito, que la poblacin sea finita pero demasiado
grande, y otras razones como costo o tiempo. Por ello parece ms prctico tomar muestras. Hay
dos maneras bsicas de hacer estimaciones:
Estimacin puntual: Estadstico calculado a partir de la informacin obtenida de la muestra y que
se usa para estimar parmetro poblacional con un solo valor.
Estimacin por intervalos de confianza: Se estima el parmetro desconocido con un intervalo, que
tiene asociado cierta probabilidad de ocurrencia.
1.1.1. ESTIMACIN PUNTUAL
Es un valor numrico que proporciona sus respectivos estimadores de punto que se calcula
considerando los datos muestrales, es decir, se usan las medidas de la muestra para calcular un
nico valor numrico que es la estimacin del parmetro poblacional.
La media muestral, es una estimacin puntual de la media poblacional, p, una proporcin
muestral, es una estimacin puntual de la proporcin poblacional; y s, la desviacin estndar
muestral, es una estimacin puntual de la desviacin estndar poblacional.
Sin embargo, es necesario que cada estimador de punto cumpla con algunos requisitos
deseables como ser:
Insesgado: Es decir, la media aritmtica de todas las posibles estimaciones puntuales del
estimador del parmetro que puedan obtenerse debe ser igual al parmetro de la poblacin.
Consistente: Nos indica que conforme se incrementa el tamao de la muestra la estimacin
puntual del estimador se acerca cada vez ms al parmetro de la poblacin.
Eficiente: El estimador debe tener varianza mnima.
Suficiente: El estimador debe contener toda la informacin de la muestra.
Ejemplo:
Se tiene inters en estimar el gasto promedio mensual en movilidad del personal profesional de
Administracin de la UNFV. Para el efecto, se recurre a una muestra aleatoria de 25 profesionales
de Administracin y se obtiene los siguientes resultados: x= S/ 160.00 y s =S/ 32.00.
El gasto promedio mensual en movilidad de todas las auxiliares de enfermera est representado
por (que es el parmetro poblacional) y la estimacin por punto de este parmetro sera:
=
S/ 160.00
Sin embargo, este valor no se considera estable porque si repetimos la experiencia con diferentes
muestras del mismo tamao se van a obtener resultados distintos. Por consiguiente, la alternativa
es construir un intervalo de tal manera que el valor del parmetro se encuentre dentro de dicho
intervalo con un cierto grado de seguridad.
tn-1 = Es el coeficiente de confianza y cuyo valor depende del grado de confianza que se establece
Ejemplo:
Se quiere estimar un intervalo de confianza al nivel de significacin a = 0, 05 para la altura media
de los individuos de una ciudad. En principio solo sabemos que la distribucin de las alturas
es normal. Para ello se toma una muestra de n = 25 personas y se obtiene:
= 170 cm
S = 10 cm
Solucin:
ERROR DE CONTRASTE
Al tomar una decisin en una prueba de hiptesis, hay cuatro posibles resultados que pueden
ocurrir; como se ilustra en el siguiente diagrama:
DECISIN
NO RECHAZAR LA
HIPTESIS Ho
RECHAZAR LA
HIPTESIS Ho
SITUACIN VERDADERA
LA HIPTESIS Ho ES VERDADERA
LA HIPTESIS Ho ES FALSA
NO EXISTE ERROR
PROB= 1- a
Confianza de la prueba
NO EXISTE ERROR
PROB=1-
Potencia de la prueba
1.
Ejemplo:
En base a una muestra de piezas en un embarque que se acaba de recibir, un inspector de
control de calidad debe decidir entre aceptar todo el embarque o regresarlo al proveedor, porque
no cumple con las especificaciones.
Supongamos que las especificaciones de determinada pieza dicen que la longitud promedio debe
ser de dos centmetros para cada pieza. Si la longitud promedio de las partes es mayor o menor
que la norma de dos pulgadas, las partes causarn problemas de calidad en la operacin de
ensamblaje. En este caso, se formularn como sigue las hiptesis:
Ho: = 2
Ha: <>2
Si los resultados de la muestra indican que no se puede rechazar Ho, el inspector de control de
calidad no tendr razn para dudar que el embarque cumpla con las especificaciones y lo
aceptar. Sin embargo, si los datos de la muestra indican que se debe rechazar Ho, la conclusin
ser que las piezas no cumplen con las especificaciones. En este caso, el inspector tendr las
pruebas suficientes para regresar el embarque al proveedor.
2.
3.
Es importante recordar que sin importar cmo se haya planteado el problema, la hiptesis
nula siempre incluir el signo "igual". El signo "igual" (=) nunca aparecer en la hiptesis
alternativa.
Por qu? Porque la hiptesis nula es la afirmacin a probar y al realizar los
clculos se requiere de un valor especfico. Se recurre a la hiptesis alterna solo
si se prueba que la hiptesis nula es falsa.
a.
b.
c.
2. Seleccionar el nivel de significancia: Despus de establecer la hiptesis y la hiptesis
alterna, el siguiente paso es determinar el nivel de significancia, que es la probabilidad de
rechazar la hiptesis nula cuando es verdadera. El nivel de significancia se denota mediante a,
la letra griega alfa. Algunas veces tambin se le denomina nivel de riesgo. Este ltimo es un
trmino ms adecuado, ya que es el riesgo que se corre de rechazar la hiptesis nula cuando
esta es verdadera. No hay un nivel de significancia que se aplique a toda las pruebas. Se usa
el nivel 0.05 (que con frecuencia se enuncia con nivel de 5%), el nivel 0.01, 0.1 o cualquier
otro nivel entre 0 y 1. Tradicionalmente se selecciona el nivel 0.05 para proyectos de
investigacin sobre consumo, el nivel 0.01 para el aseguramiento de calidad y el 0.1 para
encuestas polticas. El investigador debe decidir qu nivel de significancia usar antes de
formular una regla de decisin y recopilar los datos muestrales.
3. Seleccionar la estadstica de prueba
Estadstico para la media:
Media
(columna
2)
19
Baj
a
(columna
11
3)
18
12
38
20
59
39
140
Baja
(fila 3)
Total
40
30
(celda
3;2)
61
Total
53
El cruce entre filas (i) y columnas (j) de una tabla cruzada o de doble entrada constituyen las
celdas, las cuales contienen informacin referente a las variables consideradas en la tabla y
pueden constituir las frecuencias o porcentajes.
El razonamiento para contrastar si existe o no asociacin entre dos variables cualitativas se
basa en calcular cules seran los valores de frecuencia esperados para cada una de las celdas
en el caso de que efectivamente las variables fuesen independientes, y compararlos con los
valores realmente observados. Si no existe mucha diferencia entre ambos, no hay razones
para dudar de que las variables sean independientes.
El contraste estadstico ms utilizado para evaluar si las diferencias entre las frecuencias
observadas y las esperadas pueden atribuirse al azar, bajo la hiptesis de independencia, es el
denominado chi-cuadrado de Pearson
Entonces rechazaremos la hiptesis nula y concluimos que ambas variables son dependientes o
estn relacionadas. De lo contrario, estas seran independientes, es decir no estn
relacionadas.
Realicemos un ejemplo para poder aplicar:
Se realiza un estudio para investigar la asociacin entre la recuperacin de una enfermedad y el
uso de vitaminas. Se seleccionan 100 pacientes aleatoriamente y se recogen los datos que se
muestran en la tabla adjunta:
Tabla N. 1: Distribucin de pacientes segn uso de vitaminas y recuperacin de una
enfermedad - Hospital Dos de Mayo - Lima 2010.
(Frecuencias observadas)
Uso de
vitaminas
Recuperacin de la enfermedad
Se recupera
No se
recupera
Total
36
34
70
No
24
30
Total
60
40
100
Solucin:
Primero: Planteamos nuestras hiptesis de acuerdo al enunciado.
H0: La recuperacin de una enfermedad y el uso de vitaminas son independientes. H1: La
recuperacin de una enfermedad y el uso de vitaminas son dependientes.
Segundo: Calculamos las frecuencias esperadas:
Uso
de
vitamin
as
S
No
Tota
l
Recuperacin de la enfermedad
No se
Se recupera
Tota
recupera
l
O11=36
O12=34
70
O21=24
O22
30
=6
60
40
100
Se repite el mismo procedimiento para los que no usan vitaminas. Por ltimo, completar la tabla
Tabla N 2 Distribucin de frecuencias esperadas
Recuperacin de la enfermedad
Uso de
Se
No se
vitaminas
Tota
recupera
recupera
l
S
70
E11=42
E12=28
E21
No
30
E22
=
=
Tota
60
40
100
l
Tercero: Calculamos el estadstico de prueba, para lo cual usaremos las frecuencias
observadas (nuestros datos reales Tabla 1) y las frecuencias esperadas (la nueva Tabla 2):
Usando la frmula del contraste estadstico de la X 2:
3.2.
Prueba de bondad de ajuste. En las aplicaciones de una sola muestra( una sola
variable), la prueba de
se conoce como la tcnica de bondad de ajuste y est orientada a
probar la concordancia o no entre una distribucin muestral u observada y una distribucin
hipottica o esperada. De ah el nombre de bondad de ajuste de las frecuencias observadas
y las esperadas.
, en este caso, se usa con l finalidad de contrastar si una distribucin
muestral se ajusta o no a una distribucin terica o hipottica.
Lo que se requiere, entonces, es una hiptesis(nula) o teora postulada, denotada por H 0 que
nos permita calcular las frecuencias esperadas en cada categora y posteriormente probar H 0
con la ecuacin.
La X2 para el caso de una sola muestra, resuelve problemas cuyos datos pueden presentarse
segn el siguiente esquema.
___________________________
Variable
OI
Ei
__________________________
A1.. E1
A2.. E2
.
.
.
Ak...........................................E k
________________________________________
Total
n...n
Puede notar en la ecuacin que si existe una semejanza grande entre las O i y las EI, el valor
de X2 resultante ser pequeo lo que llevar al no rechazo de la H 0. A medida que aumentan
las discrepancias (Oi-Ei) el valor de X2 aumenta. Cuanto mayor sea el valor de X 2 mayores
probabilidades tendremos de rechazar H0.
Ejemplo1:
En Lima Metropolitana se investig la preferencia de una muestra aleatoria de 55 estudiantes
de quinto de secundaria hacia 5 profesiones. Se obtuvieron los siguientes resultados:
Profesin
A
B
C
D
E
Total
Oi
12
15
07
11
10
55
Oi
12
15
07
11
10
55
c) Estadstica de prueba
Usando la ecuacin tenemos:
Ei
11
11
11
11
11
11
d) Decisin
En este caso el nmero de categoras es 5. K=5 LUEGO gl=K-1; gl.=4.
Para tomar la decisin estadstica respecto a la H o, se tomar en cuenta la probabilidad de
cometer el error tipo I representado por p=P(Rechazar H0/Ho es verdadera. El valor de p
puede ser obtenido en forma exacta a travs del uso de algn paquete estadstico, o de la
tabla X2, en forma aproximada
Luego la regla de decisin ser:
Si p>= no se rechaza la Ho
Si p< se rechaza la Ho
Atendiendo a la regla de decisin no se rechaza H o, ya que para X2 c=3,09 El valor de p que
corresponde es : 0,50 <p< 0,70
e) Conclusin:
Se concluye que las 5 profesiones son igualmente preferidas
3.3.
Prueba de Independencia de criterio.
Supongamos que de n elementos de una poblacin se han observado dos caractersticas X e
Y, obtenindose una muestra aleatoria simple bidimensional (X1,Y1),(X2,Y2),...,(Xn,Yn). Sobre
la base de dichas observaciones se desea contrastar si las caractersticas poblacionales X e Y
son independientes o no. Para ello se dividir el conjunto de posibles valores de X en k
conjuntos disjuntos A1,A2,...,Ak; mientras que el conjunto de posibles valores Y ser
descompuesto en r conjuntos disjuntos: B1,B2,...,Br. Al clasificar os elementos de la muestra,
aparecer un cierto nmero de ellos, ij n , en cada una de las k r clases as constituidas,
dando lugar a una tabla de contingencia de la forma:
Muestra
1
2
.
.
.
r
Total
1
n11
n21
.
.
.
nr1
n1
2
n11
n22
.
.
.
nr2
n2
Caractersticas
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
c
n1c
n2c
.
.
.
nrc
nc
Total
n1.
n2.
nr.
n..
Ejemplo:
Para estudiar la dependencia entre la prctica de algn deporte y la depresin, se seleccion
una muestra aleatoria simple de 100 jvenes, con los siguientes resultados:
Determinar si existe independencia entre la actividad del sujeto y su estado de nimo. Nivel de
significacin (5%)
SOLUCIN:
Debemos primero calcular las frecuencias esperadas bajo el supuesto de independencia. La
tabla de frecuencias esperadas sera:
Este valor debemos compararlo con el percentil de la distribucin X2 con (2-1)(2-1)=1 grado de
libertad. X2 0.95 (1) =3.84
Por lo tanto como el valor del estadstico es superior al valor crtico, concluimos que debemos
rechazar la hiptesis de independencia y por lo tanto asumir que existe relacin entre la
depresin y los hbitos deportistas del individuo.
3.4.
Prueba de Homogeneidad de poblaciones Esta es una de las aplicaciones ms
recuentes de Ji-cuadrado. En este caso se tiene dos o ms poblaciones independientes las
que se desean comparar respecto de una variable categrica. En otros trminos, se trata de
determinar si dos o ms poblaciones son homogneas respecto de una variable categrica. El
esquema de datos sera
Muestra
1
2
.
.
.
r
Total
1
n11
n21
.
.
.
nr1
n1
2
n11
n22
.
.
.
nr2
n2
Caractersticas
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
c
n1c
n2c
.
.
.
nrc
nc
Total
n1.
n2.
nr.
n..
Ejemplo:
Estamos interesados en estudiar la fiabilidad de cierto componente informtico con relacin al
distribuidor que nos lo suministra. Para realizar esto, tomamos una muestra de 100
componentes de cada uno de los 3 distribuidores que nos sirven el producto comprobando el
nmero de defectuosos en cada lote. La siguiente tabla muestra el nmero de defectuosos en
para cada uno de los distribuidores.
SOLUCIN:
Debemos realizar un contraste de homogeneidad para concluir si entre los distribuidores
existen diferencias de fiabilidad referente al mismo componente.
Las frecuencias esperadas bajo homogeneidad son las representadas entre parntesis.
El estadstico del contraste ser:
Este valor del estadstico Ji-cuadrado es mayor que el valor para el nivel de significacin del
5%, por lo tanto debemos concluir que no existe homogeneidad y por lo tanto que hay
diferencias entre los tres distribuidores. X20.05 (2) 5.99.
3.5.
Prueba de Signos-Rango de Wilconxon. Hemos viso que la prueba de los signos utiliza,
simplemente informacin concerniente a la direccin de la diferencia entre pares. Una de las
desventajas de la prueba de los signos es que elimina completamente cualquier informacin
cuantitativa que puede proporcionar un par de datos. Por ejemplo, trata como si 7-8 fuera igual
que 11-19, etc, la prueba de los signos trata todas las diferencias de ms coo si fueran las
mismas y todas las diferencias de menos como si fueran las mismas.
En cambio, la prueba de Wilconson considera la magnitud as como la direccin de las
diferencias, por lo que constituye una prueba mas poderosa que la de los signos, ya que da
mayor peso al par que exhibe una diferencia grande que al par que muestra una diferencia
pequea.
Por lo que acabamos de manifestar, la prueba de Wilconson es la mejor alternativa noparamtrica de la prueba de t de Student para dos muestras relacionadas. Es decir, si la
informacin muestral no cumple con las condiciones eigidas por la prueba de t podr usarse
la prueba de wilconson para comparar estadsticamente dos muestras relacionadas.
Ejemplo.
Se formaron 8 pares de estudiantes de primaria en base de C.I. grado de instruccin, ect. De
cada par se asign, al azar, un sujeto para uno de los siguientes sistemas de enseanza:
Sistema de instruccin Personalizado, (SIP), y Sistema Convencional de Enseanza(SCE). Al
final de la enseanza obtuvieron las siguientes puntuaciones.
Par
1
2
3
4
5
6
7
8
SIP(x)
40
38
45
43
37
43
46
47
SCE(y)
32
31
36
44
40
38
42
47
Solucin:
a) Hiptesis
Planteemos las hiptesis de la siguiente manera:
Ho=SIP=SCE
Ho=SIP<>SCE
b) Nivel de significancia : =0,05
c) Estadstica de prueba
Para obtener la suma de rangos positivos y negativos procedemos de la siguiente manera:
Calculamos las diferencias y ponemos las respuestas con sus propios signos
A cada diferencia, en valor absoluto, le asignamos un rango o puesto de tal manera
que a la diferencia ms baja, en valor absoluto, se le asigna el puesto 1 y as
sucesivamente. Si hubieran diferencias en valor absoluto iguales en magnitud se les
asignar la media aritmtica de los puestos correspondientes
Luego a cada puesto le asignamos el signo correspondiente a las diferencias.
Se suman los rangos con signo positivo y los de signo negativo, que sern T(+) y T(-),
respectivamente. Veamos:
Dif
+8
+7
+9
-1
-3
+5
+4
0
Suma
d) Decisin y conclusin
Si Ho fuera verdadera podramos esperar que la suma de rangos positivos y negativos se
anularan entre s Mientras ms preponderantemente positiva o negativa sea la suma de
rangos, la posibilidad de rechazar la Ho ser mayor.
El Estadstico T es la suma de rangos que tiene la suma ms pequea En nuestro caso T
calculado ser igual a 3. Este valor con n=7, lo ubicamos n la taba de valores crticos de
T en la prueba de Wilconxon, Tabla G, que se adjunta. Al valor de T calculado en un
contraste bilateral le corresponde una p>0,05. Luego, no se puede rechazar la H o. Por
consiguiente, los dos sistemas de enseanza producen efectos que difieren
significativamente.
ACTIVIDADES RECOMENDADAS
Una vez finalizado el estudio de la segunda unidad, es importante que repase los conceptos
y practique adecuadamente los ejercicios de la Gua Acadmica del Participante
Estimado participante:
En esta tercera unidad estudiaremos el Anlisis de Regresin Lineal
OBJETIVOS ESPECFICOS
1. Aplicar el anlisis de regresin, analizando la relacin entre dos variables.
2. Elaborar modelos para predecir una variable en funcin de otra variable y medir la relacin
entre dos variables.
3. Conocer los mtodos para realizar el anlisis de la regresin lineal y la correlacin aplicadas a
modelos longitudinales y transversales.
CONTENIDO TEMTICO
1. Regresin simple y mltiple.
Nocin e Importancia
El estudio estadstico de las relaciones, entre dos variables de intervalo, presenta los aspectos
fundamentales siguientes:
1. Existencia de asociacin entre las dos variables
2. Direccin de la asociacin
3. Grado de Asociacin
4. Naturaleza forma de la asociacin
Los dos primeros aspectos quedan determinados, cuando se halla el coeficiente de correlacin
r de pearson. Este coeficiente indica:
a) La existencia o no covaiacin o variacin conjunta entr dos variables, segn sea o no
distinto de cero.
b) La direccin de la asociacin, por su sgno positivo o negativo
c) El grado de la covariacin, segn el mayor o menor valor que alcance entre 0, y ms o
menos uno.
En cuanto al cuarto aspecto, naturaleza y forma de relacin, se estudia y resuelve mediante el
anlisis de regresin. Este anlisis es el que sirve para establecer la funcin matemtica y la
forma geomtrica que representen lo ms exactamente posible la variacin conjunta de ambas
variables. De ah que pueda decirse propiamente que sirve para estudiar la naturaleza y la forma
de asociacin entre dos variables de intervalo.
1.2.
Los elementos fundamentales del anlisis de la regresin son las variables y la ecuacin de
regresin.
Las variables pueden ser dos o ms. Una de ellas es la variable dependiente y las restantes son
las variables independientes.
En cuanto a los tipos, se tiene una regresin simple y regresin mltiple. La primera se refiere a la
naturaleza y forma de covariacin entre dos variables nicamente, y la segunda entre ms de dos
variables.
A su vez, ambos tipos de regresin pueden ser lineales y no lineales. Cuando la ecuacin, que es
expresin matemtica de la relacin entre las variables, es una ecuacin lineal cuya
representacin grfica da lugar a una lnea recta, se est en el caso de la regresin lineal, y de la
no lineal, en el caso contrario.
1.3.
Sirve para estudiar la naturaleza y forma de la asociacin entre dos variables, siempre que dicha
relacin pueda ser expresada matemticamente por la ecuacin de la lnea recta
Supongamos que tenemos los datos empricos que representan para cada uno de los sujetos de
un grupo los valores de dos variables, por ejemplo, la edad y la estatura. Entonces llevando en un
espacio de coordenadas cartesianas los valores de la edad al eje de las y los de la estatura al eje
de las Y, obtendramos una serie de puntos. Esta serie suele recibir el nombre de la nube de
puntos y constituye la representacin grfica de a posicin en el espacio cartesiano de cada sujeto
del grupo, respecto a las variables en cuestin.
1.4.
y=f(x)
y=0+ 1X
Entonces el modelo de regresin simple que sirva para predecir el comportamiento de Y usando x
ser de la forma:
y=0+ 1X +e
Donde y=variable dependiente
x=variable independiente
0=Constante o parmetro de posicin. Es el valor promedio de la variable de respuesta Y cuando
X es cero. Si se tiene certeza de que la variable predictora X no puede asumir el valor 0, entonces
la interpretacin no tiene sentido.
1=Coeficiente de regresin. Es el cambio (incremento o disminucin segn el signo de 1)
promedio en la variable de respuesta Y cuando X se incrementa en una unidad.
Las unidades de 1 son las mismas unidades de la variable dependiente Y.
NOTA: Los coeficientes de regresin 1 y el coeficiente de correlacin lineal simple r deben de
tener el mismo signo
TEMA 2: MTODOS DE MNIMOS CUADRADOS.
2.1. Estimacin de parmetros de la regresin
Para que dicha ecuacin est definida es necesario que se conozca 0 y 1. Dichos parmetros
se calculan utilizando el mtodo de mnimos cuadrados.
El mtodo de mnimos cuadrados busca o fija los datos de la muestra o poblacin a una lnea
recta de modo que las diferencias de cada observacin a la lnea de regresin sea lo menos
posible
El coeficiente de determinacin R2
Es una medida de la bondad de ajuste del modelo de regresin hallado. Indica qu porcentaje de la
variabilidad de la variable de respuesta "Y" es explicada por su relacin lineal con "X".
El valor estadstico de R2 vara de 0 a 1.
2.3.
Grafico de la Ecuacin
Concepto.
El anlisis de la varianza permite contrastar la hiptesis nula de que las medias de K poblaciones
(K >2) son iguales, frente a la hiptesis alternativa de que por lo menos una de las poblaciones
difiere de las dems en cuanto a su valor esperado. Este contraste es fundamental en el anlisis
de resultados experimentales, en los que interesa comparar los resultados de K 'tratamientos' o
'factores' con respecto a la variable dependiente o de inters.
El concepto bsico de anlisis de varianza fue desarrollado por R.A. Fisher y la distribucin F se
ha denominado en honor suyo. El razonamiento conceptual es el siguiente:
1. Se calcula la media para cada grupo de la muestra y despus se determina el error estndar
de la media S, con base solo en las diversas medias muestrales.
2. Dada la frmula S_=S/
, tenemos que S= ,Sx y que S2=nSx Esta estimacin resultante de
la varianza de la poblacin se llama la media cuadrtica, entre los grupos (MCE).
3. Se calcula la varianza dentro de cada grupo muestral y con respecto a cada media de grupo.
Luego se combinan estos valores de la varianza ponderndolos de acuerdo a n-1 para cada
muestra. La estimacin resultante de la varianza de la poblacin se llama media cuadrtica, de
los grupos (MCD).
4. Si la hiptesis nula m1=m2=m3=..mk es verdadera, entonces tenemos que las dos medias
cuadrticas obtenidas en (2) y (3) no estn sesgadas y son estimadores independientes de la
misma varianza de la poblacin, . Si la hiptesis nula es falsa, entonces el valor esperado de
la MCE es mayor que el de la MCD. Esencialmente, todas las diferencias entre las medias de
la poblacin inflarn la MCE, mientras que no afectarn la MCD.
5. Con base al numeral (4) se involucra una prueba de una cola, y la frmula general de la
prueba F en el anlisis de la varianza es:
F
=MCD
MCE
Si la relacin F est en la regin de rechazo para el nivel de significacin especificado, entonces
se rechaza la hiptesis de que las diversas medias muestrales se obtuvieron de la misma
poblacin.
Para simplificar este procedimiento con diseos en trminos del modelo lineal que identifica los
componentes influyendo sobre la variable aleatoria y se presenta en una tabla estndar de anlisis
de varianza mostrando los clculos necesarios de la media cuadrtica para cada tipo de diseo
experimental.
3.2.
El modelo del anlisis de varianza de una va se relaciona con la prueba de la diferencia entre k
medias muestrales, cuando los sujetos se asignan aleatoriamente a cada uno de los diversos
grupos de tratamiento.
La ecuacin lineal que representa el modelo del anlisis de varianza de una va es:
Xik=+k+ik
Donde:
=efecto del tratamiento en el grupo especfico k, del cual se muestra el valor
ik
=error aleatorio relacionado con el proceso de muestreo
La tabla siguiente es un resumen del anlisis de varianza de una va en la cual MCD pasa
a ser la media cuadrtica entre los grupos A grupos de tratamiento (MCA) y (MCE) es
llamada media cuadrtica del error. N asigna el tamao del total de la muestra para todos
los grupos de tratamiento combinados, antes que el tamao de la poblacin T k representa
la suma(total) de los valores muestreados en todos los grupos combinados.
La hiptesis nula y alternativa son:
Ho=k==0 para todos los niveles de tratamiento
H1=k==0 para todos los niveles de tratamiento
Si la hiptesis nula es verdadera, entonces tenemos que:
1= 2 =3 =.=k
Fuente de
Suma de los
Grados de
Media
variacin
cuadrados SC
libertad gl cuadrtica MC
Entre grupos de SCA=
k-1
MCA=
tratamiento A
Error
de SCE=STC-SCA
n-k
MCE=
muestreo, E
Total, T
N-1
STC=
Relacin
F
Fo=
Ejemplo:
Quince personas que se capacitan en un programa tcnico son asignadas, en forma
aleatoria, a tres tipos diferentes de enfoques de instruccin. Los puntajes de las pruebas
de rendimiento, al concluir la especializacin, se presentan en la tabla siguiente. Use el
procedimiento de anlisis de varianza para probar la hiptesis nula de que las tres medias
muestrales son iguales, aun nivel de significacin del 5%.
Mtodo de
Puntaje de la prueba
Tk
Instruccin
Total
A1
86 79 81 70 84
400
A2
90 76 88 82 89
425
A3
82 68 73 71 81
375
Total
1200
Solucin
Suma de cuadrados de tratamiento
SCA=
=
Suma de cuadrados del total
STC=
=
Suma de cuadrados del error= SCE=STC-SCA
=698-250=448
Fuente de
Suma de los
variacin
cuadrados SC
Entre grupos de SCA=250
tratamiento A
Error
de SCE=448
muestreo, E
Total, T
STC=698
Grados de
libertad gl
k-1=2
Media
cuadrtica MC
MCA=125
Relacin
F
Fo=3,35
n-k=12
MCE=37,33
Ft=3,89
N-1=14
Ft=F(1-,glA,glE)=F(0,95,2,12)=3,89
Ho=1= 2= 3=0
Ha= a algun 1 0
=0,05
f.p. Ft=3,35
Ejemplo:
Nmero de horas de estudio y rendimiento acadmico.
Gastos en publicidad e ingreso total.
Precio de un producto y cantidad demandada del mismo.
Hay supuestos que constituyen un modelo de poblacin por correlacin lineal bivariable, para lo
cual se calcula o se estima r, los cuales son:
1. Y e X son variables aleatorias, y como tal no debe ser designada como dependiente e
4.2.
Se presenta correlacin lineal cuando la relacin entre dos variables se manifiesta a travs de
una lnea recta y es simple porque solo intervienen dos variables.
Esta correlacin o asociacin, se mide a travs del coeficiente de correlacin lineal simple (p
r), definido como:
POBLACIN:
MUESTRA:
-1
Correlacin lineal
negativa
0
No hay relacin
lineal
1
Correlacin
positiva
lineal
Recuerda que:
El signo del coeficiente de correlacin es el mismo que el de
la covarianza. Si la covarianza es positiva, la correlacin es
directa.
Si la covarianza es negativa, la correlacin
es inversa. Si la covarianza es nula, no
existe correlacin.
Recuerda que:
El signo del coeficiente de correlacin es el mismo que el de
la covarianza. Si la covarianza es positiva, la correlacin es
directa.
Si la covarianza es negativa, la correlacin
es inversa. Si la covarianza es nula, no
existe correlacin.
El coeficiente de correlacin lineal es un nmero real comprendido entre -1 y 1.
-1 r 1
Si el coeficiente de correlacin lineal toma valores cercanos a -1 la correlacin es fuerte e
inversa, y ser tanto ms fuerte cuanto ms se aproxime r a -1.
Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte y
directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.
Si el coeficiente de correlacin lineal toma valores cercanos a 0, la correlacin es dbil.
Si r = 1 o -1, los puntos de la nube estn sobre la recta creciente o decreciente. Entre
ambas variables hay dependencia funcional.
El coeficiente de correlacin lineal es un nmero real comprendido entre -1 y 1.
Observacin:
El coeficiente de correlacin de clculo "r" es un estimador muestral del coeficiente poblacional
Rho
Cuando el valor de p r sale ms cerca de "1", mayor ser la correlacin lineal positiva o
sea la relacin entre las variables X e Y es directa, es decir si X aumenta, Y tambin
aumenta; y si X disminuye, Y tambin disminuye.
Cuando el valor de p r, sale ms cera a "-1", mayor ser la correlacin lineal negativa o sea
la relacin entre las variables X e Y es inversa, es decir si X aumenta, Y disminuye; y si X
disminuye, Y aumenta.
Si Cov(Y, X) = 0 ; entonces p r = 0 , luego la correlacin es nula entre las dos variables,
N de horas/semana (horas)
(X)
84
76
72
49
71
63
64
84
47
67
Solucin:
a) Diagrama de dispersin.
b) Averiguar si existe relacin entre dos variables, se calcula el coeficiente de correlacin
lnterpretacin:
ACTIVIDADES RECOMENDADAS
Una vez finalizado el estudio de la tercera unidad, es importante que repase los conceptos y
practique adecuadamente los ejercicios de la Gua Acadmica del Participante
CUARTA UNIDAD
NMEROS NDICE
Estimado participante:
En esta cuarta unidad estudiaremos los nmeros ndices
OBJETIVOS ESPECFICOS
1. Elaborar modelos para predecir una variable de serie de tiempo y mostrar mtodos para
calcular los nmeros ndice.
2. Manejar conceptos bsicos de nmero ndice y sus relaciones.
3. Aplicar los mtodos para calcular nmeros ndices
CONTENIDO TEMTICO
1. Definicin de nmero ndice.
2. ndice de precios agregado.
3. Mtodos de promedio de relativos
Concepto y Tipologa
Un nmero ndice es una medida estadstica que expresa la variacin relativa experimentada, en
el tiempo o en el espacio, por una magnitud en dos situaciones diferentes, una tomada como
referencia denominada situacin base, la otra recibe el nombre de situacin actual.
Es una medida estadstica diseada para poner en relieve cambios en una variable o en un grupo
de variables relacionadas con respecto al tiempo, situacin geogrfica, ingresos o cualquier otra
caracterstica.
Series de ndices: Es una coleccin de nmeros ndices para diferentes aos, lugares, etc.
"Un nmero ndice es un valor relativo expresado como porcentaje o cociente, que mide un
periodo dado contra un periodo base determinado." Leonard Kasmier
"Un nmero ndice es una medida estadstica diseada para poner de relieve cambios en un
variable o en un grupo de variables relacionadas con respecto al tiempo, situacin geogrfica,
ingresos, o cualquier otra caracterstica." Spiegel Murray
Segn Richard Levin "un numero ndice mide cuanto cambia una variable con el tiempo."
Segn Enrique Cansado "no puede entenderse que los nmeros ndices, puedan "medir", ya que
la medicin arroja datos precisos, y un nmero ndice solo indica la manera de evolucionar de una
serie cronolgica pluridimensional. No mide, describe simplemente. Es un indicadoren realidad
se trata solamente de un estadgrafo que no son medidas sino caractersticas (numricas)
descriptivas de la distribucin que se estudia."
"Los nmeros ndices son indicadores de varios aspectos de la industria y el comerciotales
nmeros variaran con la fecha y tambin con el rea del pas a la que se refieran. Los nmeros
ndices normalmente comienzan con una base de 100 en un tiempo en particular para el pas."
Taro Yamane
Segn Rosembaum y Highland "un nmero ndice es una forma especial de razn utilizada para
mostrar cambios durante el periodo. Se compara una cantidad (venta, precio, produccin, etc.)
con el valor correspondiente en algn periodo anterior al que se le conoce como la base."
1.2.
1.3.
Relacin de precios
Periodo base es aquel que se toma como referencia, para todos los estudios, y es el que
se compara con el periodo dado
Ejemplo
Suponga que el precio al consumo de un litro de leche en los aos 1990 y 1998 era de
S/0,85 y S/. 1,50 respectivamente. Tomando como ao base 1990 y luego 1998, hallar la
relacin de precios.
Solucin:
x 100
Donde:
= cantidad de cada elemento en el grupo durante el ao dado
x 100
Donde:
= precio de cada elemento del grupo en el ao actual
= precio de cada elemento del grupo en el ao base
Q= factor seleccionado de ponderacin de cantidad
Existen 3 mtodos de ponderar un ndice
ndice de Laspeyres=
X 100
Donde:
= precios en el ao actual
= cantidades vendidas en el ao base
= precio en el ao base
Ejemplo calcular el ndice agregado de precios de Laspeyres para el ao 2000 de las tres
mercancas tabla 1, usando como base el ao 1995.
Mercanca
I=
Leche
19.35 ($)
14.85($)
Pan
4.56
4.18
Huevos
1.20
0.80
total
25.11($)
19.83
x 100= 126.7
El utilizar la misma cantidad del periodo base nos permite realizar una comparacin directa.
ndice de Paasche=
x 100
Donde:
= precios en el periodo actual
=cantidades en el periodo actual
=precios en el periodo base
Ejemplo calcule el ndice agregado de precios paasche par el ao 2000 de las tres mercancas de
la tabla 1, usando como base el ao 1995.
Mercanca
I=
Leche
23.22 ($)
17.82($)
Pan
4.44
4.07
Huevos
1.44
0.96
total
29.10($)
22.85($)
x 100= 127.4
x 100
Donde:
= precios del periodo actual
= precios del periodo base
=pesos fijos
Ventajas del Mtodo de agregados de peso fijo
La flexibilidad en la seleccin del precio base y del peso (cantidad) fijo." Richard Levin
= 1.270
"Supongamos que se dispone de las series de precios, durante cierto nmero de ao, y se
disponga de este para clculos posteriores, debemos considerar la naturaleza y las variaciones de
dichos precios, ya que primero se deben homogenizar los datos que son heterogneos, (precios
por kilos, por galn, por litros, etc.), por esto en vez de precios absolutos, es natural el empleo de
los precios relativos obtenidos al comparar, por cociente, los precios de cada ao con los
correspondientes a otro que servir de base. La idea del ao base, o en general periodo base,
parte de la necesidad de un punto de comparacin temporal." Enrique Cansado
3.2.
"Como alternativa antes los mtodos de agregados, es posible aplicar el promedio de un mtodo
de relativos para construir un ndice.
Para calcularlo, con ms de un producto, primero se obtiene la razn del precio actual con el
precio base de cada producto y se multiplica cada razn por 100. Entonces se suman los relativos
porcentuales resultantes y se divide el total entre el numero de productos, as:" Richard Levin
"El ndice es un promedio de precios relativos, por citar un ejemplo, pero aqu surge aun una
dificultad adicional: los artculos de este grupo no tienen todos igual importancia desde el punto de
vista de un productor, o de un consumidor, o del gobierno, o de una ama de casa. Pues bien,
antes de calcular el promedio de dichos precios relativos, debemos establecer cuales la
importancia o "ponderacin" relativa que tiene cada articulo en relacin con algo, tal como un
programa de exportacin, un presupuesto familiar, una balanza de pago, etc. debe considerarse
que si se trata de artculos de consumo familiar, por ejemplo, la ponderacin no puede ser igual
para todas las familias, por que cada articulo tiene importancia relativa diferente segn su nivel
econmico de la familia."
3.4.
"Es una alternativa a la ponderacin agregada de precios, donde el ndice simple de precios de
cada mercanca en lo individual se pondera con una cifra de valor pq. Los valores usados pueden
corresponder al ao base,
o al ao dado,
. Habitualmente, los valores del ao
base se emplean como ponderaciones, lo que resulta en la siguiente formula:" Leonard Kasmier
Relativos de precios
Leche
130.30
14.85($)
1934.96
Pan
109.09
4.18
456.00
Huevos
150.00
0.80
120.00
19.83($)
2510.96
total
I=
3.5.
=126.6
Relativos eslabonados
"Son ndices cuya base es siempre periodo anterior. En consecuencia, respecto de un conjunto de
relativos eslabonados de valores anuales de ventas, cada numero ndice representa una
comparacin porcentual con el ao anterior. Estos relativos son tiles para destacar
comparaciones entre un ao y otro, pero resultan inconvenientes como base de comparaciones a
largo plazo" Leonard Kasmier
3.6.
"La base de una serie establecida de nmeros ndices suele cambiarse a un ao mas reciente
para que las comparaciones actuales sean mas significativas. Partiendo del supuesto de que no
se dispone de las cantidades originales en las que se apoya la serie de nmeros ndices, el
periodo base de un numero ndice puede cambiarse dividiendo cada ndice (original) entre el
ndice del ao base recin determinado y multiplicando el resultado por 100:" Leonard Kasmier
x100
3.7.
"Es frecuente que un numero ndice sufra cambios a causa de la adiccin de ciertos productos
nuevos o de la exclusin de ciertos productos antiguos, as como de cambios en el ao base. Sin
embargo, para efectos de continuidad histrica es deseable contar con una serie uniforme de
nmeros ndices. Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una
serie continua de nmeros ndices, debe haber un ao de empalme de las dos series en relacin
con el cual se hayan calculado ambos nmeros ndices. Generalmente el ao de empalme es
tambin la nueva base, por que es el ao en que se ha aadido y/o eliminado productos del ndice
agregado. Los nmeros ndices que deben modificarse en el proceso de fusin son los ndices de
la antigua serie. Este cambio se realiza dividiendo el nuevo numero ndice del ao de empalme,
entre el antiguo ndice de ese ao y multiplicando despus por este cociente cada uno de los
nmeros ndices de la antigua serie de los nmeros ndices." Leonard Kasmier
ACTIVIDADES RECOMENDADAS
Una vez finalizado el estudio de la cuarta unidad, es importante que repase los conceptos y
practique adecuadamente los ejercicios de la Gua Acadmica del Participante
BIBLIOGRAFIA
4. Lind, Douglas A./ Mason Robert D. / Marchal, William G. (2001). Estadstica para
administracin y Economa. Mxico DF: McGraw Hill, 2001.