Escolar Documentos
Profissional Documentos
Cultura Documentos
Con base al año 2013 que podemos afirmar sobre el crecimiento o decrecimiento de la
creación de empresas durante los últimos cuatro años.
En el cuadro siguiente se muestras los resultados de los cálculos de los números índice
Empresas
Ítem Año creadas NI
1 2013 3.500
2 2014 2.800 2800/3500 0,8000
3 2015 4.100 4100/3500 1,1714
4 2016 3.650 3650/3500 1,0429
5 2017 4.850 4850/3500 1,3857
Serie
Simples
Cadena
Numero
indice Sin
ponderar
Complejos
ponderados
Número índice simple: Son los índices que proporcionan la variación que ha sufrido una
magnitud o concepto entre dos periodos o lugares distintos.
Numero índice simple en serie: Los numero índice simple en serie es aquel que se calcula
tomando como referencia una base fija.
Número índice simple en cadena: Los numero índice simple en cadena es aquel que se
calcula tomando como referencia el dato inmediatamente anterior.
Ejemplo:
En la tabla siguiente se muestra el número de estudiantes activos del programa de
Administración de Empresas durante el periodo 2010 – 2017 en Colombia. Tomado los
datos de la tabla siguiente calcule los números índice simple en serie y el número índice en
cadena
No estudiantes
NI simple en serie
Ítem Año matriculados
1 2010 309.336
2 2011 345.556 345556/309336 1,11709
3 2012 425.033 425033/309336 1,37402
4 2013 435.150 435150/309336 1,40672
5 2014 389.180 389180/309336 1,25811
6 2015 356.189 356189/309336 1,15146
7 2016 325.130 325130/309336 1,05106
8 2017 300.582 300582/309336 0,97170
Año base 2010
Interpretación.
Los datos nos indican que con relación al año base 2010, en el 2011 hubo un crecimiento
del 11.71%, con respeto al 2012 del 37.40%, con relación al 2013 40.67% y así
sucesivamente.
Numero índice simple en cadena
No estudiantes
NI simple en cadena
Ítem Año matriculados
1 2010 309.336
2 2011 345.556 345556/309336 1,11709
3 2012 425.033 425033/345556 1,23000
4 2013 435.150 435150/425033 1,02380
5 2014 389.180 389180/435150 0,89436
6 2015 356.189 356189/389180 0,91523
7 2016 325.130 325130/356189 0,91280
8 2017 300.582 300582/325130 0,92450
Interpretación.
En la interpretación el numero índice en cadena nos da la relación de un año con respeto al
otro, por decir algo si observamos el ítem 8 quiere decir que los matriculados en el 2017
han decrecido en un 7.55% con relación al año 2016. El ítem 5 significa que los
matriculados en administración en el año 2014, han descendido en un 10.57 con relación al
año 2013.
Fuente:
http://www.educaguia.com/apuntesde/matematicas/ESTADISTICAYPROBABILIDAD/SERIESESTADISTICAS.pdf
Fuente:
http://www.educaguia.com/apuntesde/matematicas/ESTADISTICAYPROBABILIDAD/SERIESESTADISTICAS.pdf
Usos:
Pronósticos temporales
Economía, presupuestos
Proyecciones de empleo y desempleo
Evolución del índice de precios al consumidor IPP
Índices de precio del petróleo
Número de habitantes por año
Tasa de mortalidad infantil por año, entre otros.
Bernoulli
Para variables
Geometrica
discretas
Tipos de Poisson
distribucción
Normal
Para variables
continuas
Exponencial
Definición de términos
Variables discretas: Las variables discretas son variables numéricas que tienen un
número contable de valores entre dos valores cualesquiera. Una variable discreta
siempre es numérica. Por ejemplo, el número de quejas de los clientes o el número de
fallas o defectos.
Variables continuas: Las variables continuas son variables numéricas que tienen un
número infinito de valores entre dos valores cualesquiera. Una variable continua puede
ser numérica o de fecha/hora. Por ejemplo, la longitud de una pieza o la fecha y hora
en que se recibe un pago.
P (X = x) = p.qx-1
Ejemplo
En un laboratorio de medición han determinado que la probabilidad de que un micrómetro
muestre una desviación excesiva es de 0.05, ¿cuál es la probabilidad de que; ¿a) el sexto de
los micrómetros del laboratorio sometidos a prueba sea el primero en mostrar una desviación
excesiva?, ¿b) el quinto de los micrómetros del laboratorio sometidos a prueba, sea el primero
que no muestre una desviación excesiva?
a. Datos
x=6
p = 0.05
q = 0.95
P ( x=6) = 0.05 * 0.95(6-1) = 0.03869
b. Datos
x=5
p = 0.95
q = 0.05
P (x=6) = 0.95 * 0.05(5-1) = 0.0000059
Donde:
x = la variabl aleatoria a la que se le quiere calcular la probabilidad
λ = promedio o media de los datos observados
e = número de Euler que es una constante matemática cuyo valor es aproximadamente igual
a 2.71828
Ejemplo
Si un banco recibe en promedio 6 cheques sin fondo por día, ¿cuáles son las probabilidades
de que reciba, a) cuatro cheques sin fondo en un día dado, b) 10 cheques sin fondos en
cualquiera de dos días consecutivos?
a. Datos
λ = 6 cheques/dia
x=4
Solución
P(x=4) = e-6 * 64 / 4! = 0.13392
Interpretación
La probabilidad de que 4 cheques sin fondos lleguen en un día dado es de 0.13392 o
del 13.392%
b. Datos
λ = 12 cheques/ dos días consecutivos (6 * 2)
x = 10
Solución
P(x=4) = e-10 * 1210 / 10! = 0.104953
Interpretación
La probabilidad de que 10 cheques sin fondos lleguen en dos días consecutivos es de
0.104953 o del 10.49%
Una vez calculada el valor de Z, vamos a las tablas de la curva normal y buscamos el valor
de z y en el intervalo de la tabla da el valor del área bajo la curva que es básicamente la
probabilidad de que el suceso acontezca
Ejemplo
Se ha encontrado que el consumo promedio de agua en un municipio de Colombia es de 20
galones, con una desviación estándar de 5 galones. ¿Cuál es la probabilidad de que una
persona del municipio consuma entre 15 y 25 galones de agua?
Donde
µ = 20 galones
σ = 5 galones
x1 = Consumo de agua de 15 galones
x2 = Consumo de agua de 25 galones
A1
A2
X1 µ X2
Mientras que la distribución de Poisson describe las llegadas por unidad de tiempo, la
distribución exponencial estudia el tiempo entre cada una de estas llegadas. Si las llegadas
son de Poisson el tiempo entre estas llegadas es exponencial. Mientras que la distribución
de Poisson es discreta la distribución exponencial es continua porque el tiempo entre
llegadas no tiene que ser un número entero. Esta distribución se utiliza mucho para
describir el tiempo entre eventos. Más específicamente la variable aleatoria que representa
al tiempo necesario para servir a la llegada. ( (Gonzalez, 2018)
Ejemplos típicos de esta situación son el tiempo que un médico dedica a una exploración, el
tiempo de servir una medicina en una farmacia, o el tiempo de atender a una urgencia. (
(Gonzalez, 2018)
Donde:
Interpretación
La probabilidad de que el tiempo de falla sea mayo a 400 días es de 0.329 o del 32.9%
Cuando se va a realizar la prueba de hipótesis de deben plantear dos hipótesis, las cuales
son totalmente opuestas. Estas hipótesis de denominan hipótesis nula e hipótesis
alternativa. La hipótesis nula es el hecho que se quiere probar, generalmente cuando la
vamos a enunciar se inicie escribiendo “No hay diferencia”, “es igual a” o “no hay efecto.
La hipótesis alternativa es lo opuesto a la hipótesis nula y generalmente es el cambio que
espera el investigador que suceda
Un error común de percepción es que las pruebas estadísticas de hipótesis están diseñadas
para seleccionar la más probable de dos hipótesis. Sin embargo, al diseñar una prueba de
hipótesis, establecemos la hipótesis nula como lo que queremos desaprobar. Puesto que
establecemos el nivel de significancia para que sea pequeño antes del análisis (por lo
general, un valor de 0.05 funciona adecuadamente), cuando rechazamos la hipótesis nula,
tenemos prueba estadística de que la alternativa es verdadera. En cambio, si no podemos
rechazar la hipótesis nula, no tenemos prueba estadística de que la hipótesis nula sea
verdadera. Esto se debe a que no establecimos la probabilidad de aceptar equivocadamente
la hipótesis nula para que fuera pequeña. ( (minitab18, 2017)
Segundo se dibuja la curva norma, explicitando las áreas de aceptación de cada una de las
hipótesis. Como el planteamiento del problema dice que la hipótesis alternativa es diferente
(≠) se emplea una curva normal de dos colas.
Tercero calculamos las áreas de aceptación y rechazo de la hipótesis nula.
Nivel de significancia 0.05, luego el nivel de confianza será = 1 -0.05 = 0.95
x1 x2
Como cuarto paso buscamos en las tablas de la normal, el valor de Z para un área de 0.475
Siendo este valor de 1.96
Como quinto paso calculamos los límites del intervalo de confianza, aplicando la fórmula
de:
Z = (x - µ) / σx
Despejamos x de la ecuación anterior y encontramos que:
Límite inferior x1 = µ - Z* σx
Límite superior x2 = µ + Z* σx
x1 = 80.000 – 1.96* 400 = 79.216 psi
x2 = 80.000 + 1.96 * 400 = 80.784 psi
Como sexto paso se ubican estos valores en la curva normal, como también el valor de la
media de la muestra x (79.600 psi)
Interpretación
Al colocar el valor estandarizado en la escala z se observa que esta media muestral cae de
lleno en la región de aceptación, Por tanto, el hospital debe aceptar la hipótesis nula, porque
la media observada de la muestra no es significativamente menor que la media hipotética de
100 cc. Con base en esta muestra de 50 dosis, el hospital debe concluir que las dosis de la
entrega son suficientes.
Prueba de hipótesis para proporciones (muestras grandes)
La empresa Socolcar en su proceso de mejora continua, desea evaluar a sus empleados
mediante una serie de pruebas que midan la capacidad, capacitación y experiencia de
supervisión para considerar cuales de sus empleados están listos parar pasar al siguiente
nivel administrativo y se merezcan un ascenso. Para el director de Desarrollo Humano el
80% de los empleados están cualificados para el ascenso. El gerente general de la compañía
no está muy convencido de este dato y solicita realzar entrevista a fondo a los 150
empleados de la empresa, una vez realizadas estas entrevistas se encuentra que solo el 70%
de los empleados califica para el ascenso.
El gerente general desea probar a un nivel de significancia de 0.05 la hipótesis de que 0.8
de los empleados son aptos para el ascenso:
Datos:
pH0 = 0.8 ← Valor hipotético de la proporción de éxitos de la población (considerados
aptos para el ascenso, en este caso)
qH0 = 0.2 ← Valor hipotético de la proporción de fracasos de la población
(considerados no aptos para el ascenso)
n = 150 ← Tamaño de muestra
p = 0.7 ← Proporción apta para el ascenso de la muestra
q = 0.3 ← Proporción no apta para el ascenso de la muestra
Planteamiento
H0: p = 0.8 ← Hipótesis nula: 80% de los empleados es apto
H1: p ≠ 0.8 ← Hipótesis alternativa: la proporción de empleados aptos no es el 80%
α = 0.05 ← Nivel de significancia
Se calcula el error estándar de la proporción media
Se dibuja la curva norma, explicitando las áreas de aceptación de cada una de las hipótesis.
Como el planteamiento del problema dice que la hipótesis alternativa es diferente (≠) se
emplea una curva normal de dos colas.
Interpretación:
Como observamos en la gráfica el valor de t estandarizado cae fuera de la región de
aceptación por lo tanto la rectoría debe rechazar la hipótesis nula y aceptar la hipótesis
alternativa que la evaluación tiene un resultado diferente a los 90 puntos
Pruebas de una cola para medias usando la distribución t
El procedimiento para una prueba de hipótesis de una cola utilizando la distribución t es el
mismo, conceptualmente, que para una prueba de una cola usando la distribución normal y
la tabla z. ( (Lewin, 2012).
Cuando estamos haciendo pruebas de una cola en la distribución t y como en la tabla de
valores de la distribución t lo que representa son valores para dos áreas combinadas, es
necesario multiplicar por dos el nivel de significancia y buscar ese valor en la tabla.
Ejemplo para encontrar el valor t apropiado para una prueba de una cola a un nivel de
significancia de 0.05, con 12 grados de libertad, buscaríamos en la tabla de la distribución t
en la columna con 0.10 el renglón de 12 grados de libertad.
Tema: Análisis de varianza
El análisis de la varianza (ANOVA) es una colección de modelos estadísticos y sus
procedimientos asociados, en el cual la varianza está particionada en ciertos componentes
debidos a diferentes variables explicativas. El análisis de la varianza parte de los
conceptos de regresión. ( (Diaz, 2012)
Es una de las técnicas estadísticas más utilizadas para comparar grupos de medidas y
normalmente se emplea para establecer semejanzas y diferencias entre tres o más grupos
distintos. A través de ANOVA se establece un análisis para evaluar comparativamente unos
resultados en distintas clasificaciones o grupos. De esta manera, es posible calcular si los
valores medios son iguales en los distintos grupos estudiados.( (Navarro, 2016)
(Salinas, 2016).Los miembros de un equipo ciclista se dividen al azar en tres grupos que
entrenan con métodos diferentes. El primer grupo realiza largos recorridos a ritmo pausado,
el segundo grupo realiza series cortas de alta intensidad y el tercero trabaja en el gimnasio
con pesas y se ejercita en el pedaleo de alta frecuencia. Después de un mes de
entrenamiento se realiza un test de rendimiento consistente en un recorrido cronometrado
de 9 Km. Los tiempos empleados fueron los siguientes:
A un nivel de confianza del 95% ¿Puede considerarse que los tres métodos producen
resultados equivalentes? O por el contrario ¿Hay algún método superior a los demás?
Comenzamos calculando los totales y los cuadrados de los totales divididos por el número
de observaciones:
Año Ventas
Año 2007 120.000.000
Año 2008 160.000.000
Año 2009 165.000.000
Año 2010 175.000.000
Año 2011 182.000.000
Año 2012 193.000.000
Año 2013 198.000.000
Año 2014 207.000.000
Año 2015 213.000.000
Año 2016 220.000.000
Año 2017 230.000.000
Entonces hacemos la gráfica de dispersión
Ventas
250.000.000
200.000.000
150.000.000
100.000.000
50.000.000
0
0 2 4 6 8 10 12
Las gráficas (a) y (b) muestran relaciones lineales directas e inversas. Las gráficas (c) y (d)
son ejemplos de relaciones curvilíneas que indican asociaciones directas e inversas entre
variables, respectivamente. La gráfica (e) ilustra una relación lineal inversa con un patrón
de puntos ampliamente disperso.( (Lewin, 2012)
Calculo de la línea de regresión
Para calcular la línea de regresión empleamos la ecuación de la recta
No de estudiantes
Año Semestre
matriculados
I 2.000
Año 2010
II 1.980
I 2.050
Año 2011 II 2.000
I 2.120
Año 2012
II 2.080
I 2.200
Año 2014
II 2.100
I 2.280
Año 2015
II 2.120
I 2.350
Año 2017
II 2.190
Primero graficamos los datos
No de estudiantes matriculados
2.400
2.300
2.200
2.100
2.000
1.900
0 2 4 6 8 10 12 14
Luego hacemos click derecho en el punto final de los datos y le decimos agregar línea de
tendencia
No de estudiantes matriculados
2.400
2.350 y = 25,769x + 1955
2.300
2.250
2.200
2.150
2.100
2.050
2.000
1.950
0 2 4 6 8 10 12 14
No Unidades
Año Producidas
Año 2007 150.000
Año 2008 185.000
Año 2009 192.000
Año 2010 195.000
Año 2011 210.000
Año 2012 212.000
Año 2013 215.000
Año 2014 225.000
Año 2015 228.000
Año 2016 235.000
Año 2017 242.000
No Unidades Producidas
300.000
y = 7572,7x + 162655
250.000 R² = 0,9062
200.000
150.000
100.000
50.000
0
Año Año Año Año Año Año Año Año Año Año Año
2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017
Por lo tanto
La ecuación de regresión es:
Y = 7572.7 + 162.655
Y el coeficiente de determinación
R2 = 0.9062
Esto significa que las unidades producidas tienen una alta relación con el tiempo
Tendencia
secular
Variación Fluctuación
irregular ciclica
Variación
estacional
Tendencia secular
En datos tienen tendencia secular cuando la variable que se esa analizando aumenta o
disminuye a través del tiempo, (Ver grafico siguiente)
Demanda
295.000
290.000
285.000
280.000
275.000
270.000
265.000
260.000
255.000
250.000
245.000
0 2 4 6 8 10 12
Fluctuación cíclica
Las fluctuaciones cíclicas son movimientos en forma de onda alrededor de una
tendencia, El ejemplo más común de esta serie de tiempos es el ciclo económico,
generalmente la variación en el movimiento ondulatoria es de más de un año,
pudiendo a llegar a 15 y hasta 20 años.
Demanda
262.000
260.000
258.000
256.000
254.000
252.000
250.000
248.000
0 2 4 6 8 10 12 14 16
Variación estacional
Esta serie de tiempo son cambios que se presentan en periodos inferiores a un año que
tienden a repetirse anualmente. Por ejemplo, es de esperarse incremento en los casos de
resfríos cuando estamos en temporada de invierno.
Ventas
40.000
35.000
30.000
25.000
20.000
15.000
10.000
5.000
0
jul-15 ene-16 ago-16 mar-17 sep-17 abr-18 oct-18
Variación irregular
La variación irregular se presenta cuando generalmente las variaciones de las observaciones
son aleatorias, no siguen ningún patrón, el valor de la variable es impredecible
Demanda
800.000
700.000
600.000
500.000
400.000
300.000
200.000
100.000
0
0 2 4 6 8 10 12 14 16
Series de tiempo
REFERENCIAS