Resumen Practico Teórico Proyecto de Ingeniería

Resumen Practico - Teórico
Proyecto de Ingeniería
Autor:
Willams A. Canales Verdugo
Santiago, 2019
Índice general
1. Estadística Descriptiva 4
1.1. Conceptos Estadísticos . . . . . . . . . . . . . . . . . . . . 4
1.2. Tablas de Frecuencia . . . . . . . . . . . . . . . . . . . . . 5
1.3. Parámetros Estadísticos . . . . . . . . . . . . . . . . . . . 8
1.4. Grácos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.5. Ejercicios Aplicados - Tipo Pruebas . . . . . . . . . . . . . 16
2. PROBABILIDADES: MODELOS DISCRETOS Y CON-

TINUOS 21
2.1. Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2. Variable aleatoria . . . . . . . . . . . . . . . . . . . . . . . 23
2.3. Función de Probabilidad ó distribución de probabilidad . . 23
2.4. Función de distribución acumulada . . . . . . . . . . . . . 25
2.5. Esperanza (Media) - Varianza . . . . . . . . . . . . . . . . 25
2.6. Distribución Bernoulli . . . . . . . . . . . . . . . . . . . . 26
2.7. Distribución Binomial . . . . . . . . . . . . . . . . . . . . 26
2.8. Distribución de Poisson . . . . . . . . . . . . . . . . . . . . 27
2.9. Distribución Normal . . . . . . . . . . . . . . . . . . . . . 29
2.10. Distribuciones con Excel . . . . . . . . . . . . . . . . . . . 32
1
ÍNDICE GENERAL
2.10.1. Binomial mediante Excel . . . . . . . . . . . . . . . 32
2.10.2. Possion mediante Excel . . . . . . . . . . . . . . . . 34
2.10.3. Normal mediante Excel . . . . . . . . . . . . . . . . 34
2.11. Ejercicio . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3. Concepto de Inferencia Estadística 37

3.1. Estimador y estimación de parámetros . . . . . . . . . . . 37
3.2. Estimación por Intervalos de Conanza . . . . . . . . . . . 37
3.3. Determinación del Tamaño Muestral . . . . . . . . . . . . 40
3.4. Prueba de Hipótesis . . . . . . . . . . . . . . . . . . . . . . 43
3.5. Intervalo de Conanza - Prueba Hipótesis con Excel . . . . 48
3.5.1. Intervalo de Conanza con Excel . . . . . . . . . . 48
3.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.7. Dócima de Hipótesis para la Diferencia de dos Medias en
Poblaciones Normales (Comparación de dos Poblaciones
Normales) . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4. Regresión Lineal 57
4.1. Análisis de Correlación . . . . . . . . . . . . . . . . . . . . 58
4.2. Coeciente de Correlación Lineal . . . . . . . . . . . . . . 58
4.3. Regresión Lineal Simple . . . . . . . . . . . . . . . . . . . 59
4.4. Coeciente de determinación y Bondad de ajuste . . . . . 62
4.5. Pruebas de hipótesis para el modelo de regresión lineal simple 65
4.6. Dócima para βi . . . . . . . . . . . . . . . . . . . . . . . . 65
4.7. Análisis de varianza ANOVA . . . . . . . . . . . . . . . . . 66
4.8. Intervalos de conanza para los parámetros . . . . . . . . 67
4.9. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
Resumen Practico - Teórico 2 William Canales Verdugo

ÍNDICE GENERAL
5. Regresión Lineal Múltiple 75

5.1. Test F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
6. ¾ Tesis o Informe ? 91
6.1. Informe . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
6.1.1. Tipos de informe . . . . . . . . . . . . . . . . . . . 91
6.1.2. Partes principales de un Informe . . . . . . . . . . . 92
6.2. Tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
6.2.1. Partes de una tesis . . . . . . . . . . . . . . . . . . 94

Capítulo 1
Estadística Descriptiva
1.1. Conceptos Estadísticos

1. Población.
2. Muestra
3. Parámetro.
4. Estadígrafo o Estadístico.
5. Variable.
4
1. Estadística Descriptiva
1.2. Tablas de Frecuencia

a) Variables Cuantitativas.
b) Variables Cualitativos.
Tabla 1.1: Tabla de Frecuencia para Datos Cuantitativos Agrupados en
Intervalos de Clase
Intervalo Marcas Frecuencia frec. Frec. Frec. Rela.

de Clase de Clases Absoluta Acumulada Relativa Acumulada
[Linf − LSup [ mi ni Ni fi Fi fi % Fi %
[L1 − L2 [ m1 n1 N 1 = n1 f1 = nn1 F1 f1 % F1 %
[L2 − L3 [ m2 n2 N2 = n1 + n2 f2 = nn2 F1 + F2 f2 % F2 %
... ... ... ... ... ... ... ...
n
[Lj−1 − Lj [ mj nj Nj = (n1 + . . . + nj ) fj = nj F1 + . . . + Fj fj % Fj %
... ... ... ... ... ... ... ...
[Lk−1 − Lk ] mk nk n = (n1 + . . . + nk ) fk = nnk F1 + . . . + Fk fk % Fk %
Total n 1
Para realizar la tabla efectuamos los siguientes pasos:
1) Se ordena de Menor a Mayor.
2) Se busca el valor mínimo y el máximo: Xmin y Xmax
3) Se calcula el rango: es decir, Xmax − Xmin .
4) La cantidad de intervalos se calcula de la siguiente formula:
k = 1 + 3, 322 ∗ log(n)
5) Se calcula la amplitud de cada intervalo con la siguiente ecuación:
rango
c=
k
6) Se construye la tabla:

Por ejemplo si estudiamos las alturas de 15 personas, las cuales son:
150, 165, 165, 166, 171, 171, 175, 176, 180, 180, 180, 180, 181, 181, 190
Intervalos de Clase
Intervalo Marcas Frecuencia frec. Frec. Frec. Rela.

de Clase de Clases Absoluta Acumulada Relativa Acumulada
[LInf − LSup [ mi ni Ni fi Fi fi % Fi %
[150 - 160[ 155 n1 = 1 N1 = 1 n1 = 1/15

n F1 = 0,06 6,66̄ % 6,66̄ %
[160 - 170[ 165 n2 = 3 N2 = 4 n2 = 3/15
n F2 = 0,26 20 % 26.66 %
[170 - 180[ 175 n3 = 4 N3 = 8 n3 = 4/15

n F3 = 0,53 ¯ %
26, 66 53.3 %
[180 - 190] 185 n4 = 7 N4 = 15 n4 = 7/15

n F4 = 1 46, 6̄ % 100 %
Total 15 1
Interpretación ???

Tonemos la Tabla 1.2 de datos del apunte Resumen_clase_Proyecto_Ingeniería:
Tabla 1.3: Tabla de Frecuencia para Datos Cualitativos
Categoría o Clase i Concepto o Atributo ni fi fi % Fi Fi %

1 c1 n1 f1 f1 % f1 % F1 %
2 c2 n2 f2 f2 % f2 % F2 %
. . . . . . .
. . . . . . .
. . . . . . .
j cj nj fj fj % fj % Fj %
. . . . . . .
. . . . . . .
. . . . . . .
k ck nk fk fk % fk % Fk %
total n 1 100 %
Categoría o Clase i Concepto o Atributo ni fi fi % Fi Fi %

1 Básica Incompleta 4 0,1 10 % 10 % 10 %
2 Básica Completa 4 0,1 10 % 10 % 20 %
3 Media Incompleta 10 0,25 25 % 25 % 45 %
4 Media Completa 10 0,25 25 % 25 % 70 %
5 Universitaria Incompleta 1 0,025 2,5 % 2,5 % 72,5 %
6 Técnico Universitario 8 0,2 20 % 20 % 92,5 %
7 Universitaria Completa 3 0,075 7,5 % 7,5 % 100 %
total n = 40 1 100 %
Interpretación ???

1.3. Parámetros Estadísticos
1. Parámetro Centralización
a ) Moda :
Es el valor con mayor frecuencia.
Datos tabulados: Para buscar la moda se utiliza la siguiente
formula.
n(i) − n(i−1)

M o = LInf + C ∗ (1.1)
(n(i) − n(i−1) ) + (n(i) − n(i+1) )

Intervalos de Clase
[LInf − LSup [ mi ni Ni fi Fi fp % Fp %
[150 - 160[ 155 1 1 1/15 0,06 6,66̄ % 6,66̄ %
[160 - 170[ 165 3 4 3/15 0,26 20 % 26.6 %
[170 - 180[ 175 4 8 4/15 0,53 26, 6̄ % 53.3 %
[180 - 190] 185 7 15 7/15 1 46, 6̄ % 100 %
Total 15 1

7−4
M o = 180 + 10 ∗
(7 − 4) + (7 − 0)

3
M o = 180 + 10 ∗
10
M o = 180 + 3 = 183
Por lo tanto 183 valor más repetido.
b ) Mediana
Acumula el 50 % de los datos observados
1) Datos Sueltos


 X n + 1 , n par
2



Me = (1.2)


 X n + X n +1 , n impar


2 2
2) Datos Tabulados
n −N !
2 (i−1)
M e = LInf + C ∗ (1.3)
n(i)

Ejemplo 1.3.1. Consideremos la siguiente tabla de fre-
cuencia.
Tabla 1.5: Tabla de Frecuencia
[LInf − LSup [ mi ni Ni
[150 - 160[ 155 1 1
[160 - 170[ 165 3 4
[170 - 180[ 175 4 8
[180 - 190] 185 7 15
Total 15
Como
n = 7, 5 ≈ 8, en la columna Ni , el tercer intervalo
2
que se encuentra el 8, El calculo de la media sería:
15 − 4 !
M e = 170 + 10 ∗ 2
4
M e = 170 + 10 ∗ (0, 875)
M e = 178, 75
Por lo tanto, la estatura media sería 178,75 cm
c) Media Aritmética (X)
1) Datos Sueltos:
n
P
xi
i=1
X= (1.4)
n
2) Datos Tabulados:
k
P
mi ∗ ni
i=1
X= (1.5)
n
Si k número de intervalos.
2. Parámetro Dispersión
a) Varianza
1) Datos Sueltos
0
a Varianza Poblacional
n n
(xi − x)2 x2i
P P
i=1 i=1
σ2 = = − x2 (1.6)
n n
0
b Varianza Muestral
n n
(xi − x)2 x2i − nx2
P P
i=1 i=1
S2 = = (1.7)
n−1 n−1
2) Datos Tabulados
0
a Varianza Poblacional
k
(mi − X)2 ∗ ni
P
i=1
σ2 = (1.8)
n
con k número de intervalos
0
b Varianza Muestral
k
(mi − X)2 ∗ ni
P " k #
i=1 1 X 2
S2 = = m2 ∗ ni − n ∗ X
n−1 n − 1 i=1 i
(1.9)
con k número de intervalos

b) Desviación estándar :
Se dene como la raíz de la Varianza.
√ √
S= S2 ∨ σ= σ2
De uso más frecuente que la Varianza, se obtiene a partir de
ésta:
Si los datos no están agrupados:
v
u n
uP
√ u (xi − x)2
S = S 2 = i=1
t
n−1
Si los datos están agrupados:
v
u k
u (mi − x)2 ∗ ni
uP
√ t i=1
S= S2 =
n−1
c) Coeciente de variación (C.V.)
S
C.V. = ∗ 100 (1.10)
X



 M enor 30 %, Homogéneo







 30 % < C.V. < 50 %, Tiende Homog.
C.V = (1.11)




M ayor 50 % Heterogéneo







3. Percentil

Pα : punto que concentra el α% inferior de la distribución de fre-
cuencias, con α = 1, 2, . . . , 99.
α∗n −N !
100 i−1
Pα = Linf + C (1.12)
ni
4. Quintil
Kα : punto que concentra el α% inferior de la distribución de fre-
cuencias, con α = 1, 2, . . ..
Particiona a una distribución en 5 partes iguales, agrupan 20 % c/u
(son 4)
α∗n −N !
5 i−1
Kα = Linf + C (1.13)
ni
5. Cuartil
Qα : punto que concentra el α% inferior de la distribución de fre-
cuencias, con α = 1, 2, . . .
Particiona a una distribución en 4 partes iguales mediante los puntos
Q1 , Q2 y Q3 , llamado primer cuartil, segundo cuartil y tercer cuartil.
α∗n −N !
4 i−1
Qα = Linf + C (1.14)
ni
Notemos que D1 = P10 ; P50 = D5 = Q2 = M e; P75 = Q3 , etc.
1.4. Grácos

Tipo de variable Diagrama
Variable Cualitativa Barras, Sectores, Pictogramas, Barras subliminales
Variable Discreta Barras, Histograma, Histograma %, Sectores
Variable Continua Histograma, Polígono de frecuencia
Tallo y hojas , Nubes
Importante:
Un gráco asociado a los cuartiles es el boxplot o gráco de caja.
Una regla para determinar si un dato es anómalo es:
1. Si un dato es < Q1 − 1, 5(Q3 − Q1 )
2. Si un dato es > Q3 + 1, 5(Q3 − Q1 )
Ejemplo:
El precio de un interruptor en 10 comercios de electricidad de una
ciudad son : 25, 25, 26, 24, 30, 25, 29, 28, 26, y 27 en miles de pesos.

Hallar la media, moda, mediana, (diagrama de barras y el diagrama de
caja.

1.5. Ejercicios Aplicados - Tipo Pruebas

1. Un analista realiza una investigación sobre la tendencia política para
las próximas elecciones presidenciales, para lo cual administra una
encuesta de opinión a 1.000 personas en edad de votar e inscritas
en el padrón electoral, sobre la preferencia del candidato. De esta
encuesta se obtuvo que el 45 % vota por el candidato y que solo el
5 % no, mientras que el resto no sabe.
a ) ¾ Cuál es la población de estudio?
b ) ¾ Cuál es la muestra?
c ) Identique el parámetro de interés.
d ) Identique el estadígrafo y su valor.
2. En los últimos 40 meses, una empresa ha dividido su tasa de riesgo
en tres grandes áreas, ver base datos_clases.xls, pestaña Indice_Riesgo
Donde:
A es el índice de riesgo en Administración y Finanzas.
B es le índice de riesgo en Recursos Humanos.
C es el índice de riesgo en Ciencia e Investigación.
Una empresa lo contrata, con el nalidad de saber:
a ) Cual o cuales seria(n) el(los) gráco(s) más adecuado, para
representar el indice de riesgo de las tres áreas durante los
40 meses baso estudio. (Interprete todos sus resultados y los
grácos).
b ) Utilizando las funciones estadísticas de Excel, calcular: media,
mediana, la moda, percentil 25, cuartil 3, varianza, desviación
estándar y coeciente de variación de Pearson, de las tres áreas.
Interprete los valores obtenidos.
c ) ¾ Cual de las tres áreas es menos riesgosa?.

d ) Calcule el coeciente de variación para el índice de riesgo en
Recursos Humanos ¾ Existirá alguna diferencia entre datos
agrupado y no agrupados?
3. Abel Grandes Pregunto a sus compañeros de clase que nota obtu-
vieron en el último examen de estadística. Solo recuerda que el que
aprobó con la nota mediana de 5,6666667 y a su compañero que
tuvo un 4,6 (una de las nota más frecuente). Y, haciendo memoria,
ha podido completar los siguientes datos:
Notas de Número de
Estadísticas Alumnos
0 - 4 8
4 - 5 n2
5 - 7 8
7 - 9 6
9 - 10 6
a ) ¾ Qué proporción de alumnos ha obtenido una nota superior a
7?
b ) ¾ Cómo es la distribución respecto a la moda?
c ) ¾ Las notas son homogéneas?
4. En la base de datos Base datos_clases.xls, pestaña Base_2 contiene
la información respecto de la Edad, Sexo, Estado Civil, Actividad
Actual, Comuna, Año del Vehículo, Región, Deuda, mes de naci-
miento, Numero de Hijos(as), de 100 personas
a ) ¾ La deuda es homogénea?.
b ) Construya un gráco comparativo y tablas que muestre el pro-
medio de deudas por sexo, (Indicación: realice la comparación
porcentual y numérica, utilice tablas dinámicas)
c ) Utilizando una tabla dinámica realice un gráco (optimo) de
los Quintiles de la deuda.

d ) Utilizando una tabla dinámica realice un gráco (optimo) de
los Quintiles de la deuda v/s Sexo.
e ) En promedio, cual es la deuda para las comunas de la región
Metropolitana. Ademas realice una comparación gratica
f ) Quienes tienen mayor y menor deuda, los solteros, casados, o
viudos, Comente sus resultados.
g ) En que comuna tienen mayor y menor deuda según sexo y
estado civil.
h ) ¾ Que edad tiene el 50 % de los datos?
i ) ¾ En promedio de la deuda supera al 50 % de la deuda?
5. La siguiente tabla muestra la distribución de los gastos en publici-
dad de 60 empresas manufactureras.
o
Gastos en publicidad N de empresas
en (MM$) (ni )
0 - 5 8
5 - 10 10
10 - 15 11
15 - 20 15
20 - 25 13
25 - 35 10
a ) Determine el gasto promedio en publicidad.
b ) Hallar e interpretar el P25 y Q3 .

c ) ¾ Los datos son homogéneos?
6. Se llevó a cabo un estudio a 67 empresas del rubro nanciero, res-
pecto al tiempo que llevan operando en el mercado de nanciero
en años, el siguiente cuadro muestra los resultados obtenidos en el
estudio.

Años en mercado nanciero Número de empresas
0 - 5 8
5 - 10 10
10 - 15 11
15 - 20 15
20 - 25 13
25 - 35 10
a ) Reconozca y clasique la (s) variable (s) en estudio según tipo
y escala.
b ) Si se realiza otro estudio a un nuevo grupo de 67 empresas, el
tiempo registrado que llevan las empresas de este nuevo estudio
es de 17,6 (años), ¾cuál es el tiempo promedio total?
c ) El 16 % superior de los años en el rubro del mercado se en-
cuentran catalogadas como empresas de clase A. ¾ Cuántas
empresas se puede clasicar de Clase A?
d ) El tiempo es homogéneo con respecto a la cantidad de empre-
sas.
7. Un profesor está interesado en estudiar los hábitos del sueño de los
estudiantes en sus clases. El profesor registra el tiempo (en minutos)
que demoran en quedarse dormidos sus alumnos desde que empieza
la clase. Los datos del Profesor son los siguientes
20,8 11,3 14,2 12 12,3 12,5 12,7 13,4
13,7 13,8 11,9 14,8 15,1 15,3 16,7 10,5
a ) Dibuje un diagrama de caja. Comente el resultado acerca de
la distribución.
b ) Usted cree que solo basta con el grácos de cajas para anali-
zar el comportamiento de la distribución, en caso negativo que
otro gráco podría explicar el comportamiento de la distri-
bución.(Indicación: Realice los cálculos y grácos pertinentes,
comente todos sus resultados ).

c ) ¾ Qué porcentaje de alumnos se queda dormido antes de los
12,3 minutos?
8. La siguiente gráca representa la tasa regional de sindicalización del
años 2014
a ) ¾ Cuál es la tasa regional promedio de sindicalización ?
b ) En promedio las tasas regionales de sindicalización en 2014, se
encuentra sobre el 50 % del total de los sindicalizados.

Capítulo 2
PROBABILIDADES:
MODELOS DISCRETOS Y
CONTINUOS
2.1. Probabilidad
Sea:
1. Espacio Muestral Ω: Conjunto formado por todos los resultados
posibles de un experimento aleatorio
2. A un evento cualquiera de un espacio muestral Ω
no Casos Faborables #A
IP (A) = o = (2.1)
n Casos Totales #Ω
Propiedades:
1. P(A) ≥ 0, ∀A
2. P(Ω) = 1
21
2. PROBABILIDADES: MODELOS DISCRETOS Y CONTINUOS
3. P(∅) = 0
4. P(Ac ) = 1 − P(A), ∀A
5. Si A1 ∩ A2 = ∅ =⇒ P(A1 ∪ A2 ) = P(A1 ) + P(A2 )
6. Si A ≤ B =⇒ P(A) ≤ P(B)
7. P(A ∪ B) = P(A) + P(B) − P(A ∩ B)

P(A ∩ B)
8. P(A/B) = , si P(B) > 0
P(B)
9. P(A ∩ B) = P(A) ∗ P(B). Sucesos independientes ( P(A/B) = P(A)
ó P(B/A) = P(B))
Ejemplo 2.1.1. Sea Extraer una carta de un juego de naipe español
de 40 cartas el espacio muestral y los eventos A =Obtener un oro,
B =Obtener un rey, C= Obtener un uno de espadas y D =Obtener

guras
i) Cuál es la probabilidad que sea oro o sea rey, pues A ∩ B =Obtener

rey de oros
10 4 1 13
P(A ∪ B) = P(A) + P(B) − P(A ∩ B) = + − =
40 40 40 40
ii) Cuál es la probabilidad que sea oro o sean guras, A ∪ D =obtener

gura de oros.
10 12 3 19
P(A ∪ D) = P(A) + P(D) − P(A ∩ D) = + − =
40 40 40 40
iii) Cuál es la probabilidad que sea oro o un uno de espadas.
10 1 0 11
P(A ∪ C) = P(A) + P(C) − P(A ∩ C) = + − =
40 40 40 40

2.2. Variable aleatoria

Una Variable Aleatoria (V.A.) es una función que le asigna un número
real a cada elemento del espacio muestral.
1. Variables aleatorias discretas (V.A.D.): son aquellas que toman un
número nito o innito numerable de valores Ejemplo: número de
correos electrónicos que recibe diariamente una persona, número de
cheques protestados en una sucursal bancaria, etc.
2. Variables aleatorias Continuas (V.A.C.): son aquellas que toman un
número innito de valores dentro de un intervalo. Ejemplo: Pesos de
los recién nacidos en un hospital, tiempo de duración de un proceso
de análisis contable, etc.
2.3. Función de Probabilidad ó distribución

de probabilidad
Es aquella función que le asigna a cada valor de una variable aleatoria,
su respectiva probabilidad Se designa por f (x).
Ejemplo 2.3.1. Un experimento aleatorio consiste en probar tres ampo-
lletas.
Se dene la v.a. A= número de ampolletas defectuosas.
El espacio muestral de este experimento es el siguiente:
Ω = {(N, N, N ), (D, N, N ), (N, D, N ), (N, N, D), (N, D, D), (D, N, D), (D, D, N )(D, D, D)}

Donde N: no defectuosa y D: defectuosa Luego X = 0, 1, 2, 3
Podemos representar con el siguiente diagrama:
Entonces si se eligen 3 ampolletas al azar y se van probando de a una,
¾ cuál es la probabilidad de obtener una defectuosa?
Como X = número de ampolletas defectuosas, entonces su función de
probabilidad es :
Propiedades
1. f (x) > 0
P
2. f (x) = 1
3. f (x) = IP (X = x)

Observación
1. Si X es una V.A.D., f (x) se denomina función de cuantía .

2. Si X es una V.A.C., f (x) se denomina función de densidad .
2.4. Función de distribución acumulada

Se X es una V.A.D. con función de distribución f (x) La función de
distribución acumulada F (x), se dene como:
X
F (x) = IP (X ≤ x) = f (t) (2.2)
x≤t
En el ejemplo anterior, calcular la probabilidad de obtener a lo más 2
ampolletas defectuosas
1 3 3 7
F (2) = IP (X ≤ 2) = IP (X = 0)+IP (X = 1)+IP (X = 2) = + + =
8 8 8 8
2.5. Esperanza (Media) - Varianza

Sea X es una V.A.D. con función de distribución f (x)
1. Esperanza de X
n
X
E(X) = µ = xi f (xi ) (2.3)
i=1
2. Varianza de X
n
X n
X
2 2
Var(X) = σ = (xi −µ) = x2i f (xi )−µ2 = E(x2i )−µ2 (2.4)
i=1 i=1
Teorema 2.5.1. Sea X una variable aleatoria (continua o discreta). Con-

sideremos dos funciones de X , H(X) y G(X), y sea k una constante.
Entonces

a) E[K] = k
b) E[kH(X)] = kE[H(X)]
c) E[H(X) + G(X)] = E[H(X)] + E[G(X)]
Teorema 2.5.2. Sea X una variable aleatoria con media µ y varianza

2
σ . Entonces,
a) V ar(K) = 0
b) V ar(X + k) = V ar(X) = σ 2
c) V ar(Xk) = k2 V ar(X) = k2 σ 2
Ejemplo 2.5.1. ¾ Calcular la esperanza y varianza del ejemplo 2.3.1?
2.6. Distribución Bernoulli

Este tipo de experimento con sólo dos posibles resultados se denomi-
na Ensayo Bernoulli y sus eventos elementales comúnmente llamados
éxito o fracaso y su función de probabilidad esta dada:
PX (X) = pX q 1−X , X = 0, 1, donde p+q =1 (2.5)
2.7. Distribución Binomial

Una variable que corresponda con esas características se denomina bi-
nomial B(n, p), siendo n el número de pruebas realizadas y p la probabi-
lidad de éxito. La probabilidad de r éxitos se calculará:
X ∼ Bi(n; p)
!
n
IP (X = a) = pa q n−a , a = 0, 1, 2, . . . , n (2.6)
a

La media, Varianza y desviación típica se calcula:
√
E(X) = np, V ar(X) = npq, σ= npq (2.7)
Ejemplo 2.7.1. En un banco comercial, en el proceso de análisis de cré-
ditos, el 12 % de las solicitudes que llegan en una semana, son rechazadas
por falta de antecedentes del solicitante. Si en una semana llegan 25 solici-
tudes, ¾ Cuál es la probabilidad de que se rechacen menos de 2 solicitudes
en una semana por falta de antecedentes del solicitante?
Solución :
Sea X = no de solicitudes rechazadas semanalmente por falta de antece-
dentes del solicitante
X ∼ Bin(n = 25; p = 0, 12)
2.8. Distribución de Poisson

En un proceso de Poisson de parámetro µ, si X es el número de ocu-
rrencias de un evento en un intervalo de longitud t, entonces X se llama
variable aleatoria Poisson de parámetro µt = λ
X ∼ P(λ)
λa e−λ
IP (X = a) = , a = 0, 1, · · · (2.8)
a!
La media y Varianza se calcula:
IE(X) = λ ∧ V ar(X) = λ (2.9)
Ejemplo 2.8.1. Supongamos que clientes llegan a una cola de espera a
una tasa de 4 por minuto. Suponiendo que este proceso de llegada ocurre
a un proceso de Poisson, determinemos la probabilidad que al menos una
persona llegue a la cola en un intervalo de 1/2 minuto.
Sea X el número de personas que llegan a la cola en 1/2 minuto. Si
tomamos 1 minuto como unidad de tiempo tenemos λ = 4 y luego el
número medio de llegadas en 1/2 minuto es 2. Por lo tanto, X ∼ P (λ = 2)

y
2a e−2
IP (X = a) = , x = 0, 1, 2, · · ·
a!
De donde la probabilidad que llegue al menos una persona durante un
periodo de 1/2 minuto es:
IP (x > 1) = 1 − IP (X < 1) = 1 − IP (X = 0) = 1 − e−2 = 0, 865
Observación 2.8.1. Haciendo np = λ, la distribución Poisson puede
ser usada como una aproximación Binomial con parametro n y p, cuando
n > 20 y p 6 0, 05, es decir,
Si X ∼ Bin(n, p), con n > 20 y p ≈ 0 ⇒ X ∼ P (λ), con λ = n∗p
Ejemplo 2.8.2. En un sistema de control de calidad de productos termi-
nados, un experto, basado en su experiencia, estima que hay una proba-
bilidad de 0, 001 de encontrar un articulo defectuoso durante un periodo
de 5 minutos, en una estación de la cadena de producción continua. Si
X es una variable Binomial con parámetro n = 100 y p = 0, 001 y la
probabilidad exacta de no encontrar defectuosos es :
IP (X = 0) = 0, 999100 = 0, 9048
y la probabilidad encontrar un defectuoso en una sola ocasión es:
IP (X = 1) = 100(0, 999)99 (0, 001) = 0, 0906

Notemos que en este ejemplo n es bastante grande y p es más bien peque-
ño.
Usando la distribución Poisson (µ = np = 0, 1) estas probabilidades
son respectivamente:
IP (X = 0) = 0, 10 e−0,1 = 0, 9048
y
0, 11 e−0,1
IP (X = 1) = = 0, 0905
1!
2.9. Distribución Normal
X ∼ N (µ, σ 2 )
La función de densidad es:
x−µ
2
−1

1 σ
f (x) = √ e 2
σ 2π
E(X) = µ y V ar(x) = σ 2
Representación gráca de la función de densidad de una distribución nor-
mal.
Propiedades

1. IP (X > a) = 1 − IP (X ≤ a)
2. IP (X < −a) = 1 − IP (X < a)
3. IP (a ≤ X ≤ b) = IP (X ≤ b) − IP (X ≤ a)
Distribución Normal Estándar (Distribución Z)

Si se tiene una variable aleatoria X, X ∼ N (µ; σ 2 ),con µ 6= 0 y σ 2 6= 1
ésta variable se puede convertir en una variable aleatoria normal estándar
Z ∼ (0; 1), mediante el siguiente cambio de variable
X −µ
Z= (2.10)
σ
La función de distribución acumulada de esta variable Z, se representa
como:
Φ(Z) = IP (Z < z)
Esta distribución se encuentra tabulada (Tabla Normal)
Por ejemplo,

1. Sea Z ∼ (0, 1)
a) P(Z ≤ 1, 23)
La probabilidad pedida se encuentra directamente en las ta-
blas. Basta buscar 1,2 en la columna y 0,3 en la la. Su inter-
sección nos da la probabilidad.
b) P(Z ≥ 1, 24) = 1 − P(Z ≤ 1, 24) = 1 − 0, 8925 = 0, 1075
c) P(Z ≤ −0, 72) = 1 − P(Z ≤ 0,72)
d) P(0,5 ≤ Z ≤ 1,76) = P(Z ≤ 1, 76) − P(Z ≤ 0,5) = 0, 9608 −

0, 6915 = 0, 2693
2. El peso de los individuos de una población se distribuye normalmen-
te con media de 70 Kg. y desviación típica 6 Kg. De una población
de 2000 personas, calcula cuántas tendrán un peso comprendido
entre 64 y 76 Kg.
Solución

Sea X el peso los individuos de una población.
X ∼ N (70, 62 )
Se trata de una distribución normal con µ = 70 y σ = 6), por lo
que se utilizar el T.L.C, esto es:
X −µ
Z=
σ
Por lo que se tiene:

64 − 70 76 − 70
P(64 ≤ X ≤ 76) = P ≤Z≤ = P(−1 ≤ Z ≤ 1) = P(Z ≤ 1)−P(Z ≤ −1)
6 6
por tabla se sabe que P(Z ≤ 1) = 0,8413, y P(Z ≤ −1) = 0,1587

Por lo tanto:
P(64 ≤ Z ≤ 76) = 0,8413 − 0,1587 = 0,6826
Esto signica que el 68,26 % de las personas pesan entre 64 y 76
Kg.. Como hay 2000 personas, calculamos el 68,26 % de 2000 y
obtenemos aproximadamente 1365 personas.
2.10. Distribuciones con Excel

2.10.1. Binomial mediante Excel
Volvamos al 2.7.1, esto es:
En un banco comercial, en el proceso de análisis de créditos, el 12 %
de las solicitudes que llegan en una semana, son rechazadas por falta de
antecedentes del solicitante. Si en una semana llegan 25 solicitudes, ¾
Cuál es la probabilidad de que se rechacen menos de 2 solicitudes en una
semana por falta de antecedentes del solicitante?

Solución :
Sea X = no de solicitudes rechazadas semanalmente por falta de antece-
dentes del solicitante
X ∼ Bin(n = 25; p = 0, 12)

IP (X < 3) = P I(X = 0) + IP (X = 1) + IP (X = 2)
IP (X < 3) = P I(X = 0) + IP (X = 1) + IP (X = 2)
IP (X < 3) = 0, 0409 + 0, 1395 + 0, 2283 = 0, 4088

2.10.2. Possion mediante Excel

Veamos el ejemplo 2.8.1, esto es:
Supongamos que clientes llegan a una cola de espera a una tasa de 4 por
minuto. Suponiendo que este proceso de llegada ocurre a un proceso de
Poisson, determinemos la probabilidad que al menos una persona llegue
a la cola en un intervalo de 1/2 minuto.
Sea X el número de personas que llegan a la cola en 1/2 minuto. Si
tomamos 1 minuto como unidad de tiempo tenemos λ = 4 y luego el
número medio de llegadas en 1/2 minuto es 2. Por lo tanto, X ∼ P (λ = 2)

y
2a e−2
IP (X = a) = , x = 0, 1, 2, · · ·
a!
De donde la probabilidad que llegue al menos una persona durante un
periodo de 1/2 minuto es:
IP (x > 1) = 1 − IP (X < 1) = 1 − IP (X = 0) = 1 − e−2 = 0, 865
2.10.3. Normal mediante Excel

Ejemplo 2.10.1. El contenido de leche de cierto envase se puede modelar
mediante una distribución normal comedia 500 cc y desviación estándar
5 cc, si se selecciona un envase al azar y se mide el contenido de este. ¾
Cual es la probabilidad de que tal contenido sea a lo mas 502 cc?.
Solución:
Sea X= Cantidad de leche..
X ∼ N (µ = 500 ; σ 2 = 52 )
Interpretación

¾ Que contenido de leche debería tener un envase seleccionado al azar
para pertenecer al 30 % inferior en al distribución de datos?.
Interpretación ?????
2.11. Ejercicio

Capítulo 3
Concepto de Inferencia
Estadística
3.1. Estimador y estimación de parámetros

1. Estimador Puntual es una función de la información de la mues-
tra que genera un único valor que denominamos estimación puntual.
2. Estimación por Intervalo estará determinada por dos valores
obtenidos a partir de la muestra.
3.2. Estimación por Intervalos de Conanza

Sea X1 , X2 , . . . , Xn una m.a.(n), X ∼ N (µ; σ 2 ).
1. I. C. (µ) con σ2 conocida.
2. I. C. (µ) con σ2 desconocida.
3. Intervalo de Conanza para Proporciones
37
3. Concepto de Inferencia Estadística
Caso a) I. C. (µ) con σ2 conocida.

σ σ
I.C. para (µ) X − Z1−α/2 √ ; X + Z1−α/2 √ (3.1)
n n
Caso b) I. C. (µ) con σ2 desconocida.

S S
I.C. (µ) X − t(1− α ,n−1) √ ; X + t(1− α ,n−1) √ (3.2)
2 n 2 n
Caso c) I. C. para Proporciones.
" r r #
p̂(1 − p̂) p̂(1 − p̂)
I.C.(p̂) p̂ − Z1−α/2 p̂ + Z1−α/2 (3.3)
n n
con
n
P
xi
pq i=1
p̂ ∼ N (p, ) y p̂ =
n n
Ejemplo 3.2.1. Los datos que a continuación se dan los pesos en
gramos del contenido de 16 cajas de cereal que se seleccionaron de
un proceso de llenado con el propósito de vericar el peso promedio
506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506,
502, 509, 496. Si el peso de cada caja es una variable aleatoria
normal con una desviación estándar σ = 5, obtener el intervalo
de conanza estimado del 90 %, para la media del llenado de este
proceso.
Solución:
Como el intervalo de conanza debe ser del 90 %, esto es 1−α =

0,90 lo que implica que α = 0,1, El valor de Z0,95 se obtiene de la
tabla normal esto es Z0,95 = 1,96, el valor de X = 503,75. Enton-
ces el intervalo de conanza del 90 % para la media del proceso de
llenado es:

5 5
I.C. para (µ) = 503,75 − 1,96 √ ; 503,75 + 1,96 √ ≈ [501,69 ; 505,81]
16 16

Ejemplo 3.2.2. Los datos que a continuación se dan, son los pesos
en gramos del contenido de 16 cajas de cereal que se seleccionaron de
un proceso de llenado con el propósito de vericar el peso promedio
506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502,
509, 496. Si el peso de cada caja es una variable aleatoria normal,
obtener el intervalo de conanza estimado del 90 %, para la media
del llenado de este proceso.
Solución:
Como el intervalo de conanza debe ser del 90 %, esto es 1−α =

0,90 lo que implica que α = 0,1, como no se conoce la varianza,
esta debe ser calculada lo que implica que S = 6, 20, por lo que
se debe obtener un intervalo de conanza para la media con sigma
desconocido y este es:

6, 20 6, 20
I.C. para (µ) = 503,75 − 1,753 √ ; 503,75 + 1,753 √ ≈ [501,03 ; 506,47]
16 16

Ejemplo 3.2.3. Se quiere estimar el resultado de un referéndum
mediante un sondeo. Para ello se realiza un muestreo aleatorio sim-
ple con n = 100 personas y se obtienen 35 % que votarán a favor
y 65 % que votarán en contra (suponemos que no hay indecisos pa-
ra simplicar el problema a una variable dicotómica). Con un nivel
de signicación del 5 %, calcule un intervalo de conanza para el
verdadero resultado de las elecciones.
Solución:
Dada una persona cualquiera (i) de la población, el resultado de su
voto es una variable dicotómica:
Xi ∼ Bin(n, p)
El parámetro a estimar en un intervalo de conanza con α = 0, 05

es p, y tenemos sobre una muestra de tamaño n = 100, la siguiente
estimación puntual de p:
35
p̂ = = 0, 35 =⇒ q̂ = 0, 65
100
El intervalo de conanza buscado es:
0, 35 ± 0, 0935
Por tanto, tenemos con esa muestra un error aproximado de 9, 3
puntos al nivel de conanza del 95 %.
3.3. Determinación del Tamaño Muestral

Para ello, recordemos que un intervalo de conanza para una media
en el caso general se escribe como:
S2
µ = X ∓ T(1−α/2,n−1) √
n
| {z }
precisión ε

Si n es sucientemente grande, la distribución t de Student se apro-

xima a la distribución normal. Luego una manera de obtener la
precisión buscada consiste en elegir n con el siguiente criterio:
2
Z1−α/2
n≥ 2 S2 (3.4)
ε
Ejemplo 3.3.1. Un estudiante de administración pública desea de-
terminar la cantidad media que perciben los miembros de los con-
sejos de ciudades. El error para estimar la media es menor de 100
dólares, con un nivel de conanza de 95 %. El estudiante encontró
un informe del departamento de Trabajo que se estimó una desvia-
ción estándar de 1.000 dólares. ¾Cuál es el tamaño requerido de la
muestra?
Solución:
El error máximo permisible, d es de 100 dólares. El valor de Z

para un nivel de conanza del 95 % es de 1.96 y el estimado de la
desviación estándar son 1.000 dólares. Al sustituir estos valores en
la fórmula que aparece a continuación, nos arroja el tamaño de la
muestra requerido.
2
Z1−α/2 1,962
n≥ S2 = 10002 = 384,16
ε2 1002
El valor calculado se redondea hacia arriba quedando 385. Por lo
cual se requiere una muestra de 385 para cumplir con las especi-
caciones
Si la población es proporcional el tamaño muestral proporcional es:
2
Z1−α/2 p̂q̂
n= (3.5)
ε2
Ejemplo 3.3.2. Se quiere estimar el resultado de un referendum
mediante un sondeo, y sin tener una idea sobre el posible resultado

del mismo, se desea conocer el tamaño de muestra que se ha de
tomar para obtener un intervalo al 97 % de conanza, con un error
del 1.
Solución:
Como no se tiene una idea previa del posible resultado del refe-
rendum, hay que tomar un tamaño de muestra, N, que se calcula
mediante:
2
Z1−α/2 p̂q̂
n= 2
ε
Si en un principio no tenemos una idea sobre que valores puede
tomar p̂, debemos considerar el peor caso posible, que es en el que
se ha de estimar el tamaño muestral cuando p = q = 1/2. Así:
2
Z
n = 14 1−α/2
ε2
de esto se tiene:
2
Z 0,25 ∗ 2,172
n = 14 0,9852 = = 1177, 25
0,01 0,012
Así para tener un resultado tan able, el número de personas a
entrevistar debe ser muy elevado lo que puede volver excesivamente
costoso.

3.4. Prueba de Hipótesis

1. Prueba de hipótesis con respecto a la media con σ 2 conocida.
2. Prueba de hipótesis con respecto a la media con σ2 desconocida.
3. Prueba de hipótesis con respecto a la proporción de una población.
Tabla 3.1: Prueba de hipótesis para la media con σ2 conocida
Hipótesis Nula Valor de la estadística de prueba bajo H0
x̄ −√µ0
H0 : µ = µ0 Zcal =
σ/ n
Hipótesis Alternativa Criterio de rechazo
H1 : µ 6= µ0 R.C. = {Zcal ≤ Zα/2 ∨ Zcal ≥ Z1−α/2 }

H1 : µ > µ0 R.C. = {Zcal ≥ Z1−α }
H1 : µ < µ0 R.C. = {Zcal ≤ −Zα }

Tabla 3.2: Prueba de hipótesis para a la media con σ2 desconocida
x̄ −√µ0
H0 : µ = µ0 tcal =
S/ n
H1 : µ 6= µ0 R.C. = {tcal ≤ t(α/2,n−1) ∨ tcal ≥ t(1−α/2,n−1) }
H1 : µ > µ0 R.C. = {tcal ≥ t(1−α,n−1) }
H1 : µ < µ0 R.C. = {tcal ≤ t(α,n−1) }

Tabla 3.3: Prueba de hipótesis para la proporción de una población
p − p0
H0 : p = p0 Zcal = p
p0 q0 /n
H1 : p 6= p0 R.C. = {Zcal ≤ −Z α2 ∨ Zcal ≥ Z α2 }
H1 : p > p0 R.C. = {Zcal ≥ Z1−α }
H1 : p < p0 R.C. = {Zcal ≤ −Zα }

Observación: Otra forma de ver si se cumple o no la hipótesis nula es
mediante del p - valor
Si p − valor < α, se Rechaza Ho (3.6)
El valor-p depende de la hipótesis alternativa, así si:
1. Para la media con varianza conocida.
a) H1 : µ >µo , se tiene valor-p = 1 − IP (Z < Zcal ) (prueba de
cola derecha.)
b) H1 : µ <µo , se tiene valor-p = IP (Z < Zcal ) (prueba de cola
izquierda).
c) H1 : µ 6= µo , se tiene valor-p=2 ∗ [1 − IP (Z < Zcal )] (prueba
bilateral)
2. Para la media con varianza desconocida.
a) H1 : µ >µo , se tiene valor-p = 1 − IP (t < tcal ) (prueba de cola
derecha.)
b) H1 : µ <µo , se tiene valor-p = IP (t < tcal ) (prueba de cola
izquierda).
c) H1 : µ 6= µo , se tiene valor-p=2 ∗ [1 − IP (t < tcal )] (prueba
bilateral)
3. Para proporciones.
a) H1 : p >po , se tiene valor-p = 1 − IP (Z < Zcal ) (prueba de cola

derecha.)
b) H1 : p <po , se tiene valor-p = IP (Z < Zcal ) (prueba de cola
izquierda).
c) H1 : p 6= po , se tiene valor-p=2 ∗ [1 − IP (Z < Zcal )] (prueba
bilateral)

Ejemplo 3.4.1. 1. Los siguientes datos representan los tiempos de
ventas de cierto medicamentos para 20 unidades seleccionadas alea-
toriamente: 0.9 , 10.4, 10.6, 9.6, 9.7, 9.9, 10.9, 11.1, 9.6, 10.2,
10.3, 9.6, 9.9, 11.2, 10.6, 9.8, 10.5, 10.1, 10.5, 9.7. Supóngase que
el tiempo necesario de venta de una unidad es una variable aleatoria
normal con media µ y desviación estándar σ = 0,6 minutos. Con
base en esta muestra, ¾ existe alguna razón para creer, a un nivel
de 0.05, que el tiempo de venta promedio es mayor de 10 minutos?
Solución:
Considérese la hipótesis nula:
H0 : µ = 10
contra la alternativa
H1 : µ > 10
Si puede rechazar a H0 con α = 0,05, entonces existe una razón para

creer que el tiempo necesario para vender una unidad es mayor que
10 minutos. Dado que P(Z ≥ 1,645) = 0,05, el valor critico en
términos de variable aleatoria normal estándar es Z0,95 = 1,645.

De los datos de la muestra, el valor x̄ = 10,2 minutos. Entonces:
x̄ − µ0 10,2 − 10
Zcal = √ = √ = 1,4907
σ/ n 0,6/ 20
Dado que Zcal = 1,4907 < Z0,95 = 1,645 no se puede rechazar la
hipótesis nula.
Ejemplo 3.4.2. las puntuaciones en un test que mide la variable reac-
tividad siguen, en la población general de adolescentes, una distribución
Normal de media 11, 5. En un centro escolar que ha implantado un pro-
grama de estimulación de la reactividad una muestra de 30 alumnos ha
proporcionado las siguientes puntuaciones:
11, 9, 12, 17, 8, 11, 9, 4, 5, 9, 14, 9, 17, 24, 19, 10, 17, 17, 8, 23, 8,
6, 14, 16, 6, 7, 15, 20, 14, 15.

A un nivel de conanza del 95 % ¾Puede armarse que el programa es
efectivo?
Solución: Considérese la hipótesis nula:

H0 : µ = 11,5
contra la alternativa
H1 : µ > 11,5
El estadístico de contraste en este caso es:
x̄ − µ 12,47 − 11,5
tcal = √ = √ = 1,0178
s/ n 5,22/ 30
Como el contraste es unilateral, buscamos en las tablas de la t de Stu-
dent, con 29 grados de libertad, el valor que deja por debajo de sí una
probabilidad de 0,95, que resulta ser t0,95,29 = 1, 699.
Dado que tcal = 1,0178 < t(0,95;29) = 1,699, no se puede rechazar la
hipótesis nula.
Ejemplo 3.4.3. Se cree que determinada enfermedad se presenta en ma-
yor medida en hombres que en mujeres. Para ello se elige una muestra
aleatoria de 100 de estos enfermos y se observa que 70 son hombres. ¾Que
podemos concluir?
Solución:
Sea p la proporción de hombres que existen entre los enfermos. Que-
remos encontrar evidencia a favor (H1 ) de que p > 1/2, pero nuestra
hipótesis de partida (mientras no tengamos evidencia en contra) es que
p = 1/2 (H0 ). Es decir, plantemos el siguiente contraste unilateral para
una proporción:
H0 : p = 1/2 v/sH1 : p > 1/2

La estimación puntual de p es p̂ = 70/100 = 0, 7. Si elegimos α = 5 %, los
valores críticos son los que están situados a la derecha del percentil 95 de
esta distribución, es decir, los valores superiores a Z1−α = Z1−0,05 = 1, 96,

y el estadístico que usamos para el contraste es:
p − p0 0,7 − 0,5
Zcal = p =p =4
p0 q0 /n 0,5 × 0,5/100

Como se aprecia, Z entra ampliamente dentro de la region critica, por
tanto hemos de concluir con el rechazo de la hipótesis nula y la aceptación
de la hipótesis alternativa. Resumamos el ejemplo con otras palabras: Si la
hipótesis nula fuese cierta, deberíamos esperar que el valor del estadístico
Z no fuese demasiado grande. Por tanto como hemos obtenido un valor
grande del mismo, debemos concluir que la hipótesis de partida (H0 ) ha
de ser rechazada. El valor Z se calcula exclusivamente a partir de α, y
nos sirve para saber a que nos referimos por un valor demasiado grande
para Z.
3.5. Intervalo de Conanza - Prueba Hipóte-

sis con Excel
Para poder calcular los Intervalos de conanza o Prueba Hipotiposis en
forma automatiza mediante Excel, existen paquetes adicionales de excel
que se puede instalar en el complemento, esto pueden ser "MegaStat",
XLSTAT, etc. o construir las formulas es excel.
3.5.1. Intervalo de Conanza con Excel
3.6. Ejercicios
1. Un fabricante arma que el peso promedio de las latas de fruta en
conserva que saca al mercado es de 19 onzas. Para vericar esta
armación se escogen al azar 20 latas de fruta y se encuentra que
el peso promedio es de 18,5 onzas. Suponga que la población de los
pesos es normal con una desviación de 2 onzas.
a ) Utilizando un intervalo del 98 %, ¾ se puede aceptar la arma-

ción del fabricante? (Resp : [17, 46 ; 19, 54])
b ) ¾Qué tamaño de muestra se debe escoger para estimar µ si

se quiere un error no superior a 0,98 onzas con conanza del
95 %?, (Resp : apox. 16)
2. En los datos que se encuentran en la base base_datos_envia_xls
pestaña base_2.
El gerente comercial arma que la deuda promedio es de $4.317.326.

Para vericar esta información se escojen al azar 50 clientes y se
encuentra que la deuda promedio es $3.940.000. Suponga que la
población de la deuda actual sigue una distribución normal con una
desviación estándar de $1.937.555.
a ) Utilizando un intervalo del 98 %, ¾ se puede aceptar la arma-

ción del fabricante?
b ) ¾Qué tamaño de muestra se debe escoger para estimar µ si se
quiere un error no superior $100.000 de la muestra, con una
conanza del 95 %?
3. Durante los doce meses pasados del volumen diario de ventas de
un restaurante fue de 20.000 U.M. el dueño piensa que los próxi-
mos 25 días serán críticos con respecto al volumen normal, debido
a las medidas económicas tomadas por el gobierno. Al nalizar los
25 días, el volumen de ventas promedios y su desviación estándar
fueron 19.000 U.M. y 2.000 U.M. respectivamente. Suponiendo que
el volumen de ventas se distribuye normalmente. ¾ Tiene razón el
dueño del restaurante para conar en un 95 %, con base en los re-
sultados muestrales, hubo una disminución en el volumen de ventas
promedios diario?
4. Se administra una solución de dimetil-sufóxico al 50 % en dosis de 1

ml por cada 100 gramos de peso, a ratones de laboratorio. Al cabo
de 30 minutos, se sacrica y se les extrae el hígado, con la nalidad
de medir el consumo de oxigeno. Los resultados de captaciones de
oxigeno de 27 ratones fueron los siguientes:

27
X 27
X
Xi = 68, 625 y Xi2 = 4, 721
i=1 i=1

Construya un intervalo de conanza para la media del consumo de
oxigeno al 98 % de conanza. (Resp : [−3, 77 ; 8, 85])
5. Una organización de salud se interesa en actualizar su información
con respecto a la proporción de hombres que fuman. Con base a
estudios previos, se cree que la proporción es de un 40 %. La orga-
nización lleva a cabo una encuesta en la que seleccionan en forma
aleatoria a 1.200 hombres a los cuales se les pregunta sus hábitos de
fumador. De los encuestados, 420 son fumadores. Emplee un méto-
do aproximado para determinar si esta evidencia apoya al estudio
previo, con un 99 % de conanza. (Resp: No se apoya el estudio)
6. El departamento de mejoramientos de autopista, encargado de re-
parar un tramo de 25 km de una autopista, quiere diseñar una
supercie que sea estructuralmente eciente. Una consideración im-
portante es el tráco de carga pesada. Las estaciones de control de
peso del estado informan que le número medio de remolques pesado
que viajan en un tramos de 25 km es de 72 horas. Sin embargo, la
sección por reparar se encuentra en un área urbana y el departamen-
to de ingenieros piensa que el volumen de tráco de carga pesada
de este sector en particular es mayor que el volumen del medio in-
formado, a n de comprobar la validez d su teoría, el departamento
vigila la autopista durante 50 periodos de una hora seleccionados
aleatoriamente, con un promedio en horas de 74,1 y una desviación
de 13,3
a ) ¾Usted apoya la teoría del departamento? Utilice α = 0, 1

b ) Por otra parte, el departamento de logística dice que el número
de remolque no es de 72 horas. Calcule el nivel de signicancia
observado e interprete el resultado.
7. El empleo de acero intemperizado en la construcción de puentes para
autopistas ha sido tema de considerable controversia. Los críticos ha

citado recientemente problemas de corrosión graves del acero intem-
perizado y están tratando de convencer al estado de que prohíban
su uso en la construcción de puentes. Por otro lado, las corporacio-
nes acereras aseguran que estas acusaciones son exageradas y dicen
que 95 % de todos los puentes de acero intemperizado en opera-
ción tienen un buen desempeño, sin daños graves por corrosión. A
n de probar esta aseveración, un equipo de ingenieros y expertos
de la industria del acero evalúan 60 puentes de acero intemperi-
zado seleccionados al azar y encontraron 54 de ellos exhibían un
buen desempeño. ¾Hay pruebas de que la verdadera proporción de
puentes de autopistas de acero intemperizado que presenta un buen
desempeño sea menor al que dice la corporación?
8. En los datos que se encuentran en la base base_datos_envia_xls
pestaña base_2.
a ) Se puede armar que el promedio de deuda es de $4.310.000.

b ) en promedio las deuda de los hombres es de $4.256.000.
9. Un neurólogo está probando el efecto de un fármaco sobre el tiempo
respuesta inyectando, inyectando 100 ratas con una dosis unitaria,
exponiéndole individualmente estímulos neurológicos y registrando
el tiempo respuesta. El neurólogo sabe que la media del tiempo res-
puesta para las ratas que no han sido inyectadas es de 1,2 segundos.
La media del tiempo respuesta de las 100 ratas inyectadas es de 1,05
segundos con una desviación estándar de 0,5 segundos. ¾Piensas que
el fármaco ha tenido efecto en el tiempo respuesta?
10. Fernanda lee un artículo en el cual mencionan que el 26 % de los
chilenos pueden hablar más de un idioma. A ella le da curiosidad
saber si esta cantidad es mayor en su cuidad, por lo que ella probo
Ho : p = 0, 26 v/s H1 : p > 0, 26, donde p representa la proporción
de personas en su ciudad que pueden hablar más de un idioma.
Encontró que 40 de 120 personas muestreadas pueden hablar más

de un idioma. El estadístico de prueba para esto resultados fue
z ≈ 1, 83 Suponiendo que se cumplen las condiciones necesarias,
¾Cuál es el valor p aproximado para la prueba de Fernanda?
11. Sea H0 : µ = 0 v/s H1 : µ 6= 0 , con una m.a de 6 observaciones y
un estadístico t=2,75 ¾Cuál es valor p aproximado?
12. Una empresa está interesada en lanzar un nuevo producto al merca-
do. Tras realizar una campaña publicitaria, se toma la muestra de 1
000 habitantes, de los cuales, 25 no conocían el producto. A un nivel
de signicación del 1 % ¾apoya el estudio las siguientes hipótesis?
a ) Más del 3 % de la población no conoce el nuevo producto.
b ) Menos del 2 % de la población no conoce el nuevo producto
13. Cuando las ventas medias, por establecimiento autorizado, de una
marca de relojes caen por debajo de las 170.000 unidades mensuales,
se considera razón suciente para lanzar una campaña publicitaria
que active las ventas de esta marca. Para conocer la evolución de
las ventas, el departamento de marketing realiza una encuesta a
51 establecimientos autorizados, seleccionados aleatoriamente, que
facilitan la cifra de ventas del último mes en relojes de esta mar-
ca. A partir de estas cifras se obtienen los siguientes resultados:
media = 169.411,8 unidades., desviación estándar = 32.827,5 uni-
dades. Suponiendo que las ventas mensuales por establecimiento se
distribuyen normalmente; con un nivel de signicación del 5 % y en
vista a la situación reejada en los datos. ¾Se considerará oportuno
lanzar una nueva campaña publicitaria?
14. Un gerente de ventas de libros universitarios arma que en pro-
medio sus representantes de ventas realiza 40 visitas a profesores
por semana. Varios de estos representantes piensan que realizan un
número de visitas promedio superior a 40. Una muestra tomada al
azar durante 8 semanas reveló un promedio de 42 visitas semanales

y una desviación estándar de 2 visitas. Utilice un nivel de conanza
del 99 % para aclarar esta cuestión.
15. Un investigador de mercados y hábitos de comportamiento arma
que el tiempo que los niños de tres a cinco años dedican a ver la
televisión cada semana se distribuye normalmente con una media de
22 horas y desviación estándar 6 horas. Frente a este estudio, una
empresa de investigación de mercados cree que la media es mayor
y para probar su hipótesis toma una muestra de 64 observaciones
procedentes de la misma población, obteniendo como resultado una
media de 25. Si se utiliza un nivel de signicación del 5 %. Verique
si la armación del investigador es realmente cierta.
16. Se sabe que la desviación típica de las notas de cierto examen de
Matemáticas es 2,4. Para una muestra de 36 estudiantes se obtuvo
una nota media de 5,6. ¾Sirven estos datos para conrmar la hi-
pótesis de que la nota media del examen fue de 6, con un nivel de
conanza del 95 %?
17. Una empresa de neumáticos arma que una nueva gama en prome-
dio dura al menos 28.000 km. Las pruebas con 64 neumáticos dan
como resultados una duración media de 27.800 km, con una desvia-
ción estándar de 1.000 km. bajo la normalidad de los neumáticos se
pide:
a ) Existe evidencia suciente para rechazar la armación de la
empresa, con un nivel de signicación del 5 %
b ) ¾ Cual es el p-valor?
18. El propietario de un automóvil sospecha que su vehículo tiene un
consumo medio de combustible en carretera superior a los 5,6 li-
tros/100 km, que es lo que el fabricante indica en su publicidad.
Para apoyar empíricamente su sospecha el consumo medio en 11
viajes seleccionados aleatoriamente entre todos los que realiza en el
año, obteniendo los siguientes resultados

6,1 - 6,5 - 5,1 - 6,0 - 5,9 - 5,2 - 5,8 - 5,3 - 6,2 - 5,9 - 6,3
a ) ¾ Están fundadas las sospechas del propietario a un nivel de
signicación del 1 %?
b ) Calcule el p-valor
19. la directora del departamento de personal esta buscando empleados
para un puesto en el extranjero. Durante el procesos de selección, la
administración le pregunta como va la incorporación de empleados,
y ella contesta que la puntuación promedio en la prueba de aptitudes
sera de 90 puntos. Cuando la administración 19 de los resultados
de la prueba,encuentra que la puntuación media es de 83,25 puntos
y la desviación estándar es de 11. Bajo el supuesto de normalidad,
¾ lleva la razón la directora con un nivel de conanza del 90 %?
20. Un portal e-business sabe que el 60 % de todos los visitantes a la
web están interesados en adquirir sus productos pero son reacios al
comercio electrónico y no realizan nalmente la compra vía internet.
Sin embargo, la dirección del portal se piensa que en el último año
el porcentaje de gente que esta dispuesta a comprar por internet ha
aumentado y esto se debe reejar en los resultados empresariales.
En esta linea, se tomo una muestra de 500 visitantes para conocer
su opinión y se observo que el 55 % no estaba dispuesto a realizar
compras vía on-line.
Contrastar con el 2 % de signicación si el último año se ha redu-
cido el porcentaje de personas que no esta dispuesta a comprar vía
internet.
21. Los contenidos de una m.a. de 5 latas de café instantáneo de un
producto han dado los siguientes pesos netos en gramos: 280, 290,
285, 275, 284. Asumiendo que la población es normal
a ) Encuentre un intervalo de conanza del 95 % para la media de

los contenidos de todas las latas de café del productor. (Resp:
[275,8 ; 289,8])

b ) ¾ Con que grado de conanza se estima que el contenido pro-
medio de café tengas limites de conanza 277,432 y 288,168?.
(Resp : 98 %)
22. Una encuestadora utilizó una m.a. de 600 electores que acaban de
votar y encontró que 240 votaron a favor del candidato A
a ) Estimar el porcentaje de electores a favor de A en toda la po-
blación. Utilizando un intervalo de conanza del 95 %. (Resp :

[36 % ; 44 %] aprox)
b ) Si la proporción a favor del candidato A se estima en 40 %, ¾
Cuánto es el error máximo de la estimación, se se quiere tener
una conanza del 98 %. (Resp : 4, 47 % aporx.)
3.7. Dócima de Hipótesis para la Diferencia

de dos Medias en Poblaciones Normales
(Comparación de dos Poblaciones Nor-
males)

Tabla 3.4: Criterio de rechazo para la prueba de hipótesis con respecto
a las medias con varianzas iguales pero desconocida, pero
iguales σ12 = σ22
(X 1 − X 2 ) − d0
H0 : µ1 − µ2 = d0 Tcal = r ∼ t(n1 +n2 −2)
(n1 − 1)S12 + (n2 − 1)S22 1

1
n1 + n2 − 2 n1 + n2
H1 : µ1 − µ2 6= d0 R.C. = {Tcal ≤ t(α/2,n1 +n2 −2) ∨ Tcal ≥ t(1−α/2,n−1) }

H1 : µ1 − µ2 > d0 R.C. = {tcal ≥ t(1−α,n1 +n2 −2) }
H1 : µ1 − µ2 < d0 R.C. = {tcal ≤ t(α,n1 +n2 −2) }

Capítulo 4
Regresión Lineal
En estadística la regresión lineal o ajuste lineal es un modelo matemá-
tico usado para aproximar la relación de dependencia entre una variable
dependiente Y, las variables independientes X y un término aleatorio ε.
57
4. Regresión Lineal
4.1. Análisis de Correlación

Consideraremos ahora una medida del grado de asociación lineal entre
dos variables cuantitativas
4.2. Coeciente de Correlación Lineal

Sea (X, Y ) una variable aleatoria bivariada. La covarianza entre x e y
se dene como:
Cov(x, y) = IE{[x − IE(x)][y − IE(y)]}
en forma equivalente se tiene:
Cov(x, y) = IE(xy) − IE(x)IE(y) (4.1)
Se dene el coeciente de correlación lineal de Pearson como:
cov(x, y)
ρ= , −1 < ρ < 1 (4.2)
σx σy
Sea (x1 , x1 ),. . . (xn , yn ) una muestra de tamaño n. El estimador de ρ

es el coeciente de correlación muestral r dado por:

P P P
xy − x y n
rxy =p P P p P P (4.3)
x x2 − ( x)2 y y 2 − ( y)2
4.3. Regresión Lineal Simple

Ahora consideraremos una técnica para estudiar la forma de relación
entre dos variables, conocida como análisis de regresión.
Sea (xi , yi ), i = 1, . . . , n una muestra de observaciones bi-variadas, y
supongamos que nos interesa predecir Y a partir de X . El propósito puede

ser:
1. Encontrar un modelo que describa la forma que X afecta a Y.
2. Ajustar una función de X para predecir Y, sin preocuparnos del
modelo.
y i = β 0 + β 1 xi + εi (4.4)
Donde:
• yi : Variable respuesta o dependiente (es aleatoria).
• xi : Variable independiente, explicativa o regresor, y puede ser ja
o controlada por diseño, o v. a.
• εi : Variable aleatoria, que representa un error, y es independiente
de x.
• β0 : Parámetro, denominado intercepto, que representa el nivel glo-
bal de respuesta o también se le conoce como valor basal y que
corresponde al valor de y cuando x = 0.
• β1 : Parámetro, denominado pendiente, que representa el cambio
esperado en y cuando x aumenta en una unidad.

La segunda clasicación importante es la de modelos de regresión sim-
ples o múltiples, de acuerdo al número de variables que explican a la
variable dependiente. Cuando solamente existe una variable explicativa
se llama a éste un modelo de regresión simple y cuando son varias se le
llama modelo de regresión múltiple.
V entast = β0 + β1 ∗ P ublicidadt + εt
La relación lineal entre las ventas (y) y los gastos en publicidad (x)
Ahora un modelo de Regresión Múltiple, seria por ejemplo.
La relación lineal entre el gasto en consumo de las familias (y) en fun-
ción del ingreso (x1 ), los activos nancieros de la familia (x2 ) y del tamaño
de la familia (x3 ).
Consumot = β0 + β1 ∗ Ingresot + β2 ∗ Activot + β3 ∗ tamañot + εt
Los parámetros β0 y β1 se obtienen mediante el estimadores de mínimos

cuadrados ordinarios (EMCO). Con un poco de trabajo se obtiene que:
yi = βb0 + βb1 xi + εi (4.5)
εi = yi − (βb0 + βb1 xi ) = yi − ybi (4.6)
βb0 = ȳ − x̄βb1 (4.7)
P P P P
(xi − x̄)(yi − ȳ) xi yi − ȳ xi xi yi − nxy
βb1 = 2 = P 2 = P 2 (4.8)
xi − nx̄2
P P
(xi − x̄) xi − x̄ xi
Ejemplo 4.3.1. Se seleccionó a 7 alumnas de la carrera de psicología
del 2013, quienes nos dieron sus datos de estatura (en cm) y de peso (en
kilos) y se obtuvo el siguiente gráco de dispersión.

Como se puede ver, es imposible describir todos los datos a través de
una sola recta que pase por todos los puntos, por lo tanto, debemos hallar
la ecuación de la recta que mejor se ajuste a dichos puntos.

Interpretación
• β0 : Si la estatura de una alumna es igual a cero, su peso promedio
sería de -45,276 gr.
• β1 : Por cada cm que aumente la altura de una estudiante, su peso
aumenta en promedio en 52,43 gr
4.4. Coeciente de determinación y Bondad

de ajuste
El siguiente gráco nos permite visualizar como se descompone la va-
rianza total de un modelo de regresión simple.

Luego para una muestra de n puntos se cumple que:
X X X
(yi − ȳ)2 = y − ȳ)2 +
(b (yi − yb)2 (4.9)
donde:
X
S.C.T. = (yi − ȳ)2 (4.10)
X
S.C.E. = (yi − yb)2 (4.11)
X
S.C.R. = yi − ȳ)2
(b (4.12)
Se puede demostrar que la variación total en la variable dependiente (y)

puede ser expresada en términos de la variación explicada y la variación
no explicada.
S.T.C. = S.C.E + S.C.R (4.13)
Dividiendo la igualdad anterior por S.C.T. y despejando S.C.R./S.C.T

se obtiene:
S.C.R. S.C.E.
=1− (4.14)
S.C.T. S.C.T
A esta expresión se le denomina coeciente de determinación (R2 ).
Este coeciente permite cuanticar la calidad el ajuste. Especícamente

indica el porcentaje de la variación total de la variable dependiente que
es explicada por el modelo ajustado. Por lo tanto.
yi − ȳ)2
P
S.C.R.
2 (b S.C.E.
R = =P ¯ 2
=1− (4.15)
S.C.T. (yi − (y)) S.C.T.
Observación 4.4.1.
1. 0 ≤ R2 ≤ 1
2. R2 = 1 signica un ajuste perfecto.
3. R2 =0 signica que no hay relación alguna entre la variable explica-
tiva x e y.
4. SCR = R2 ∗ SCT
R2 siempre se incrementa cuando se incluyen más variables al modelo.
El R2 ajustado considera el número de variables en un modelo,y por
tanto, puede disminuir.
S.C.E.
2
Rajus =1− −k−1
n (4.16)
S.C.T.
n−1
Donde k = número de variables independientes que incluye el modelo
Bondad de ajuste
Nos indica el porcentaje de las variaciones que no se explican por el
modelo ajustado, es decir, es la varianza inexplicada , o sea la varianza
de los residuos.
S.C.E. S.C.R.
Bon_Ajus = =1− = 1 − R2 (4.17)
S.C.T. S.C.T.

4.5. Pruebas de hipótesis para el modelo de

regresión lineal simple
yi = βb0 + βb1 xi + εi
La Regresión lineal normal clásica supone que cada i está normalmente
distribuida con:
• IE(ε) = 0.
• IE[ε − IE(ε)]2 = IE(ε2i ) = σ 2
• Cov(εi , εj ) = IE{[εi − IE(εi )][εi − IE(εj )]} = IE(εi , εj ) = 0, i 6= j
Por lo tanto:
εi ∼ N (0, σ 2 ) (4.18)
4.6. Dócima para βi

1. Para β1
σ2

βb1 ∼ N β1 ; P (4.19)
(xi − x̄)2
H0 : βb1 = 0 v/s Ha : βb1 6= 0 (4.20)
n o
R.C. = tcal < t(n−2; α2 ) ∨ tcal > t(n−2;1− α2 ) (4.21)
βb1 − β1
tcal = r (4.22)
2
P σε
(xi − x̄)2

yi − ybi
σε2 = Sxy
2
= (4.23)
n−2
2. Para β0
H0 : βb0 = 0 v/s Ha : βb0 6= 0 (4.24)
n o
R.C. = tcal < t(n−2; α2 ) ∨ tcal > t(n−2;1− α2 ) (4.25)
βb0 − β0
tcal = s (4.26)
2
σε2 1 x̄
n + P(xi − x̄)2
4.7. Análisis de varianza ANOVA

con los resultados anteriores se construye la siguiente tabla denominada
ANOVA (Analisys of Variance) que se puede obtener en Excel.
De la tabla ANOVA se desprende dos indicadores muy relevantes:
Test F

Permite llevar a cabo la prueba estadística para:
H0 : βb1 = 0 v/s Ha : βb1 6= 0 (4.27)
Bajo H0 ,
M.C.R.
F = ∼ F(1,n−2) (4.28)
M.C.E
Se rechaza la hipótesis nula para valores grandes, es decir, si:
Fcal > F(1,n−2,α) (4.29)
Para calcular FCal utilizamos la misma tabla ANOVA
4.8. Intervalos de conanza para los paráme-

tros
" s #
1 x̄2
I.C.βb0 = βb0 ± t( α ;n−2) +P (4.30)
2 n (xi − x̄)2
" #
σε2
I.C.βb1 = βb1 ± t( α ;n−2) pP (4.31)
2 (xi − x̄)2
Ejemplo 4.8.1.

Los siguientes datos, se dene:
o
X: temperatura máxima diaria (en C)
Y: demanda eléctrica promedio (en KW/hr).
Se pide lo siguiente:
1. Determinar un modelo de regresión lineal que permita estimar la
demanda en función de la temperatura. Interprete sus parámetros.
2. Calcular el coeciente de correlación y determinación, interpretando
los valores obtenidos
3. Realizar una prueba de hipótesis para β1 ???

Utilizando Excel, obtenemos la siguiente tabla resumen:
Solución
Para 1) El modelo de regresión lineal simple es:
ybi = 211, 2 − 4, 8xi + εi (4.32)
El siguiente gráco generado en Excel, nos muestra la recta de ajustada
de regresión, la ecuación de regresión y el coeciente de terminación.

La interpretación de los parámetros del modelo.
• Para una temperatura de 0, la demanda es de 211,21 KW
• Por cada grado que aumente la temperatura, se espera que la de-
manda disminuya en -4,8 Kw
Para 2. Analizamos el R2 y R
R = −0, 96
Esto signica que existe una alta correlación lineal inversa entre las dos
variables.
R2 = 0, 92
Por lo tanta el 92 % de la variabilidad de la demanda es explicada por
la variabilidad de x
Para 3) Analicemos se si cumple la hipótesis, para β1 , con α = 5%

utilizando t student.
3.1) Prueba de hipótesis
H0 : βb1 = 0 v/s Ha : βb1 6= 0 (4.33)
3.2) R.C. n o
R.C. = tcal < t(n−2; α2 ) ∨ tcal > t(n−2;1− α2 )
De esto se tiene:
t(n−2; α2 ) = t(12;0,025) = −2, 1788, y t(n−2; 1−α ) = t(12;0,975) = 2, 1788

2
3.3) Para tcal tenemos:
βb1 − β1
tcal = r
2
P σε
(xi − x̄)2

Del modelo obtenido en a) se tiene que βb1 =-4,8

Ahora recordemos el estimador de σx2 es:
P
(xi − x̄i X
Sx2 = ⇒ (xi −x̄i = (n−1)∗Sx2 = (14−1)∗(5, 42)2 = 381, 89
n−1
A continuación debemos obtener el valor de Sxy Para esto debemos
considerar la igualdad: SCT = SCE + SCR Donde:
P
(yi − ȳi S.C.T.
Sy2 = =
n−1 n−1
Esto implica que:
S.C.T. = (n − 1) ∗ Sy2 = (14 − 1) ∗ (27,0 6)2 = 9,519, 17
S.C.R. = R2 ∗ S.C.T = 9,519, 17 = 0, 92 ∗ 8,757,64
De esto se tiene que:
S.C.E. = S.C.T. − S.C.R. = 9,519, 17 − 8,757, 64 = 761, 53
(yi − ybi )2
P
2 S.C.E.
⇒ Sxy = =
n−1 n−1
2 751, 53 p
⇒ Sxy = ≈ 58, 58 ⇒ Sxy = 58, 58 =≈ 7, 65
13
Por lo tanto:
−4, 8 − 0
tcal = =≈ −12, 25
√ 7, 65
381, 19
3.4) Se analiza el cumplimiento de la R.C.
Como tcal < t, entonces se rechaza H0

Por lo tanto, hay regresión, es decir, el modelo ajustado es bueno
para estimar los valores de la demanda a partir de la temperatura.
Salida Excel

Con la tabla ANOVA podemos:
a) Estimar σ 2 =⇒ M.C.E. = 67, 98
b) H0 : No existe regresión v/s H1 : existe regresión
Fobs = 138, 8
V alor − p = 5, 93 × 10−8 < α = 0, 05
Por lo tanto, se rechaza H0 , es decir, existe regresión x explica
signicativamente el comportamiento de y
c) Coeciente de determinación:
R2 = 0, 92
Es decir, la variabilidad de y es explicada en un 92 % por la varia-
bilidad de x.
d) Con un 95 % de conanza se puede armar que:
β0 ∈ [193, 84 ; 228, 58]
β1 ∈ [−5, 674 ; −3, 9]

4.9. Ejercicios
1. Un centro comercial sabe en función de la distancia, en kilómetros,
a la que se sitúe de un núcleo de población, acuden los clientes, en
cientos, que guran en la tabla:
a ) Calcular el coeciente de correlación lineal e interpretelo.
b ) Si el centro comercial se sitúa a 2 km, ¾cuántos clientes puede
esperar?.
c ) Si desea recibir a 5 clientes, ¾a qué distancia del núcleo de
población debe situarse?. (Respuesta: 24,96 km)
2. Especique y estime un modelo econométrico que explique el con-
sumo agregado ct en función del ingreso disponible tt , de acuerdo
a la información como datos de corte transversal que se entrega.
Explique sus resultados en términos de la teoría económica.
10
X 10
X 10
X
yt = 1700, ct = 1110, ct yt = 205500
t=1 t=1 t=1
10
X 10
X
yt2 = 322000, c2t = 132100, t = 1, . . . , 10
t=1 t=1
3. Los siguientes datos corresponden a una estimación de la Ingresos
por Ventas de una empresa (Y ) y el Número de Vendedores (X),

para el período Abril 2006 a Marzo 2007, ambos expresados en miles
de pesos.

X X
σ 2 = 80, 376431, x2i = 471, xi = 69
X X
yi xi = 3541, yi = 561
a ) Encuentre en modelo e interprete sus coecientes.
b ) Usted aceptaría con el modelo, justifoque
4. de la base de datos

Capítulo 5
Regresión Lineal Múltiple
En el modelo de regresión lineal múltiple se utilizan muchas variables
independientes (continuas o discretas) para predecir o explicar la varia-
ción de una variable dependiente (continua).
Utilizamos la regresión múltiple para tratar de seleccionar cuáles de
ellas, en realidad, explican la variación de la variable dependiente.
Posiblemente esta técnica sea una de las más extendidas en las más
variadas áreas, en especial, negocios, educación e ingeniería.
Simbólicamente, escribimos el modelo de regresión lineal múltiple de k

variables o predictores:
Yi = β0 + β1 X1i + β2 X2i + β3 X3i + . . . + βk Xki + ε (5.1)
Donde:
1. Y : variable dependiente.
2. X1i , X2i , . . . , Xki son las k variables predictoras.
3. ε: Error.
4. β0 : intercepto .
5. β1 , . . . , βk son las pendientes parciales.
75
5. Regresión Lineal Múltiple
Supuestos
Los supuestos formales del modelo de regresión lineal múltiple son:
1. E(ε) = 0 y que las Xj son linealmente independientes.
2. V ar(εi ) = σ 2 (homocedasticidad)
3. Cov(εi , εj ) = 0 para todo i 6= j (independencia)
El modelo normal implica que εi son i.i.d. N (0, σ 2 ).
Estimación
Al igual que en el modelo de regresión lineal simple, la solución de míni-
mos cuadrados permite obtener estimadores de los parámetros betas. Es
decir, nos interesa determinar los betas que minimizan S(β), es decir:
∂S(β)
= 0|βi =βbj , i = 1, . . . , n
∂βi
Generalmente, la solución se presenta en términos matriciales. Así, el
modelo se escribe en términos del vector Y, matriz de diseño X, vector
de parámetros β y vector de errores ε, como:
La solución o EMCO de b se obtiene minimizando S(β). Sin embargo,

S(β) =|| Y − Xβ ||= (Y − Xβ)T (Y − Xβ) (5.2)
Por tanto, al derivar, igualar a cero y despejar se obtiene la Matriz de
los parámetros:
βb = (XT X)−1 XT Y (5.3)
Siempre que (XT X) tenga inversa, por tanto es condición necesaria que
X sea de rango completo.
Ahora, es necesario estimar la matriz de varianza covarianza de los
parámetros. Esta es la siguiente:
V ar − Cov(β) b2 (XT X)−1

b =σ (5.4)
Donde:
YT Y − βbT XT Y
b2 =
σ (5.5)
n−k
La matriz de los parámetros y la matriz de varianza covarianza se
utilizan para hacer pruebas de hipótesis respecto de los parámetros (test
de signicancia individuales)
Ejemplo 5.0.1.
Se desea estudiar el consumo de petróleo destinado a calefacción reque-
rido por las familias. Se cree que los grados de temperatura y el grado de
aislamiento del desván explican el consumo. Se tomó una muestra de 15
familias, desde donde se extrajo la siguiente información:



Para realizar los tesis de signicancia individuales, necesitamos cono-
cer las desviaciones estándar de cada uno de los parámetros estimados:
Usando:

YT Y − βbT XT Y
b2 =
σ
n−k
Ahora, podemos calcular la matriz de var-cov de los parámetros esti-
mados, de esta manera, podemos encontrar las desviaciones estándar de
ellos: Usando:
V ar − Cov(β) b2 (XT X)−1

b =σ
La diagonal principal de la matriz var−cov(β), contiene a las varianzas

de los estimadores de los parámetros.
Así, las desviaciones estándar de los parámetros son:
p
σ
bβb0 = 444, 92 = 21, 0931
p
σ
bβb1 = 0, 11 = 0, 3362
p
σ
bβb0 = 5, 49 = 2, 3495

Tabla ANOVA Al igual que en el modelo de regresión lineal simple, la

partición de la variabilidad se vacía en una tabla denominada ANOVA
(Analisys of Variance)
De la misma forma que en el MRLS, de la tabla ANOVA se desprende
dos indicadores muy relevantes:
5.1. Test F
Permite llevar a cabo la prueba estadística para:
H0 : β1 = β2 = . . . = βk = 0
v/s
H1 : βj 6= 0
Se rechaza la hipótesis nula
R.C{Fcalc > Fα (k, n − (k + 1)}
Coeciente de Determinación (R2 )

El coeciente de determinación, más conocido como R2 permite cuan-
ticar la calidad del ajuste. Se dene como la razón entre la SCR y la
SCT , es decir,
(Yi − Yb̄ )2
P b
2 SCR SCE
R = =P 2
=1− (5.6)
SCT (Yi − Ȳ ) SCT
Generalmente, se expresa en términos porcentuales y mientras más cer-
ca del 100Nos será de mucha utilidad para optar en el proceso de selección
de modelos. Matricialmente, R2 lo podemos calcular como:
2 βbT XT Y − nȲ 2
R = (5.7)
YY Y − nȲ 2
R2 ajustado
La desventaja del R2 es que por lo general aumenta cuando se agrega
una variable al modelo, independiente del valor de la contribución de esa
variable. Su valor se dene como:
n−1
R̄2 = 1 − (1 − R2 ) (5.8)
n−k
Relación entre R2 y F
La estadística de prueba F , se puede expresar en términos R2 , mediante
la siguiente fórmula:
R2
k
F = 1−R2
(5.9)
n−k−1
SELECCIÓN DE MODELOS
Cuando se dispone de muchas variables explicatorias, existen métodos
que permiten seleccionar el mejor modelo:
1. Forward hacia adelante Se inicia con el modelo nulo Y =

β0 + ε, e incluye variables signicativas, una a una, hasta que no es
posible ingresar más. Es decir:

a ) Elegir la variable que más incremente la SCR, o equivalente-
mente entregue el mayor R2 .

b ) Elegir la variable que arroje el mayor incremento en el R2 , o en
la SCR (signicativa) en presencia de la variable seleccionada
en el paso 1.
c ) Este proceso se continua hasta que las variables incluidas sean
estadísticamente signicativas, es decir, los incrementos de
SCR o R2 sean signicativos.
2. Backward hacia atrás.

Usa los mismos conceptos del método Forward. Es decir,
a ) Se ajusta el modelo completo, es decir, aquel que incorpora
TODAS las variables explicatorias.
b ) Se busca la variable que MENOS aporta a la regresión (la
con mayor valor-p). Si el aporte no es signicativo, se elimina.
c ) Se ajusta el modelo con las variables que quedan y se itera el
paso 2, iterando hasta cuando NO HAY variables que puedan
ser eliminadas.
3. Selección de modelos
Como se indicó en los procesos de selección de modelos, un criterio
es el R2 , es decir, seleccionar el modelo de mayor R2 . sin embargo,

2
el coeciente R crece siempre. Por tanto, se recomienda utilizar
el coeciente de determinación corregido que se dene como:
n−1
R̄2 = 1 − (1 − R2 )
n−k
cuya característica es incrementarse sólo cuando variables signica-
tivas son incorporadas.
4. Test formal - comparación de modelos jerárquicos.

Para evaluar la contribución incremental de nuevas variables al mo-
delo se utiliza una prueba Fisher, deniendo la siguiente función
(usando el método forward):
Sea M1 el modelo más completo (más grande o más antiguo) e
interesa tomar decisión sobre un modelo reducido M2, es decir,
nos interesa contrastar las hipótesis
H0 : Cβ = 0, donde C representa restricciones sobre β, es decir, El
test para decidir sobre H0 , esta dado por:
(SCE(M 1)−SCE(M 2)) (R12 −R22 )

q p
F = SCE(M 1)
= (1−r12
(5.10)
(n−k−1) (n−k−1)
Donde:
q = número de regresores nuevos
R.C.{Fcal > Fα (q, n − k − 1)} (5.11)
5. Validez del Modelo

Por último, una vez que se ha escogido el mejor modelo debe rea-
lizarse un análisis de residuos que permiten VALIDAR el modelo.
Es decir, si los supuestos se cumplen. Se debe gracar los residuos
versus valores ajustados. Si estos no presentan patrones (tendencia,
anomalías, agrupaciones, etc.) el modelo es adecuado.
6. Problema y solución varianza no constante

Si se observa algún patrón en los residuos, debe buscarse la trans-
formación más adecuada. Transformaciones recurrente es logaritmo,
raíz cuadrada e inverso de la o las variables independiente.
7. Problema y solución anomalías

Debe ajustar con y sin los datos anómalos y discutir la pertinencia

8. Problema y solución autocorrelación

Generalmente, la solución pasa por a) incorporar la variable retar-
dada, o bien b) incorporar variables que reejen el efecto estacional
o de tendencia.
Ejemplo 5.1.1.
Nuestra primera aproximación al modelo, es a través de regresiones
simples, es decir, primeramente decimos que el consumo mensual de pe-
tróleo depende de la temperatura, luego de la cantidad de aislamiento y
nalmente de ambas variables predictoras (método forward).
1. Obtenemos el modelo de regresión lineal simple con la temperatura
promedio diaria (X1 ), utilizando el análisis de datos de Excel, o bien

con el gráco de dispersión.
Y el modelo es
Y = 43644 − 5, 46x1
2. Obtenemos el modelo de regresión lineal simple con la cantidad de
aislamiento en el desván (X2 ), utilizando el análisis de datos de
Excel, o bien con el gráco de dispersión.
Y el modelo es
Y = 345, 38 − 20, 35x1

Se puede observar que esta variable explica solo el 15,6 % de la
variabilidad de Y, por lo tanto, no es muy signicativo su aporte

3. Obtenemos el modelo de regresión lineal múltiple con las dos varia-
bles independientes, utilizando el análisis de datos de Excel, o bien
con el gráco de dispersión.
Y el modelo es:
Y = 562, 15 − 5, 44x1 + 20, 01x2
Podemos ver que al considerar ambas variables, el r2 ajustado au-
menta a un 95,92 %, en consecuencia, se deben considerar ambas
variables en el modelo
4. ¾Es signicativo cada uno de los parámetros del modelo?

Utilizaremos el Test t para cada uno de los estimadores de los pará-
metros y sus respectivas desviaciones estándar (Análisis individual).
Considere un α = 5%
Para β0 se tiene:
H0 : β0 = 0 v/s H1 : β0 6= 0 (5.12)
βb0 − β0 562, 12 − 0
tcal = = = 26, 65 (5.13)
σβb0 21, 0931

p − valor = 0, 0000 (5.14)
Para β1 se tiene:
H0 : β1 = 0 v/s H1 : β1 6= 0 (5.15)
βb1 − β1 −5, 44 − 0
tcal = = = 16, 17 (5.16)
σβb1 0, 3266
p − valor = 0, 0000 (5.17)
Para β2 se tiene:
H0 : β2 = 0 v/s H1 : β2 6= 0 (5.18)
βb2 − β2 −20, 01 − 0
tcal = = = 8, 54 (5.19)
σβb2 2, 3425
p − valor = 0, 0000 (5.20)
Por lo tanto, con un 5 % de signicancia, se puede armar que cada
variable es signicativa o bien tiene incidencia en el modelo
5. ¾ Los parámetros en su conjunto son signicativos? Utilizaremos el
test F para responder esta pregunta:
R2
k
F = (1−R2 )
(5.21)
(n−k−1)
El coeciente de determinación puede ser calculado como:
βbT XT Y − nȲ 2
R2 = (5.22)
YY Y − nȲ 2
Estos valores fueron calculados para la obtención de las varianzas
de los estimadores de los parámetros
931055, 88 − 703040, 45 228014, 63

R2 = = = 0, 96561 (5.23)
939175, 68 − 703040, 45 236135, 23
Adicionalmente, podemos calcular:

n−1 (15 − 1)
R̄2 = 1 − (1 − R2 ) = 1 − (1 − 0, 965612 ) = 0, 95988
n−k (15 − 3)
(5.24)
Por lo tanto, ahora procedemos a calcular el Test F:
a ) Planteamos la hipótesis nula versus la hipótesis alternativa.
H0 : β0 = β1 = β2 v/s H1 : β0 6= β1 6= β2 (5.25)
Lo anterior, indica que al menos un coeciente es distinto de
cero
b ) El estadígrafo a utilizar es:
0,96561
(3−1)
F(2;12) = (1−0,96561)
= 168, 4712 (5.26)
(15−3)
p − valor = 0, 0000 (5.27)
Por lo tanto, con 5 % de signicancia se puede armar que el modelo
los parámetros en su conjunto son signicativos
Todo este proceso, se puede hacer a través del análisis de datos de Excel,
el cuál nos entrega el siguiente resumen.


Capítulo 6
¾ Tesis o Informe ?
6.1. Informe
El informe es un documento escrito en prosa informativa (cientíca,
técnica o comercial) con el propósito de comunicar información del nivel
más alto en una organización.
Por consiguiente, reere hechos obtenidos o vericados por el autor
(reconocimientos, investigaciones, estudios o trabajos). Además, aporta
los datos necesarios para una completa comprensión del caso, explica los
métodos empleados y propone o recomienda la mejor solución para el
hecho tratado.
6.1.1. Tipos de informe

1. Por la materia que abarcan los informes se clasican en:
a ) Cientícos: se reeren a temas de ciencia y utilizan un lengua-
je propio y riguroso; pertenecen a la categoría de memorias
cientícas.
b ) Técnicos: se desarrollan en las organizaciones públicas o priva-
das sobre temas de sociología , antropología, psicología social,
91
6. ¾ Tesis o Informe ?
etc; su lenguaje es accesible, pero mantiene el rigor de la in-
vestigación cientíca.
c ) divulgación: destinados al público en general; su lenguaje se
adapta a una persona de mediana cultura.
d ) Mixtos: destinados tanto a instituciones como al público en
general; su lenguaje se adapta al de ambos grupos de destina-
tarios.
2. Por las características textuales los informes se clasican en:
a ) Expositivos: contienen una información, una descripción del
tema o unas instrucciones. No es necesario incluir conclusio-
nes, interpretación, o evaluación; a veces, reciben el nombre de
dossier.
b ) Analíticos: tienen como objetivo justicar una decisión o ac-
ción (ya realizada o, al menos, proyectada). (Ibídem). Se de-
nominan también propuesta o proyecto.
c ) Persuasivos: pretenden convencer al destinatario para que to-
me una decisión en la línea de lo que se expone en el informe.
Proponen un plan de acción (es el informe más utilizado en
consultoría).
6.1.2. Partes principales de un Informe

Tanto el informe como otros medios de comunicación tienen sus res-
pectivas partes como:
1. Portada.
2. Resumen.
3. Indice.
4. Introducción.

5. Objetivos.
a ) Objetivo General.
b ) Objetivos Especícos.
6. Alcances y limitaciones (opcional)
7. Desarrollo del informe (cuerpo).
a ) Planteamiento del problema.
b ) Desarrollo del problema.
c ) Solución del problema.
d ) Resultados del problema.
8. Conclusiones.
9. Bibliográca.
6.2. Tesis
La tesis es un texto que se caracteriza por aportar conocimiento e
información novedosa sobre un tema en particular.
1. Función del género en el medio académico.

Toda tesis parte de un problema o pregunta de investigación, donde
el objetivo principal es encontrar la respuesta objetiva y sistemática
con la cual se valorará la aportación del sustentante.
Es por eso que la tesis cumple con una variedad de funciones, como
por ejemplo:
a) Exponer
b) Argumentar,
c) Informar.

La tesis debe dar cuenta de hallazgos o aportes en el área que se
esta desarrollando.
2. Estructuras básicas para la construcción del género.

La estructuración de la tesis dependerá, fundamentalmente, de la
disciplina a la que pertenece (biología, literatura, lenguas, ingenie-
ría, etc.).
Normalmente, la tesis se divide en capítulos y apartados o subapar-
tados para facilitar su lectura.
Cada capítulo deberá estar enumerado y tener un título que espe-
cique su contenido.
En cuanto al estilo, la tesis será redactada con un lenguaje apropia-
do a la disciplina y objeto de estudio.
6.2.1. Partes de una tesis

1. Portada.
2. Dedicatoria.
3. Agradecimientos.
4. Resumen.
5. Índice.
6. Listas de tablas y guras.
7. Introducción.
8. Capitulo 1.
a ) Planteamiento del problema.
b ) Descripción del problema.
c ) Objetivos.

1) Objetivo General
2) Objetivos especícos.
a ) Hipótesis de investigación.
b ) Justicación del problema.
c ) Alcances.
d ) Delimitación.
9. Marco teórico ( Capitulo II).

En esta sección del trabajo, se describen y analizan los estudios
llevados a cabo previamente, que tienen relación con el objeto de
estudio. Algunos autores (Ibáñez Brambilla, 165) sugieren que la
extensión de este apartado sea de entre 25 y 40 páginas.
10. Metodología. (Capitulo III).

En esta parte de la tesis se reportan y se justican los métodos,
participantes e instrumentos utilizados para la investigación. La
descripción de la metodología debe ser breve y clara, ya que se
busca que otro investigador pueda repetir el estudio sin necesidad
de cuestionar al autor. En esta parte del proyecto, también suelen
describirse los métodos que se usarán en el análisis de datos.
11. Resultados.
12. Conclusiones.
13. Recomendaciones.
14. Referencias.
15. Apéndices.
Observación 6.2.1.
En la mayoría de los informe o tesis se utiliza la norma A.P.A.


Resumen Practico Teórico Proyecto de Ingeniería

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Resumen Practico Teórico Proyecto de Ingeniería

Enviado por

Direitos autorais:

Formatos disponíveis

Resumen Practico - Teórico

Willams A. Canales Verdugo

1.2. Tablas de Frecuencia . . . . . . . . . . . . . . . . . . . . . 5

1.3. Parámetros Estadísticos . . . . . . . . . . . . . . . . . . . 8

1.5. Ejercicios Aplicados - Tipo Pruebas . . . . . . . . . . . . . 16

2. PROBABILIDADES: MODELOS DISCRETOS Y CON-

2.2. Variable aleatoria . . . . . . . . . . . . . . . . . . . . . . . 23

2.3. Función de Probabilidad ó distribución de probabilidad . . 23

2.4. Función de distribución acumulada . . . . . . . . . . . . . 25

2.5. Esperanza (Media) - Varianza . . . . . . . . . . . . . . . . 25

2.6. Distribución Bernoulli . . . . . . . . . . . . . . . . . . . . 26

2.7. Distribución Binomial . . . . . . . . . . . . . . . . . . . . 26

2.8. Distribución de Poisson . . . . . . . . . . . . . . . . . . . . 27

2.9. Distribución Normal . . . . . . . . . . . . . . . . . . . . . 29

2.10. Distribuciones con Excel . . . . . . . . . . . . . . . . . . . 32

2.10.1. Binomial mediante Excel . . . . . . . . . . . . . . . 32

2.10.2. Possion mediante Excel . . . . . . . . . . . . . . . . 34

2.10.3. Normal mediante Excel . . . . . . . . . . . . . . . . 34

3. Concepto de Inferencia Estadística 37

3.2. Estimación por Intervalos de Conanza . . . . . . . . . . . 37

3.3. Determinación del Tamaño Muestral . . . . . . . . . . . . 40

3.4. Prueba de Hipótesis . . . . . . . . . . . . . . . . . . . . . . 43

3.5. Intervalo de Conanza - Prueba Hipótesis con Excel . . . . 48

3.5.1. Intervalo de Conanza con Excel . . . . . . . . . . 48

3.7. Dócima de Hipótesis para la Diferencia de dos Medias en

Poblaciones Normales (Comparación de dos Poblaciones

4.2. Coeciente de Correlación Lineal . . . . . . . . . . . . . . 58

4.3. Regresión Lineal Simple . . . . . . . . . . . . . . . . . . . 59

4.4. Coeciente de determinación y Bondad de ajuste . . . . . 62

4.5. Pruebas de hipótesis para el modelo de regresión lineal simple 65

4.6. Dócima para βi . . . . . . . . . . . . . . . . . . . . . . . . 65

4.7. Análisis de varianza ANOVA . . . . . . . . . . . . . . . . . 66

4.8. Intervalos de conanza para los parámetros . . . . . . . . 67

Resumen Practico - Teórico 2 William Canales Verdugo

5. Regresión Lineal Múltiple 75

6.1.1. Tipos de informe . . . . . . . . . . . . . . . . . . . 91

6.1.2. Partes principales de un Informe . . . . . . . . . . . 92

6.2.1. Partes de una tesis . . . . . . . . . . . . . . . . . . 94

Resumen Practico - Teórico 3 William Canales Verdugo

1.1. Conceptos Estadísticos

1.2. Tablas de Frecuencia

Tabla 1.1: Tabla de Frecuencia para Datos Cuantitativos Agrupados en

Intervalo Marcas Frecuencia frec. Frec. Frec. Rela.

1) Se ordena de Menor a Mayor.

2) Se busca el valor mínimo y el máximo: Xmin y Xmax

3) Se calcula el rango: es decir, Xmax − Xmin .

4) La cantidad de intervalos se calcula de la siguiente formula:

5) Se calcula la amplitud de cada intervalo con la siguiente ecuación:

Resumen Practico - Teórico 5 William Canales Verdugo

Por ejemplo si estudiamos las alturas de 15 personas, las cuales son:

Tabla 1.2: Tabla de Frecuencia para Datos Cuantitativos Agrupados en

Intervalo Marcas Frecuencia frec. Frec. Frec. Rela.

[150 - 160[ 155 n1 = 1 N1 = 1 n1 = 1/15

[170 - 180[ 175 n3 = 4 N3 = 8 n3 = 4/15

[180 - 190] 185 n4 = 7 N4 = 15 n4 = 7/15

Resumen Practico - Teórico 6 William Canales Verdugo

Tonemos la Tabla 1.2 de datos del apunte Resumen_clase_Proyecto_Ingeniería:

Tabla 1.3: Tabla de Frecuencia para Datos Cualitativos

Categoría o Clase i Concepto o Atributo ni fi fi % Fi Fi %

Categoría o Clase i Concepto o Atributo ni fi fi % Fi Fi %

2 Básica Completa 4 0,1 10 % 10 % 20 %

3 Media Incompleta 10 0,25 25 % 25 % 45 %

4 Media Completa 10 0,25 25 % 25 % 70 %

5 Universitaria Incompleta 1 0,025 2,5 % 2,5 % 72,5 %

3.2. Estimación por Intervalos de Conanza . . . . . . . . . . . 37

3.5. Intervalo de Conanza - Prueba Hipótesis con Excel . . . . 48

3.5.1. Intervalo de Conanza con Excel . . . . . . . . . . 48

4.2. Coeciente de Correlación Lineal . . . . . . . . . . . . . . 58

4.4. Coeciente de determinación y Bondad de ajuste . . . . . 62

4.8. Intervalos de conanza para los parámetros . . . . . . . . 67

Un gráco asociado a los cuartiles es el boxplot o gráco de caja.

c ) Identique el parámetro de interés.

d ) Identique el estadígrafo y su valor.

Una empresa lo contrata, con el nalidad de saber:

a ) Cual o cuales seria(n) el(los) gráco(s) más adecuado, para

estándar y coeciente de variación de Pearson, de las tres áreas.