Você está na página 1de 97

Resumen Practico - Teórico

Proyecto de Ingeniería

Autor:

Willams A. Canales Verdugo

Santiago, 2019
Índice general

1. Estadística Descriptiva 4
1.1. Conceptos Estadísticos . . . . . . . . . . . . . . . . . . . . 4

1.2. Tablas de Frecuencia . . . . . . . . . . . . . . . . . . . . . 5

1.3. Parámetros Estadísticos . . . . . . . . . . . . . . . . . . . 8

1.4. Grácos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

1.5. Ejercicios Aplicados - Tipo Pruebas . . . . . . . . . . . . . 16

2. PROBABILIDADES: MODELOS DISCRETOS Y CON-


TINUOS 21
2.1. Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.2. Variable aleatoria . . . . . . . . . . . . . . . . . . . . . . . 23

2.3. Función de Probabilidad ó distribución de probabilidad . . 23

2.4. Función de distribución acumulada . . . . . . . . . . . . . 25

2.5. Esperanza (Media) - Varianza . . . . . . . . . . . . . . . . 25

2.6. Distribución Bernoulli . . . . . . . . . . . . . . . . . . . . 26

2.7. Distribución Binomial . . . . . . . . . . . . . . . . . . . . 26

2.8. Distribución de Poisson . . . . . . . . . . . . . . . . . . . . 27

2.9. Distribución Normal . . . . . . . . . . . . . . . . . . . . . 29

2.10. Distribuciones con Excel . . . . . . . . . . . . . . . . . . . 32

1
ÍNDICE GENERAL

2.10.1. Binomial mediante Excel . . . . . . . . . . . . . . . 32

2.10.2. Possion mediante Excel . . . . . . . . . . . . . . . . 34

2.10.3. Normal mediante Excel . . . . . . . . . . . . . . . . 34

2.11. Ejercicio . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3. Concepto de Inferencia Estadística 37


3.1. Estimador y estimación de parámetros . . . . . . . . . . . 37

3.2. Estimación por Intervalos de Conanza . . . . . . . . . . . 37

3.3. Determinación del Tamaño Muestral . . . . . . . . . . . . 40

3.4. Prueba de Hipótesis . . . . . . . . . . . . . . . . . . . . . . 43

3.5. Intervalo de Conanza - Prueba Hipótesis con Excel . . . . 48

3.5.1. Intervalo de Conanza con Excel . . . . . . . . . . 48

3.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

3.7. Dócima de Hipótesis para la Diferencia de dos Medias en

Poblaciones Normales (Comparación de dos Poblaciones

Normales) . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4. Regresión Lineal 57
4.1. Análisis de Correlación . . . . . . . . . . . . . . . . . . . . 58

4.2. Coeciente de Correlación Lineal . . . . . . . . . . . . . . 58

4.3. Regresión Lineal Simple . . . . . . . . . . . . . . . . . . . 59

4.4. Coeciente de determinación y Bondad de ajuste . . . . . 62

4.5. Pruebas de hipótesis para el modelo de regresión lineal simple 65

4.6. Dócima para βi . . . . . . . . . . . . . . . . . . . . . . . . 65

4.7. Análisis de varianza ANOVA . . . . . . . . . . . . . . . . . 66

4.8. Intervalos de conanza para los parámetros . . . . . . . . 67

4.9. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

Resumen Practico - Teórico 2 William Canales Verdugo


ÍNDICE GENERAL

5. Regresión Lineal Múltiple 75


5.1. Test F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

6. ¾ Tesis o Informe ? 91
6.1. Informe . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

6.1.1. Tipos de informe . . . . . . . . . . . . . . . . . . . 91

6.1.2. Partes principales de un Informe . . . . . . . . . . . 92

6.2. Tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

6.2.1. Partes de una tesis . . . . . . . . . . . . . . . . . . 94

Resumen Practico - Teórico 3 William Canales Verdugo


Capítulo 1

Estadística Descriptiva

1.1. Conceptos Estadísticos


1. Población.

2. Muestra

3. Parámetro.

4. Estadígrafo o Estadístico.

5. Variable.

4
1. Estadística Descriptiva

1.2. Tablas de Frecuencia


a) Variables Cuantitativas.

b) Variables Cualitativos.

Tabla 1.1: Tabla de Frecuencia para Datos Cuantitativos Agrupados en

Intervalos de Clase

Intervalo Marcas Frecuencia frec. Frec. Frec. Rela.


de Clase de Clases Absoluta Acumulada Relativa Acumulada
[Linf − LSup [ mi ni Ni fi Fi fi % Fi %
[L1 − L2 [ m1 n1 N 1 = n1 f1 = nn1 F1 f1 % F1 %
[L2 − L3 [ m2 n2 N2 = n1 + n2 f2 = nn2 F1 + F2 f2 % F2 %
... ... ... ... ... ... ... ...
n
[Lj−1 − Lj [ mj nj Nj = (n1 + . . . + nj ) fj = nj F1 + . . . + Fj fj % Fj %
... ... ... ... ... ... ... ...
[Lk−1 − Lk ] mk nk n = (n1 + . . . + nk ) fk = nnk F1 + . . . + Fk fk % Fk %
Total n 1
Para realizar la tabla efectuamos los siguientes pasos:

1) Se ordena de Menor a Mayor.

2) Se busca el valor mínimo y el máximo: Xmin y Xmax

3) Se calcula el rango: es decir, Xmax − Xmin .

4) La cantidad de intervalos se calcula de la siguiente formula:

k = 1 + 3, 322 ∗ log(n)

5) Se calcula la amplitud de cada intervalo con la siguiente ecuación:

rango
c=
k

6) Se construye la tabla:

Resumen Practico - Teórico 5 William Canales Verdugo


1. Estadística Descriptiva

Por ejemplo si estudiamos las alturas de 15 personas, las cuales son:

150, 165, 165, 166, 171, 171, 175, 176, 180, 180, 180, 180, 181, 181, 190

Tabla 1.2: Tabla de Frecuencia para Datos Cuantitativos Agrupados en

Intervalos de Clase

Intervalo Marcas Frecuencia frec. Frec. Frec. Rela.


de Clase de Clases Absoluta Acumulada Relativa Acumulada
[LInf − LSup [ mi ni Ni fi Fi fi % Fi %

[150 - 160[ 155 n1 = 1 N1 = 1 n1 = 1/15


n F1 = 0,06 6,66̄ % 6,66̄ %
[160 - 170[ 165 n2 = 3 N2 = 4 n2 = 3/15
n F2 = 0,26 20 % 26.66 %

[170 - 180[ 175 n3 = 4 N3 = 8 n3 = 4/15


n F3 = 0,53 ¯ %
26, 66 53.3 %

[180 - 190] 185 n4 = 7 N4 = 15 n4 = 7/15


n F4 = 1 46, 6̄ % 100 %

Total 15 1

Interpretación ???

Resumen Practico - Teórico 6 William Canales Verdugo


1. Estadística Descriptiva

Tonemos la Tabla 1.2 de datos del apunte Resumen_clase_Proyecto_Ingeniería:

Tabla 1.3: Tabla de Frecuencia para Datos Cualitativos

Categoría o Clase i Concepto o Atributo ni fi fi % Fi Fi %


1 c1 n1 f1 f1 % f1 % F1 %
2 c2 n2 f2 f2 % f2 % F2 %
. . . . . . .
. . . . . . .
. . . . . . .

j cj nj fj fj % fj % Fj %
. . . . . . .
. . . . . . .
. . . . . . .

k ck nk fk fk % fk % Fk %
total n 1 100 %

Categoría o Clase i Concepto o Atributo ni fi fi % Fi Fi %


1 Básica Incompleta 4 0,1 10 % 10 % 10 %

2 Básica Completa 4 0,1 10 % 10 % 20 %

3 Media Incompleta 10 0,25 25 % 25 % 45 %

4 Media Completa 10 0,25 25 % 25 % 70 %

5 Universitaria Incompleta 1 0,025 2,5 % 2,5 % 72,5 %

6 Técnico Universitario 8 0,2 20 % 20 % 92,5 %

7 Universitaria Completa 3 0,075 7,5 % 7,5 % 100 %

total n = 40 1 100 %

Interpretación ???

Resumen Practico - Teórico 7 William Canales Verdugo


1. Estadística Descriptiva

1.3. Parámetros Estadísticos

1. Parámetro Centralización

a ) Moda :

Es el valor con mayor frecuencia.

Datos tabulados: Para buscar la moda se utiliza la siguiente

formula.

n(i) − n(i−1)
 
M o = LInf + C ∗ (1.1)
(n(i) − n(i−1) ) + (n(i) − n(i+1) )

Resumen Practico - Teórico 8 William Canales Verdugo


1. Estadística Descriptiva

Tabla 1.4: Tabla de Frecuencia para Datos Cuantitativos Agrupados en

Intervalos de Clase

[LInf − LSup [ mi ni Ni fi Fi fp % Fp %

[150 - 160[ 155 1 1 1/15 0,06 6,66̄ % 6,66̄ %

[160 - 170[ 165 3 4 3/15 0,26 20 % 26.6 %

[170 - 180[ 175 4 8 4/15 0,53 26, 6̄ % 53.3 %

[180 - 190] 185 7 15 7/15 1 46, 6̄ % 100 %

Total 15 1

 
7−4
M o = 180 + 10 ∗
(7 − 4) + (7 − 0)
 
3
M o = 180 + 10 ∗
10
M o = 180 + 3 = 183

Por lo tanto 183 valor más repetido.

b ) Mediana

Acumula el 50 % de los datos observados

1) Datos Sueltos


 X n + 1  , n par
2



Me = (1.2)


 X n + X n +1 , n impar

  
2 2
2) Datos Tabulados

n −N !
2 (i−1)
M e = LInf + C ∗ (1.3)
n(i)

Resumen Practico - Teórico 9 William Canales Verdugo


1. Estadística Descriptiva

Ejemplo 1.3.1. Consideremos la siguiente tabla de fre-

cuencia.

Tabla 1.5: Tabla de Frecuencia

[LInf − LSup [ mi ni Ni

[150 - 160[ 155 1 1

[160 - 170[ 165 3 4

[170 - 180[ 175 4 8

[180 - 190] 185 7 15

Total 15

Como
n = 7, 5 ≈ 8, en la columna Ni , el tercer intervalo
2
que se encuentra el 8, El calculo de la media sería:

15 − 4 !
M e = 170 + 10 ∗ 2
4
M e = 170 + 10 ∗ (0, 875)
M e = 178, 75
Por lo tanto, la estatura media sería 178,75 cm

c) Media Aritmética (X)

1) Datos Sueltos:

n
P
xi
i=1
X= (1.4)
n
Resumen Practico - Teórico 10 William Canales Verdugo
1. Estadística Descriptiva

2) Datos Tabulados:

k
P
mi ∗ ni
i=1
X= (1.5)
n
Si k número de intervalos.

2. Parámetro Dispersión

a) Varianza
1) Datos Sueltos

0
a Varianza Poblacional

n n
(xi − x)2 x2i
P P
i=1 i=1
σ2 = = − x2 (1.6)
n n
0
b Varianza Muestral

n n
(xi − x)2 x2i − nx2
P P
i=1 i=1
S2 = = (1.7)
n−1 n−1
2) Datos Tabulados

0
a Varianza Poblacional

k
(mi − X)2 ∗ ni
P
i=1
σ2 = (1.8)
n
con k número de intervalos

0
b Varianza Muestral

k
(mi − X)2 ∗ ni
P " k #
i=1 1 X 2
S2 = = m2 ∗ ni − n ∗ X
n−1 n − 1 i=1 i
(1.9)

con k número de intervalos

Resumen Practico - Teórico 11 William Canales Verdugo


1. Estadística Descriptiva

b) Desviación estándar :
Se dene como la raíz de la Varianza.

√ √
S= S2 ∨ σ= σ2

De uso más frecuente que la Varianza, se obtiene a partir de

ésta:

Si los datos no están agrupados:

v
u n
uP
√ u (xi − x)2
S = S 2 = i=1
t
n−1
Si los datos están agrupados:

v
u k
u (mi − x)2 ∗ ni
uP
√ t i=1
S= S2 =
n−1
c) Coeciente de variación (C.V.)

S
C.V. = ∗ 100 (1.10)
X




 M enor 30 %, Homogéneo







 30 % < C.V. < 50 %, Tiende Homog.
C.V = (1.11)




M ayor 50 % Heterogéneo






3. Percentil

Resumen Practico - Teórico 12 William Canales Verdugo


1. Estadística Descriptiva

Pα : punto que concentra el α% inferior de la distribución de fre-

cuencias, con α = 1, 2, . . . , 99.

α∗n −N !
100 i−1
Pα = Linf + C (1.12)
ni

4. Quintil

Kα : punto que concentra el α% inferior de la distribución de fre-

cuencias, con α = 1, 2, . . ..

Particiona a una distribución en 5 partes iguales, agrupan 20 % c/u

(son 4)

α∗n −N !
5 i−1
Kα = Linf + C (1.13)
ni

5. Cuartil

Qα : punto que concentra el α% inferior de la distribución de fre-

cuencias, con α = 1, 2, . . .

Particiona a una distribución en 4 partes iguales mediante los puntos

Q1 , Q2 y Q3 , llamado primer cuartil, segundo cuartil y tercer cuartil.

α∗n −N !
4 i−1
Qα = Linf + C (1.14)
ni

Notemos que D1 = P10 ; P50 = D5 = Q2 = M e; P75 = Q3 , etc.

1.4. Grácos

Resumen Practico - Teórico 13 William Canales Verdugo


1. Estadística Descriptiva

Tipo de variable Diagrama

Variable Cualitativa Barras, Sectores, Pictogramas, Barras subliminales

Variable Discreta Barras, Histograma, Histograma %, Sectores

Variable Continua Histograma, Polígono de frecuencia

Tallo y hojas , Nubes

Importante:

Un gráco asociado a los cuartiles es el boxplot o gráco de caja.

Una regla para determinar si un dato es anómalo es:

1. Si un dato es < Q1 − 1, 5(Q3 − Q1 )

2. Si un dato es > Q3 + 1, 5(Q3 − Q1 )

Ejemplo:

El precio de un interruptor en 10 comercios de electricidad de una

ciudad son : 25, 25, 26, 24, 30, 25, 29, 28, 26, y 27 en miles de pesos.

Resumen Practico - Teórico 14 William Canales Verdugo


1. Estadística Descriptiva

Hallar la media, moda, mediana, (diagrama de barras y el diagrama de

caja.

Resumen Practico - Teórico 15 William Canales Verdugo


1. Estadística Descriptiva

1.5. Ejercicios Aplicados - Tipo Pruebas


1. Un analista realiza una investigación sobre la tendencia política para

las próximas elecciones presidenciales, para lo cual administra una

encuesta de opinión a 1.000 personas en edad de votar e inscritas

en el padrón electoral, sobre la preferencia del candidato. De esta

encuesta se obtuvo que el 45 % vota por el candidato y que solo el

5 % no, mientras que el resto no sabe.

a ) ¾ Cuál es la población de estudio?

b ) ¾ Cuál es la muestra?

c ) Identique el parámetro de interés.

d ) Identique el estadígrafo y su valor.

2. En los últimos 40 meses, una empresa ha dividido su tasa de riesgo

en tres grandes áreas, ver base datos_clases.xls, pestaña Indice_Riesgo

Donde:

A es el índice de riesgo en Administración y Finanzas.

B es le índice de riesgo en Recursos Humanos.

C es el índice de riesgo en Ciencia e Investigación.

Una empresa lo contrata, con el nalidad de saber:

a ) Cual o cuales seria(n) el(los) gráco(s) más adecuado, para

representar el indice de riesgo de las tres áreas durante los

40 meses baso estudio. (Interprete todos sus resultados y los

grácos).

b ) Utilizando las funciones estadísticas de Excel, calcular: media,

mediana, la moda, percentil 25, cuartil 3, varianza, desviación

estándar y coeciente de variación de Pearson, de las tres áreas.

Interprete los valores obtenidos.

c ) ¾ Cual de las tres áreas es menos riesgosa?.

Resumen Practico - Teórico 16 William Canales Verdugo


1. Estadística Descriptiva

d ) Calcule el coeciente de variación para el índice de riesgo en

Recursos Humanos ¾ Existirá alguna diferencia entre datos

agrupado y no agrupados?

3. Abel Grandes Pregunto a sus compañeros de clase que nota obtu-

vieron en el último examen de estadística. Solo recuerda que el que

aprobó con la nota mediana de 5,6666667 y a su compañero que

tuvo un 4,6 (una de las nota más frecuente). Y, haciendo memoria,

ha podido completar los siguientes datos:

Notas de Número de

Estadísticas Alumnos

0 - 4 8

4 - 5 n2
5 - 7 8

7 - 9 6

9 - 10 6

a ) ¾ Qué proporción de alumnos ha obtenido una nota superior a

7?

b ) ¾ Cómo es la distribución respecto a la moda?

c ) ¾ Las notas son homogéneas?

4. En la base de datos Base datos_clases.xls, pestaña Base_2 contiene

la información respecto de la Edad, Sexo, Estado Civil, Actividad

Actual, Comuna, Año del Vehículo, Región, Deuda, mes de naci-

miento, Numero de Hijos(as), de 100 personas

a ) ¾ La deuda es homogénea?.

b ) Construya un gráco comparativo y tablas que muestre el pro-

medio de deudas por sexo, (Indicación: realice la comparación

porcentual y numérica, utilice tablas dinámicas)

c ) Utilizando una tabla dinámica realice un gráco (optimo) de

los Quintiles de la deuda.

Resumen Practico - Teórico 17 William Canales Verdugo


1. Estadística Descriptiva

d ) Utilizando una tabla dinámica realice un gráco (optimo) de

los Quintiles de la deuda v/s Sexo.

e ) En promedio, cual es la deuda para las comunas de la región

Metropolitana. Ademas realice una comparación gratica

f ) Quienes tienen mayor y menor deuda, los solteros, casados, o

viudos, Comente sus resultados.

g ) En que comuna tienen mayor y menor deuda según sexo y

estado civil.

h ) ¾ Que edad tiene el 50 % de los datos?

i ) ¾ En promedio de la deuda supera al 50 % de la deuda?

5. La siguiente tabla muestra la distribución de los gastos en publici-

dad de 60 empresas manufactureras.

o
Gastos en publicidad N de empresas

en (MM$) (ni )
0 - 5 8

5 - 10 10

10 - 15 11

15 - 20 15

20 - 25 13

25 - 35 10

a ) Determine el gasto promedio en publicidad.

b ) Hallar e interpretar el P25 y Q3 .


c ) ¾ Los datos son homogéneos?

6. Se llevó a cabo un estudio a 67 empresas del rubro nanciero, res-

pecto al tiempo que llevan operando en el mercado de nanciero

en años, el siguiente cuadro muestra los resultados obtenidos en el

estudio.

Resumen Practico - Teórico 18 William Canales Verdugo


1. Estadística Descriptiva

Años en mercado nanciero Número de empresas

0 - 5 8

5 - 10 10

10 - 15 11

15 - 20 15

20 - 25 13

25 - 35 10

a ) Reconozca y clasique la (s) variable (s) en estudio según tipo

y escala.

b ) Si se realiza otro estudio a un nuevo grupo de 67 empresas, el

tiempo registrado que llevan las empresas de este nuevo estudio

es de 17,6 (años), ¾cuál es el tiempo promedio total?

c ) El 16 % superior de los años en el rubro del mercado se en-

cuentran catalogadas como empresas de clase A. ¾ Cuántas

empresas se puede clasicar de Clase A?

d ) El tiempo es homogéneo con respecto a la cantidad de empre-

sas.

7. Un profesor está interesado en estudiar los hábitos del sueño de los

estudiantes en sus clases. El profesor registra el tiempo (en minutos)

que demoran en quedarse dormidos sus alumnos desde que empieza

la clase. Los datos del Profesor son los siguientes

20,8 11,3 14,2 12 12,3 12,5 12,7 13,4

13,7 13,8 11,9 14,8 15,1 15,3 16,7 10,5

a ) Dibuje un diagrama de caja. Comente el resultado acerca de

la distribución.

b ) Usted cree que solo basta con el grácos de cajas para anali-

zar el comportamiento de la distribución, en caso negativo que

otro gráco podría explicar el comportamiento de la distri-

bución.(Indicación: Realice los cálculos y grácos pertinentes,

comente todos sus resultados ).

Resumen Practico - Teórico 19 William Canales Verdugo


1. Estadística Descriptiva

c ) ¾ Qué porcentaje de alumnos se queda dormido antes de los

12,3 minutos?

8. La siguiente gráca representa la tasa regional de sindicalización del

años 2014

a ) ¾ Cuál es la tasa regional promedio de sindicalización ?

b ) En promedio las tasas regionales de sindicalización en 2014, se

encuentra sobre el 50 % del total de los sindicalizados.

Resumen Practico - Teórico 20 William Canales Verdugo


Capítulo 2

PROBABILIDADES:
MODELOS DISCRETOS Y
CONTINUOS

2.1. Probabilidad
Sea:

1. Espacio Muestral Ω: Conjunto formado por todos los resultados

posibles de un experimento aleatorio

2. A un evento cualquiera de un espacio muestral Ω

no Casos Faborables #A
IP (A) = o = (2.1)
n Casos Totales #Ω
Propiedades:

1. P(A) ≥ 0, ∀A

2. P(Ω) = 1

21
2. PROBABILIDADES: MODELOS DISCRETOS Y CONTINUOS

3. P(∅) = 0

4. P(Ac ) = 1 − P(A), ∀A

5. Si A1 ∩ A2 = ∅ =⇒ P(A1 ∪ A2 ) = P(A1 ) + P(A2 )

6. Si A ≤ B =⇒ P(A) ≤ P(B)

7. P(A ∪ B) = P(A) + P(B) − P(A ∩ B)


P(A ∩ B)
8. P(A/B) = , si P(B) > 0
P(B)
9. P(A ∩ B) = P(A) ∗ P(B). Sucesos independientes ( P(A/B) = P(A)
ó P(B/A) = P(B))

Ejemplo 2.1.1. Sea Extraer una carta de un juego de naipe español

de 40 cartas el espacio muestral y los eventos A =Obtener un oro,

B =Obtener un rey, C= Obtener un uno de espadas y D =Obtener


guras

i) Cuál es la probabilidad que sea oro o sea rey, pues A ∩ B =Obtener


rey de oros

10 4 1 13
P(A ∪ B) = P(A) + P(B) − P(A ∩ B) = + − =
40 40 40 40

ii) Cuál es la probabilidad que sea oro o sean guras, A ∪ D =obtener


gura de oros.

10 12 3 19
P(A ∪ D) = P(A) + P(D) − P(A ∩ D) = + − =
40 40 40 40

iii) Cuál es la probabilidad que sea oro o un uno de espadas.

10 1 0 11
P(A ∪ C) = P(A) + P(C) − P(A ∩ C) = + − =
40 40 40 40

Resumen Practico - Teórico 22 William Canales Verdugo


2. PROBABILIDADES: MODELOS DISCRETOS Y CONTINUOS

2.2. Variable aleatoria


Una Variable Aleatoria (V.A.) es una función que le asigna un número

real a cada elemento del espacio muestral.

1. Variables aleatorias discretas (V.A.D.): son aquellas que toman un

número nito o innito numerable de valores Ejemplo: número de

correos electrónicos que recibe diariamente una persona, número de

cheques protestados en una sucursal bancaria, etc.

2. Variables aleatorias Continuas (V.A.C.): son aquellas que toman un

número innito de valores dentro de un intervalo. Ejemplo: Pesos de

los recién nacidos en un hospital, tiempo de duración de un proceso

de análisis contable, etc.

2.3. Función de Probabilidad ó distribución


de probabilidad
Es aquella función que le asigna a cada valor de una variable aleatoria,

su respectiva probabilidad Se designa por f (x).

Ejemplo 2.3.1. Un experimento aleatorio consiste en probar tres ampo-

lletas.

Se dene la v.a. A= número de ampolletas defectuosas.

El espacio muestral de este experimento es el siguiente:

Ω = {(N, N, N ), (D, N, N ), (N, D, N ), (N, N, D), (N, D, D), (D, N, D), (D, D, N )(D, D, D)}

Resumen Practico - Teórico 23 William Canales Verdugo


2. PROBABILIDADES: MODELOS DISCRETOS Y CONTINUOS

Donde N: no defectuosa y D: defectuosa Luego X = 0, 1, 2, 3

Podemos representar con el siguiente diagrama:

Entonces si se eligen 3 ampolletas al azar y se van probando de a una,

¾ cuál es la probabilidad de obtener una defectuosa?

Como X = número de ampolletas defectuosas, entonces su función de

probabilidad es :

Propiedades

1. f (x) > 0
P
2. f (x) = 1

3. f (x) = IP (X = x)

Resumen Practico - Teórico 24 William Canales Verdugo


2. PROBABILIDADES: MODELOS DISCRETOS Y CONTINUOS

Observación

1. Si X es una V.A.D., f (x) se denomina función de cuantía .


2. Si X es una V.A.C., f (x) se denomina función de densidad .

2.4. Función de distribución acumulada


Se X es una V.A.D. con función de distribución f (x) La función de

distribución acumulada F (x), se dene como:

X
F (x) = IP (X ≤ x) = f (t) (2.2)
x≤t

En el ejemplo anterior, calcular la probabilidad de obtener a lo más 2

ampolletas defectuosas

1 3 3 7
F (2) = IP (X ≤ 2) = IP (X = 0)+IP (X = 1)+IP (X = 2) = + + =
8 8 8 8

2.5. Esperanza (Media) - Varianza


Sea X es una V.A.D. con función de distribución f (x)

1. Esperanza de X
n
X
E(X) = µ = xi f (xi ) (2.3)
i=1

2. Varianza de X
n
X n
X
2 2
Var(X) = σ = (xi −µ) = x2i f (xi )−µ2 = E(x2i )−µ2 (2.4)
i=1 i=1

Teorema 2.5.1. Sea X una variable aleatoria (continua o discreta). Con-


sideremos dos funciones de X , H(X) y G(X), y sea k una constante.

Entonces

Resumen Practico - Teórico 25 William Canales Verdugo


2. PROBABILIDADES: MODELOS DISCRETOS Y CONTINUOS

a) E[K] = k

b) E[kH(X)] = kE[H(X)]

c) E[H(X) + G(X)] = E[H(X)] + E[G(X)]

Teorema 2.5.2. Sea X una variable aleatoria con media µ y varianza


2
σ . Entonces,

a) V ar(K) = 0

b) V ar(X + k) = V ar(X) = σ 2

c) V ar(Xk) = k2 V ar(X) = k2 σ 2

Ejemplo 2.5.1. ¾ Calcular la esperanza y varianza del ejemplo 2.3.1?

2.6. Distribución Bernoulli


Este tipo de experimento con sólo dos posibles resultados se denomi-

na Ensayo Bernoulli y sus eventos elementales comúnmente llamados

éxito o fracaso y su función de probabilidad esta dada:

PX (X) = pX q 1−X , X = 0, 1, donde p+q =1 (2.5)

2.7. Distribución Binomial


Una variable que corresponda con esas características se denomina bi-

nomial B(n, p), siendo n el número de pruebas realizadas y p la probabi-

lidad de éxito. La probabilidad de r éxitos se calculará:

X ∼ Bi(n; p)

!
n
IP (X = a) = pa q n−a , a = 0, 1, 2, . . . , n (2.6)
a

Resumen Practico - Teórico 26 William Canales Verdugo


2. PROBABILIDADES: MODELOS DISCRETOS Y CONTINUOS

La media, Varianza y desviación típica se calcula:


E(X) = np, V ar(X) = npq, σ= npq (2.7)

Ejemplo 2.7.1. En un banco comercial, en el proceso de análisis de cré-

ditos, el 12 % de las solicitudes que llegan en una semana, son rechazadas

por falta de antecedentes del solicitante. Si en una semana llegan 25 solici-

tudes, ¾ Cuál es la probabilidad de que se rechacen menos de 2 solicitudes

en una semana por falta de antecedentes del solicitante?

Solución :

Sea X = no de solicitudes rechazadas semanalmente por falta de antece-

dentes del solicitante

X ∼ Bin(n = 25; p = 0, 12)

2.8. Distribución de Poisson


En un proceso de Poisson de parámetro µ, si X es el número de ocu-

rrencias de un evento en un intervalo de longitud t, entonces X se llama

variable aleatoria Poisson de parámetro µt = λ

X ∼ P(λ)

λa e−λ
IP (X = a) = , a = 0, 1, · · · (2.8)
a!
Resumen Practico - Teórico 27 William Canales Verdugo
2. PROBABILIDADES: MODELOS DISCRETOS Y CONTINUOS

La media y Varianza se calcula:

IE(X) = λ ∧ V ar(X) = λ (2.9)

Ejemplo 2.8.1. Supongamos que clientes llegan a una cola de espera a

una tasa de 4 por minuto. Suponiendo que este proceso de llegada ocurre

a un proceso de Poisson, determinemos la probabilidad que al menos una

persona llegue a la cola en un intervalo de 1/2 minuto.

Sea X el número de personas que llegan a la cola en 1/2 minuto. Si

tomamos 1 minuto como unidad de tiempo tenemos λ = 4 y luego el

número medio de llegadas en 1/2 minuto es 2. Por lo tanto, X ∼ P (λ = 2)


y
2a e−2
IP (X = a) = , x = 0, 1, 2, · · ·
a!
De donde la probabilidad que llegue al menos una persona durante un

periodo de 1/2 minuto es:

IP (x > 1) = 1 − IP (X < 1) = 1 − IP (X = 0) = 1 − e−2 = 0, 865

Observación 2.8.1. Haciendo np = λ, la distribución Poisson puede

ser usada como una aproximación Binomial con parametro n y p, cuando

n > 20 y p 6 0, 05, es decir,

Si X ∼ Bin(n, p), con n > 20 y p ≈ 0 ⇒ X ∼ P (λ), con λ = n∗p

Ejemplo 2.8.2. En un sistema de control de calidad de productos termi-

nados, un experto, basado en su experiencia, estima que hay una proba-

bilidad de 0, 001 de encontrar un articulo defectuoso durante un periodo

de 5 minutos, en una estación de la cadena de producción continua. Si

X es una variable Binomial con parámetro n = 100 y p = 0, 001 y la

probabilidad exacta de no encontrar defectuosos es :

IP (X = 0) = 0, 999100 = 0, 9048

y la probabilidad encontrar un defectuoso en una sola ocasión es:

IP (X = 1) = 100(0, 999)99 (0, 001) = 0, 0906

Resumen Practico - Teórico 28 William Canales Verdugo


2. PROBABILIDADES: MODELOS DISCRETOS Y CONTINUOS

Notemos que en este ejemplo n es bastante grande y p es más bien peque-

ño.

Usando la distribución Poisson (µ = np = 0, 1) estas probabilidades

son respectivamente:

IP (X = 0) = 0, 10 e−0,1 = 0, 9048

y
0, 11 e−0,1
IP (X = 1) = = 0, 0905
1!

2.9. Distribución Normal

X ∼ N (µ, σ 2 )

La función de densidad es:

x−µ
2
−1

1 σ
f (x) = √ e 2
σ 2π

E(X) = µ y V ar(x) = σ 2

Representación gráca de la función de densidad de una distribución nor-

mal.

Propiedades

Resumen Practico - Teórico 29 William Canales Verdugo


2. PROBABILIDADES: MODELOS DISCRETOS Y CONTINUOS

1. IP (X > a) = 1 − IP (X ≤ a)

2. IP (X < −a) = 1 − IP (X < a)

3. IP (a ≤ X ≤ b) = IP (X ≤ b) − IP (X ≤ a)

Distribución Normal Estándar (Distribución Z)


Si se tiene una variable aleatoria X, X ∼ N (µ; σ 2 ),con µ 6= 0 y σ 2 6= 1
ésta variable se puede convertir en una variable aleatoria normal estándar

Z ∼ (0; 1), mediante el siguiente cambio de variable

X −µ
Z= (2.10)
σ
La función de distribución acumulada de esta variable Z, se representa

como:

Φ(Z) = IP (Z < z)

Esta distribución se encuentra tabulada (Tabla Normal)

Por ejemplo,

Resumen Practico - Teórico 30 William Canales Verdugo


2. PROBABILIDADES: MODELOS DISCRETOS Y CONTINUOS

1. Sea Z ∼ (0, 1)

a) P(Z ≤ 1, 23)

La probabilidad pedida se encuentra directamente en las ta-

blas. Basta buscar 1,2 en la columna y 0,3 en la la. Su inter-

sección nos da la probabilidad.

b) P(Z ≥ 1, 24) = 1 − P(Z ≤ 1, 24) = 1 − 0, 8925 = 0, 1075

c) P(Z ≤ −0, 72) = 1 − P(Z ≤ 0,72)

d) P(0,5 ≤ Z ≤ 1,76) = P(Z ≤ 1, 76) − P(Z ≤ 0,5) = 0, 9608 −


0, 6915 = 0, 2693

2. El peso de los individuos de una población se distribuye normalmen-

te con media de 70 Kg. y desviación típica 6 Kg. De una población

de 2000 personas, calcula cuántas tendrán un peso comprendido

entre 64 y 76 Kg.

Solución

Resumen Practico - Teórico 31 William Canales Verdugo


2. PROBABILIDADES: MODELOS DISCRETOS Y CONTINUOS

Sea X el peso los individuos de una población.

X ∼ N (70, 62 )

Se trata de una distribución normal con µ = 70 y σ = 6), por lo

que se utilizar el T.L.C, esto es:

X −µ
Z=
σ
Por lo que se tiene:

 
64 − 70 76 − 70
P(64 ≤ X ≤ 76) = P ≤Z≤ = P(−1 ≤ Z ≤ 1) = P(Z ≤ 1)−P(Z ≤ −1)
6 6

por tabla se sabe que P(Z ≤ 1) = 0,8413, y P(Z ≤ −1) = 0,1587


Por lo tanto:

P(64 ≤ Z ≤ 76) = 0,8413 − 0,1587 = 0,6826

Esto signica que el 68,26 % de las personas pesan entre 64 y 76

Kg.. Como hay 2000 personas, calculamos el 68,26 % de 2000 y

obtenemos aproximadamente 1365 personas.

2.10. Distribuciones con Excel


2.10.1. Binomial mediante Excel
Volvamos al 2.7.1, esto es:

En un banco comercial, en el proceso de análisis de créditos, el 12 %

de las solicitudes que llegan en una semana, son rechazadas por falta de

antecedentes del solicitante. Si en una semana llegan 25 solicitudes, ¾

Cuál es la probabilidad de que se rechacen menos de 2 solicitudes en una

semana por falta de antecedentes del solicitante?

Resumen Practico - Teórico 32 William Canales Verdugo


2. PROBABILIDADES: MODELOS DISCRETOS Y CONTINUOS

Solución :

Sea X = no de solicitudes rechazadas semanalmente por falta de antece-

dentes del solicitante

X ∼ Bin(n = 25; p = 0, 12)


IP (X < 3) = P I(X = 0) + IP (X = 1) + IP (X = 2)

IP (X < 3) = P I(X = 0) + IP (X = 1) + IP (X = 2)

IP (X < 3) = 0, 0409 + 0, 1395 + 0, 2283 = 0, 4088

Resumen Practico - Teórico 33 William Canales Verdugo


2. PROBABILIDADES: MODELOS DISCRETOS Y CONTINUOS

2.10.2. Possion mediante Excel


Veamos el ejemplo 2.8.1, esto es:

Supongamos que clientes llegan a una cola de espera a una tasa de 4 por

minuto. Suponiendo que este proceso de llegada ocurre a un proceso de

Poisson, determinemos la probabilidad que al menos una persona llegue

a la cola en un intervalo de 1/2 minuto.

Sea X el número de personas que llegan a la cola en 1/2 minuto. Si

tomamos 1 minuto como unidad de tiempo tenemos λ = 4 y luego el

número medio de llegadas en 1/2 minuto es 2. Por lo tanto, X ∼ P (λ = 2)


y
2a e−2
IP (X = a) = , x = 0, 1, 2, · · ·
a!
De donde la probabilidad que llegue al menos una persona durante un

periodo de 1/2 minuto es:

IP (x > 1) = 1 − IP (X < 1) = 1 − IP (X = 0) = 1 − e−2 = 0, 865

2.10.3. Normal mediante Excel

Resumen Practico - Teórico 34 William Canales Verdugo


2. PROBABILIDADES: MODELOS DISCRETOS Y CONTINUOS

Ejemplo 2.10.1. El contenido de leche de cierto envase se puede modelar

mediante una distribución normal comedia 500 cc y desviación estándar

5 cc, si se selecciona un envase al azar y se mide el contenido de este. ¾

Cual es la probabilidad de que tal contenido sea a lo mas 502 cc?.

Solución:

Sea X= Cantidad de leche..

X ∼ N (µ = 500 ; σ 2 = 52 )

Interpretación

Resumen Practico - Teórico 35 William Canales Verdugo


2. PROBABILIDADES: MODELOS DISCRETOS Y CONTINUOS

¾ Que contenido de leche debería tener un envase seleccionado al azar

para pertenecer al 30 % inferior en al distribución de datos?.

Interpretación ?????

2.11. Ejercicio

Resumen Practico - Teórico 36 William Canales Verdugo


Capítulo 3

Concepto de Inferencia
Estadística

3.1. Estimador y estimación de parámetros


1. Estimador Puntual es una función de la información de la mues-
tra que genera un único valor que denominamos estimación puntual.

2. Estimación por Intervalo estará determinada por dos valores

obtenidos a partir de la muestra.

3.2. Estimación por Intervalos de Conanza


Sea X1 , X2 , . . . , Xn una m.a.(n), X ∼ N (µ; σ 2 ).

1. I. C. (µ) con σ2 conocida.

2. I. C. (µ) con σ2 desconocida.

3. Intervalo de Conanza para Proporciones

37
3. Concepto de Inferencia Estadística

Caso a) I. C. (µ) con σ2 conocida.


 
σ σ
I.C. para (µ) X − Z1−α/2 √ ; X + Z1−α/2 √ (3.1)
n n

Caso b) I. C. (µ) con σ2 desconocida.

 
S S
I.C. (µ) X − t(1− α ,n−1) √ ; X + t(1− α ,n−1) √ (3.2)
2 n 2 n
Caso c) I. C. para Proporciones.

" r r #
p̂(1 − p̂) p̂(1 − p̂)
I.C.(p̂) p̂ − Z1−α/2 p̂ + Z1−α/2 (3.3)
n n
con
n
P
xi
pq i=1
p̂ ∼ N (p, ) y p̂ =
n n
Ejemplo 3.2.1. Los datos que a continuación se dan los pesos en

gramos del contenido de 16 cajas de cereal que se seleccionaron de

un proceso de llenado con el propósito de vericar el peso promedio

506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506,

502, 509, 496. Si el peso de cada caja es una variable aleatoria

normal con una desviación estándar σ = 5, obtener el intervalo

de conanza estimado del 90 %, para la media del llenado de este

proceso.

Solución:

Como el intervalo de conanza debe ser del 90 %, esto es 1−α =


0,90 lo que implica que α = 0,1, El valor de Z0,95 se obtiene de la

tabla normal esto es Z0,95 = 1,96, el valor de X = 503,75. Enton-

ces el intervalo de conanza del 90 % para la media del proceso de

llenado es:
 
5 5
I.C. para (µ) = 503,75 − 1,96 √ ; 503,75 + 1,96 √ ≈ [501,69 ; 505,81]
16 16
Interpretación ?????

Resumen Practico - Teórico 38 William Canales Verdugo


3. Concepto de Inferencia Estadística

Ejemplo 3.2.2. Los datos que a continuación se dan, son los pesos

en gramos del contenido de 16 cajas de cereal que se seleccionaron de

un proceso de llenado con el propósito de vericar el peso promedio

506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502,

509, 496. Si el peso de cada caja es una variable aleatoria normal,

obtener el intervalo de conanza estimado del 90 %, para la media

del llenado de este proceso.

Solución:

Como el intervalo de conanza debe ser del 90 %, esto es 1−α =


0,90 lo que implica que α = 0,1, como no se conoce la varianza,

esta debe ser calculada lo que implica que S = 6, 20, por lo que

se debe obtener un intervalo de conanza para la media con sigma

desconocido y este es:


 
6, 20 6, 20
I.C. para (µ) = 503,75 − 1,753 √ ; 503,75 + 1,753 √ ≈ [501,03 ; 506,47]
16 16

Interpretación ?????

Resumen Practico - Teórico 39 William Canales Verdugo


3. Concepto de Inferencia Estadística

Ejemplo 3.2.3. Se quiere estimar el resultado de un referéndum

mediante un sondeo. Para ello se realiza un muestreo aleatorio sim-

ple con n = 100 personas y se obtienen 35 % que votarán a favor

y 65 % que votarán en contra (suponemos que no hay indecisos pa-

ra simplicar el problema a una variable dicotómica). Con un nivel

de signicación del 5 %, calcule un intervalo de conanza para el

verdadero resultado de las elecciones.

Solución:
Dada una persona cualquiera (i) de la población, el resultado de su

voto es una variable dicotómica:

Xi ∼ Bin(n, p)

El parámetro a estimar en un intervalo de conanza con α = 0, 05


es p, y tenemos sobre una muestra de tamaño n = 100, la siguiente

estimación puntual de p:
35
p̂ = = 0, 35 =⇒ q̂ = 0, 65
100
El intervalo de conanza buscado es:

0, 35 ± 0, 0935

Por tanto, tenemos con esa muestra un error aproximado de 9, 3

puntos al nivel de conanza del 95 %.

3.3. Determinación del Tamaño Muestral


Para ello, recordemos que un intervalo de conanza para una media

en el caso general se escribe como:

S2
µ = X ∓ T(1−α/2,n−1) √
n
| {z }
precisión ε

Resumen Practico - Teórico 40 William Canales Verdugo


3. Concepto de Inferencia Estadística

Si n es sucientemente grande, la distribución t de Student se apro-


xima a la distribución normal. Luego una manera de obtener la

precisión buscada consiste en elegir n con el siguiente criterio:

2
Z1−α/2
n≥ 2 S2 (3.4)
ε
Ejemplo 3.3.1. Un estudiante de administración pública desea de-

terminar la cantidad media que perciben los miembros de los con-

sejos de ciudades. El error para estimar la media es menor de 100

dólares, con un nivel de conanza de 95 %. El estudiante encontró

un informe del departamento de Trabajo que se estimó una desvia-

ción estándar de 1.000 dólares. ¾Cuál es el tamaño requerido de la

muestra?

Solución:

El error máximo permisible, d es de 100 dólares. El valor de Z


para un nivel de conanza del 95 % es de 1.96 y el estimado de la

desviación estándar son 1.000 dólares. Al sustituir estos valores en

la fórmula que aparece a continuación, nos arroja el tamaño de la

muestra requerido.

2
Z1−α/2 1,962
n≥ S2 = 10002 = 384,16
ε2 1002
El valor calculado se redondea hacia arriba quedando 385. Por lo

cual se requiere una muestra de 385 para cumplir con las especi-

caciones

Si la población es proporcional el tamaño muestral proporcional es:

2
Z1−α/2 p̂q̂
n= (3.5)
ε2
Ejemplo 3.3.2. Se quiere estimar el resultado de un referendum

mediante un sondeo, y sin tener una idea sobre el posible resultado

Resumen Practico - Teórico 41 William Canales Verdugo


3. Concepto de Inferencia Estadística

del mismo, se desea conocer el tamaño de muestra que se ha de

tomar para obtener un intervalo al 97 % de conanza, con un error

del 1.

Solución:

Como no se tiene una idea previa del posible resultado del refe-

rendum, hay que tomar un tamaño de muestra, N, que se calcula

mediante:

2
Z1−α/2 p̂q̂
n= 2
ε

Si en un principio no tenemos una idea sobre que valores puede

tomar p̂, debemos considerar el peor caso posible, que es en el que

se ha de estimar el tamaño muestral cuando p = q = 1/2. Así:

2
Z
n = 14 1−α/2
ε2

de esto se tiene:

2
Z 0,25 ∗ 2,172
n = 14 0,9852 = = 1177, 25
0,01 0,012

Así para tener un resultado tan able, el número de personas a

entrevistar debe ser muy elevado lo que puede volver excesivamente

costoso.

Resumen Practico - Teórico 42 William Canales Verdugo


3. Concepto de Inferencia Estadística

3.4. Prueba de Hipótesis


1. Prueba de hipótesis con respecto a la media con σ 2 conocida.

2. Prueba de hipótesis con respecto a la media con σ2 desconocida.

3. Prueba de hipótesis con respecto a la proporción de una población.

Tabla 3.1: Prueba de hipótesis para la media con σ2 conocida

Hipótesis Nula Valor de la estadística de prueba bajo H0

x̄ −√µ0
H0 : µ = µ0 Zcal =
σ/ n

Hipótesis Alternativa Criterio de rechazo

H1 : µ 6= µ0 R.C. = {Zcal ≤ Zα/2 ∨ Zcal ≥ Z1−α/2 }


H1 : µ > µ0 R.C. = {Zcal ≥ Z1−α }
H1 : µ < µ0 R.C. = {Zcal ≤ −Zα }

Resumen Practico - Teórico 43 William Canales Verdugo


3. Concepto de Inferencia Estadística

Tabla 3.2: Prueba de hipótesis para a la media con σ2 desconocida

Hipótesis Nula Valor de la estadística de prueba bajo H0

x̄ −√µ0
H0 : µ = µ0 tcal =
S/ n

Hipótesis Alternativa Criterio de rechazo

H1 : µ 6= µ0 R.C. = {tcal ≤ t(α/2,n−1) ∨ tcal ≥ t(1−α/2,n−1) }

H1 : µ > µ0 R.C. = {tcal ≥ t(1−α,n−1) }

H1 : µ < µ0 R.C. = {tcal ≤ t(α,n−1) }


Tabla 3.3: Prueba de hipótesis para la proporción de una población

Hipótesis Nula Valor de la estadística de prueba bajo H0

p − p0
H0 : p = p0 Zcal = p
p0 q0 /n

Hipótesis Alternativa Criterio de rechazo

H1 : p 6= p0 R.C. = {Zcal ≤ −Z α2 ∨ Zcal ≥ Z α2 }

H1 : p > p0 R.C. = {Zcal ≥ Z1−α }

H1 : p < p0 R.C. = {Zcal ≤ −Zα }

Resumen Practico - Teórico 44 William Canales Verdugo


3. Concepto de Inferencia Estadística

Observación: Otra forma de ver si se cumple o no la hipótesis nula es

mediante del p - valor

Si p − valor < α, se Rechaza Ho (3.6)

El valor-p depende de la hipótesis alternativa, así si:

1. Para la media con varianza conocida.

a) H1 : µ >µo , se tiene valor-p = 1 − IP (Z < Zcal ) (prueba de

cola derecha.)

b) H1 : µ <µo , se tiene valor-p = IP (Z < Zcal ) (prueba de cola

izquierda).

c) H1 : µ 6= µo , se tiene valor-p=2 ∗ [1 − IP (Z < Zcal )] (prueba

bilateral)

2. Para la media con varianza desconocida.

a) H1 : µ >µo , se tiene valor-p = 1 − IP (t < tcal ) (prueba de cola

derecha.)

b) H1 : µ <µo , se tiene valor-p = IP (t < tcal ) (prueba de cola

izquierda).

c) H1 : µ 6= µo , se tiene valor-p=2 ∗ [1 − IP (t < tcal )] (prueba

bilateral)

3. Para proporciones.

a) H1 : p >po , se tiene valor-p = 1 − IP (Z < Zcal ) (prueba de cola


derecha.)

b) H1 : p <po , se tiene valor-p = IP (Z < Zcal ) (prueba de cola

izquierda).

c) H1 : p 6= po , se tiene valor-p=2 ∗ [1 − IP (Z < Zcal )] (prueba

bilateral)

Resumen Practico - Teórico 45 William Canales Verdugo


3. Concepto de Inferencia Estadística

Ejemplo 3.4.1. 1. Los siguientes datos representan los tiempos de

ventas de cierto medicamentos para 20 unidades seleccionadas alea-

toriamente: 0.9 , 10.4, 10.6, 9.6, 9.7, 9.9, 10.9, 11.1, 9.6, 10.2,

10.3, 9.6, 9.9, 11.2, 10.6, 9.8, 10.5, 10.1, 10.5, 9.7. Supóngase que

el tiempo necesario de venta de una unidad es una variable aleatoria

normal con media µ y desviación estándar σ = 0,6 minutos. Con

base en esta muestra, ¾ existe alguna razón para creer, a un nivel

de 0.05, que el tiempo de venta promedio es mayor de 10 minutos?

Solución:
Considérese la hipótesis nula:

H0 : µ = 10

contra la alternativa

H1 : µ > 10

Si puede rechazar a H0 con α = 0,05, entonces existe una razón para


creer que el tiempo necesario para vender una unidad es mayor que

10 minutos. Dado que P(Z ≥ 1,645) = 0,05, el valor critico en

términos de variable aleatoria normal estándar es Z0,95 = 1,645.


De los datos de la muestra, el valor x̄ = 10,2 minutos. Entonces:

x̄ − µ0 10,2 − 10
Zcal = √ = √ = 1,4907
σ/ n 0,6/ 20

Dado que Zcal = 1,4907 < Z0,95 = 1,645 no se puede rechazar la

hipótesis nula.

Ejemplo 3.4.2. las puntuaciones en un test que mide la variable reac-

tividad siguen, en la población general de adolescentes, una distribución

Normal de media 11, 5. En un centro escolar que ha implantado un pro-

grama de estimulación de la reactividad una muestra de 30 alumnos ha

proporcionado las siguientes puntuaciones:

11, 9, 12, 17, 8, 11, 9, 4, 5, 9, 14, 9, 17, 24, 19, 10, 17, 17, 8, 23, 8,

6, 14, 16, 6, 7, 15, 20, 14, 15.

Resumen Practico - Teórico 46 William Canales Verdugo


3. Concepto de Inferencia Estadística

A un nivel de conanza del 95 % ¾Puede armarse que el programa es

efectivo?

Solución: Considérese la hipótesis nula:


H0 : µ = 11,5

contra la alternativa

H1 : µ > 11,5
El estadístico de contraste en este caso es:

x̄ − µ 12,47 − 11,5
tcal = √ = √ = 1,0178
s/ n 5,22/ 30
Como el contraste es unilateral, buscamos en las tablas de la t de Stu-

dent, con 29 grados de libertad, el valor que deja por debajo de sí una

probabilidad de 0,95, que resulta ser t0,95,29 = 1, 699.

Dado que tcal = 1,0178 < t(0,95;29) = 1,699, no se puede rechazar la

hipótesis nula.

Ejemplo 3.4.3. Se cree que determinada enfermedad se presenta en ma-

yor medida en hombres que en mujeres. Para ello se elige una muestra

aleatoria de 100 de estos enfermos y se observa que 70 son hombres. ¾Que

podemos concluir?

Solución:
Sea p la proporción de hombres que existen entre los enfermos. Que-

remos encontrar evidencia a favor (H1 ) de que p > 1/2, pero nuestra

hipótesis de partida (mientras no tengamos evidencia en contra) es que

p = 1/2 (H0 ). Es decir, plantemos el siguiente contraste unilateral para

una proporción:

H0 : p = 1/2 v/sH1 : p > 1/2


La estimación puntual de p es p̂ = 70/100 = 0, 7. Si elegimos α = 5 %, los
valores críticos son los que están situados a la derecha del percentil 95 de

esta distribución, es decir, los valores superiores a Z1−α = Z1−0,05 = 1, 96,


y el estadístico que usamos para el contraste es:

p − p0 0,7 − 0,5
Zcal = p =p =4
p0 q0 /n 0,5 × 0,5/100

Resumen Practico - Teórico 47 William Canales Verdugo


3. Concepto de Inferencia Estadística

Como se aprecia, Z entra ampliamente dentro de la region critica, por

tanto hemos de concluir con el rechazo de la hipótesis nula y la aceptación

de la hipótesis alternativa. Resumamos el ejemplo con otras palabras: Si la

hipótesis nula fuese cierta, deberíamos esperar que el valor del estadístico

Z no fuese demasiado grande. Por tanto como hemos obtenido un valor

grande del mismo, debemos concluir que la hipótesis de partida (H0 ) ha

de ser rechazada. El valor Z se calcula exclusivamente a partir de α, y

nos sirve para saber a que nos referimos por un valor demasiado grande

para Z.

3.5. Intervalo de Conanza - Prueba Hipóte-


sis con Excel
Para poder calcular los Intervalos de conanza o Prueba Hipotiposis en

forma automatiza mediante Excel, existen paquetes adicionales de excel

que se puede instalar en el complemento, esto pueden ser "MegaStat",

XLSTAT, etc. o construir las formulas es excel.

3.5.1. Intervalo de Conanza con Excel

3.6. Ejercicios
1. Un fabricante arma que el peso promedio de las latas de fruta en

conserva que saca al mercado es de 19 onzas. Para vericar esta

armación se escogen al azar 20 latas de fruta y se encuentra que

el peso promedio es de 18,5 onzas. Suponga que la población de los

pesos es normal con una desviación de 2 onzas.

a ) Utilizando un intervalo del 98 %, ¾ se puede aceptar la arma-


ción del fabricante? (Resp : [17, 46 ; 19, 54])
b ) ¾Qué tamaño de muestra se debe escoger para estimar µ si

Resumen Practico - Teórico 48 William Canales Verdugo


3. Concepto de Inferencia Estadística

se quiere un error no superior a 0,98 onzas con conanza del

95 %?, (Resp : apox. 16)

2. En los datos que se encuentran en la base base_datos_envia_xls

pestaña base_2.

El gerente comercial arma que la deuda promedio es de $4.317.326.


Para vericar esta información se escojen al azar 50 clientes y se

encuentra que la deuda promedio es $3.940.000. Suponga que la

población de la deuda actual sigue una distribución normal con una

desviación estándar de $1.937.555.

a ) Utilizando un intervalo del 98 %, ¾ se puede aceptar la arma-


ción del fabricante?

b ) ¾Qué tamaño de muestra se debe escoger para estimar µ si se

quiere un error no superior $100.000 de la muestra, con una

conanza del 95 %?

3. Durante los doce meses pasados del volumen diario de ventas de

un restaurante fue de 20.000 U.M. el dueño piensa que los próxi-

mos 25 días serán críticos con respecto al volumen normal, debido

a las medidas económicas tomadas por el gobierno. Al nalizar los

25 días, el volumen de ventas promedios y su desviación estándar

fueron 19.000 U.M. y 2.000 U.M. respectivamente. Suponiendo que

el volumen de ventas se distribuye normalmente. ¾ Tiene razón el

dueño del restaurante para conar en un 95 %, con base en los re-

sultados muestrales, hubo una disminución en el volumen de ventas

promedios diario?

4. Se administra una solución de dimetil-sufóxico al 50 % en dosis de 1


ml por cada 100 gramos de peso, a ratones de laboratorio. Al cabo

de 30 minutos, se sacrica y se les extrae el hígado, con la nalidad

de medir el consumo de oxigeno. Los resultados de captaciones de

oxigeno de 27 ratones fueron los siguientes:


27
X 27
X
Xi = 68, 625 y Xi2 = 4, 721
i=1 i=1

Resumen Practico - Teórico 49 William Canales Verdugo


3. Concepto de Inferencia Estadística

Construya un intervalo de conanza para la media del consumo de

oxigeno al 98 % de conanza. (Resp : [−3, 77 ; 8, 85])

5. Una organización de salud se interesa en actualizar su información

con respecto a la proporción de hombres que fuman. Con base a

estudios previos, se cree que la proporción es de un 40 %. La orga-

nización lleva a cabo una encuesta en la que seleccionan en forma

aleatoria a 1.200 hombres a los cuales se les pregunta sus hábitos de

fumador. De los encuestados, 420 son fumadores. Emplee un méto-

do aproximado para determinar si esta evidencia apoya al estudio

previo, con un 99 % de conanza. (Resp: No se apoya el estudio)

6. El departamento de mejoramientos de autopista, encargado de re-

parar un tramo de 25 km de una autopista, quiere diseñar una

supercie que sea estructuralmente eciente. Una consideración im-

portante es el tráco de carga pesada. Las estaciones de control de

peso del estado informan que le número medio de remolques pesado

que viajan en un tramos de 25 km es de 72 horas. Sin embargo, la

sección por reparar se encuentra en un área urbana y el departamen-

to de ingenieros piensa que el volumen de tráco de carga pesada

de este sector en particular es mayor que el volumen del medio in-

formado, a n de comprobar la validez d su teoría, el departamento

vigila la autopista durante 50 periodos de una hora seleccionados

aleatoriamente, con un promedio en horas de 74,1 y una desviación

de 13,3

a ) ¾Usted apoya la teoría del departamento? Utilice α = 0, 1


b ) Por otra parte, el departamento de logística dice que el número

de remolque no es de 72 horas. Calcule el nivel de signicancia

observado e interprete el resultado.

7. El empleo de acero intemperizado en la construcción de puentes para

autopistas ha sido tema de considerable controversia. Los críticos ha

Resumen Practico - Teórico 50 William Canales Verdugo


3. Concepto de Inferencia Estadística

citado recientemente problemas de corrosión graves del acero intem-

perizado y están tratando de convencer al estado de que prohíban

su uso en la construcción de puentes. Por otro lado, las corporacio-

nes acereras aseguran que estas acusaciones son exageradas y dicen

que 95 % de todos los puentes de acero intemperizado en opera-

ción tienen un buen desempeño, sin daños graves por corrosión. A

n de probar esta aseveración, un equipo de ingenieros y expertos

de la industria del acero evalúan 60 puentes de acero intemperi-

zado seleccionados al azar y encontraron 54 de ellos exhibían un

buen desempeño. ¾Hay pruebas de que la verdadera proporción de

puentes de autopistas de acero intemperizado que presenta un buen

desempeño sea menor al que dice la corporación?

8. En los datos que se encuentran en la base base_datos_envia_xls

pestaña base_2.

a ) Se puede armar que el promedio de deuda es de $4.310.000.


b ) en promedio las deuda de los hombres es de $4.256.000.

9. Un neurólogo está probando el efecto de un fármaco sobre el tiempo

respuesta inyectando, inyectando 100 ratas con una dosis unitaria,

exponiéndole individualmente estímulos neurológicos y registrando

el tiempo respuesta. El neurólogo sabe que la media del tiempo res-

puesta para las ratas que no han sido inyectadas es de 1,2 segundos.

La media del tiempo respuesta de las 100 ratas inyectadas es de 1,05

segundos con una desviación estándar de 0,5 segundos. ¾Piensas que

el fármaco ha tenido efecto en el tiempo respuesta?

10. Fernanda lee un artículo en el cual mencionan que el 26 % de los

chilenos pueden hablar más de un idioma. A ella le da curiosidad

saber si esta cantidad es mayor en su cuidad, por lo que ella probo

Ho : p = 0, 26 v/s H1 : p > 0, 26, donde p representa la proporción

de personas en su ciudad que pueden hablar más de un idioma.

Encontró que 40 de 120 personas muestreadas pueden hablar más

Resumen Practico - Teórico 51 William Canales Verdugo


3. Concepto de Inferencia Estadística

de un idioma. El estadístico de prueba para esto resultados fue

z ≈ 1, 83 Suponiendo que se cumplen las condiciones necesarias,

¾Cuál es el valor p aproximado para la prueba de Fernanda?

11. Sea H0 : µ = 0 v/s H1 : µ 6= 0 , con una m.a de 6 observaciones y

un estadístico t=2,75 ¾Cuál es valor p aproximado?

12. Una empresa está interesada en lanzar un nuevo producto al merca-

do. Tras realizar una campaña publicitaria, se toma la muestra de 1

000 habitantes, de los cuales, 25 no conocían el producto. A un nivel

de signicación del 1 % ¾apoya el estudio las siguientes hipótesis?

a ) Más del 3 % de la población no conoce el nuevo producto.

b ) Menos del 2 % de la población no conoce el nuevo producto

13. Cuando las ventas medias, por establecimiento autorizado, de una

marca de relojes caen por debajo de las 170.000 unidades mensuales,

se considera razón suciente para lanzar una campaña publicitaria

que active las ventas de esta marca. Para conocer la evolución de

las ventas, el departamento de marketing realiza una encuesta a

51 establecimientos autorizados, seleccionados aleatoriamente, que

facilitan la cifra de ventas del último mes en relojes de esta mar-

ca. A partir de estas cifras se obtienen los siguientes resultados:

media = 169.411,8 unidades., desviación estándar = 32.827,5 uni-

dades. Suponiendo que las ventas mensuales por establecimiento se

distribuyen normalmente; con un nivel de signicación del 5 % y en

vista a la situación reejada en los datos. ¾Se considerará oportuno

lanzar una nueva campaña publicitaria?

14. Un gerente de ventas de libros universitarios arma que en pro-

medio sus representantes de ventas realiza 40 visitas a profesores

por semana. Varios de estos representantes piensan que realizan un

número de visitas promedio superior a 40. Una muestra tomada al

azar durante 8 semanas reveló un promedio de 42 visitas semanales

Resumen Practico - Teórico 52 William Canales Verdugo


3. Concepto de Inferencia Estadística

y una desviación estándar de 2 visitas. Utilice un nivel de conanza

del 99 % para aclarar esta cuestión.

15. Un investigador de mercados y hábitos de comportamiento arma

que el tiempo que los niños de tres a cinco años dedican a ver la

televisión cada semana se distribuye normalmente con una media de

22 horas y desviación estándar 6 horas. Frente a este estudio, una

empresa de investigación de mercados cree que la media es mayor

y para probar su hipótesis toma una muestra de 64 observaciones

procedentes de la misma población, obteniendo como resultado una

media de 25. Si se utiliza un nivel de signicación del 5 %. Verique

si la armación del investigador es realmente cierta.

16. Se sabe que la desviación típica de las notas de cierto examen de

Matemáticas es 2,4. Para una muestra de 36 estudiantes se obtuvo

una nota media de 5,6. ¾Sirven estos datos para conrmar la hi-

pótesis de que la nota media del examen fue de 6, con un nivel de

conanza del 95 %?

17. Una empresa de neumáticos arma que una nueva gama en prome-

dio dura al menos 28.000 km. Las pruebas con 64 neumáticos dan

como resultados una duración media de 27.800 km, con una desvia-

ción estándar de 1.000 km. bajo la normalidad de los neumáticos se

pide:

a ) Existe evidencia suciente para rechazar la armación de la

empresa, con un nivel de signicación del 5 %

b ) ¾ Cual es el p-valor?

18. El propietario de un automóvil sospecha que su vehículo tiene un

consumo medio de combustible en carretera superior a los 5,6 li-

tros/100 km, que es lo que el fabricante indica en su publicidad.

Para apoyar empíricamente su sospecha el consumo medio en 11

viajes seleccionados aleatoriamente entre todos los que realiza en el

año, obteniendo los siguientes resultados

Resumen Practico - Teórico 53 William Canales Verdugo


3. Concepto de Inferencia Estadística

6,1 - 6,5 - 5,1 - 6,0 - 5,9 - 5,2 - 5,8 - 5,3 - 6,2 - 5,9 - 6,3

a ) ¾ Están fundadas las sospechas del propietario a un nivel de

signicación del 1 %?

b ) Calcule el p-valor

19. la directora del departamento de personal esta buscando empleados

para un puesto en el extranjero. Durante el procesos de selección, la

administración le pregunta como va la incorporación de empleados,

y ella contesta que la puntuación promedio en la prueba de aptitudes

sera de 90 puntos. Cuando la administración 19 de los resultados

de la prueba,encuentra que la puntuación media es de 83,25 puntos

y la desviación estándar es de 11. Bajo el supuesto de normalidad,

¾ lleva la razón la directora con un nivel de conanza del 90 %?

20. Un portal e-business sabe que el 60 % de todos los visitantes a la

web están interesados en adquirir sus productos pero son reacios al

comercio electrónico y no realizan nalmente la compra vía internet.

Sin embargo, la dirección del portal se piensa que en el último año

el porcentaje de gente que esta dispuesta a comprar por internet ha

aumentado y esto se debe reejar en los resultados empresariales.

En esta linea, se tomo una muestra de 500 visitantes para conocer

su opinión y se observo que el 55 % no estaba dispuesto a realizar

compras vía on-line.

Contrastar con el 2 % de signicación si el último año se ha redu-

cido el porcentaje de personas que no esta dispuesta a comprar vía

internet.

21. Los contenidos de una m.a. de 5 latas de café instantáneo de un

producto han dado los siguientes pesos netos en gramos: 280, 290,

285, 275, 284. Asumiendo que la población es normal

a ) Encuentre un intervalo de conanza del 95 % para la media de


los contenidos de todas las latas de café del productor. (Resp:

[275,8 ; 289,8])

Resumen Practico - Teórico 54 William Canales Verdugo


3. Concepto de Inferencia Estadística

b ) ¾ Con que grado de conanza se estima que el contenido pro-

medio de café tengas limites de conanza 277,432 y 288,168?.

(Resp : 98 %)

22. Una encuestadora utilizó una m.a. de 600 electores que acaban de

votar y encontró que 240 votaron a favor del candidato A

a ) Estimar el porcentaje de electores a favor de A en toda la po-

blación. Utilizando un intervalo de conanza del 95 %. (Resp :


[36 % ; 44 %] aprox)
b ) Si la proporción a favor del candidato A se estima en 40 %, ¾

Cuánto es el error máximo de la estimación, se se quiere tener

una conanza del 98 %. (Resp : 4, 47 % aporx.)

3.7. Dócima de Hipótesis para la Diferencia


de dos Medias en Poblaciones Normales
(Comparación de dos Poblaciones Nor-
males)

Resumen Practico - Teórico 55 William Canales Verdugo


3. Concepto de Inferencia Estadística

Tabla 3.4: Criterio de rechazo para la prueba de hipótesis con respecto

a las medias con varianzas iguales pero desconocida, pero

iguales σ12 = σ22

Hipótesis Nula Valor de la estadística de prueba bajo H0

(X 1 − X 2 ) − d0
H0 : µ1 − µ2 = d0 Tcal = r  ∼ t(n1 +n2 −2)
(n1 − 1)S12 + (n2 − 1)S22 1

1
n1 + n2 − 2 n1 + n2

Hipótesis Alternativa Criterio de rechazo

H1 : µ1 − µ2 6= d0 R.C. = {Tcal ≤ t(α/2,n1 +n2 −2) ∨ Tcal ≥ t(1−α/2,n−1) }


H1 : µ1 − µ2 > d0 R.C. = {tcal ≥ t(1−α,n1 +n2 −2) }
H1 : µ1 − µ2 < d0 R.C. = {tcal ≤ t(α,n1 +n2 −2) }

Resumen Practico - Teórico 56 William Canales Verdugo


Capítulo 4

Regresión Lineal

En estadística la regresión lineal o ajuste lineal es un modelo matemá-

tico usado para aproximar la relación de dependencia entre una variable

dependiente Y, las variables independientes X y un término aleatorio ε.

57
4. Regresión Lineal

4.1. Análisis de Correlación


Consideraremos ahora una medida del grado de asociación lineal entre

dos variables cuantitativas

4.2. Coeciente de Correlación Lineal


Sea (X, Y ) una variable aleatoria bivariada. La covarianza entre x e y
se dene como:

Cov(x, y) = IE{[x − IE(x)][y − IE(y)]}

en forma equivalente se tiene:

Cov(x, y) = IE(xy) − IE(x)IE(y) (4.1)

Se dene el coeciente de correlación lineal de Pearson como:

cov(x, y)
ρ= , −1 < ρ < 1 (4.2)
σx σy

Sea (x1 , x1 ),. . . (xn , yn ) una muestra de tamaño n. El estimador de ρ


es el coeciente de correlación muestral r dado por:

Resumen Practico - Teórico 58 William Canales Verdugo


4. Regresión Lineal

P P P
xy − x y n
rxy =p P P p P P (4.3)
x x2 − ( x)2 y y 2 − ( y)2

4.3. Regresión Lineal Simple


Ahora consideraremos una técnica para estudiar la forma de relación

entre dos variables, conocida como análisis de regresión.

Sea (xi , yi ), i = 1, . . . , n una muestra de observaciones bi-variadas, y

supongamos que nos interesa predecir Y a partir de X . El propósito puede


ser:

1. Encontrar un modelo que describa la forma que X afecta a Y.

2. Ajustar una función de X para predecir Y, sin preocuparnos del

modelo.

y i = β 0 + β 1 xi + εi (4.4)

Donde:

• yi : Variable respuesta o dependiente (es aleatoria).

• xi : Variable independiente, explicativa o regresor, y puede ser ja

o controlada por diseño, o v. a.

• εi : Variable aleatoria, que representa un error, y es independiente

de x.

• β0 : Parámetro, denominado intercepto, que representa el nivel glo-

bal de respuesta o también se le conoce como valor basal y que

corresponde al valor de y cuando x = 0.

• β1 : Parámetro, denominado pendiente, que representa el cambio

esperado en y cuando x aumenta en una unidad.

Resumen Practico - Teórico 59 William Canales Verdugo


4. Regresión Lineal

La segunda clasicación importante es la de modelos de regresión sim-

ples o múltiples, de acuerdo al número de variables que explican a la

variable dependiente. Cuando solamente existe una variable explicativa

se llama a éste un modelo de regresión simple y cuando son varias se le

llama modelo de regresión múltiple.

V entast = β0 + β1 ∗ P ublicidadt + εt

La relación lineal entre las ventas (y) y los gastos en publicidad (x)

Ahora un modelo de Regresión Múltiple, seria por ejemplo.

La relación lineal entre el gasto en consumo de las familias (y) en fun-

ción del ingreso (x1 ), los activos nancieros de la familia (x2 ) y del tamaño
de la familia (x3 ).

Consumot = β0 + β1 ∗ Ingresot + β2 ∗ Activot + β3 ∗ tamañot + εt

Los parámetros β0 y β1 se obtienen mediante el estimadores de mínimos


cuadrados ordinarios (EMCO). Con un poco de trabajo se obtiene que:

yi = βb0 + βb1 xi + εi (4.5)

εi = yi − (βb0 + βb1 xi ) = yi − ybi (4.6)

βb0 = ȳ − x̄βb1 (4.7)

P P P P
(xi − x̄)(yi − ȳ) xi yi − ȳ xi xi yi − nxy
βb1 = 2 = P 2 = P 2 (4.8)
xi − nx̄2
P P
(xi − x̄) xi − x̄ xi
Ejemplo 4.3.1. Se seleccionó a 7 alumnas de la carrera de psicología

del 2013, quienes nos dieron sus datos de estatura (en cm) y de peso (en

kilos) y se obtuvo el siguiente gráco de dispersión.

Resumen Practico - Teórico 60 William Canales Verdugo


4. Regresión Lineal

Como se puede ver, es imposible describir todos los datos a través de

una sola recta que pase por todos los puntos, por lo tanto, debemos hallar

la ecuación de la recta que mejor se ajuste a dichos puntos.

Resumen Practico - Teórico 61 William Canales Verdugo


4. Regresión Lineal

Interpretación

• β0 : Si la estatura de una alumna es igual a cero, su peso promedio

sería de -45,276 gr.

• β1 : Por cada cm que aumente la altura de una estudiante, su peso

aumenta en promedio en 52,43 gr

4.4. Coeciente de determinación y Bondad


de ajuste
El siguiente gráco nos permite visualizar como se descompone la va-

rianza total de un modelo de regresión simple.

Resumen Practico - Teórico 62 William Canales Verdugo


4. Regresión Lineal

Luego para una muestra de n puntos se cumple que:

X X X
(yi − ȳ)2 = y − ȳ)2 +
(b (yi − yb)2 (4.9)

donde:

X
S.C.T. = (yi − ȳ)2 (4.10)

X
S.C.E. = (yi − yb)2 (4.11)

X
S.C.R. = yi − ȳ)2
(b (4.12)

Se puede demostrar que la variación total en la variable dependiente (y)


puede ser expresada en términos de la variación explicada y la variación

no explicada.

S.T.C. = S.C.E + S.C.R (4.13)

Dividiendo la igualdad anterior por S.C.T. y despejando S.C.R./S.C.T


se obtiene:
S.C.R. S.C.E.
=1− (4.14)
S.C.T. S.C.T
A esta expresión se le denomina coeciente de determinación (R2 ).
Este coeciente permite cuanticar la calidad el ajuste. Especícamente

Resumen Practico - Teórico 63 William Canales Verdugo


4. Regresión Lineal

indica el porcentaje de la variación total de la variable dependiente que

es explicada por el modelo ajustado. Por lo tanto.

yi − ȳ)2
P
S.C.R.
2 (b S.C.E.
R = =P ¯ 2
=1− (4.15)
S.C.T. (yi − (y)) S.C.T.
Observación 4.4.1.

1. 0 ≤ R2 ≤ 1

2. R2 = 1 signica un ajuste perfecto.

3. R2 =0 signica que no hay relación alguna entre la variable explica-

tiva x e y.

4. SCR = R2 ∗ SCT

R2 siempre se incrementa cuando se incluyen más variables al modelo.

El R2 ajustado considera el número de variables en un modelo,y por

tanto, puede disminuir.

S.C.E.
2
Rajus =1− −k−1
n (4.16)
S.C.T.
n−1
Donde k = número de variables independientes que incluye el modelo
Bondad de ajuste
Nos indica el porcentaje de las variaciones que no se explican por el

modelo ajustado, es decir, es la varianza inexplicada , o sea la varianza

de los residuos.

S.C.E. S.C.R.
Bon_Ajus = =1− = 1 − R2 (4.17)
S.C.T. S.C.T.

Resumen Practico - Teórico 64 William Canales Verdugo


4. Regresión Lineal

4.5. Pruebas de hipótesis para el modelo de


regresión lineal simple

yi = βb0 + βb1 xi + εi

La Regresión lineal normal clásica supone que cada i está normalmente

distribuida con:

• IE(ε) = 0.

• IE[ε − IE(ε)]2 = IE(ε2i ) = σ 2

• Cov(εi , εj ) = IE{[εi − IE(εi )][εi − IE(εj )]} = IE(εi , εj ) = 0, i 6= j

Por lo tanto:

εi ∼ N (0, σ 2 ) (4.18)

4.6. Dócima para βi


1. Para β1

σ2
 
βb1 ∼ N β1 ; P (4.19)
(xi − x̄)2

H0 : βb1 = 0 v/s Ha : βb1 6= 0 (4.20)

n o
R.C. = tcal < t(n−2; α2 ) ∨ tcal > t(n−2;1− α2 ) (4.21)

βb1 − β1
tcal = r (4.22)
2
P σε
(xi − x̄)2

Resumen Practico - Teórico 65 William Canales Verdugo


4. Regresión Lineal

yi − ybi
σε2 = Sxy
2
= (4.23)
n−2
2. Para β0

H0 : βb0 = 0 v/s Ha : βb0 6= 0 (4.24)

n o
R.C. = tcal < t(n−2; α2 ) ∨ tcal > t(n−2;1− α2 ) (4.25)

βb0 − β0
tcal = s   (4.26)
2
σε2 1 x̄
n + P(xi − x̄)2

4.7. Análisis de varianza ANOVA


con los resultados anteriores se construye la siguiente tabla denominada

ANOVA (Analisys of Variance) que se puede obtener en Excel.

De la tabla ANOVA se desprende dos indicadores muy relevantes:

Test F

Resumen Practico - Teórico 66 William Canales Verdugo


4. Regresión Lineal

Permite llevar a cabo la prueba estadística para:

H0 : βb1 = 0 v/s Ha : βb1 6= 0 (4.27)

Bajo H0 ,

M.C.R.
F = ∼ F(1,n−2) (4.28)
M.C.E
Se rechaza la hipótesis nula para valores grandes, es decir, si:

Fcal > F(1,n−2,α) (4.29)

Para calcular FCal utilizamos la misma tabla ANOVA

4.8. Intervalos de conanza para los paráme-


tros
" s #
1 x̄2
I.C.βb0 = βb0 ± t( α ;n−2) +P (4.30)
2 n (xi − x̄)2
" #
σε2
I.C.βb1 = βb1 ± t( α ;n−2) pP (4.31)
2 (xi − x̄)2
Ejemplo 4.8.1.

Resumen Practico - Teórico 67 William Canales Verdugo


4. Regresión Lineal

Los siguientes datos, se dene:

o
X: temperatura máxima diaria (en C)

Y: demanda eléctrica promedio (en KW/hr).

Se pide lo siguiente:

1. Determinar un modelo de regresión lineal que permita estimar la

demanda en función de la temperatura. Interprete sus parámetros.

2. Calcular el coeciente de correlación y determinación, interpretando

los valores obtenidos

3. Realizar una prueba de hipótesis para β1 ???

Resumen Practico - Teórico 68 William Canales Verdugo


4. Regresión Lineal

Utilizando Excel, obtenemos la siguiente tabla resumen:

Solución

Para 1) El modelo de regresión lineal simple es:

ybi = 211, 2 − 4, 8xi + εi (4.32)

El siguiente gráco generado en Excel, nos muestra la recta de ajustada

de regresión, la ecuación de regresión y el coeciente de terminación.

Resumen Practico - Teórico 69 William Canales Verdugo


4. Regresión Lineal

La interpretación de los parámetros del modelo.

• Para una temperatura de 0, la demanda es de 211,21 KW

• Por cada grado que aumente la temperatura, se espera que la de-

manda disminuya en -4,8 Kw

Para 2. Analizamos el R2 y R

R = −0, 96

Esto signica que existe una alta correlación lineal inversa entre las dos

variables.

R2 = 0, 92

Por lo tanta el 92 % de la variabilidad de la demanda es explicada por

la variabilidad de x

Para 3) Analicemos se si cumple la hipótesis, para β1 , con α = 5%


utilizando t  student.

3.1) Prueba de hipótesis

H0 : βb1 = 0 v/s Ha : βb1 6= 0 (4.33)

3.2) R.C. n o
R.C. = tcal < t(n−2; α2 ) ∨ tcal > t(n−2;1− α2 )

De esto se tiene:

t(n−2; α2 ) = t(12;0,025) = −2, 1788, y t(n−2; 1−α ) = t(12;0,975) = 2, 1788


2

3.3) Para tcal tenemos:

βb1 − β1
tcal = r
2
P σε
(xi − x̄)2

Resumen Practico - Teórico 70 William Canales Verdugo


4. Regresión Lineal

Del modelo obtenido en a) se tiene que βb1 =-4,8


Ahora recordemos el estimador de σx2 es:

P
(xi − x̄i X
Sx2 = ⇒ (xi −x̄i = (n−1)∗Sx2 = (14−1)∗(5, 42)2 = 381, 89
n−1
A continuación debemos obtener el valor de Sxy Para esto debemos

considerar la igualdad: SCT = SCE + SCR Donde:

P
(yi − ȳi S.C.T.
Sy2 = =
n−1 n−1
Esto implica que:

S.C.T. = (n − 1) ∗ Sy2 = (14 − 1) ∗ (27,0 6)2 = 9,519, 17

S.C.R. = R2 ∗ S.C.T = 9,519, 17 = 0, 92 ∗ 8,757,64

De esto se tiene que:

S.C.E. = S.C.T. − S.C.R. = 9,519, 17 − 8,757, 64 = 761, 53

(yi − ybi )2
P
2 S.C.E.
⇒ Sxy = =
n−1 n−1

2 751, 53 p
⇒ Sxy = ≈ 58, 58 ⇒ Sxy = 58, 58 =≈ 7, 65
13
Por lo tanto:

−4, 8 − 0
tcal = =≈ −12, 25
√ 7, 65
381, 19
3.4) Se analiza el cumplimiento de la R.C.

Como tcal < t, entonces se rechaza H0


Por lo tanto, hay regresión, es decir, el modelo ajustado es bueno

para estimar los valores de la demanda a partir de la temperatura.

Salida Excel

Resumen Practico - Teórico 71 William Canales Verdugo


4. Regresión Lineal

Con la tabla ANOVA podemos:

a) Estimar σ 2 =⇒ M.C.E. = 67, 98

b) H0 : No existe regresión v/s H1 : existe regresión

Fobs = 138, 8

V alor − p = 5, 93 × 10−8 < α = 0, 05

Por lo tanto, se rechaza H0 , es decir, existe regresión  x explica

signicativamente el comportamiento de y

c) Coeciente de determinación:

R2 = 0, 92

Es decir, la variabilidad de y es explicada en un 92 % por la varia-

bilidad de x.

d) Con un 95 % de conanza se puede armar que:

β0 ∈ [193, 84 ; 228, 58]

β1 ∈ [−5, 674 ; −3, 9]

Resumen Practico - Teórico 72 William Canales Verdugo


4. Regresión Lineal

4.9. Ejercicios
1. Un centro comercial sabe en función de la distancia, en kilómetros,

a la que se sitúe de un núcleo de población, acuden los clientes, en

cientos, que guran en la tabla:

a ) Calcular el coeciente de correlación lineal e interpretelo.

b ) Si el centro comercial se sitúa a 2 km, ¾cuántos clientes puede

esperar?.

c ) Si desea recibir a 5 clientes, ¾a qué distancia del núcleo de

población debe situarse?. (Respuesta: 24,96 km)

2. Especique y estime un modelo econométrico que explique el con-

sumo agregado ct en función del ingreso disponible tt , de acuerdo

a la información como datos de corte transversal que se entrega.

Explique sus resultados en términos de la teoría económica.

10
X 10
X 10
X
yt = 1700, ct = 1110, ct yt = 205500
t=1 t=1 t=1
10
X 10
X
yt2 = 322000, c2t = 132100, t = 1, . . . , 10
t=1 t=1

3. Los siguientes datos corresponden a una estimación de la Ingresos

por Ventas de una empresa (Y ) y el Número de Vendedores (X),


para el período Abril 2006 a Marzo 2007, ambos expresados en miles

de pesos.

Resumen Practico - Teórico 73 William Canales Verdugo


4. Regresión Lineal

X X
σ 2 = 80, 376431, x2i = 471, xi = 69
X X
yi xi = 3541, yi = 561

a ) Encuentre en modelo e interprete sus coecientes.

b ) Usted aceptaría con el modelo, justifoque

4. de la base de datos

Resumen Practico - Teórico 74 William Canales Verdugo


Capítulo 5

Regresión Lineal Múltiple

En el modelo de regresión lineal múltiple se utilizan muchas variables

independientes (continuas o discretas) para predecir o explicar la varia-

ción de una variable dependiente (continua).

Utilizamos la regresión múltiple para tratar de seleccionar cuáles de

ellas, en realidad, explican la variación de la variable dependiente.

Posiblemente esta técnica sea una de las más extendidas en las más

variadas áreas, en especial, negocios, educación e ingeniería.

Simbólicamente, escribimos el modelo de regresión lineal múltiple de k


variables o predictores:

Yi = β0 + β1 X1i + β2 X2i + β3 X3i + . . . + βk Xki + ε (5.1)

Donde:

1. Y : variable dependiente.

2. X1i , X2i , . . . , Xki son las k variables predictoras.

3. ε: Error.

4. β0 : intercepto .

5. β1 , . . . , βk son las pendientes parciales.

75
5. Regresión Lineal Múltiple

Supuestos

Los supuestos formales del modelo de regresión lineal múltiple son:

1. E(ε) = 0 y que las Xj son linealmente independientes.

2. V ar(εi ) = σ 2 (homocedasticidad)

3. Cov(εi , εj ) = 0 para todo i 6= j (independencia)

El modelo normal implica que εi son i.i.d. N (0, σ 2 ).

Estimación
Al igual que en el modelo de regresión lineal simple, la solución de míni-

mos cuadrados permite obtener estimadores de los parámetros betas. Es

decir, nos interesa determinar los betas que minimizan S(β), es decir:

∂S(β)
= 0|βi =βbj , i = 1, . . . , n
∂βi
Generalmente, la solución se presenta en términos matriciales. Así, el

modelo se escribe en términos del vector Y, matriz de diseño X, vector

de parámetros β y vector de errores ε, como:

La solución o EMCO de b se obtiene minimizando S(β). Sin embargo,

Resumen Practico - Teórico 76 William Canales Verdugo


5. Regresión Lineal Múltiple

S(β) =|| Y − Xβ ||= (Y − Xβ)T (Y − Xβ) (5.2)

Por tanto, al derivar, igualar a cero y despejar se obtiene la Matriz de

los parámetros:

βb = (XT X)−1 XT Y (5.3)

Siempre que (XT X) tenga inversa, por tanto es condición necesaria que
X sea de rango completo.

Ahora, es necesario estimar la matriz de varianza  covarianza de los

parámetros. Esta es la siguiente:

V ar − Cov(β) b2 (XT X)−1


b =σ (5.4)

Donde:

YT Y − βbT XT Y
b2 =
σ (5.5)
n−k
La matriz de los parámetros y la matriz de varianza  covarianza se

utilizan para hacer pruebas de hipótesis respecto de los parámetros (test

de signicancia individuales)

Ejemplo 5.0.1.

Se desea estudiar el consumo de petróleo destinado a calefacción reque-

rido por las familias. Se cree que los grados de temperatura y el grado de

aislamiento del desván explican el consumo. Se tomó una muestra de 15

familias, desde donde se extrajo la siguiente información:

Resumen Practico - Teórico 77 William Canales Verdugo


5. Regresión Lineal Múltiple

Resumen Practico - Teórico 78 William Canales Verdugo


5. Regresión Lineal Múltiple

Resumen Practico - Teórico 79 William Canales Verdugo


5. Regresión Lineal Múltiple

Para realizar los tesis de signicancia individuales, necesitamos cono-

cer las desviaciones estándar de cada uno de los parámetros estimados:

Usando:

Resumen Practico - Teórico 80 William Canales Verdugo


5. Regresión Lineal Múltiple

YT Y − βbT XT Y
b2 =
σ
n−k

Ahora, podemos calcular la matriz de var-cov de los parámetros esti-

mados, de esta manera, podemos encontrar las desviaciones estándar de

ellos: Usando:

V ar − Cov(β) b2 (XT X)−1


b =σ

La diagonal principal de la matriz var−cov(β), contiene a las varianzas


de los estimadores de los parámetros.

Así, las desviaciones estándar de los parámetros son:

p
σ
bβb0 = 444, 92 = 21, 0931

p
σ
bβb1 = 0, 11 = 0, 3362

p
σ
bβb0 = 5, 49 = 2, 3495

Resumen Practico - Teórico 81 William Canales Verdugo


5. Regresión Lineal Múltiple

Tabla ANOVA Al igual que en el modelo de regresión lineal simple, la


partición de la variabilidad se vacía en una tabla denominada ANOVA

(Analisys of Variance)

De la misma forma que en el MRLS, de la tabla ANOVA se desprende

dos indicadores muy relevantes:

5.1. Test F
Permite llevar a cabo la prueba estadística para:

H0 : β1 = β2 = . . . = βk = 0

v/s

H1 : βj 6= 0

Se rechaza la hipótesis nula

R.C{Fcalc > Fα (k, n − (k + 1)}

Coeciente de Determinación (R2 )

Resumen Practico - Teórico 82 William Canales Verdugo


5. Regresión Lineal Múltiple

El coeciente de determinación, más conocido como R2 permite cuan-

ticar la calidad del ajuste. Se dene como la razón entre la SCR y la

SCT , es decir,

(Yi − Yb̄ )2
P b
2 SCR SCE
R = =P 2
=1− (5.6)
SCT (Yi − Ȳ ) SCT
Generalmente, se expresa en términos porcentuales y mientras más cer-

ca del 100Nos será de mucha utilidad para optar en el proceso de selección

de modelos. Matricialmente, R2 lo podemos calcular como:

2 βbT XT Y − nȲ 2
R = (5.7)
YY Y − nȲ 2
R2 ajustado

La desventaja del R2 es que por lo general aumenta cuando se agrega

una variable al modelo, independiente del valor de la contribución de esa

variable. Su valor se dene como:

n−1
R̄2 = 1 − (1 − R2 ) (5.8)
n−k
Relación entre R2 y F
La estadística de prueba F , se puede expresar en términos R2 , mediante
la siguiente fórmula:

R2
k
F = 1−R2
(5.9)
n−k−1

SELECCIÓN DE MODELOS
Cuando se dispone de muchas variables explicatorias, existen métodos

que permiten seleccionar el mejor modelo:

1. Forward  hacia adelante Se inicia con el modelo nulo Y =


β0 + ε, e incluye variables signicativas, una a una, hasta que no es

posible ingresar más. Es decir:

Resumen Practico - Teórico 83 William Canales Verdugo


5. Regresión Lineal Múltiple

a ) Elegir la variable que más incremente la SCR, o equivalente-

mente entregue el mayor R2 .


b ) Elegir la variable que arroje el mayor incremento en el R2 , o en
la SCR (signicativa) en presencia de la variable seleccionada
en el paso 1.

c ) Este proceso se continua hasta que las variables incluidas sean

estadísticamente signicativas, es decir, los incrementos de

SCR o R2 sean signicativos.

2. Backward  hacia atrás.


Usa los mismos conceptos del método Forward. Es decir,

a ) Se ajusta el modelo completo, es decir, aquel que incorpora

TODAS las variables explicatorias.

b ) Se busca la variable que MENOS aporta a la regresión (la

con mayor valor-p). Si el aporte no es signicativo, se elimina.

c ) Se ajusta el modelo con las variables que quedan y se itera el

paso 2, iterando hasta cuando NO HAY variables que puedan

ser eliminadas.

3. Selección de modelos
Como se indicó en los procesos de selección de modelos, un criterio

es el R2 , es decir, seleccionar el modelo de mayor R2 . sin embargo,


2
el coeciente R crece siempre. Por tanto, se recomienda utilizar

el coeciente de determinación corregido que se dene como:

n−1
R̄2 = 1 − (1 − R2 )
n−k
cuya característica es incrementarse sólo cuando variables signica-

tivas son incorporadas.

4. Test formal - comparación de modelos jerárquicos.

Resumen Practico - Teórico 84 William Canales Verdugo


5. Regresión Lineal Múltiple

Para evaluar la contribución incremental de nuevas variables al mo-

delo se utiliza una prueba Fisher, deniendo la siguiente función

(usando el método forward):

Sea M1 el modelo más completo (más grande o más antiguo) e

interesa tomar decisión sobre un modelo reducido M2, es decir,

nos interesa contrastar las hipótesis

H0 : Cβ = 0, donde C representa restricciones sobre β, es decir, El

test para decidir sobre H0 , esta dado por:

(SCE(M 1)−SCE(M 2)) (R12 −R22 )


q p
F = SCE(M 1)
= (1−r12
(5.10)
(n−k−1) (n−k−1)

Donde:

q = número de regresores nuevos

R.C.{Fcal > Fα (q, n − k − 1)} (5.11)

5. Validez del Modelo


Por último, una vez que se ha escogido el mejor modelo debe rea-

lizarse un análisis de residuos que permiten VALIDAR el modelo.

Es decir, si los supuestos se cumplen. Se debe gracar los residuos

versus valores ajustados. Si estos no presentan patrones (tendencia,

anomalías, agrupaciones, etc.) el modelo es adecuado.

6. Problema y solución  varianza no constante


Si se observa algún patrón en los residuos, debe buscarse la trans-

formación más adecuada. Transformaciones recurrente es logaritmo,

raíz cuadrada e inverso de la o las variables independiente.

7. Problema y solución  anomalías


Debe ajustar con y sin los datos anómalos y discutir la pertinencia

Resumen Practico - Teórico 85 William Canales Verdugo


5. Regresión Lineal Múltiple

8. Problema y solución  autocorrelación


Generalmente, la solución pasa por a) incorporar la variable retar-

dada, o bien b) incorporar variables que reejen el efecto estacional

o de tendencia.

Ejemplo 5.1.1.

Nuestra primera aproximación al modelo, es a través de regresiones

simples, es decir, primeramente decimos que el consumo mensual de pe-

tróleo depende de la temperatura, luego de la cantidad de aislamiento y

nalmente de ambas variables predictoras (método forward).

1. Obtenemos el modelo de regresión lineal simple con la temperatura

promedio diaria (X1 ), utilizando el análisis de datos de Excel, o bien


con el gráco de dispersión.

Y el modelo es

Y = 43644 − 5, 46x1

2. Obtenemos el modelo de regresión lineal simple con la cantidad de

aislamiento en el desván (X2 ), utilizando el análisis de datos de

Excel, o bien con el gráco de dispersión.

Y el modelo es

Y = 345, 38 − 20, 35x1


Se puede observar que esta variable explica solo el 15,6 % de la

variabilidad de Y, por lo tanto, no es muy signicativo su aporte

Resumen Practico - Teórico 86 William Canales Verdugo


5. Regresión Lineal Múltiple

3. Obtenemos el modelo de regresión lineal múltiple con las dos varia-

bles independientes, utilizando el análisis de datos de Excel, o bien

con el gráco de dispersión.

Y el modelo es:

Y = 562, 15 − 5, 44x1 + 20, 01x2

Podemos ver que al considerar ambas variables, el r2 ajustado au-

menta a un 95,92 %, en consecuencia, se deben considerar ambas

variables en el modelo

4. ¾Es signicativo cada uno de los parámetros del modelo?


Utilizaremos el Test t para cada uno de los estimadores de los pará-
metros y sus respectivas desviaciones estándar (Análisis individual).

Considere un α = 5%
Para β0 se tiene:

H0 : β0 = 0 v/s H1 : β0 6= 0 (5.12)

βb0 − β0 562, 12 − 0
tcal = = = 26, 65 (5.13)
σβb0 21, 0931

Resumen Practico - Teórico 87 William Canales Verdugo


5. Regresión Lineal Múltiple

p − valor = 0, 0000 (5.14)

Para β1 se tiene:

H0 : β1 = 0 v/s H1 : β1 6= 0 (5.15)

βb1 − β1 −5, 44 − 0
tcal = = = 16, 17 (5.16)
σβb1 0, 3266
p − valor = 0, 0000 (5.17)

Para β2 se tiene:

H0 : β2 = 0 v/s H1 : β2 6= 0 (5.18)

βb2 − β2 −20, 01 − 0
tcal = = = 8, 54 (5.19)
σβb2 2, 3425
p − valor = 0, 0000 (5.20)

Por lo tanto, con un 5 % de signicancia, se puede armar que cada

variable es signicativa o bien tiene incidencia en el modelo

5. ¾ Los parámetros en su conjunto son signicativos? Utilizaremos el

test F para responder esta pregunta:

R2
k
F = (1−R2 )
(5.21)
(n−k−1)

El coeciente de determinación puede ser calculado como:

βbT XT Y − nȲ 2
R2 = (5.22)
YY Y − nȲ 2
Estos valores fueron calculados para la obtención de las varianzas

de los estimadores de los parámetros

931055, 88 − 703040, 45 228014, 63


R2 = = = 0, 96561 (5.23)
939175, 68 − 703040, 45 236135, 23

Adicionalmente, podemos calcular:

Resumen Practico - Teórico 88 William Canales Verdugo


5. Regresión Lineal Múltiple

n−1 (15 − 1)
R̄2 = 1 − (1 − R2 ) = 1 − (1 − 0, 965612 ) = 0, 95988
n−k (15 − 3)
(5.24)

Por lo tanto, ahora procedemos a calcular el Test  F:

a ) Planteamos la hipótesis nula versus la hipótesis alternativa.

H0 : β0 = β1 = β2 v/s H1 : β0 6= β1 6= β2 (5.25)

Lo anterior, indica que al menos un coeciente es distinto de

cero

b ) El estadígrafo a utilizar es:

0,96561
(3−1)
F(2;12) = (1−0,96561)
= 168, 4712 (5.26)
(15−3)

p − valor = 0, 0000 (5.27)

Por lo tanto, con 5 % de signicancia se puede armar que el modelo

los parámetros en su conjunto son signicativos

Todo este proceso, se puede hacer a través del análisis de datos de Excel,

el cuál nos entrega el siguiente resumen.

Resumen Practico - Teórico 89 William Canales Verdugo


5. Regresión Lineal Múltiple

Resumen Practico - Teórico 90 William Canales Verdugo


Capítulo 6

¾ Tesis o Informe ?

6.1. Informe
El informe es un documento escrito en prosa informativa (cientíca,

técnica o comercial) con el propósito de comunicar información del nivel

más alto en una organización.

Por consiguiente, reere hechos obtenidos o vericados por el autor

(reconocimientos, investigaciones, estudios o trabajos). Además, aporta

los datos necesarios para una completa comprensión del caso, explica los

métodos empleados y propone o recomienda la mejor solución para el

hecho tratado.

6.1.1. Tipos de informe


1. Por la materia que abarcan los informes se clasican en:

a ) Cientícos: se reeren a temas de ciencia y utilizan un lengua-

je propio y riguroso; pertenecen a la categoría de memorias

cientícas.

b ) Técnicos: se desarrollan en las organizaciones públicas o priva-

das sobre temas de sociología , antropología, psicología social,

91
6. ¾ Tesis o Informe ?

etc; su lenguaje es accesible, pero mantiene el rigor de la in-

vestigación cientíca.

c ) divulgación: destinados al público en general; su lenguaje se

adapta a una persona de mediana cultura.

d ) Mixtos: destinados tanto a instituciones como al público en

general; su lenguaje se adapta al de ambos grupos de destina-

tarios.

2. Por las características textuales los informes se clasican en:

a ) Expositivos: contienen una información, una descripción del

tema o unas instrucciones. No es necesario incluir conclusio-

nes, interpretación, o evaluación; a veces, reciben el nombre de

dossier.

b ) Analíticos: tienen como objetivo justicar una decisión o ac-

ción (ya realizada o, al menos, proyectada). (Ibídem). Se de-

nominan también propuesta o proyecto.

c ) Persuasivos: pretenden convencer al destinatario para que to-

me una decisión en la línea de lo que se expone en el informe.

Proponen un plan de acción (es el informe más utilizado en

consultoría).

6.1.2. Partes principales de un Informe


Tanto el informe como otros medios de comunicación tienen sus res-

pectivas partes como:

1. Portada.

2. Resumen.

3. Indice.

4. Introducción.

Resumen Practico - Teórico 92 William Canales Verdugo


6. ¾ Tesis o Informe ?

5. Objetivos.

a ) Objetivo General.

b ) Objetivos Especícos.

6. Alcances y limitaciones (opcional)

7. Desarrollo del informe (cuerpo).

a ) Planteamiento del problema.

b ) Desarrollo del problema.

c ) Solución del problema.

d ) Resultados del problema.

8. Conclusiones.

9. Bibliográca.

6.2. Tesis
La tesis es un texto que se caracteriza por aportar conocimiento e

información novedosa sobre un tema en particular.

1. Función del género en el medio académico.


Toda tesis parte de un problema o pregunta de investigación, donde

el objetivo principal es encontrar la respuesta objetiva y sistemática

con la cual se valorará la aportación del sustentante.

Es por eso que la tesis cumple con una variedad de funciones, como

por ejemplo:

a) Exponer

b) Argumentar,

c) Informar.

Resumen Practico - Teórico 93 William Canales Verdugo


6. ¾ Tesis o Informe ?

La tesis debe dar cuenta de hallazgos o aportes en el área que se

esta desarrollando.

2. Estructuras básicas para la construcción del género.


La estructuración de la tesis dependerá, fundamentalmente, de la

disciplina a la que pertenece (biología, literatura, lenguas, ingenie-

ría, etc.).

Normalmente, la tesis se divide en capítulos y apartados o subapar-

tados para facilitar su lectura.

Cada capítulo deberá estar enumerado y tener un título que espe-

cique su contenido.

En cuanto al estilo, la tesis será redactada con un lenguaje apropia-

do a la disciplina y objeto de estudio.

6.2.1. Partes de una tesis


1. Portada.

2. Dedicatoria.

3. Agradecimientos.

4. Resumen.

5. Índice.

6. Listas de tablas y guras.

7. Introducción.

8. Capitulo 1.

a ) Planteamiento del problema.

b ) Descripción del problema.

c ) Objetivos.

Resumen Practico - Teórico 94 William Canales Verdugo


6. ¾ Tesis o Informe ?

1) Objetivo General

2) Objetivos especícos.

a ) Hipótesis de investigación.

b ) Justicación del problema.

c ) Alcances.

d ) Delimitación.

9. Marco teórico ( Capitulo II).


En esta sección del trabajo, se describen y analizan los estudios

llevados a cabo previamente, que tienen relación con el objeto de

estudio. Algunos autores (Ibáñez Brambilla, 165) sugieren que la

extensión de este apartado sea de entre 25 y 40 páginas.

10. Metodología. (Capitulo III).


En esta parte de la tesis se reportan y se justican los métodos,

participantes e instrumentos utilizados para la investigación. La

descripción de la metodología debe ser breve y clara, ya que se

busca que otro investigador pueda repetir el estudio sin necesidad

de cuestionar al autor. En esta parte del proyecto, también suelen

describirse los métodos que se usarán en el análisis de datos.

11. Resultados.

12. Conclusiones.

13. Recomendaciones.

14. Referencias.

15. Apéndices.

Observación 6.2.1.

En la mayoría de los informe o tesis se utiliza la norma A.P.A.

Resumen Practico - Teórico 95 William Canales Verdugo


6. ¾ Tesis o Informe ?

Resumen Practico - Teórico 96 William Canales Verdugo

Você também pode gostar