Escolar Documentos
Profissional Documentos
Cultura Documentos
n=100
n=10
Densidad
0.30
n=1
0.20
0.10
0.00
-5.00
-2.50
0.00
Variable
29/08/2012
2.50
5.00
UNI Norte
ndice
Introduccin ............................................................................................................. 1
Captulo 1. Estadstica Descriptiva .......................................................................... 2
1.1 Introduccin. .......................................................................................................... 2
1.2 Anlisis de datos, Tablas de Distribucin de frecuencias y Tablas de
Contingencia ................................................................................................................ 5
1.3 Grficos ............................................................................................................... 14
1.4 Medidas de Tendencia Central ........................................................................... 19
1.4.1 Media Aritmtica............................................................................................ 20
1.4.2 La Mediana ................................................................................................... 21
1.4.3 La Moda ........................................................................................................ 22
1.4.4 Otras medidas de tendencia central .............................................................. 24
1.4.4.1 La Media Geomtrica ................................................................................. 24
1.4.4.2 La Media Cuadrtica .................................................................................. 25
1.4.4.3 Cuartiles, Deciles y Percentiles .................................................................. 25
1.5 Medidas de Dispersin o de Variabilidad ............................................................ 26
1.5.1 El Rango ....................................................................................................... 26
1.5.2 El Desvo Estndar........................................................................................ 27
1.5.3 La Varianza ................................................................................................... 29
1.5.4 El Coeficiente de variacin ............................................................................ 29
1.6 Otras medidas tiles en Estadstica Descriptiva ................................................. 30
1.6.1 La Asimetra o Sesgo .................................................................................... 30
1.6.2 La Curtosis .................................................................................................... 31
1.7 Muestras y Poblacin........................................................................................... 33
1.7.1 Muestreo Aleatorio Simple ............................................................................ 33
1.7.2 Muestreo Estratificado................................................................................... 36
1.7.3 Muestreo por Conglomerados ....................................................................... 36
1.7.4 Muestreo Sistemtico .................................................................................... 37
Captulo 2. Teora Elemental de Probabilidades ................................................... 39
2.1 Introduccin a las Probabilidades ........................................................................ 39
2.2 Trminos Bsicos. ............................................................................................... 39
2.3 Propiedades de la Probabilidad ........................................................................... 41
2.3.1 Regla de la Suma. ......................................................................................... 42
2.3.2 Regla del producto. ....................................................................................... 43
2.4 Probabilidad condicionada ................................................................................... 44
2.5 Teorema de Bayes .............................................................................................. 46
2.5.1 Regla de la probabilidad total ........................................................................ 46
2.5.2 Planteo del Teorema de Bayes ..................................................................... 47
2.6 Tcnicas de conteo: Combinaciones y Permutaciones....................................... 51
Estadstica Bsica para Ingenieros Agrondustriales
ii
UNI Norte
iii
UNI Norte
Introduccin
Este texto bsico de estadstica est diseando y organizado en funcin del contenido
de la mayora de los temas que se aborda en las asignaturas de Estadstica que se
imparte en las carreras de Ingeniera Agroindustrial de la Universidad Nacional de
Ingeniera, UNI, Nicaragua. Sin embargo por su forma sencilla y asequible con que se
trat de abordar los diferentes temas, este texto puede ser til como libro de texto en
otras carreras universitarias.
Por ltimo, para realizar los ejercicios de este texto y construir grficos digitales se
sugiere utilizar el programa estadstico INFOSTAT, el cual dispone de una versin de
uso libre que se puede descargar gratuitamente desde la pgina www.infostat.com.ar .
UNI Norte
Objetivos
Reflexionar sobre el uso de la estadstica a travs de situaciones de la vida
profesional.
Introducir a la recoleccin de datos a partir de un problema del entorno de un
ingeniero y desde la experiencia del estudiante.
Construir medidas de tendencia central, de variabilidad y diferentes tipos de
Grficos ms comunes que permite una tabla de distribucin de frecuencia, TDF.
Diferenciar las diferentes formas de muestreos para estudiar el contexto
socioeconmico.
Calcular de forma representativa el tamao de una muestra con variables
construidas con ejemplos de su carrera.
1.1 Introduccin.
La estadstica, es una ciencia relativamente nueva pero con miles de aos de uso
emprico, Mara y Jos parten de Nazaret a Beln para ser censados por los romanos.
Hace 2000 aos ste imperio llevaba un control estadstico de lo que posean sus
colonias para cobrarles impuestos En la actualidad los procedimientos estadsticos son
de particular importancia en las diferentes ciencias, para reducir y abstraer datos. Una
definicin que describe la estadstica de manera utilitaria es la que dice que es: un
conjunto de tcnicas para describir grupos de datos y para tomar decisiones en
ausencia de una informacin completa. La estadstica a diferencia de la matemtica no
genera resultados exactos, los resultados siempre tienen asociada un grado de
incertidumbre o error. La estadstica trata de lograr una aproximacin de la realidad, la
cual es siempre mucho ms compleja y rica que el modelo que podemos abstraer. Si
bien esta ciencia es ideal para describir procesos cuantitativos, tiene serios problemas
para explicar por qu cualitativo de las cosas.
UNI Norte
En general podemos hablar de dos tipos de estadsticas, las descriptivas que nos
permiten resumir las caractersticas de grandes grupos de individuos y las
inferenciales que nos permite dar respuestas a preguntas (hiptesis) sobre poblaciones
grandes a partir de datos de grupos pequeos o muestras.
crear un
modelo numrico terico donde se estudian variables para describirlas y analizar sus
relaciones. Para hacer esto primero es necesario definir algunos trminos tericos.
Tipos de
Variables
Cuantitativas
Cualitativas
Nominales
Ordinales
Continuas
Discretas
UNI Norte
Las variables Continuas o Reales pueden adquirir cualquier valor dentro de un intervalo
especificado de valores, permite siempre que se encuentre un valor nuevo entre dos
valores previos, aceptan valores con fracciones de enteros. El rendimiento de un lote
de frjol se mide en qq/mz es una variable continua. Generalmente estas variables se
obtienen de medir o pesar.
ordenamiento de datos en fila y columnas donde cada fila es un individuo, una parcela,
una muestra, una unidad experimental o una encuesta determinada y cada columna:
Estadstica Bsica para Ingenieros Agrondustriales
UNI Norte
una variable. Los programas Access, Excel, Infostat y SPSS ordenan los datos en
forma de matriz numrica. Por ejemplo en una encuesta (cuestionario) cada pregunta
que se tiene, genera al menos, una variable generalmente discreta. Hay casos donde
una pregunta puede generar muchas variables de tipo dicotmico, SI- NO.
Peso de un estudiante.
Color de ojos.
Temperatura semanal.
Tipo de techo.
Dimetro de un tornillo
UNI Norte
Creacin de la
matriz de datos
Definicin de
anlisis a
realizar
Ejecucin de
anlisis en
computadora
Interpretacin
de resultados
Una primera tarea luego de construir una tabla o matriz de datos, es explorarlos
buscando informacin atpica o anormal y corregir los casos que la informacin extraa
se deba a una mala digitacin o error en la recoleccin de datos.
Lo siguiente para observar el comportamiento de los datos es realizar una distribucin
frecuencias en forma de tabla y grficos. Para esto, los datos se agrupan en clases o
categoras y para grupo se calcula las frecuencias absolutas y relativas.
UNI Norte
Las Escalas Ordinales, son discontinuas y se usan donde hay un orden jerrquico
de un conjunto de objetos o eventos con respecto a algn atributo especfico, por
ejemplo ordenar los ingresos en tres niveles: alto =1, medio = 2 y bajo = 3.
Las Escala de Razn Constante, tienen todas las propiedades de las Escalas de
intervalos ms un cero absoluto, por ejemplo las medidas de tiempo, peso y
distancia, el valor 0 representa ausencia del valor.
Un caso especial de escala ordinal es la escala de Likert, esta escala es muy usada en
las ciencias sociales y se usa para medir actitudes, Una actitud es una predisposicin
aprendida para responder consistentemente de una manera favorable o desfavorable.
As las personas tenemos actitudes hacia muy diversos objetos o smbolos, por
ejemplo: actitudes hacia la poltica econmica, un profesor, la ley, nosotros, etc. Las
actitudes estn relacionadas con el comportamiento que mantenemos. Estas
mediciones de actitudes deben interpretarse como sntomas y no como hechos. Esta
escala es bipolar porque
UNI Norte
Ejercicio 1.3: entre los participantes del grupo de clases tomar datos de 15 variables
al menos por ejemplo: Edad, Sexo, Procedencia, etc. Y luego ordnelos en forma de
matriz de datos, recodifique la informacin cualitativa en numrica.
Si las opciones que genera una variable discreta permite hacer combinaciones de las
respuestas se sugiere crear muchas variables dicotmicas del tipo Si o No. Veamos
un ejemplo: Si se pregunta: que prcticas de en los cultivos realiza un campesino,
estas pueden ser varias y combinadas como: Insecticidas Botnicos, Trampas
amarillas, Barreras vivas, Semilla resistente etc. En este caso lo que se hace es
Estadstica Bsica para Ingenieros Agrondustriales
UNI Norte
generar un variable del tipo Si, No para cada opcin de prctica de cultivo, generando
muchas variables en una sola pregunta.
Para crear una base de datos hay que recordar que se est obteniendo una matriz de
datos donde en la primera fila se tiene el nombre abreviado de la variable y en el resto
de las filas los datos para cada
Encuesta
Sexo
Edad
Ingresos
Comunidad
semanales C$
Labor
realizada
31
1,394
35
1,311
43
1,300
28
1,304
45
1,310
36
1,443
21
1,536
32
1,823
Esta matriz se puede codificar as: la variable Sexo: varn, mujer. Para la variable
comunidad hay 4 tipos diferentes donde: 1= Estel, 2= Condega, 3= Pueblo Nuevo y
4= Limay y para Labor realizado: 1= en otra finca, 2= en la cuidad y 3= en la propia
finca.
Ejercicio 1.4: Intente codificar numricamente las respuestas que se generan a partir
de la
discuta las posibles respuestas, diga si las preguntas estn bien formuladas, sugiera si
alguna de ellas est de ms y que preguntas propone para completar la informacin.
Hoja de Encuesta
Nmero de ficha___________
Estadstica Bsica para Ingenieros Agrondustriales
UNI Norte
Fecha: ______________________________________________________
Primer Apellido_______________ Segundo Apellido___________________________
Nombres:________________________ Ao____________
Direccin: _____________________________________________________
Estado Civil: _____ Nmero de personas que habitan la vivienda________________
Nivel de estudio de ellos ______________Edad de cada una de ellos________
Profesin: _____________________________________________________
Ejercicio 1.5:
Defina variables para caracterizar a los estudiantes del curso con el objetivo de
determinar posibles causas que tengan influencia en el rendimiento acadmico
del grupo.
Peso
140
110
150
117
150
150
140
112
160
120
135
110
110
160
114
128
120
130
140
174
Origen
No
Estel
Estel
Estel
No
Estel
No
Estel
Estel
No
Estel
Estel
Estel
No
No
No
Estel
No
No
No
Ingresos
Alto
Media
Media
Media
Alto
Media
Media
Alto
Alto
Alto
Alto
Media
Media
Media
Alto
Alto
Alto
Alto
Media
Media
Becas opinin
No
3
Si
3
Si
2
No
4
No
5
No
5
Si
5
Si
1
No
4
No
4
No
2
No
3
Si
3
Si
3
No
2
No
5
No
5
Si
4
Si
2
Si
4
10
UNI Norte
Nmero de clases
30-50
5-7
51-100
6-10
101-250
7-12
+250
10-20
El valor central de una clase se llama marca de clase, este valor se usa para construir
los grficos de polgonos de frecuencia. Veamos un ejemplo de cmo se construye una
Tabla de Distribucin de Frecuencias. Es importante resaltar que con las variables
nominales no se construyen intervalos, lmites marcas de clase, esto no tiene sentido
con este tipo de variable.
Estadstica Bsica para Ingenieros Agrondustriales
11
UNI Norte
1,443
1,536
1,394
1,623
1,650
1,480
1,355
1,350
1,430
1,520
1,550
1,425
1,360
1,430
1,450
1,680
1,540
1,304
1,260
1,328
1,304
1,360
1,600
Secuencia de actividades
Se calcula el Rango de los datos, valor mayor menos valor menor: 1680- 1,260 =
420 C$.
Ancho de clase: El rango se divide en cuatro, 420/4= 105 C$, se ajusta a 100 C$ y
de esta manera el nmero de clases queda en cinco.
Se construye los lmites inferiores y superiores de cada clase como intervalos
semiabiertos,
Luego se cuentan las frecuencias por clase, esto es la Frecuencia Absoluta
Se calcula la Frecuencia Relativa (Frecuencia Absoluta / n)
Se hace Frecuencia Acumulada. que es la suma de las frecuencias absolutas.
Tambin se pueden hacer las frecuencias expresadas en porcentajes.
Tabla de Distribucin de frecuencias, TDF.
Clase
Marca de
Frecuencia
Frecuencia
Frecuencia
Igual a
clase
Absoluta
Relativa
Acumulada
Menor a
1,200
<1,300
1,250
0.04
1,300
<1,400
1,350
0.33
1,400
<1,500
1,450
0.29
16
1,500
<1,600
1,550
0.17
20
1,600
<1,700
1,650
0.17
24
Total
24
1.00
12
Texto..
UNI Norte
0.35
frecuencia relativa
0.28
0.21
0.14
0.07
0.00
1100
1200
1300
1400
1500
1600
1700
1800
C$
Se puede observar que la informacin que lleva el grfico es completa, incluye todos
los datos y permite explicar el contenido del mismo por ejemplo: la barra de mayor
altura contiene la moda y al no ser un grfico simtrico concluyo que la media y
mediana son diferentes y que los datos son sesgados hay un agrupamiento de
frecuencias a la izquierda del centro.
Tablas de contingencia
Las tablas de contingencia, o tablas cruzadas, se usan para resumir la relacin de
variables cualitativas con pocas categoras, incluso dicotmicas. Estas tablas
generalmente vinculan dos variables y en las celdas generadas se muestran las
frecuencias absolutas o relativas de las variables involucradas, tambin se puede
Estadstica Bsica para Ingenieros Agrondustriales
13
UNI Norte
una de
Frecuencias absolutas
En columnas: Beca
En columnas: Beca
Sexo No
Si
Total
Mujer 10
17
Varn 7
Total 17
14
Sexo
No
Si
Total
Mujer 0.59
0.41
1.00
14
Varn 0.50
0.50
1.00
31
Total 0.55
0.45
1.00
Ejercicio 1.6 Realizar una tabla de frecuencias con una variable discreta (contable) y
una variable continua (medible) de la matriz generada con los datos obtenidos en clase.
Con dos variables cualitativas construye una tabla de contingencia.
1.3 Grficos
Los grficos nos permiten presentar la informacin que dan los datos de manera
rpida, resumida y fcil de entender. Los grficos se pueden clasificar de mltiples
maneras pero en ste texto los consideraremos como: univariados, bivariados y
multivariados, segn el nmero de variables involucradas.
14
UNI Norte
unidas, no habiendo espacio entre las barras. Para su construccin primero se tiene
que hacer una tabla de distribucin de frecuencias, TDF, donde se precisen los lmites
reales de frecuencia, que se usan para construir las barras. El centro de cada barra es
la marca de clase, esta medida se usa para construir polgonos.
40
30
20
10
0
0
5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90
Edad
598 personas de origen rural. Este Grfico creado con frecuencias y porcentajes,
permite resaltar segmentos de clases determinadas.
15
UNI Norte
otros
19%
primaria
45%
ninguno
15%
secundaria
21%
16
UNI Norte
75.5
75.2
75.0
74.5
74.0
73.5
Nota Promedio
73.5
73.0
73.0
72.5
72.5
72.0
Matematica
Contabilidad
Programacin
Algebra
Asignatura
17
UNI Norte
30
20
10
0
13
20
27
34
41
48
55
62
69
76
100
98
eficiente la informacin de
80
hasta 6 o 7 variables. Es
ideal
para
usar
con
60
variables dicotmica, SI y
40
NO.
43
30
20
19
0
Escuela Cercana
Electricidad
Agua Potable
Asistencia Mdica
Telfono
Grfico De Barras,
Bivariado en
18
UNI Norte
Agrupamientos
Un
Grfico
permite
ver
rpidamente lo que dicen los datos
Ejercicio 1.7. Realizar un grfico de barras y un grfico de Pastel a partir de los datos
recolectados en clase.
19
UNI Norte
20
UNI Norte
Media Aritmtica
Muestra
Poblacin
Variable Nota = xi
X1
X2
X3
X4
X5
X6
X7
X8
X9
X10
10
1
xi =
Valor de xi
62
68
92
88
55
79
89
92
67
69
761.
1.4.2 La Mediana
La segunda medida de tendencia central en importancia es la mediana. La mediana
Me de un conjunto de mediciones x1, x2, x3,...., xn es el valor de x que se encuentra
en el punto medio o centro cuando se ordenan los valores de menor a mayor, ranking.
Esta medida no sufre la influencia de valores extremos atpicos.
21
UNI Norte
Datos ordenados
1
2
3
4
5
6
7
8
9
10
Valor de xi
55
62
67
68
69
79
88
89
92
92
1.4.3 La Moda
La moda, Mo, es la medida de tendencia central ms fcil de calcular y tambin es la
ms sujeta a fluctuaciones cuando cambian unos pocos valores de la distribucin. Por
esta razn la moda se suele usar para una evaluacin rpida de la tendencia central.
La moda se define como el valor ms frecuente de una distribucin. En una tabla de
22
UNI Norte
La mediana suele ser la medida preferida cuando se emplea una escala ordinal, estas
son las situaciones donde el valor asignado a cada caso no tiene otro significado ms
que el indicar el orden entre los casos. Por ejemplo saber en una clase cuales alumnos
estn dentro del 50% con mejores notas y cuales dentro del 50% con peores notas.
Tambin se suele preferir la mediana cuando unos pocos valores extremos
distorsionan el valor de la media. Por ejemplo si tengo 9 personas con 0 ingresos y uno
sola que tiene ingresos de 10 unidades, la media dar a entender que la mayora recibe
1 unidad, cuando esto no es real.
23
UNI Norte
Aunque no necesariamente una escala de medida nos debe decir qu tipo de medida
de tendencia central debemos usar, pero si nos ayuda a determinar cul es la ms
apropiada.
Un aspecto interesante entre las tres medidas es su comportamiento referente a la
simetra que toma una distribucin. Cuando las distribuciones son simtricas, sin
sesgo, caso de la distribucin Normal que tiene forma de campana, la media, la
mediana y la moda coinciden. Si la distribucin es asimtrica con sesgo positivo, hay
ms datos hacia la izquierda de la media, entonces la media es mayor que la mediana
y esta mayor que la moda. Si ocurre lo contrario, el sesgo es negativo, entonces la
media es menor que la mediana y sta menor que la moda.
x g 4 (4)(5)(4)(6) 4.68
Su valor siempre es menor o igual a la media aritmtica. Una ventaja de su uso es que
considera todos los valores de la distribucin y es menos sensible que la media
aritmtica a los valores extremos, sin embargo es de clculo complicado y si un valor
vale 0 se anula.
24
UNI Norte
xc
xc 2
42 52 42 62
4.81
4
Se utiliza cuando se quiere evitar los efectos de los signos negativos. sta media solo
puede tomar valores positivos. Luego veremos que el desvo estndar es un tipo de
media cuadrtica.
anmalos de la distribucin.
25
UNI Norte
18.7
Kg
14.9
11.2
Mediana
7.5
3.7
1.5.1 El Rango
El Rango, Recorrido o Amplitud de un conjunto de mediciones, es la diferencia entre el
valor mayor y el valor menor, indica el nmero necesario y mnimo de unidades, en la
escala de medicin, para incluir los valores mnimo y mximo. Es la medida de
Estadstica Bsica para Ingenieros Agrondustriales
26
UNI Norte
Cuando se trabaja con muestras el desvo estndar se simboliza con una S y con la
letra sigma minscula cuando se usan datos de una poblacin. Su frmula de
clculo tradicional es:
/ 1
27
UNI Norte
1
Esta forma de resolucin es equivalente a la forma de clculo tradicional, es de ms
fcil resolucin cuando se tienen calculadoras de mano que hacen sumas de
cuadrados.
Clculo del desvi estndar S para datos agrupados
((55 76.1) 2 (62 76.1) 2 (67 76.1) 2 (68 76.1) 2 (69 76.1) 2 (79 76.1) 2
(88 76.1) 2 (89 76.1) 2 (92 76.1) 2 (92 76.1) 2 ) / 9
= 13.6
Se sugiere hacer estos clculos usando una calculadora cientfica en funcin
estadstica.
28
UNI Norte
1.5.3 La Varianza
La varianza es el desvo estndar elevado al cuadrado y se simboliza con S 2 cuando
es de una muestra, o 2 cuando es poblacional. Este es una medida que se usa en
muchas pruebas de Hiptesis estadsticas, por ejemplo el Anlisis de Varianza,
ANDEVA que se basa en la descomposicin y relacin de las varianzas de las causas
de variacin de los datos. Pero para fines descriptivos se prefiere usar el desvo
estndar en vez de la varianza, que suele ser un valor mayor y difcil de interpretar.
29
UNI Norte
Moda = 3 (Media - Mediana), se usa la siguiente forma de clculo prctico del sesgo:
30
UNI Norte
frecuencia relativa
0.34
Asimetria 0.93
0.25
0.17
0.08
0.00
15
22
28
34
41
47
54
60
Cereal
Para datos que siguen una distribucin normal (ver Captulo 3) el sesgo estandarizado
debe caer dentro de un intervalo (-2,+2).
1.6.2 La Curtosis
La curtosis es una medida que indica o mide lo plano o puntiaguda que es una curva de
distribucin. Cuando esta es cero, curtosis = 0, significa que se trata de una curva
Normal. Si es positiva, quiere decir que la curva o distribucin o polgono es ms
puntiaguda o levantada que la curva normal (curva leptocrtica). Si es negativa quiere
decir que es ms plana (curva mesocrtica).
Curtosis =
Curtosis estandarizada, es una medida que se calcula de la siguiente manera:
31
UNI Norte
Definicin:
Las medidas calculadas a partir de la poblacin, Ej. y se llaman
PARMETROS
Las medidas calculadas a partir de las muestras, Ej. S se llaman
ESTADSTICOS
Ejercicio 1.8:
Tomando como fuente de datos las variables continuas recolectadas a partir de los
datos que generen los estudiantes en clase deben construir:
distribucin de frecuencias.
espacios:
Ejercicio 1.9:
Se tiene los datos de 30 aos de precipitaciones de San Ramn, Matagalpa. Calcule
los datos promedios y el coeficiente de variacin
de los 30 aos
y de forma
quinquenal (cada 5 aos). Haga una tabla de los valores mximos y mnimos
quinquenales. Comente si observa alguna tendencia de variacin de lluvias.
Datos de precipitaciones, San Ramn Matagalpa
Ao
Mm
1970
1793
1971
1610
1972
1126
1973
1647
1974
1344
1975
1820
1976
974
Ao
Mm
Ao
mm
1980
2373
1990
1583
1981
1854
1991
1302
1982
1470
1992
1651
1983
1185
1993
2250
1984
1522
1994
1361
1985
1154
1995
2072
1986
1383
1996
1869
32
UNI Norte
1977
1978
1979
1248
1530
1164
1987
1988
1989
1335
2266
1038
1997
1998
1999
1499
2980
2175
33
UNI Norte
El muestreo aleatorio simple debe utilizarse cuando los elementos de la poblacin son
homogneo respecto a las caractersticas a estudiar, es decir a priori no conocemos
que elementos de la poblacin tendrn valores altos de ella. El primer problema al
aplicar esta forma de muestreo, es calcular el n, nmero de de elementos de la
muestra.
Clculo de n por ecuacin predeterminada: Cuando la fraccin n / N a priori se
determina que ser
aproximada es el siguiente:
Dnde:
Si bien este modelo es bastante terico es un mtodo muy usado para aproximar un
valor de n entrevistados, cuando se realiza investigacin social o para determinar el
tamao de muestra de un lote de piezas donde lo que se evala es si stas estn
defectuosas o no, muestreo por atributos.
Clculo de n Grficamente: Se sabe que a ms grande la muestra mejor sta
estima la media de la poblacin, sin embargo hay un momento que la media que se
calcula a partir de la muestra casi no cambia, aunque sta aumente de tamao, en ese
momento el tamao de la muestra comienza a ser ptimo.
34
UNI Norte
68
82
88
65
79
89
92
67
69
75
79
71
78
75
x1
x2
x3
x4
x5
x6
x7
x8
x9
x 10
x 11
x 12
x 13
x 14
x 15
72
70
74
77
75
76
78
79
78
77
77
77
77
77
77
% de piezas de la muestra
35
UNI Norte
60-300
10
301-1000
1001-5000
+ 5000
36
UNI Norte
37
UNI Norte
Si el orden de los elementos es tal que los ms prximos tienden a ser ms semejantes
que los alejados, el muestreo sistemtico tiende a ser ms preciso que el aleatorio
simple al cubrir ms homogneamente toda la poblacin.
38
UNI Norte
probabilidad condicional en
modelos aplicados.
Construir ejemplos del uso del teorema de Bayes al describir situaciones del
entorno profesional.
los
mismos.
Esta
ciencia
comenz
Sin
39
UNI Norte
Es la definicin ms antigua y se atribuye al matemtico francs Pierre Laplace (17491827); tambin se conoce con el nombre de probabilidad a priori, pues para calcularla,
es necesario conocer, antes de realizar el experimento aleatorio, el espacio muestral y
el nmero de resultados o sucesos elementales que entran a formar parte del suceso.
40
UNI Norte
Tiene dos reglas bsicas que la estructuran: la regla de la suma y la regla del
producto.
41
UNI Norte
Siendo:
= A unin B
. (Un ejemplo de eventos incompatibles es cuando se tira una vez un dado y que
salgan al mismo tiempo el nmero 1 y el nmero 6.)
En casos de eventos incompatibles la probabilidad que ocurra A B es P(A B) =
Ejemplo, si se arroja dos veces una moneda al aire, la probabilidad que salga una vez
escudo y el otro nmero sin importar el orden, es la probabilidad de los eventos
escudo, nmero y nmero, escudo. Debido a que son cuatro los eventos posibles
= 0.25,
de
42
UNI Norte
lluvias es del 0.02 anual. Cul es la probabilidad que en un mismo ao la ciudad sufra
un terremoto y una inundacin?
Ejercicio 2.3. Se hace un juego donde se tira un dado una vez, y se gana si sale el
nmero 1,2 3. Si sale un nmero diferente se pierde. Qu es ms probable perder o
ganar?
. Siendo
=A
interseccin B.
Por ejemplo si la Probabilidad de un nacimiento de un nio es 0.5, P (nio) = 0.5, la
probabilidad que dos mujeres en su primer parto tengan hijos varones es un evento
independiente, uno no influye sobre otro, la P (nio, nio) es de 0.52 = 0.25.
Una paradoja es que una persona que compra todas las semanas la lotera, para un
sorteo dado, tiene la misma probabilidad de sacar el premio mayor que una persona
que compr un nmero por primera vez.
Ejercicio 2.4: Estime la probabilidad que al elegir por sorteo dos estudiantes del grupo
de clase, ambos sean varones. Considere que la misma persona elegida en el primer
sorteo puede ser elegida en el segundo. Determinar tambin cuales eventos forman
es este caso.
43
UNI Norte
Si p (B) 0
= P(A) x P (B)
Ejemplo: Se conoce que los estudiantes de la UNI tienen las siguientes preferencias
en el consumo de gaseosas:
Consumo de Gaseosas por semana
Varones
Mujeres
Total
No consume
30
10
40
1-5 veces
50
25
75
Ms de 5 veces
20
15
35
44
UNI Norte
Total
100
50
150
se selecciona al azar un
estudiante varn Cul es la probabilidad que ese que ese joven haya consumido ms
de 5 gaseosas por semana? En este problema ya no es necesarios conocer el nmero
total de estudiantes, porque al seleccionar a un individuo del sexo masculino, los
individuos del sexo femenino no son tomados en cuenta. Entonces se puede definir la
probabilidad deseada como Qu probabilidad existe de que un individuo beba ms de
5 gaseosas a la semana dado que el individuo seleccionado sea varn? Esta es una
probabilidad condicional y se resuelve de la siguiente manera:
P(C+5\Sv) =
Ejercicio 2.5 Si se tiene una escuela de 200 alumnos distribuidos en tres aulas: A, B y
C. Por sexo: mujer, y varn; como sigue:
Aula/ Sexo
Varn
Mujer
20
20
30
30
56
44
Total
106
94
Cul es la probabilidad que un estudiante, sin importar el sexo, sea del aula B?
Cul es la probabilidad que un estudiante que pasa por el corredor sea del aula A, si
el estudiante es mujer?
Ejercicio 2.6 En un aula hay 6 estudiantes realizando un examen, dos son mujeres y
cuatro son varones. Cul es la probabilidad que finalice una mujer de segunda dado
que el primero en finalizar fue un hombre?
Si la solucin es:
45
UNI Norte
/
/
Explicar cmo se construyeron los valores 8/30 y 4/6?
A1 A2 ... An = y Ai Aj = i j
A1
A2
An
Y si el conjunto de sucesos Ai que forman una particin del espacio muestral y sucede
que p (Ai) 0 Ai. Entonces si ocurre un suceso B dentro del mismo espacio muestral
y se cumple que:
46
UNI Norte
A2
A1
B
An
47
UNI Norte
P= 0.27
P= 0.50
P= 0.23
Varn
Mujer
P= 0.25
No
Consume
P= 0.43
P= 0.33
Mujer
1-5 Gaseosas
+ 5 Gaseosas
Resolviendo por Bayes, la probabilidad que una mujer no consuma gaseosas es:
48
UNI Norte
Prob.
Mquina
Prob.
Tipo de
produccin
0.45
0.30
0.25
0.03
0.97
0.04
0.96
0.05
0.095
49
UNI Norte
20%.
Segn estos posibles estados meteorolgicos y datos histricos de comportamiento vehicular, la
posibilidad de que ocurra un accidente es la siguiente:
sale el sol: probabilidad de accidente del 10%
Ejercicio 2.8 Cierto artculo es manufacturado por tres fbricas: F1, F2 y F3. Se sabe que la primera
produce el doble de artculos que la segunda y que sta (F2) y la tercera producen el mismo nmero de
artculos (durante un perodo de tiempo especificado, el mismo para las tres). Se sabe tambin que el
1.5% de los artculos producidos por las dos primeras fbricas es defectuoso, mientras que en la tercera
los es el 3.5%.
Se colocan juntos todos los artculos producidos por las tres fbricas y se escoge uno al azar.
Cul es la Probabilidad de que un artculo sea Defectuoso?
Cul Fbrica tiene la mayor probabilidad de haber producido el artculo Defectuosos?
50
UNI Norte
El trmino " n! " se denomina "factorial de n" y es la multiplicacin de todos los nmeros que van desde
"n" hasta 1. Por ejemplo: 4! = 4 X 3 X 2 X 1 = 24
Ejemplo:
1
1
1
1
1
1
Ejemplo: Un grupo de clases est compuesto por 17 mujeres y 20 varones cul es la probabilidad que
entre los dos mejores estudiantes, 1 sean mujer y 1 varn?
Probabilidad (1m, 1v)=
51
UNI Norte
Permutaciones:
La expresin "Pm,n" representa las variaciones de "m" elementos, formando subgrupos de "n" elementos.
En este caso, un subgrupo se diferenciar del resto, bien por los elementos que lo forman, o bien por el
orden de dichos elementos. Para calcular el nmero de permutaciones se aplica la siguiente frmula:
Ejemplo:
obtener?
Lo que se pide es formar permutaciones u ordenaciones de 2 letras, cuando el total de
letras es 4. P(14,2) En este caso n=2 y m =4. Las "palabras" de 2 letras formadas son: ab,
ac, ad, ba, bc, bd, ca, cb, cd, da, db, dc. En total son 12.
2
1
1
1
1
52
UNI Norte
Ejercicio 2.11. Una persona olvido su clave de acceso a una caja fuerte, la clave est
formada por 3 nmeros, determina cuantas formas diferentes puede tener la clave si no
se permite repetir los nmeros.
53
UNI Norte
54
UNI Norte
empricos. Debido a que estas distribuciones tratan sobre expectativas de que algo
suceda, resultan ser modelos tiles para hacer inferencias y para tomar decisiones en
condiciones de incertidumbre.
Una distribucin de frecuencias son las frecuencias observadas de todos los resultados
de un experimento que se presentaron cuando ya se efectu el experimento, es
emprica. Mientras que una distribucin de probabilidad es un listado de las
probabilidades de todos los posibles resultados que podran obtenerse si el
experimento se va a llevar a cabo, es terica.
55
UNI Norte
las distribuciones continuas, cuando stas tienen muchos resultados posibles, todos
muy cercanos entre s.
Se puede pensar en una variable aleatoria como un valor o una magnitud que cambia
de una presentacin a otra, sin seguir una secuencia predecible. Los valores de una
variable aleatoria son los valores numricos correspondientes a cada posible resultado
de un experimento aleatorio. Una variable aleatoria asocia un nmero o ms
generalmente una caracterstica a todo resultado posible del experimento. Por ejemplo,
si consideramos el experimento que consiste en realizar mediciones de
la
56
UNI Norte
Sucesos
px
{}
1/16
{v, v, v, v}
4/16
6/16
4/16
{vvvv}
1/16
57
UNI Norte
Probabilidad
0.39
0.31
0.22
0.13
0.05
0
Nro Nios
Sin embargo para las variables continuas la probabilidad de que una variable tome
cualquier valor concreto es 0, por lo tanto la fx slo permite calcular la probabilidad para
un intervalo del tipo (a<X<b), mediante el clculo de la integral correspondiente. Para
simplificar el clculo con variables aleatorias continuas, se aproximan estas a funciones
conocidas y con tablas de probabilidades, ahora con programas computacionales, se
pueden buscar los valores de P(a<X<b).
Distribucin acumulativa o funcin de distribucin. Funcin que acumula
probabilidades asociadas a una variable aleatoria. Su notacin es F(x) = p (X x). Para
el ejemplo anterior, F (X) es:
X
fx
Fx
0
1
2
3
4
1/16
4/16
6/16
4/16
1/16
1/16
5/16
11/16
15/16
16/16
a
f ( x)dx
58
UNI Norte
x E ( x) xf ( x)
xf ( x)dx
x E ( x)
Caso discreto
Caso continuo
x Eh( x) h( x) f ( x)
h( x) f ( x)dx
x Eh( x)
Caso discreto
Caso continuo
Ejemplo con una variable discreta: Si en una bolsa tengo 5 marcadores de 5 colores
diferentes: azul, amarillo, negro, rojo, verde. Y el experimento consiste en extraer un
marcador y observar su color Cul es la probabilidad media?
La variable X solo puede tomar el valor 1 y para todos los colores f(x) = 1/5. En
consecuencia la media es
59
UNI Norte
h(x)
90
90
450
0
0
60
UNI Norte
Ejercicio 3.1: En los casino el juego de ruleta mesa tiene 38 nmeros, esto incluye el
nmero 0 y doble 00. Si usted apuesta una moneda a un nmero y gana, el casino le
paga 36 monedas. Este es un juego justo? Justificar la respuesta.
dice que la
. Si E(x) es la media (o la
siguiente relacin:
|
|
, por ejemplo si a = 2
|
61
UNI Norte
El intervalo
El intervalo
Ejercicio 3.2 Una industria produce ventanas cuya ancho tiene una media de 250 cm
y una desviacin estndar de 1.80 cm Construya un intervalo donde se encuentre al
menos el 8/9 de los datos?
Para una variable x con media y desviacin estndar que est normalmente
distribuida, escribimos: x es N (, ). La funcin de densidad de la distribucin normal
es:
62
UNI Norte
20
Frecuencia
10
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
El intervalo
El intervalo
63
UNI Norte
Luego con una tabla normal tipificada es fcil determinar probabilidades por intervalos
para diferentes valores de la variable x. Esta distribucin funciona relativamente bien
para hacer probabilidades cuando se tiene ms de 30 datos, y estos tienen una
distribucin en forma de campana. A continuacin
distribucin normal tipificada (0,1) donde est sombreado un intervalo de 1.96 desvi
estndar.
Funcin de densidad distribucin normal tipificada
0.40
Normal(0,1): p(evento)=0.9500
Densidad
0.30
0.20
0.10
0.00
-3.00
-2.00
-1.00
0.00
1.00
2.00
3.00
Variable
64
UNI Norte
Funcin de densidad
Normal(21,10.24): p(evento)=0.0144
0.13
Densidad
0.09
0.06
0.03
0.00
5.00
13.00
21.00
Variable
29.00
37.00
Ejercicio 3.4 Una fbrica produce puertas cuya altura tiene una distribucin normal con
media de 250 cm y una desviacin estndar de 2.60 cm
Cul es la probabilidad que una puerta seleccionada de este grupo tenga una altura
entre 244 y 255 cm?
Ejercicio 3.5 Una poblacin de nios en edad escolar tiene una media de 11.5 aos y
un desvo estndar de 3 aos. Cul es la probabilidad de que un nio sea entre 8.5 y
14.5 aos, ms de 10, y menos de 12?
Ejercicio 3.7 Se producen quesos con un dimetro es 35cm y se acepta una varianza
de 0.1 cm2. Si por problemas de envase se rechaza productos con dimetros menores
a 34.5cm y mayores a 35.5 Cul es la probabilidad de rechazo de la produccin por
problemas de envase?
Estadstica Bsica para Ingenieros Agrondustriales
65
UNI Norte
Esta distribucin es simtrica, con forma de campana y su media vale 0. Cuando hay
pocos datos la campana es ms aplanada que una campana Normal, con de 30 datos
la distribucin t es casi igual que la distribucin Normal Tipificada (0,1). Esta
Distribucin se usa extensivamente para construir intervalos de confianza de y para
realizar pruebas de hiptesis de: uno y dos promedias, del coeficiente de correlacin y
de los coeficientes beta en la regresin lineal.
n=100
n=10
Densidad
0.30
n=1
0.20
0.10
0.00
-5.00
-2.50
0.00
2.50
5.00
Variable
Estadstica Bsica para Ingenieros Agrondustriales
66
UNI Norte
Ejemplo Se sabe que la media histrica de edad de los estudiantes de una universidad
es de 21 aos. Cul es la probabilidad que un grupo de 30 estudiantes tenga un
promedio de edad mayor a 22 aos? En este grupo se calcul S, desvo estndar, y
En este caso
22 2
/ 2
0.40
Densidad
0.30
0.20
0.10
0.00
-5.18
-2.59
0.00
Variable
2.59
5.18
Ejercicio 3.9 Histricamente se venden postes con un dimetro de 25cm, y con una
varianza de 64 cm. Si el comprador rechaza un lote si este tiene un promedio de
dimetro menor a 24 cm. Cul es la probabilidad de rechazar un lote de 100 postes?
Resolver con el mdulo didctico de INFOSTAT.
67
UNI Norte
Densidad
0.18
0.12
0.06
0.00
0.00
3.81
7.62
11.44
15.25
Variable
68
UNI Norte
Hiptesis nula, las medias de los tratamientos pertenecen a una mismo media
poblacional
Densidad
0.5
0.3
0.2
0.0
0.00
4.14
8.29
12.43
16.57
Variable
69
UNI Norte
3. 7 La distribucin Binomial
Se utiliza para construir probabilidades con variables discretas, es decir cuyos valores
son contables. Este modelo se aplica a poblaciones finitas de las que tomamos
elementos al azar con reemplazamiento y tambin a poblaciones conceptualmente
infinitas, como son las piezas que generara una mquina, siempre que el proceso
generador sea estable (proporcin de pieza defectuosas constante a largo plazo) y sin
memoria (el resultado en cada momento es independiente de lo previamente ocurrido).
Conociendo que:
70
UNI Norte
P (x) = ( )
siendo x = 0, 1, ..., n
( )
A evento varn
71
UNI Norte
Por lo tanto:
12 5 125
P (5 varones) = 0.5 0.5
5
12
Donde 12!/ 5!(12 5)! = 792
5
792(0.55 )0.57 = 792 (0.03125) (0.0078125) = 0.19
P (5 varones) =
Ejemplo 2. Existe una empresa que produce vasos, y se sabe que histricamente el 2
% de estos salen fallados. Por otro lado existe un comprador que tolera el 2 % de
fallos, si el valor es mayor rechaza el lote completo que quiere comprar. Se decide
tomar una muestra de 100 vasos, Cul es la probabilidad de que el comprador acepte
el lote?
1
1
(
1
1
(
1
(
)
1
)
)
Ejercicio 3.10 El Ministerio del Trabajo reporta que 20% de la fuerza de trabajo en un
pueblo est desempleada. De una muestra de 14 trabajadores, calcule las siguientes
probabilidades con la frmula de la distribucin binomial (n=14, p=0.2): Resuelva:
1. Tres estn desempleados. Respuesta: P(x=3)=.250
2. Al menos un trabajador est desempleado.
Respuesta: P(x 1) = 1 - P(x=0) =1 - .044 = .956
3. A lo ms dos trabajadores estn desempleados.
Respuesta: P(x 2)=.044 +.154 +.250 =.448
72
UNI Norte
Ejercicio 3.11 Si el 15 % de las piezas producidas por una mquina son defectuosas,
cul es la probabilidad de que entre cuatro piezas elegidas al azar, a lo sumo una sea
defectuosa? Respuesta: P(x 1)=.89
Ejercicio 3.12 Si de seis a siete de la tarde se admite que un nmero de telfono de
cada cinco est comunicando, cul es la probabilidad de que, cuando se marquen 10
nmeros de telfono elegidos al azar, slo comuniquen dos? Respuesta: P(x=2) = .30
73
UNI Norte
Ejemplo: Se est haciendo un estudio para ampliar una terminal de taxis y se sabe que
en las horas de la tarde de 6-10 PM el nmero medio de llegadas es 4.0 personas por
hora. Cul es la probabilidad de 4 llegadas en una hora?
P (4) = (44) (e-4) / 4!= 0.1954.
74
UNI Norte
, S, n).
75
UNI Norte
, de muestras.
es el ms usado y para
95 %,
IC 95 % de
1.96
IC 95 % de
t95
El IC
95 %
95 %
variable que genera grupos, con una variable continua. En este grfico se observan las
medias de cada grupo con sus intervalos de confianza al 95 %, estos en forma de dos
rayas. Veamos un ejemplo de este tipo.
76
UNI Norte
al hacer una
Ejercicio 4.1 Una fbrica produce puertas, una muestra de 50 de stas arroja que
tienen una altura media de 250 cm y una desviacin estndar de 2.60 cm. Construir
el intervalo de confianza de la media poblacional?
77
UNI Norte
hiptesis nula y se representa por H0. Rechazar H0 implica aceptar una hiptesis
alternativa (HA).
Cuando se acepta o se rechaza una hiptesis puede ocurrir que:
H0 rechazada
H0 cierta
H0 falsa, HA cierta
Error tipo I ()
Decisin correcta
Error tipo II ( )
78
UNI Norte
79
UNI Norte
S=3.6
Se trata de un contraste sobre medias. La hiptesis nula (lo que queremos rechazar)
es: H0: = 18. La hiptesis alternativa es: HA: > 18. Este un contraste lateral derecho.
Fijamos "a priori" el nivel de significacin en = 0,05 y la regin crtica en este ejemplo
t(35)0,05=1,70.
Calculamos el valor de tc en la muestra
80
UNI Norte
cambiado. B- Se quiere saber si diez fbricas artesanales que producen bloques estn
manteniendo la calidad de sus productos en el tiempo, para eso se comparan 10
muestras del mes uno con 10 muestras del mes dos.
El estadstico de contraste es
es la desviacin
81
UNI Norte
% Mes 6
86
82
80
78
75
82
85
86
86
% Mes 12
79
69
74
70
67
64
76
63
76
La hiptesis nula es H0: 6=12, hiptesis alternativa HA: 6>12. Fijamos "a priori" el
nivel de significacin en = 0,05 y la regin crtica en este ejemplo t(8)0,05=1,86.
11
El valor tc de 5.96 est en la regin crtica (el valor P es de 0.002), por lo tanto
rechazamos H0, concluimos que el poder germinativo de la semilla de maz disminuy
al estar 12 meses almacenados.
82
UNI Norte
2
2
2
2
Ejemplo. En un ensayo para evaluar la vida til de dos productos. La variable medida
es el tiempo de vida til en aos: producto T, n = 35;
producto K n = 40;
Como no conocemos como son las varianzas entre s, el modelo nos obliga a verificar
si la varianzas son iguales, si fueran distintas es otra la prueba t a realizar. Para ello
se debe plantear primero un contraste de prueba de hiptesis de variancias. Si las
variancias son iguales se sigue con la prueba t que se presenta, sino se debe hacer
otra variante de prueba t de ms difcil clculo.
Hiptesis de Variancias
H0: 2T = 2K, HA: 2T 2K
El estadstico es de contraste es una prueba F= S2K / S2T = 13.9 / 12.8= 1.09, como el
valor F de tabla es 1.74, en consecuencia aceptamos la H0 y concluimos que las
varianzas son iguales. Luego se hace la prueba de hiptesis de medias con el
estadstico antes detallado.
83
UNI Norte
1 1
1
1
1
II
III
IV
Pulpa caf
1.00
0.90
1.16
0.98
Lombrihumus
1.65
1.59
2.00
1.65
Realizar e Interpretar su prueba de hiptesis. Resolver con una prueba t para dos
grupos que pertenecen a una misma poblacin
84
UNI Norte
Desarrollar
5.1 Correlacin
Se puede definir la correlacin cmo la medida estadstica que sirve para evaluar la
intensidad de la asociacin entre dos o ms variables cuantitativas. Es comn que se
quiera saber, si sobre una misma poblacin los valores de dos o ms variables
cuantitativas distintas tienen alguna relacin medible entre ellas, o si los cambios en
una o varias de ellas influyen en los valores de otra variable. Si ocurre esto decimos
que las variables estn correlacionadas o bien que hay correlacin entre ellas. Este tipo
de anlisis funciona bien cuando las variables estudiadas son continuas, no es
adecuado usar esta prueba con variables del tipo nominal.
variables. El valor del coeficiente de correlacin puede tomar valores desde menos uno
hasta uno, -1 < r < 1, indicando que mientras ms cercano a uno sea el valor del
coeficiente de correlacin, en cualquier direccin, ms fuerte ser la asociacin lineal
entre las dos variables. El coeficiente de correlacin de clculo r es un estimador l del
Estadstica Bsica para Ingenieros Agrondustriales
85
UNI Norte
2
2 2
Coeficiente Correlacin, Estimacin por Suma de Cuadrados. Ms utilizado cuando se
dispone de calculadoras de mano que hacen sumas de cuadrados.
) (
86
UNI Norte
Segn sea la dispersin de los datos (nube de puntos) en el plano cartesiano, pueden
darse, alguna de las siguientes relaciones: lineales o curvilneas cmo la cuadrtica,
cbica, etc. Dentro de estas nubes de puntos se pueden generar lneas poligonales a
partir de ecuaciones de regresin, que permitan predecir el comportamiento de la
variable dependiente.
5.2 Regresin
La regresin es una tcnica que permite predecir un valor numrico de una variable,
dependiente, basndonos en el conocimiento de un valor diferente de otra variable,
independiente. El trmino regresin fue introducido por Francis Galton en su libro
Natural inheritance (1889), partiendo de los anlisis estadsticos de Karl Pearson. Su
trabajo se centr en la descripcin de los rasgos fsicos de los descendientes a partir
de los de sus padres. Estudiando la altura de padres e hijos lleg a la conclusin de
que los padres muy altos tenan una tendencia a tener hijos que heredaban parte de
esta altura, pero los datos tambin revelaban una tendencia a regresar a la media.
Los tipos de regresin ms comunes entre dos variables son las del tipo polinmico
como la regresin: lineal, cuadrtica y cbica. La primera regresin genera una recta,
las otras diferentes tipos de parbolas. Otros tipos de regresin que se pueden usar
con dos variables son la logartmica y la exponencial, la regresin logartmica permite
transformar una curva en una lnea recta. Cuando hay ms de una variable
independiente x, la regresin ms utilizada en la regresin mltiple. A continuacin se
expresan matemticamente los diferentes modelos comentados:
87
UNI Norte
REGRESIN
ECUACIN
Lineal
Logartmica
Exponencial
Cuadrtica
Cbica
Lineal Mltiple
2
2
2
El valor de
. El promedio de los
88
UNI Norte
se
De tal manera que la ordenada al origen, cuando X vale 0, b0, queda definida de la
siguiente manera:
89
UNI Norte
Matemticas
40
56
64
65
66
68
75
76
85
95
Espaol
45
59
67
59
69
70
61
82
75
100
Se supone que los alumnos con mejores notas en matemticas, variable independiente
X, tienen las mejores notas en espaol, variable dependiente Y. Esta pregunta se
puede responder con un anlisis de regresin correlacin.
Grfico de Dispersin
103
espaol
88
73
57
42
37
52
68
matemticas
83
98
Clculo de la recta de regresin con datos generados con una calculadora de mano
que hace sumatorias:
90
UNI Norte
Coeficiente de correlacin r:
1
1
(
1 ) (
1 )
Este valor de r de 0.891 refleja que hay una alta correlacin, asociacin, entre las
notas de matemticas y espaol, los mejores estudiantes en una asignatura son los
mejores estudiantes en la otra.
Para hacer la recta de regresin debemos calcular b1 y b0:
1
b0 =
= 8.27
Error
1.70
1.69
2.68
-6.20
2.93
2.18
74.83
-12.96 7.17
82.71
91.47
-7.72
8.53
91
UNI Norte
Regresin simple
100
espaol
85
70
56
41
37
52
68
83
98
matemticas
Grfico de Regresin de la asignatura Matemtica y Espaol. Se observa la recta de
regresin y los datos observados en forma de puntos.
92
Cuantiles observados(RDUO_espaol)
UNI Norte
10.5
Grfico QQ plot
r= 0.95 (RDUO)
4.6
-1.2
-7.1
-13.0
-13.0
-7.1
-1.2
4.6
10.5
1
1
12
93
UNI Norte
El valor 5.55 es mayo que el valor t de tabla con 8 gl, de 2.3, por lo tanto se acepta la
hiptesis alternativa, Rho es diferente de 0, existe correlacin, por lo tanto se justifica
realizar un estudio posterior de regresin.
el ingreso
familiar mensual en C$. Haga estudio de regresin y correlacin de las dos variables.
Trabaje con calculadora.
Tabla de datos
Ingreso observado por
familia, en cientos C$
Gasto observados en
alimentacin, en cientos C$
30
34
17
26
29
18
32
32
21
26
5
19
18
7
23
25
94