Você está na página 1de 60

Probabilidad y Estadı́stica

Saba Infante
Escuela de Ciencias Matemáticas y Computacionales,
Universidad Yachay Tech

Ibarra, Ecuador

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 1 / 60
Objetivo terminal: al concluir esta sección debemos estar en la
capacidad de definir y usar las principales medidas de tendencia
central, las medidas de posición , las medidas de dispersión, las
medidas de forma (asimetrı́a y curtosis) de un conjunto de datos y las
técnicas para manipular distribuciones de frecuencias.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 2 / 60
Definición
Medidas descriptivas: son cantidades que de manera resumida proveen
información acerca de caracterı́sticas importantes de un conjunto de datos.
Las medidas descriptivas se pueden clasificar de acuerdo a lo que se mide
en los siguientes tres grupos: medidas de localización, medidas de
dispersión y medidas de forma.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 3 / 60
Definición
La media aritmética: de una variable es simplemente el promedio de los
datos. Su cálculo depende si los datos están o no agrupados en una
distribución de frecuencia.
Media para datos no agrupados es dada por:
Pn
xi
x̄ = i=1
n
donde: xi representa la i−ésima observación y n es el tamaño de la
muestra.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 4 / 60
Definición
Media para datos agrupados en tablas de frecuencia, su fórmula de
cálculo es:
Clases individuales:
Pk
i=1 xi fi
x̄ =
n
Clases en intervalos:
Pk
i=1 mi fi
x̄ =
n
fi es la frecuencia absoluta de la clase, y mi es el punto medio de la
clase.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 5 / 60
Ventajas:
Toma en cuenta todos los datos.
Fácil de calcular y de operar algebraicamente.
A medida que la distribución sea mas simétrica mayor será la
aproximación entre el valor medio de los datos no agrupados y el valor
medio de los datos agrupados.
Desventajas:
Es sensible a valores extremos.
No ofrece siempre una buena aproximación cuando las distribuciones
son asimétricas.
No se puede calcular para tablas de frecuencias con intervalos de clases
abiertas.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 6 / 60
Definición
La media aritmética ponderada se define de la siguiente manera:
Pn
xi wi
x̄ = Pi=1n
i=1 wi

donde: wi es la ponderación (peso) de la i−ésima observación.

Media de la composición de poblaciones


n1 x̄1 + . . . + nk x̄k
x̄p =
n = n1 + . . . + nk

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 7 / 60
Definición
La media geométrica se define de la siguiente manera:
q
x̄a = n x1n1 x2n2 . . . xknk

Definición
La media armónica se define de la siguiente manera:
n = n1 + . . . + nk
x̄a = n1
x1 + nx22 + . . . + nxkk

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 8 / 60
Definición
La mediana: es el valor que ocupa la posición central de un conjunto de
observaciones, una vez que han sido ordenados en forma ascendente o
descendente.
Para datos no agrupados, la mediana es el valor central del conjunto
ordenado , mientras que cuando el número de datos es par, la medina es el
promedio de los valores centrales del conjunto ordenado, es decir:
X( n2 ) + X( n2 )+1
Md = , si n es par
2
Md = X( n+1 ) , si n es impar
2

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 9 / 60
Ejemplo
Supóngase que se tienen los siguientes datos: 6, 8, 3, 4, 4, 8, 5, 8, 10, los
datos ordenados son :3, 4, 4, 5, 6, 8, 8, 8, 10, y n = 9, entonces la mediana
es:

Md = X( 9+1 ) = X(5) = 6
2

Ejemplo
Supóngase que se tienen los siguientes datos: 5, 5, 7, 9, 11, 12, 15, 18, los
datos ordenados son: 5, 5, 7, 9, 11, 12, 15, 18, y n = 8, entonces la mediana
es:
X( 8 ) + X( 8 )+1 X(4) + X(5) 9 + 11
2 2
Md = = = = 10
2 2 2

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 10 / 60
Procedimiento para el cálculo de la mediana
Si los datos están agrupados en tablas de frecuencias y las clases son
valores individuales, el procedimiento es el siguiente:
Se calcula n2 .
Si n2 coincide con Fa , la mediana es el promedio de ese valor de la
variable y el siguiente.
Si n2 no coincide con Fa , se ubica aquella frecuencia acumulada que
contiene a n2 y la mediana es su correspondiente valor de variable.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 11 / 60
Si los datos están agrupados en tablas de frecuencias y las clases son
intervalos, la mediana viene dada por
n
2 − Fam
md = LIm + am
fm
donde:
md = Mediana
LIm = Lı́mite inferior exacto de la clase mediana, es decir la que
contiene a la mediana,
n = Suma de las frecuencias, es decir, cantidad total de datos,
Fam = Frecuencia acumulada de la clase anterior a la clase mediana,
fm = frecuencia absoluta de la clase mediana,
am = amplitud o tamaño del intervalo de la clase mediana.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 12 / 60
El procedimiento para su calculo es el siguiente:
Se calcula n2 .
Ubicar la clase cuya frecuencia acumulada es igual o superior a n2 . A
esta clase se le llama clase mediana.
Identificar los elementos de la fórmula anterior y sustituirlo.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 13 / 60
Propiedades de la mediana:
No se ve afectada por observaciones extremas.
Es de cálculo rápido y de interpretación sencilla.
Es función de los intervalos escogidos.
Puede calcularse en el caso de las clases abiertas.
Su mayor defecto es las propiedades matemáticas que posee. Para
cualquier conjunto de datos,
Pn la mediana es el valor mas cercano o
próximo a todos ellos ( i=1 |xi − Md |) es mı́nimo.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 14 / 60
Definición
La Moda: es el valor más común entre los datos:
Si las clases son valores individuales entonces la moda es el valor o los
valores que poseen las mayores frecuencias absolutas.
Si los datos están agrupados en tablas de frecuencias y las clases son
intervalos, la moda viene dada por:
∆1
M0 = LI0 + A0
∆1 + ∆ 2

donde:
LI0 es el lı́mite inferior de la clase con mayor frecuencia absoluta
(clase modal),
∆1 es la frecuencia absoluta de la clase modal-frecuencia absoluta de
la clase pre-modal,
∆2 es la frecuencia absoluta de la clase modal- frecuencia absoluta de
la clase post-modal,
A0 es la amplitud modal.
Saba Infante Escuela de Ciencias Matemáticas y Computacionales,
Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 15 / 60
Propiedades de la moda:
Es muy fácil de calcular.
No es susceptible de operaciones algebraicas.
Es la única medida que puede ser usada para datos cualitativos.
Es una medida muy imprecisa e inestable.
Puede no ser única

Definición
Para cualquier variable aleatoria X , se define la moda como el valor de X
que máximiza la función de probabilidad p(X ), si X es discreta o continua.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 16 / 60
Definición
Cuál medida es mejor: la moda tiene como principal ventaja sobre el resto
de medidas de tendencia central su aplicabilidad en todas las escalas de
medida. Si el tamaño muestral no es bastante grande, la moda no es una
medida confiable. La mediana por su lado, es una medida excelente para
representar el nivel caracterı́stico o representativo de los datos. Es una
medida más confiable que la moda. La media tiene un error de muestreo
menor que las medidas anteriores, por lo tanto es la más confiable de las
tres.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 17 / 60
Para fines descriptivos, la mediana es la medida de tendencia central
preferida mientras que para fines inferenciales, la media es la de
mayor uso. A continuación se muestra un resumen de las medidas de
posición y tendencia central de acuerdo al tipo de datos:
1 Variables cualitativas:
Nominal:
moda
Ordinal:
mediana
moda
2 Variables cuantitativas:
media
mediana
moda

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 18 / 60
Definición
Para cualquier variable aleatoria X , se define la mediana:
Si X es discreta:
1 1
Pr {xmed < x0,5 } ≤ , Pr {xmed ≤ x0,5 } ≥
2 2
Si X es continua:
1
Pr {xmed < x0,5 } =
2

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 19 / 60
Otras medidas de localización
Los cuartiles: de una sucesión de datos ordenados son aquellos
números que dividen la sucesión en 4 partes porcentualmente iguales.
Hay tres cuartiles denotados por: Q1 , Q2 y Q3 . El segundo Q2 ,
coincide con la mediana, el primer Q1 es el valor por debajo del cual
queda el 25 % de todos los valores de la sucesión ordenada. El tercer
Q3 , es el valor por debajo del cual queda el 75 % de todos los valores
de la sucesión ordenada.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 20 / 60
Los cuartiles para datos agrupados:

k( n4 ) − Fk
Q k = Lk + Am
fk
donde:
Lk : lı́mite inferior de la clase del cuartil k, se determina de manera
similar que en el caso de la mediana.
n : es el número de datos.
Fk : es la frecuencia acumulada a la clase que antecede a la clase del
cuartil k.
fk : frecuencia de la clase cuartil.
Am : amplitud de la clase cuartil.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 21 / 60
Para cualquier variable aleatoria X , se define el valor cuartil Xq , de
orden q, 0 < q < 1, es el valor de X tal que:
Si X es discreta:

Pr {X < Xq } ≤ q, Pr {X ≤ Xq } ≥ q

Si X es continua:

Pr {X < Xq } = q

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 22 / 60
Los deciles: son ciertos números que dividen la sucesión de datos
ordenados en 10 partes porcentualmente iguales. Los deciles se
denotan por Dk , k = 1, . . . , 9.
Los deciles para datos agrupados:
n
k( 10 ) − Fk
Dk = Lk + Am , k = 1, 2, . . . , 9
fk
donde:
Lk = lı́mite inferior del intervalo de clase del decil k.
n = es el número de datos.
Fk = es la frecuencia acumulada a la clase que antecede a la clase del
decil k.
fk = frecuencia de la clase del decil k.
Am = longitud del intervalo de la clase del decil k.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 23 / 60
Los percentiles: son ciertos números que dividen la sucesión de datos
ordenados en 100 partes porcentualmente iguales. Los percentiles se
denotan por Pk , k = 1, . . . , 99.
Los percentiles para datos agrupados:
n
k( 100 ) − Fk
Pk = Lk + Am , k = 1, 2, . . . , 99
fk
donde:
Lk : lı́mite inferior del intervalo de clase del percentil k.
n = es el número de datos.
Fk = es la frecuencia acumulada a la clase que antecede a la clase del
percentil k.
fk = frecuencia de la clase del decil k.
Am = longitud del intervalo de la clase del percentil k.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 24 / 60
Medidas de dispersión
Definición
Las medidas de variabilidad: son medidas que permiten medir el grado de
agrupación o disgregación en un conjunto de datos. Esto es, permiten
determinar si los valores están cercanos o separados entre si. Se pueden
clasificar en absolutas y relativas
absolutas:
Rango;
Recorrido intercuartilico;
Desviación media;
Varianza;
Desviación estándar.
relativas:
Recorrido intercuartilico relativo;
Coeficiente de variación.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 25 / 60
Definición
Rango o recorrido: es un medida de poco utilidad ya que puede llevar a
conclusiones erróneas acerca del verdadero comportamiento de los datos.
Viene dada por R = Vmax − Vmin. Es decir, el rango es la diferencia entre
el valor máximo y el valor mı́nimo.

Definición
Recorrido intercuartı́lico: es una medida de la dispersion en la zona
intermedia de los datos. Viene dada por la diferencia entre los cuartiles 3 y
4. Esto es, RIC = Q3 − Q1 . Su principal ventaja es que no se ve
influenciada por los valores extremos.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 26 / 60
Definición
Desviación media: está dada por el promedio de los valores absolutos de
las diferencias entre cada valor del conjunto de datos y su media. Mide la
diferencia que hay en cualquier sentido, positivo o negativo, entre los
valores de una variable y su media. Su fórmula de calculo es:
Pn
|xi − x̄|
DM = i=1
n

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 27 / 60
Definición
Si los datos están agrupados en una tabla de frecuencias, entonces su
fórmula de cálculo es:
Si los datos son individuales:
Pn
i=1 |xi − x̄|fi
DM =
n
Si los datos son agrupados en intervalos:
Pn
|mi − x̄|fi
DM = i=1
n

Definición
Varianza: se define como la media de las diferencias al cuadrado de los
datos respecto de su media, es decir:
Pn
(xi − x̄)2
var (x) = S 2 = i=1
n−1
Saba Infante Escuela de Ciencias Matemáticas y Computacionales,
Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 28 / 60
Definición
Si los datos están agrupados en una tabla de frecuencias, entonces su
fórmula de cálculo es:
Si los datos son individuales:
Pn
2 i=1 (xi− x̄)2 fi
S =
n−1
Si los datos son agrupados en intervalos:
Pn
2 (mi − x̄)2 fi
S = i=1
n−1

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 29 / 60
Definición
Las siguientes fórmulas son usadas comúnmente por su facilidad de
cálculo:
Si los datos no están agrupados en tablas de frecuencias:
Pn
2 x 2 − nx̄ 2
S = i=1 i
n−1
Si los datos son individuales:
Pn 2
2 − nx̄ 2
i=1 xi fi
S =
n−1
Si los datos están agrupados en intervalos:
Pn
2 m2 fi − nx̄ 2
S = i=1 i
n−1

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 30 / 60
Definición
Desviación estándar: dada la dificultad presentada con la interpretación de
la varianza, surge una medida de dispersion función de ella y que viene
expresada en las mismas unidades que la variable. Esta medida recibe el
nombre de desviación estándar o tı́pica y esta dada por:

S = S2

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 31 / 60
Propiedades de la varianza y desviación estándar:
La varianza y la desviación estándar no pueden ser negativas.
Si todos los datos son iguales a una constante c, entonces S 2 = 0 y
S = 0.
Si a cada dato original se le suma una constante k, la varianza y la
desviación estándar no se ven afectadas.
Si cada dato original se multiplica por una constante k, la varianza y
la desviación estándar del nuevo conjunto de datos están dadas por
k 2 S 2 y kS
Supongamos que se tiene un conjunto de datos digamos,x1 , x2 , ..., xn ,
cuya varianza es S 2 , entonces la varianza y la desviación estándar de
a + bx1 , a + bx2 , . . . , a + bxn , están dadas por, b 2 S 2 y |b|S.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 32 / 60
Definición
covarianza muestral: la covarianza es un valor que indica el grado de
variación conjunta de dos variables aleatorias. Es el dato básico para
determinar si existe una dependencia entre ambas variables. Se estima por:
Pn
(xi − x̄)(yi − ȳ )
cov (x, y ) = i=1
n

La correlación se estima por:

cov (x, y )
corr (x, y ) = p p
var (x) var (y )

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 33 / 60
Medidas de variabilidad relativas.
Por lo general están dados por el cociente entre una medida de
variabilidad y una medida de tendencia central y sirven para comparar
la variabilidad de dos conjuntos de valores.
Rango intercuartı́lico relativo: resulta del cociente entre el rango
intercuartı́lico y la mediana, es decir:
Q3 − Q1
IQ =
Md

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 34 / 60
Definición
Coeficiente de variación: indica el tamaño relativo de la desviación
estándar respecto a la media y debe ser calculado para variables cuyos
valores son todos positivos. Es la medida de variabilidad relativa de mayor
uso y su fórmula de calculo es:
S
CV = 100 %

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 35 / 60
Medidas de forma
Las medidas de forma de una distribución se pueden clasificar en dos
grandes grupos: medidas de asimetrı́a y medidas de curtosis. Estas
medidas permiten evaluar la situación de los datos desde los ejes
vertical (simetrı́a) y horizontal (curtosis).
Las medidas de asimetrı́a permiten saber si los datos se distribuyen en
forma simétrica con respecto a su valor central. Cuando un
histograma de frecuencias de una variable presenta una forma
acampanada, diremos que los datos tienen una distribución simétrica.
En caso contrario, dicha distribución ser´a asimétrica.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 36 / 60
Comparando las medidas de tendencia central, podemos establecer la
asimetrı́a en un conjunto de datos:
Si x̄ = Md = M0 la distribución es simétrica.
Si x̄ < Md < M0 la distribución es asimétrica negativa.
Si x̄ > Md > M0 la distribución es asimétrica positiva.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 37 / 60
Coeficiente de asimetrı́a de Fisher: para determinar el grado de
asimetrı́a de un conjunto de datos una posibilidad es el coeficiente de
Fisher, cuya fórmula de cálculo es:
datos no agrupados:
Pn
i=1 (xi − x̄)3
CAF =
nS 3
datos agrupados en intervalos:
Pk
i=1 (mi − x̄)3 fi
CAF =
nS 3

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 38 / 60
Otra manera de evaluar la simetrı́a de un conjunto de datos es
calculando ciertos coeficientes de asimetrı́a de Fisher:
Si CAF = 0, la distribución es simétrica.
Si CAF < 0, la distribución es asimétrica negativa.
Si CAF > 0 ,la distribución es asimétrica positiva.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 39 / 60
Coeficiente de asimetrı́a de Pearson: mide el grado de asimetrı́a en
términos de la distancia entre la media y la moda. Este coeficiente
divide esta diferencia entre la desviación estándar para eliminar la
dimensionalidad. Su fórmula de cálculo es:
x̄ − M0
Ap =
S

Si Ap = 0, la distribución es simétrica.
Si Ap < 0, la distribución es asimétrica negativa.
Si Ap > 0 , la distribución es asimétrica positiva.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 40 / 60
Coeficiente de curtosis de Fisher: permite medir el grado de
apuntamiento de la distribución de un conjunto de datos. Está dada
por:
datos no agrupados:
Pn
i=1 (xi − x̄)4
CCF = −3
nS 4
datos agrupados en intervalos:
Pk
i=1 (mi − x̄)4 fi
CCF = −3
nS 4

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 41 / 60
Al comparar con la distribución normal, se tiene la siguiente:
interpretación:
Si CCF > 0, la distribución es leptocúrtica. Más apuntada que la
normal.
Si CCF < 0, la distribución es platicúrtica. Menos apuntada que la
normal.
Si CCF = 0 ,la distribución es mesocúrtica. Similar a la normal.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 42 / 60
Ejemplo
Los datos que se muestran a continuación, son los precios en dólares por
los servicios de electricidad, agua y luz durante en el mes de julio en el año
2000 de 50 apartamentos, en USA.

96 171 202 178 147 102 153 197 127 82


157 185 90 116 172 111 148 203 130 165
141 149 206 175 123 128 144 168 109 167
95 163 150 154 130 143 187 166 139 149
108 119 183 151 114 135 195 137 129 158
Cuadro: datos de servicios básicos

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 43 / 60
Elaborar:
Una tabla de frecuencia.
Un histograma.
Poligono de frecuencia
Box plot.
Cálcule:
x̄, md y la mo .
Q1 y Q3 .
D5 .
P80 .
S 2.
S.
IQ.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 44 / 60
Solución
Valor mayor es 206, y el valor menor es 82.
Rango es: Rgo = 206 − 82 = 124.
La clase es K = 1 + 3· 3log10 (50) = 6,606 ≈ 7.
Amplitud de la clase es: A = 1247 ≈ 18

Intervalos fi fri F Fr mi
[ 82,100) 4 0.08 4 0.08 91
[100,118) 6 0.12 10 0.20 109
[118,136) 8 0.16 18 0.36 127
[136,154) 12 0.24 30 0.60 145
[154,172) 9 0.18 39 0.78 163
[172,190) 6 0.12 45 0.90 181
[190,208) 5 0.10 50 1 199
Cuadro: Tabla de frecuencias para los datos de servicios

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 45 / 60
Cuadro: Continuación de la tabla de frecuencias

Pk
intervalos fi mi (mi − m̄)2 i=1 fi (mi − m̄)2
[82,100) 364 2916 11664
[100,118) 654 1296 7776
[118,136) 1016 324 2592
[136,154) 1740 0 0
[154,172) 1467 324 2916
[172,190) 1086 1296 7776
[190,208) 995 2916 36610

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 46 / 60
La media para datos agrupados:
m1 f1 + . . . + mk fk 91 ∗ 4 + . . . + 199 ∗ 5
x̄ = = = 146,44
n 50
La mediana para datos agrupados:
n
2 − Fam 25 − 18
md = LIm + Am = 136 + 18 = 146,5
fm 12

dónde: n2 = 50
2 = 25, la primera clase mediana es donde la frecuencia
acumulada es igual o superior a n2 , en este caso es [136, 154),
entonces LIm = 136, Fam = 18, fm = 12, y Am = 18. Esto se
interpreta como: 50 porciento de los apartamentos tiene un consumo
por debajo de 147 dólares aproximadamente.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 47 / 60
La moda para datos agrupados, los elementos requeridos son:
LI0 = 136, ∆1 = 12 − 8 = 4, ∆2 = 12 − 9 = 3, A = 18
∆1 4
M0 = LI0 + A0 = 136 + 18 = 146,78
∆1 + ∆2 4+3
Esto se interpreta como: la mayorı́a de los apartamentos tiene un
consumo de 147 dólares aproximadamente.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 48 / 60
Cuartı́les:
k( n2 ) − Fk
Qk = Lk + Am
fk
Primer cuartil:
el valor de k = 1, k n4 = 1 50
4 = 12,5. La clase donde F1 ≥ 12,5 es
[118, 136), entonces L1 = 118, F1 = 10, f1 = 8, y Am = 18. Ası́ que:

12,5 − 10
Q1 = 118 + 18 ≈ 124
8
Esto se interpreta como el 25 porciento de los apartamentos tiene un
consumo por debajo 124 dólares.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 49 / 60
Tercer cuartil:
el valor es k = 3, k n4 = 3 ∗ 50
4 = 37,5. La clase donde F3 ≥ 37,5 es
[154, 172), entonces L3 = 154, F3 = 30, f3 = 9, y a = 18. Ası́ que:

37,5 − 30
Q3 = 154 + ∗ 18 ≈ 169
8
Esto se interpreta que el 75 porciento de los apartamentos tiene un
consumo por debajo 169 dólares.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 50 / 60
Decı́les:
n
k( 10 ) − Fk
Dk = Lk + Am
fk
Decil D5 :
el valor es k = 5, k ∗ n2 = 5 ∗ 50
10 = 25. La clase donde F5 ≥ 25 es
[136, 154), entonces L5 = 136, F5 = 18, f5 = 12, y Am = 18. Ası́ que:

25 − 18
D5 = 136 + ∗ 18 = 146,5
12
note que el D5 = md .

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 51 / 60
Percentiles:
n
k( 100 ) − Fk
Pk = Lk + A
fk
Percentil P80 :
n 50
el valor es k = 80, k ∗ 100 = 80 100 = 40. La clase donde F80 ≥ 40 es
[172, 190), entonces L80 = 172, F80 = 39, f80 = 6, y A = 18. Ası́ que:

40 − 39
P80 = 172 + 18 ≈ 176
6
Esto se interpreta que el 80 porciento de los apartamentos tiene un
consumo por debajo 176 dólares.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 52 / 60
Ejemplo 2: Servicios básicos

Figura: Histograma para los datos de servicios básicos


Saba Infante Escuela de Ciencias Matemáticas y Computacionales,
Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 53 / 60
Ejemplo 2: Servicios básicos

Figura: Histigrama y poligono de frecuencias para los datos de servicios básicos


Saba Infante Escuela de Ciencias Matemáticas y Computacionales,
Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 54 / 60
Ejemplo 2: Servicios básicos

Figura: Boxplot para los datos de servicios básicos

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 55 / 60
Ejemplo
Suponga que un investigador desea determinar cómo varı́an las estaturas
en pulgadas de las obreras al tomar una muestra de 50 mujeres de la
fuerza laboral de Estados Unidos, los datos obtenidos fueron los siguientes:

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 56 / 60
65 63 65 69 67 53 58 60 61 64
65 64 72 68 66 55 57 60 62 64
65 64 71 68 66 56 59 61 63 65
63 70 67 66 57 59 61 62 64 64
63 69 67 66 58 60 61 62 68 71
Cuadro: Estaturas en pulgadas de las obreras de los EEUU

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 57 / 60
Elaborar:
Una tabla de frecuencia.
Un histograma.
Poligono de frecuencia
Box plot.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 58 / 60
Cálcule:
x̄, md y la mo .
Q1 y Q3 .
D5 .
P80 .
S 2.
S.
IQ.

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 59 / 60
MUCHAS GRACIAS POR SU ATENCIÓN

Saba Infante Escuela de Ciencias Matemáticas y Computacionales,


Probabilidad y Estadı́stica Ibarra, Ecuador
Universidad Yachay Tech 60 / 60