Escolar Documentos
Profissional Documentos
Cultura Documentos
LA ESTADISTICA
La estadística es la ciencia que estudia los métodos que permiten realizar este proceso para variables
aleatorias. Estos métodos permiten resumir datos y acotar el papel de la casualidad (azar). Se divide en
dos áreas:
Página | 1
Estadística descriptiva La descripción completa de una variable aleatoria está dada por su función
densidad de probabilidad (fdp). Afortunadamente una gran cantidad de variables de muy diversos
campos están adecuadamente descritas por unas pocas familias de fdps: binomial, Poisson, normal,
gamma, etc. Dentro de cada familia, cada fdp está caracterizada por unos pocos parámetros,
típicamente dos: media y varianza. Por tanto la descripción de una variable indicará la familia a que
pertenece la fdp y los parámetros correspondientes.
Entre la muestra con la que se trabaja y la población de interés, o población diana, aparece la
denominada población de muestreo: población (la mayor parte de las veces no definida con precisión)
de la cual nuestra muestra es una muestra aleatoria. En consecuencia la generalización está amenazada
por dos posibles tipos de errores: error aleatorio que es el que las técnicas estadísticas permiten
cuantificar y críticamente dependiente del tamaño muestral, pero también de la variabilidad de la
variable a estudiar y el error sistemático que tiene que ver con la diferencia entre la población de
muestreo y la población diana y que sólo puede ser controlado por el diseño del estudio.
La eficiencia con que se realice esta etapa generará la calidad de todo el trabajo de investigación
estadística.
VARIABLE ESTADISTICA
Una variable estadística es cada una de las características o cualidades que poseen los individuos de
una población.
Variables cuantitativas
Son las variables que se expresan mediante cantidades numéricas. Las variables cuantitativas además
pueden ser:
Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores
que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los
distintos valores específicos que la variable pueda asumir. Ejemplo: El número de hijos (1, 2, 3, 4,
5).
Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo
especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg, ...) o la altura (1,64 m, 1,65 m,
1,66 m, ...), que solamente está limitado por la precisión del aparato medidor, en teoría permiten
que siempre exista un valor entre dos variables.
Variables independientes
Son las que el investigador escoge para establecer agrupaciones en el estudio, clasificando
intrínsecamente a los casos del mismo. Un tipo especial son las variables de control, que modifican al
resto de las variables independientes y que de no tenerse en cuenta adecuadamente pueden alterar los
resultados por medio de un sesgo.
Es aquella característica o propiedad que se supone ser la causa del fenómeno estudiado. En
investigación experimental se llama así a la variable que el investigador manipula.
Variables dependientes
Son las variables de respuesta que se observan en el estudio y que podrían estar influenciadas por los
valores de las variables independientes.
Hayman (1974 : 69) la define como propiedad o característica que se trata de cambiar mediante la
manipulación de la variable independiente.
La variable dependiente es el factor que es observado y medido para determinar el efecto de la variable
independiente.
Otra clasificación
Ing. Pedro Ruiz Rosales / pedro_e_ruiz@hotmail.com
4
Variable moderadora
Según Tuckman: representan un tipo especial de variable independiente, que es secundaria, y se
Página | 4
selecciona con la finalidad de determinar si afecta la relación entre la variable independiente primaria y
las variables dependientes.
Ejercicios:
1. Indica que variables son cualitativas y cuales cuantitativas:
Comida Favorita.
Profesión que te gusta.
Número de goles marcados por tu equipo favorito en la última temporada.
Número de alumnos de tu Instituto.
El color de los ojos de tus compañeros de clase.
Coeficiente intelectual de tus compañeros de clase.
2. De las siguientes variab les indica cuáles son d is cretas y cuales con tin u as .
Número de acciones vendidas cada día en la Bolsa.
Temperaturas registradas cada hora en un observatorio.
Período de duración de un automóvil.
El diámetro de las ruedas de varios coches.
Número de hijos de 50 familias.
Censo anual de los españoles.
Datos no agrupados
Son los datos donde se considera su tratamiento con sus valores individuales.
Dispersión: se refiere a la extensión de los datos en una distribución, es decir, al grado en que las
observaciones se distribuyen.
Datos agrupados
Son los datos donde se considera el tratamiento en grupos ó intervalos, es decir se considera en grupos
donde pueden existir diversos valores.
Ing. Pedro Ruiz Rosales / pedro_e_ruiz@hotmail.com
5
Medidas de Dispersión Se llaman medidas de dispersión aquellas que permiten retratar la distancia de
los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los
datos en un cierto sector del recorrido de la variable. Se trata de coeficiente para variables cuantitativas.
Página | 5
Medidas de Tendencia central La estadística busca entre otras cosas, describir las características
típicas de conjuntos de datos y, como hay varias formas de hacerlo, existen y se utilizan varios tipos de
promedios. Se les llama medidas de tendencia central porque general mente la acumulación más alta de
datos se encuentra en los valores intermedios.
DISTRIBUCIÓN DE FRECUENCIAS
La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los
datos estadísticos, asignando a cada dato su frecuencia correspondiente.
Tipos de frecuencias
Frecuencia absoluta
La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio
estadístico.
Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma
o sumatoria.
Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el
número total de datos.
Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o
iguales al valor considerado.
Ejemplo
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31
27, 28, 29, 30, 32, 31, 31, 30, 30, 29
29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
xi Recuento fi Fi ni Ni
27 I 1 1 0.032 0.032
28 II 2 3 0.065 0.097
29 6 9 0.194 0.290
30 7 16 0.226 0.516
31 8 24 0.258 0.774
32 III 3 27 0.097 0.871
33 III 3 30 0.097 0.968
34 I 1 31 0.032 1
Total 31 1
Ejercicios:
4. Las puntuaciones obtenidas por un grupo en una prueba han sido:
15, 20, 15, 18, 22, 13, 13, 16, 15, 19
18, 15, 16, 20, 16, 15, 18, 16, 14, 13
Construir la tabla de distribución de frecuencias y dibuja el polígono de frecuencias.
5. El número de estrellas de los hoteles de una ciudad viene dado por la siguiente serie:
3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3
2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1
Construir la tabla de distribución de frecuencias y dibuja el diagrama de barras.
MEDIDAS DESCRIPTIVAS
Las medidas descriptivas son valores numéricos calculados a partir de la muestra y que nos resumen
Página | 7la
información contenida en ella.
MEDIDAS DE CENTRALIZACIÓN
Nos dan un centro de la distribución de frecuencias, es un valor que se puede tomar como
representativo de todos los datos. Hay diferentes modos para definir el "centro" de las observaciones en
un conjunto de datos. Por orden de importancia, son:
LA MEDIA
Media para un conjunto de datos no agrupados.
n
Ejemplo para el cálculo de la media.
Sean los siguientes valores las calificaciones la asignatura de matemáticas de estudiantes de primer
año:
10 8 6 7.5 7 7.5 8 9.5 10 10
8 6 9 10 7.5 6 9.5 10 6.5 8
6 6 9 10 7 8 9.5 5 8 7.5
Sumando los valores de las 30 calificaciones y dividiéndolas entre los 30 datos obtendremos:
x
x i
240
8
n 30
Ing. Pedro Ruiz Rosales / pedro_e_ruiz@hotmail.com
8
n fi
Donde es el total de datos, m el número total de clase y
f i es la frecuencia de datos.
La definición es claramente entendida como una extensión de la definición que dimos para datos no
agrupados, ya que es lógico suponer que datos xi que se repiten con una frecuencia f i pueden
n m
x i x
i fi
simplificar la suma i 1 por i 1 , por supuesto que los índices de la segunda suma con respecto a
la primera corren con respecto a menor número, es decir, con respecto al número de agrupamientos m.
Ejemplo:
Sean los siguientes datos 1, 1, 2, 2, 4, 4, 5, 2, 3, 2, 3, 4, 1, 2, 1. La media para dichos datos es
aproximadamente igual a 2.4666, es decir,
x
x i
11 2 2 4 4 5 2 3 2 3 4 1 2 1
2.4666
n 15
Sin embargo, el mismo resultado podemos obtener si tomamos la frecuencia con que aparecen los
datos, en este caso:
Dato Frecuencia Producto de frecuencias y datos
xi fi f i xi
1 4 4
2 5 10
3 2 6
4 3 12
5 1 5
La obtención de la media finalmente se convierte en
1 1 4 2 5 3 2 4 3 51
x
n
xi f i
15
2.4666
Para la obtención de la media cuando las frecuencias están sujetas a la elección de clase bajo los
métodos mostrados, se realiza de igual manera, la única diferencia existe en determinar el valor xi
como el punto medio de cada clase, veamos el siguiente ejemplo.
Supongamos que una clínica de salud, obtiene una tabla de edades de las personas que son atendidas
en un fin de semana, para los que presentan la siguiente tabla. ¿Cuál será el promedio de edades de los
enfermos que acudieron a recibir atención médica?
Tabla de frecuencias reportadas por la clínica
Ing. Pedro Ruiz Rosales / pedro_e_ruiz@hotmail.com
9
10 x 20 15 8
20 x 30 25 20
30 x 40 35 14 Página | 9
40 x 50 45 8
50 x 60 55 2
60 x 70 65 2
70 x 80 75 1
55 enfermos atendidos
Por lo que el promedio de personas a las que se les dio servicio es de:
x
15 8 25 20 3514 45 8 55 2 65 2 751 32.45 años
53
LA MEDIANA
Mediana para datos no agrupados
La mediana de un conjunto finito de valores es aquel valor que divide al conjunto en dos partes iguales,
de forma que el número de valores mayor o igual a la mediana es igual al número de valores menores o
igual a estos. Su aplicación se ve limitada ya que solo considera el orden jerárquico de los datos y no
alguna propiedad propia de los datos, como en el caso de la media.
A continuación se muestran los criterios para construir la mediana. Se puede construir los siguientes
criterios:
Lo primero que se requiere es ordenar los datos en forma ascendente o descendente, cualquiera de los
dos criterios conduce al mismo resultado.
Sean ordenados lo datos en orden ascendente x1 , x 2 , x3 , , x n
xn
Si el número de valores es impar, la mediana es el valor medio, el cual corresponde al dato 2 .
Cuando el número de valores en el conjunto es par, no existe un solo valor medio, si no que existe dos
valores medios, en tal caso, la mediana es el promedio de los valores, es decir, la mediana es
numéricamente igual a
xn xn
1
Md 2 2
2
Podemos describir algunas propiedades para la mediana:
1.- Es única.
2.- Es simple.
3.- Los valores extremos no tienen efectos importantes sobre la mediana, lo que si ocurre con la media.
Ing. Pedro Ruiz Rosales / pedro_e_ruiz@hotmail.com
10
Ejemplo:
Retomemos la tabla del ejemplo mostrado para determinar la media de atenciones médicas brindadas
por el hospital, adicionando la columna de la frecuencia acumulada
Tabla de frecuencias reportadas por la clínica
Clases Punto medio de Frecuencias de cada Frecuencias acumulada
(Datos en años) clase
cada clase xi f acumulada
fi
por lo que se puede concluir que el 50% de las personas atendidas en un fin de semana por el hospital
tienen una edad inferior a los 29.75 años.
LA MODA
Moda para datos no agrupados
La moda es la medida que se relaciona con la frecuencia con que se presenta el dato o los datos con
mayor incidencia, con lo que se considera la posibilidad de que exista más de una moda para un
conjunto de datos. La notación mas frecuente es la siguiente: Mo y x̂ . Esta medida se puede aparecer
tanto para datos cualitativos como cuantitativos. Se dice que cuando un conjunto de datos tiene una
moda la muestra es unimodal, cuando tiene dos modas bimodal, cuando la muestra contiene mas de un
dato repetido se dice que es multimodal y un último caso es cuando ningún dato tiene una frecuencia,
en dicho caso se dice que la muestra es amodal.
Ejemplos:
1.- Determinar la moda del siguiente conjunto de datos:
a) 1, 2, 3, 3, 4 , 5, 6, 7, 7, 3, 1, 9, 3 la moda de este conjunto de datos es igual a 3 y si considera
unimodal
Página | 12
Moda para datos agrupados
Para determinar la moda de datos agrupados en clases de igual tamaño su cálculo se puede realizar de
la siguiente forma:
f i
Mo Li A
f i f s
Donde
Li límite inferior o frontera inferior.
f i Exceso de la frecuencia modal sobre la clase modal inferior inmediata.
f s Exceso de la frecuencia modal sobre la clase modal superior inmediata.
A Anchura o intervalo de la clase modal.
En ocasiones la expresión para el cálculo de la moda suele presentarse de la siguiente forma:
f m f ( m 1)
Mo Li A
2 f m f m 1 f m 1
donde
f m Frecuencia de clase modal
f m 1 Frecuencia de clase premodal
f m 1 Frecuencia de clase posmodal
Aunque la expresión se ve un poco diferente en realidad se trata de una misma ecuación, ya que el
exceso de la clase modal inferior se puede determinar como:
f i f m f ( m 1)
y el exceso de la clase modal superior se determina como
f s f m f ( m 1)
Por lo que basta sustituir estos valores en una de ellas para encontrar la otra expresión.
Ejemplo:
Determinar a partir de la tabla presentada, en el ejemplo de la media, cual es la moda:
60 x 70 65 2
70 x 80 75 1
55 enfermos atendidos
Identificamos que
Li 20; f m 20 ; f m 1 8; f m1 14; A 10;
Sustituyendo tenemos
f m f ( m1) 20 8
Mo Li A 20 20.666
2 f m f m1 f m 1 2 20 8 14
Pese a que el valor de la moda no pueda constituir un dato real, para el ejercicio, se puede asumir que
ese es el parámetro de mayor ocurrencia.
Distribución simétrica:
Sesgo cero moda = mediana = media
Distribución con asimetría positiva:
Sesgo a la derecha: media y mediana se encuentran a la derecha de la
moda. moda < mediana < media
Nota
Si se conocen dos promedios de una distribución de frecuencias con sesgo moderado, el tercero se
puede aproximar.
Moda = media - 3(media - mediana)
Media = [3(mediana) - moda]/2
Mediana = [2(media) + moda]/3
MEDIDAS DE DISPERSIÓN
Ing. Pedro Ruiz Rosales / pedro_e_ruiz@hotmail.com
14
LA DISPERSIÓN.
Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda sólo nos revelan
una parte de la información que necesitamos acerca de las características de los datos. Para aumentar
nuestro entendimiento del patrón de los datos, debemos medir también su dispersión, extensión o
variabilidad. Página | 14
Pero si hay dispersión en la mayoría de los datos, y debemos estar en capacidad de describirla. Ya que
la dispersión ocurre frecuentemente y su grado de variabilidad es importante, ¿cómo medimos la
variabilidad de una distribución empírica?. Vamos a considerar sólo algunas medidas de dispersión
absolutas: el rango, la varianza, la desviación estándar y el coeficiente de variación.
EL RANGO O RECORRIDO ( R ):
Es la medida de variabilidad más fácil de calcular. Para datos finitos o sin agrupar, el rango se define
como la diferencia entre el valor más alto (Xn ó Xmax.) y el mas bajo (X1 ó Xmin) en un conjunto de datos.
R = Xmáx. - Xmín = Xn - X1
Ejemplo:
Se tienen las edades de cinco estudiantes universitarios de Ier año, a saber: 18,23, 27,34 y 25., para
calcular la media aritmética (promedio de las edades, se tiene que:
R = (Xn-X1 ) = 34-18 = 16 años
Con datos agrupados no se saben los valores máximos y mínimos. Si no hay intervalos de clases
abiertos podemos aproximar el rango mediante el uso de los límites de clases. Se aproxima el rango
tomando el limite superior de la última clase menos el límite inferior de la primera clase.
Clases Xi fi h r Fi ↓ Fa ↑ hr a↓ hr a↑
7.420 – 14.628 10 0.33 10 30 0.33 1.00
21.835
Ing. Pedro Ruiz Rosales / pedro_e_ruiz@hotmail.com
15
LA VARIANZA (S2 ó δ2 ):
La varianza es una medida de dispersión relativa a algún punto de
referencia. Ese punto de referencia es la media aritmética de la
distribución. Más específicamente, la varianza es una medida de que tan
cerca, o que tan lejos están los diferentes valores de su propia media
aritmética. Cuando más lejos están las Xi de su propia media aritmética,
mayor es la varianza; cuando más cerca estén las X i a su media menos es
la varianza. Y se define y expresa matemáticamente de la siguiente
manera:
Ing. Pedro Ruiz Rosales / pedro_e_ruiz@hotmail.com
16
Para calcular se utiliza una tabla estadística de trabajo de la siguiente manera: Página | 16
Xi ( Xi - ) ( Xi - )2
18 (18 – 25.5)=-7.4 (-7.4)2=54.76
23 (23 – 25.5)=-2.4 (-2.4)2= 5.76
25 (25 – 25.5)=-0.4 (-0.4)2= 0.16
27 (27 – 25.5)= 1.6 ( 1.64)2= 2.16
34 (34 – 25.5)= 8.6 ( 8.6)2 =73.96
Total xxxx 137.20
Σ(XI-)2 137.20
2
δ = ------------ = ----------- = 27.4 años
n 5
Σ(Xi-)2f1
δ2 = ----------------
Σfi
ΣXi2fi - [(ΣXifi)2/N]
2
δ = ----------------------------
N
Donde N = Σfi
Ejemplo:
Se tienen los datos de una muestra de 30 cuentas por cobrar de la tienda Cabrera’s y Asociados
dispuestos en una tabla de distribución de frecuencias, a partir de los cuales se deberá calcular la
varianza, para lo cual se construye la siguiente tabla estadística de trabajo, si se calculó anteriormente
la media aritmética y se fijó en 43.458 (ver ejemplo del calculo en “media aritmética para datos
agrupados) de la siguiente manera
= 21,649.344 / 30 = 721.645
Propiedades de la varianza:
Es siempre un valor no negativo, que puede ser igual o distinta de 0. Será 0 solamente cuando
Xi=
La varianza es la medida de dispersión cuadrática optima por ser la menor de todas.
Si a todos los valores de la variable se le suma una constante la varianza no se modifica.
Veámoslo:
2
2 (∑x i −X ) ni
S =
n
Si a xi le sumamos una constante xi’ = xi + k tendremos (sabiendo que x'=x+k )
2
2 ∑
( x ' i−X ' )2 ni ∑ [(x i + k )−( X '+ k )]2 n i ∑ ( xi −X ) n 2 i
S = = = =S
n n n
Si todos los valores de la variable se multiplican por una constante la varianza queda multiplicada
por el cuadrado de dicha constante. Veámoslo:
2
2 ∑
( x ' i−X ' )2 ni ∑ [(x i · k )−( X '· k )] 2 ni ∑ [ k ( x i− X )] n i
S= = = =
N N N
2 2 2 2
∑ k ( xi −X ) ni k ∑ ( x i− X ) =k 2 · S 2
= =
n n
Si en una distribución obtenemos una serie de subconjuntos disjuntos, la varianza de la distribución
inicial se relaciona con la varianza de cada uno de los subconjuntos mediante la expresión
LA DESVIACIÓN ESTÁNDAR (S ó δ)
Es una medida de la cantidad típica en la que los valores del conjunto de datos difieren de la media.
Es la medida de dispersión más utilizada, se le llama también desviación típica. La desviación estándar
siempre se calcula con respecto a la media y es un mínimo cuando se estima con respecto a este valor.
Se calcula de forma sencilla, si se conoce la varianza, por cuanto que es la raíz cuadrada positiva de
esta. A la desviación se le representa por la letra minúscula griega “sigma” ( δ ) ó por la letra S
mayúscula, según otros analistas.
δ = √δ2 ó S = √S2
Ejemplo:
Del cálculo de la varianza de las edades de cinco estudiantes universitarios de primer año se obtuvo
δ2=27.44, como la desviación estándar es la raíz cuadrada positiva, entonces δ = √27.44 = 5.29 años.
Igual procedimiento se aplica para encontrar le desviación estándar de las cuentas por cobrar de la
Tienda Cabrera’s y Asociados, recordemos que la varianza obtenida fue de 721.645, luego entonces la
desviación estándar es igual a δ =√721.645 = 26.86 balboas.
La desviación estándar es siempre un valor no negativo S será siempre 0 por definición. Cuando
S = 0 X = xi (para todo i).
Es la medida de dispersión óptima por ser la más pequeña.
La desviación estándar toma en cuenta las desviaciones de todos los valores de la variable
Si a todos los valores de la variable se le suma una misma constante la desviación estándar no varía.
Si a todos los valores de la variable se multiplican por una misma constante, la desviación estándar
queda multiplicada por el valor absoluto de dicha constante.
Donde: C.V. representa el número de veces que la desviación típica contiene a la media aritmética y
por lo tanto cuanto mayor es CV mayor es la dispersión y menor la representatividad de la media.
Página | 19
Para Varones:
Página | 20
Calculamos la Media
Nº Empleados % Acumulado Varones
Sueldo (S/.)
Varones Mujeres fi Xi Xi . fi
[150 - 250[ 12 12 12 200 2400
[250 - 350[ 25 32 25 300 7500 Clase
[350 - 450[ 38 46 38 400 15200 Media
[450 - 550[ 40 92 40 500 20000
[550 - 650[ 20 100 20 600 12000
135 135 57100
1m
x xi f i 57100
n i 1 =
135
= 422.96
Calculamos la Mediana
Nº Empleados % Acumulado Varones
Sueldo (S/.)
Varones Mujeres fi Fi xi Xi . fi
[150 - 250[ 12 12 12 12 200 2400
[250 - 350[ 25 32 25 37 300 7500 Clase
[350 - 450[ 38 46 38 75 400 15200 Mediana
[450 - 550[ 40 92 40 115 500 20000
[550 - 650[ 20 100 20 135 600 12000
135 135 57100
n (135/2) - 37
f acum i 1
Md Li 2 A = 350 + 100 = 430.26
f mediana 38
Calculamos la Moda
Nº Empleados % Acumulado Varones
Sueldo (S/.)
Varones Mujeres fi Fi xi Xi . fi
[150 - 250[ 12 12 12 12 200 2400
[250 - 350[ 25 32 25 37 300 7500
[350 - 450[ 38 46 38 75 400 15200 Clase
[450 - 550[ 40 92 40 115 500 20000 Modal
[550 - 650[ 20 100 20 135 600 12000
135 135 57100
f i =
Mo Li A (40 - 38) + (40 - 20)
f i f s
Para Mujeres:
Nº Empleados % Acumulado Mujeres Página | 21
Sueldo (S/.)
Varones Mujeres fi Xi Xi . fi
[150 - 250[ 12 12 8 200 1600
[250 - 350[ 25 32 13 300 3900
[350 - 450[ 38 46 9 400 3600 Clase
[450 - 550[ 40 92 30 500 15000 Media
[550 - 650[ 20 100 5 600 3000
135 65 27100
Calculamos la media
1m
x xi f i =
27100
= 476.92
n i 1 65
Calculamos la Mediana
Nº Empleados % Acumulado Varones
Sueldo (S/.)
Varones Mujeres fi Fi xi Xi . fi
[150 - 250[ 12 12 8 8 200 1600
[250 - 350[ 25 32 13 21 300 3900
[350 - 450[ 38 46 9 30 400 3600 Clase
[450 - 550[ 40 92 30 60 500 15000 Mediana
[550 - 650[ 20 100 5 5 600 3000
135 65 27100
n (65/2) - 30
f acum i 1
Md Li 2 A = 450 + 100 = 458.33
f mediana 30
Calculamos la Moda
Nº Empleados % Acumulado Varones
Sueldo (S/.)
Varones Mujeres fi Fi xi Xi . fi
[150 - 250[ 12 12 8 8 200 1600
[250 - 350[ 25 32 13 21 300 3900
[350 - 450[ 38 46 9 30 400 3600 Clase
[450 - 550[ 40 92 30 60 500 15000 Modal
[550 - 650[ 20 100 5 65 600 3000
135 65 27100
f i =
Mo Li A (30 - 9) + (30 - 5)
f i f s
Gráficos: Página | 22
Distribución de Varones
12 12
10 10
8 8
6 6
4 4
2 2
0 0
Distribución de Mujeres
12 35
30
10 25
20
8 15
6 10
5
4 0
[1
[2
[3
[4
[5
2
5
5
5
5
0-
0-
0-
0-
0-
25
55
65
35
45
0
0[
0[
0[
0[
0[
Resumen
Nº Empleados % Acumulado Varones
Sueldo (S/.) (X - Xi)^2 . fi
Varones Mujeres fi Xi Xi . fi
[150 - 250[ 12 12 12 200 2400 596,533.94
[250 - 350[ 25 32 25 300 7500 377,979.04
[350 - 450[ 38 46 38 400 15200 20,032.14
[450 - 550[ 40 92 40 500 20000 237,406.46
[550 - 650[ 20 100 20 600 12000 626,863.23
135 135 57100 1,858,814.82
Estadígrafos
Media 422.96
Mediana 430.26
Moda 459.09
Varianza 13,769.00
Desviación 117.34
Estadígrafos
Media 476.92
Mediana 458.33
Moda 495.65
Varianza 17,928.62
Desviación 133.90
Practica Domiciliaria Nᵒ 01
1. Indica que variables son cualitativas y cuales cuantitativas:
Comida Favorita. Cualitativa.
Profesión que te gusta. Cualitativa.
Número de goles marcados por tu equipo favorito en la última temporada. Cuantitativa.
Número de alumnos de tu Instituto. Cuantitativa.
El color de los ojos de tus compañeros de clase. Cualitativa.
Coeficiente intelectual de tus compañeros de clase. Cuantitativa
5. El número de es trellas de los hoteles de una ciudad viene dado por la s iguiente
s erie:
3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2,
1, 1, 1, 2, 2, 4, 1.
Construir la tabla de distribución de frecuencias y dibuja el diagrama de barras.
6. Las calificac iones de 50 alumnos en M atemáti cas han s ido las s iguientes 24 :
5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8,246, 6, 3,
6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7.
Construir la tabla de distribución de frecuencias y dibuja el diagrama de barras.
7. Los pesos de los 65 empleados de una fábrica vienen dados por la siguiente tabla:
Peso [50, 60) [60, 70) [70, 80) [80,90) [90, 100) [100, 110) [110, 120)
fi 8 10 16 14 10 5 2
Construir la tabla de frecuencias.
Representar el histograma y el polígono de frecuencias.
8. Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50, en un examen de
Física.
3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27,
47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
Construir la tabla de frecuencias.
Dibujar el histograma y el polígono de frecuencias.
9. Los datos que se muestran a continuación representan el costo de la energía eléctrica durante el mes
de julio del 2010 para 50 departamentos con dos recamaras en una ciudad grande.
10. Se identificó una muestra de estudiantes que poseía automóviles producidos por la General Motors
y se registró la marca de cada automóvil. A continuación se presenta la muestra que se obtuvo (Ch
= Chevrolet, P = Pontiac, O = Oldsmobile, B = Buick, Ca = Cadillac):
Datos 1 15 15 21 17 16 21 20 19 24 23 1
22 19 18 19
14 17 16 14 15 18 19 19 20 18 3
21 21 21 14 16 21 24 15 21 19 1
16 15 22 19 16 13 13 15 17
17 18 22 19 15 16 17 24 17 17 7
19 20 22 18 17
20 20 18 19 14 19 17 20 15 17 21 16 15 16 22 1
20 13 14 18
8
14 22 16 20 14 16 22 19 24 24
1
18 21 20 21 23 18 21 18 17
Datos 2 17 22 21 16 22 5
18 14 21 14 15
21 24 19 22 19 1
23 19 15 14 19 23 16 15 19 20 21 17 15 13
9
22 21 22 19 18 24 19 18 23 17 22 18 16 15 17 1
21 17 14 16 18 15 20 16 21 24 17 21 15 15
19 17 20 21 18 7
15 23 21 21 22 15 18 24 17 16
1
15 20 15 23 23 18 13 21 16
23 23 17 23 19 7
18 14 15 18 14 22 20 20 16 19 1
21 17 18 18 19 22 17 22 20
22 23 16 23 21 3
17 18 22 17 23 1
14 14 21 15 19 19 14 14 21
22 20 23 19 22 6
Datos 3
Ing. Pedro Ruiz Rosales / pedro_e_ruiz@hotmail.com
Estadística y Racionalización Administrativas
1 20 15 16 12 12
15 15 13 22
8 Datos 5 19 20 14 13 18 Datos 10
1 21 23 23 24 22 13 15 20 13 18 20 25 26 21 21
17 15 20 17
4 30 24 28 30 28 17 18 15 13 19 27 27 26 25 21
1 23 24 22 28 26 25 18 20 25 22
21 13 18 22 19 14 21 19 15
6 23 26 29 25 22 22 20 26 18 23
2 30 23 29 29 30 12 13 14 16 13 25 20 22 21 20
21 16 14 14
2
21 23 24 22 24 12 13 15 13 15 26 23 18 26 20
2
20 13 20 13 25 29 27 22 24 19 19 14 12 16 27 21 26 26 20
2
22 25 27 24 28 18 21 12 17 21 18 23 19 27 25
2
18 20 21 16 26 26 29 26 30 19 21 20 22 26
1
2 26 29 26 22 25 22 25 25 22 23
14 14 18 15 29 21 30 30 26 25 23 26 24 22
1 Datos 8
1 27 25 23 30 26 19 22 20 23 19 20 20 18 21 23
15 21 20 17
6 26 28 24 29 29 22 19 24 26 19 22 23 18 21 23
1 21 22 27 26 23 25 28 23 26 22 27 20 27 25 24
17 19 22 20
8 22 30 22 23 24 19 21 24 25 25 21 18 23 24 25
2 21 21 24 20 20
16 18 17 21
2 23 21 29 29 26 20 27 26 23 18
21 28 26 28 23
29 28 24 26 23 22 23 26 25 27
20 23 26 23 27
24 26 22 26 27 22 23 19 20 25 21 21 21 26 19
Datos 4
29 27 21 30 26 21 27 24 20 22 23 22 24 21 19
2
17 20 18 17 26 23 25 21 20
5
28 21 26 21 25
1
19 22 24 25 Datos 6 22 23 23 24 26
6
1 14 16 18 15 18 23 25 27 25 21
23 25 16 25 15 14 17 14 20 19 26 28 19 19
8
1 16 13 13 18 15 20 27 19 23 25
17 24 20 19 13 19 21 13 18
8
1 15 15 18 12 20 24 19 26 25 26 Datos 11
23 17 23 18
7 12 14 15 21 20 28 19 21 27 20 23 21 2726 25 27
2 15 13 18 12 18 24 24 23 19 26 22 27 2326 19 26
17 25 24 18
5 19 15 17 13 21 27 19 21 28 20 25 23 20 20 27
2 17 21 21 13 16
18 18 20 20 25 21 21 28 20
2 21 15 18 16 18 25 24 26 23 26
1 13 17 21 20 21
23 21 19 23 24 28 27 27 26
7
13 18 15 14 16 25 26 25 24 23
1
23 23 24 17 14 14 15 19 20 23 22 19 27 28
8
18 21 21 16 20 26 20 19 27 19
2
22 21 24 25 21 18 16 12 19 23 24 26 21 28
0 Datos 9
2 28 28 27 25 24 27 26 26 21 26
17 24 16 21 13 21 16 13 17
5 22 24 25 26 29 19 26 22 23 20
2 19 18 17 14 14 26 26 26 19 22
22 25 20 16 20 29 21 20 20
4 18 19 20 19 21 24 22 27 23 20
28 23 20 25 28
1 21 17 16 13 18
24 16 17 23 21 25 21 25 22 28 23 25 19 20
7 23 24 27 24 24
2 27 23 23 24 24
16 17 21 24 26 21 22 22 29
3
26 26 24 23 25 23 23 21 20 23
2
21 19 16 19 23 25 21 22 22 24 20 26 19 25
0
1 22 29 23 23 27 21 22 20 23 25
23 19 22 19
7 Datos 7 27 26 24 21 21
1 18 20 13 20 15 20 21 22 22 28
17 24 16 23 Datos 12
9 18 16 20 18 14 27 29 27 25 23
1 17 12 16 19 18 28 24 26 24 23 24 23 21 19 22
19 23 17 17
7 14 19 20 20 17 21 18 22 21 23
27 24 26 27 27
2 13 21 19 17 14 26 23 18 23 23
22 16 22 23
1 28 26 21 24 24 18 19 18 20 21
20 12 17 14 12
22 19 19 19 21
14 13 21 18 17 29 27 27 22 26
14 17 12 19 14 21 28 29 26 20 22 24 24 20 20
15 20 20 12 12 23 28 22 26 23 24 19 23 25 19
14 18 14 12 12 22 19 20 19 24
23 22 18 19 25
21 18 27 22 21 Datos 15
26 20 24 23 24 27 27 19 19 22
20 23 22 22 27 19 20 23 21 21
21 27 19 25 20
28 25 19 20 22
20 26 26 28 26
25 27 20 28 19
22 28 28 22 27
28 19 23 28 19
23 27 23 26 19
Datos 13 22 28 19 28 24
22 20 22 23 26 25 19 26 21 22
25 21 28 25 23 25 21 21 27 26
21 19 24 26 25 22 25 25 19 20
19 22 22 22 24 20 23 25 27 20
23 27 22 24 26 25 24 27 27 26
21 25 24 23 27
26 23 20 24 24 27 23 20 22 25
23 25 24 28 26 28 24 21 23 23
24 28 27 24 21 20 20 27 22 20
20 28 28 26 26 27 27 20 24 24
23 19 28 26 20 27
23 27 28 27 22 27
27 25 19 21 21 Datos 16
22 26 20 21 24 20 24 23 25 20
25 21 22 25 19 24 19 23 19 17
24 26 18 24 23
24 21 24 25 19 21 24 17 21 26
23 28 19 28 27 18 24 21 20 26
20 19 20 20 25 22 24 21 20 24
20 20 28 19 27 25 26 18 21 21
24 21 26 19 17
20 17 18 22 23
Datos 14 22 26 25 26 25
21 16 20 21 21 26 18 19 19 17
18 19 17 22 17 17 23 20 17 26
13 18 21 22 15 22 18 20 24 17
17 14 21 16 19 17 25 21 21 23
18 13 18 13 21 19 23 22 20 25
17 20 13 17 15
20 17 14 19 21 26 20 22 22 24
21 15 20 17 16 24 17 21 23 21
22 15 18 14 17 20 20 19 23 26
17 15 20 17 13 19 21 23 23 21
18 17 21 20 22
17 22 19 13 14
18 22 17 14 13
19 20 21 15 13
17 16 14 22 13
21 18 13 22 15
21 16 19 14 18
Ing. Pedro Ruiz Rosales / pedro_e_ruiz@hotmail.com
Estadística y Racionalización Administrativas
PRACTICA DOMICILIARIA 1
(Solucionario)
Datos 1 x f fa fx fx2
14 17 16 14 15 14 14 14 196 2744
16 15 22 19 16 15 11 25 165 2475
19 20 22 18 17 16 8 33 128 2048
20 20 18 19 14 17 8 41 136 2312
14 22 16 20 14 18 9 50 162 2916
18 21 20 21 23 19 10 60 190 3610
18 14 21 14 15 20 6 66 120 2400
23 19 15 14 19 21 13 79 273 5733
22 21 22 19 18 22 8 87 176 3872
21 17 14 16 18 23 8 95 184 4232
15 23 21 21 22 1730 32342
23 23 17 23 19
18 14 15 18 14 Mínimo = 14
Máximo
22 23 16 23 21 n= 95 23
=
14 14 21 15 19 S(x) = 1730 Rango= 9
8.9126539
15 15 21 17 16 S(x2) = 32342 s2 =
8
Promedio 18.210526 2.9854068
21 21 21 14 16 s=
= 3 4 28
8.8188365
28
17 18 22 19 15 Moda = 14 s2 =
7
19 17 20 15 17 Mediana = 18 s= 2.9696526
.
Datos 2 x f fa fx fx2
21 24 19 22 19 15 8 8 120 1800
24 19 18 23 17 16 10 18 160 2560
15 20 16 21 24 17 11 29 187 3179
15 18 24 17 16 18 9 38 162 2916
15 20 15 23 23 19 13 51 247 4693
22 20 20 16 19 20 9 60 180 3600
21 17 18 18 19 21 9 69 189 3969
17 18 22 17 23 22 10 79 220 4840
22 20 23 19 22 23 7 86 161 3703
21 20 19 24 23 24 9 95 216 5184
18 19 19 20 18 1842 36444
21 24 15 21 19
16 17 24 17 17 Mínimo = 15
Máximo
21 16 15 16 22 n= 95 24
=
Ing. Pedro Ruiz Rosales / pedro_e_ruiz@hotmail.com
Estadística y Racionalización Administrativas
16 22 19 24 24 S(x) = 1842 Rango= 9
7.7509518
17 22 21 16 22 S(x2) = 36444 s2 =
5
Promedio 19.389473 2.7840531
23 16 15 19 20 s=
= 7 3
7.6693628
22 18 16 15 17 Moda = 19 s2 =
8
2.7693614
19 17 20 21 18 Mediana = 19 s=
6
Datos 3 x f fa fx fx2
13 22 19 18 19 13 11 11 143 1859
17 13 13 15 17 14 8 19 112 1568
18 20 13 14 18 15 10 29 150 2250
15 18 21 18 17 16 7 36 112 1792
19 21 17 15 13 17 13 49 221 3757
17 17 21 15 15 18 12 61 216 3888
17 18 13 21 16 19 5 66 95 1805
13 22 17 22 20 20 8 74 160 3200
16 19 14 14 21 21 12 86 252 5292
18 15 15 13 22 22 9 95 198 4356
14 17 15 20 17 1659 29767
16 21 13 18 22
22 21 16 14 14 Mínimo = 13
Máximo
22 20 13 20 13 n= 95 22 29
=
29
21 18 20 21 16 S(x) = 1659 Rango= 9
8.4640537
21 14 14 18 15 S(x2) = 29767 s2 =
5
Promedio 17.463157 2.9093046
16 15 21 20 17 s=
= 9 9
8.3749584
18 17 19 22 20 Moda = 17 s2 =
5
2.8939520
22 16 18 17 21 Mediana = 17 s=
5
Dato
x f fa fx fx2
s4
25 17 20 18 17 16 9 9 144 2304
16 19 22 24 25 17 17 26 289 4913
18 23 25 16 25 18 8 34 144 2592
18 17 24 20 19 19 9 43 171 3249
17 23 17 23 18 20 7 50 140 2800
25 17 25 24 18 21 6 56 126 2646
22 18 18 20 20 22 7 63 154 3388
17 23 21 19 23 23 13 76 299 6877
18 23 23 24 17 24 10 86 240 5760
20 22 21 24 25 25 9 95 225 5625
25 17 24 16 21 1932 40154
Datos 5 x f fa fx fx2
21 23 23 24 22 21 6 6 126 2646
30 24 28 30 28 22 11 17 242 5324
23 24 22 28 26 23 11 28 253 5819
23 26 29 25 22 24 11 39 264 6336
30 23 29 29 30 25 5 44 125 3125
21 23 24 22 24 26 16 60 416 10816
25 29 27 22 24 27 6 66 162 4374 30
22 25 27 24 28 28 6 72 168 4704 30
26 26 29 26 30 29 13 85 377 10933
26 29 26 22 25 30 10 95 300 9000
29 21 30 30 26 2433 63077
27 25 23 30 26
26 28 24 29 29 Mínimo = 21
Máximo
21 22 27 26 23 n= 95 30
=
22 30 22 23 24 S(x) = 2433 Rango= 9
8.1552071
23 21 29 29 26 S(x2) = 63077 s2 =
7
Promedio 25.610526 2.8557323
29 28 24 26 23 s=
= 3 3
8.0693628
24 26 22 26 27 Moda = 26 s2 =
8
29 27 21 30 26 Mediana = 26 s= 2.8406624
Dato
x f fa fx fx2
s6
14 16 18 15 18 12 4 4 48 576
15 14 17 14 20 13 12 16 156 2028
16 13 13 18 15 14 9 25 126 1764
13 19 21 13 18 15 11 36 165 2475
15 15 18 12 20 16 9 45 144 2304
Ing. Pedro Ruiz Rosales / pedro_e_ruiz@hotmail.com
Estadística y Racionalización Administrativas
12 14 15 21 20 17 7 52 119 2023
15 13 18 12 18 18 15 67 270 4860
19 15 17 13 21 19 7 74 133 2527
17 21 21 13 16 20 7 81 140 2800
21 15 18 16 18 21 14 95 294 6174
13 17 21 20 21 1595 27531
13 18 15 14 16
14 14 15 19 20 Mínimo = 12
Máximo
18 21 21 16 20 n= 95 21
=
21 18 16 12 19 S(x) = 1595 Rango= 9
7.9977603
13 21 16 13 17 S(x2) = 27531 s2 =
6
Promedio 16.789473 2.8280311
19 18 17 14 14 s=
= 7 8
7.9135734
18 19 20 19 21 Moda = 18 s2 =
1
2.8131074
21 17 16 13 18 Mediana = 17 s=
3
Datos 7 x f fa fx fx2 31
18 20 13 20 15 12 14 14 168 2016 31
18 16 20 18 14 13 11 25 143 1859
17 12 16 19 18 14 13 38 182 2548
14 19 20 20 17 15 8 46 120 1800
13 21 19 17 14 16 5 51 80 1280
20 12 17 14 12 17 8 59 136 2312
14 13 21 18 17 18 10 69 180 3240
14 17 12 19 14 19 10 79 190 3610
15 20 20 12 12 20 11 90 220 4400
14 18 14 12 12 21 5 95 105 2205
20 15 16 12 12 1524 25270
19 20 14 13 18
13 15 20 13 18 Mínimo = 12
Máximo
17 18 15 13 19 n= 95 21
=
19 14 21 19 15 S(x) = 1524 Rango= 9
8.7428891
12 13 14 16 13 S(x2) = 25270 s2 =
4
Promedio 16.042105 2.9568376
12 13 15 13 15 s=
= 3 9
8.6508587
19 19 14 12 16 Moda = 12 s2 =
3
18 21 12 17 21 Mediana = 16 s= 2.9412342
Datos 9 x f fa fx fx2
28 28 27 25 24 20 6 6 120 2400
22 24 25 26 29 21 10 16 210 4410
20 29 21 20 20 22 11 27 242 5324
28 23 20 25 28 23 10 37 230 5290
21 25 21 25 22 24 12 49 288 6912
23 24 27 24 24 25 8 57 200 5000
26 21 22 22 29 26 11 68 286 7436
26 26 24 23 25 27 11 79 297 8019
23 25 21 22 22 28 9 88 252 7056
22 29 23 23 27 29 7 95 203 5887
27 26 24 21 21 2328 57734
20 21 22 22 28
27 29 27 25 23 Mínimo = 20
28 24 26 24 23 n= 95 Máximo 29
Datos 11 x f fa fx fx2
23 21 27 25 27 19 8 8 152 2888
22 27 23 19 26 20 10 18 200 4000
25 23 20 20 27 21 7 25 147 3087
25 21 21 28 20 22 6 31 132 2904
25 24 26 23 26 23 16 47 368 8464
24 28 27 27 26 24 8 55 192 4608
25 26 25 24 23 25 9 64 225 5625
Datos 15 x f fa fx fx2
27 27 19 19 22 19 12 12 228 4332
19 20 23 21 21 20 13 25 260 5200
21 27 19 25 20 21 7 32 147 3087
28 25 19 20 22 22 9 41 198 4356
20 26 26 28 26 23 8 49 184 4232
25 27 20 28 19 24 5 54 120 2880
22 28 28 22 27 25 10 64 250 6250
28 19 23 28 19 26 7 71 182 4732
23 27 23 26 19 27 14 85 378 10206
22 28 19 28 24 28 10 95 280 7840
25 19 26 21 22 2227 53115
25 21 21 27 26
22 25 25 19 20 Mínimo = 19
Máximo
20 23 25 27 20 n= 95 28 36
=
25 24 27 27 26 S(x) = 2227 Rango= 9 36
9.6748040
27 23 20 22 25 S(x2) = 53115 s2 =
3
Promedio 23.442105
28 24 21 23 23 s= 3.1104347
= 3
9.5729639
20 20 27 22 20 Moda = 27 s2 =
9
3.0940206
27 27 20 24 24 Mediana = 23 s=
8
Datos 16 x f fa fx fx2
20 24 23 25 20 17 10 10 170 2890
24 19 23 19 17 18 6 16 108 1944
24 26 18 24 23 19 8 24 152 2888
21 24 17 21 26 20 11 35 220 4400
18 24 21 20 26 21 13 48 273 5733
22 24 21 20 24 22 7 55 154 3388
25 26 18 21 21 23 11 66 253 5819
24 21 26 19 17 24 12 78 288 6912
20 17 18 22 23 25 6 84 150 3750
22 26 25 26 25 26 11 95 286 7436
26 18 19 19 17 2054 45160
17 23 20 17 26
37
37