Escolar Documentos
Profissional Documentos
Cultura Documentos
FACULTAD DE INGENIERIA
Carrera de Ingeniería Civil
PORTAFOLIO DE ESTADÍSTICA
ESTUDIANTE:
MISION
La Universidad Laica Eloy Alfaro de Manabí, es una institución de educación
superior pública, que tiene como misión la formación de profesionales
competentes de grado y posgrado, en diversos campos del conocimiento,
fomenta la investigación científica y la innovación tecnológica en estrecha
vinculación con la sociedad, al promover, difundir y desarrollar los saberes con
una concepción ética, humanista e inclusiva, para aportar al desarrollo socio-
económico y cultural de los/las manabitas y ecuatorianos/as.
VISIÓN
La Universidad Laica Eloy Alfaro de Manabí será una institución de educación
superior del más alto nivel, referente en la región, con creciente reconocimiento
nacional e internacional, que promueve, difunde y genera conocimiento con
planteamientos debidamente fundamentados que contribuyen a la solución de
los problemas de la región y del país, orientados a disminuir las inequidades
existentes, favoreciendo el encuentro de voluntades que permitan edificar una
renovada sociedad más justa, solidaría e igualitaria.
2
Misión y Visión de la Facultad.
MISIÓN
La Facultad de Ingeniería forma de manera integral profesionales de ingeniería
eléctrica y civil, competitivos, nacional e internacionalmente para satisfacer los
requerimientos de la sociedad. Con habilidades, actitudes y valores que le
permiten el desempeño pleno en el ejercicio profesional, la investigación y la
docencia, con el aporte docentes competentes y éticos
VISIÓN
3
Misión y Visión de la Carrera.
MISIÓN
VISIÓN
4
Autorretrato del estudiante.
5
Universidad Laica “Eloy Alfaro” de Manabí
ESTADÍSTICA
Aprobado por Consejo Universitario, en sesión ordinaria del 30 de julio de 2014, mediante
Resolución No. 102-2014-HCU-SG-CS
6
DEFINICIÓN ESTADÍ STICA
Ciencia que utiliza conjuntos de datos numéricos para obtener, a partir de ellos,
inferencias basadas en el cálculo de probabilidades.
Estudio que reúne, clasifica y recuenta todos los hechos que tienen una determinada
característica en común, para poder llegar a conclusiones a partir de los datos numéricos
extraídos.
IMPORTANCIA DE LA ESTADÍSTICA
La estadística es una de las ramas de la ciencia matemática que se centra en el trabajo
con datos e informaciones que son ya de por sí numéricos o que ella misma se encarga
de transformar en números. La estadística, si bien es una ciencia de extracción exacta,
tiene una injerencia directa en cuestiones sociales por lo cual su utilidad práctica es
mucho más comprensible que lo que sucede normalmente con otras ciencias exactas
como la matemática.
Podemos decir que la función principal de la estadística es justamente la recolección y
agrupamiento de datos de diverso tipo para construir con ellos informes estadísticos que
nos den idea sobre diferentes y muy variados temas, siempre desde un punto de vista
cuantitativo y no cualitativo. Esto es muy importante remarcarlo ya que la estadística se
convierte entonces en una ciencia que nos habla de cantidades (por ejemplo, cuántas
personas viven en un país por metro cuadrado) pero no nos da información directa sobre
la calidad de vida de esas personas.
7
HISTORIA DE LA ESTADÍSTICA
La palabra Estadística procede del vocablo “Estado”, pues era función principal de los
Gobiernos de los Estados establecer registros de población, nacimientos, defunciones,
impuestos, cosechas... La necesidad de poseer datos cifrados sobre la población y sus
condiciones materiales de existencia han debido hacerse sentir desde que se
establecieron sociedades humanas organizadas.
Es difícil conocer los orígenes de la Estadística. Desde los comienzos de la civilización
han existido formas sencillas de estadística, pues ya se utilizaban representaciones
gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para
contar el número de personas, animales o ciertas cosas.
Su origen empieza posiblemente en la isla de Cerdeña, donde existen monumentos
prehistóricos pertenecientes a los Nuragas, las primeros habitantes de la isla; estos
monumentos constan de bloques de basalto superpuestos sin mortero y en cuyas paredes
de encontraban grabados toscos signos que han sido interpretados con mucha
verosimilidad como muescas que servían para llevar la cuenta del ganado y la caza.
Hacia el año 3.000 a.C. los babilonios usaban ya pequeñas tablillas de arcilla para
recopilar datos en tablas sobre la producción agrícola y los géneros vendidos o
cambiados mediante trueque.
Los egipcios ya analizaban los datos de la población y la renta del país mucho antes de
construir las pirámides. En los antiguos monumentos egipcios se encontraron
interesantes documentos en que demuestran la sabia organización y administración de
este pueblo; ellos llevaban cuenta de los movimientos poblacionales y continuamente
hacían censos. Tal era su dedicación por llevar siempre una relación de todo que hasta
tenían a la diosa Safnkit, diosa de los libros y las cuentas. Todo esto era hecho bajo la
dirección del Faraón y fue a partir del año 3050 a.C.
8
ESTADÍSTICA DESCRIPTIVA
La Estadística descriptiva registra los datos en tablas y los representa en gráficos.
Calcula los parámetros estadísticos (medidas de centralización y de dispersión), que
describen el conjunto estudiado.
Es la rama de las Matemáticas que recolecta, presenta y caracteriza un conjunto de datos
(por ejemplo, edad de una población, altura de los estudiantes de una escuela,
temperatura en los meses de verano, etc.)
ESTADÍSTICA INFERENCIAL
La Estadística inferencial o Inferencia estadística estudia cómo sacar conclusiones
generales para toda la población a partir del estudio de una muestra, y el grado de
fiabilidad o significación de los resultados obtenidos.
TÉRMINOS ESTADÍSTICOS
9
Variable: es la característica que estamos midiendo.
Existen dos tipos de variables:
Variable cualitativa: Es aquella que expresa un atributo o característica,
ejemplo: Rubio, moreno, etc.
Variable cuantitativa: Es aquella que podemos expresar numéricamente: edad,
peso, etc. Esta a su vez la podemos subdividir en:
Variable discreta, aquella que entre dos valores próximos puede tomar a lo
sumo un número finito de valores. Ejemplos: el número de TSE de una familia,
el de obreros de una fábrica, el de alumnos de la universidad, etc.
Variable continúa la que puede tomar los infinitos valores de un intervalo. En
muchas ocasiones la diferencia es más teórica que práctica, ya que los aparatos
de medida dificultan que puedan existir todos los valores del intervalo.
Ejemplos, peso, estatura, distancias, etc.
La variable se denota por las mayúsculas de letras finales del alfabeto castellano.
A su vez cada una de estas variables puede tomar distintos valores, colocando un
subíndice, que indica orden.
X = (X1, X2 , ...... Xn)
Muestra: Conjunto de elementos que forman parte de población. La muestra
representa a esta población.
Tamaño muestral: Es le número de elementos u observaciones que tomamos.
Se denota por n o N.
Dato: Cada uno de los individuos, cosas, entes abstractos que integran una
población o universo determinado. Dicho de otra forma, cada valor
FILA DE DATOS
La estadística se aplica en una fase concreta del proceso de investigación: en el análisis
de datos. Los datos son la materia prima de la estadística.
10
La escala de medida de las variables estadísticas es la que más afecta al tratamiento
estadístico, es decir, muchas técnicas estadísticas se diferencian según el tipo de
técnicas que se apliquen.
Cuantitativas = numéricas = intervalo
Cualitativas = categóricas
ORDENACIONES
Resulta importante conocer la estadística descriptiva sin importar la profesión que se
haya elegido, ya que es una herramienta que permite mostrar a los estudiantes o
profesionistas cómo organizar y resumir datos. La ordenación y la recopilación de datos
puede presentar variabilidad o incertidumbre para los estudios encomendados y el solo
hecho de conocerlos permite en su momento hacer correcciones ante alguna anomalía,
de ahí la importancia de realizar los cálculos de las medidas de tendencia central o
dispersión. Un gran apoyo para la estadística descriptiva es la presentación de los datos
por medio de tablas o de gráficas, simplemente porque sintetizan un gran acervo de
información y es más sencillo valorar todos los datos de un fenómeno en general con
ellas.
DISTRIBUCIÓN DE FRECUENCIAS
Ordenar y contar cuántos casos hay en cada uno de los posibles valores o categorías de
la variable que se analiza.
INTERVALOS DE CLASE
Los intervalos de clase se emplean si las variables toman un número grande de valores o
la variable es continua.
Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases.
A cada clase se le asigna su frecuencia correspondiente.
LÍMITES DE LA CLASE
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la
clase.
11
En una distribución de frecuencias agrupadas el límite inferior de una clase pertenece al
intervalo, pero el límite superior no pertenece intervalo, se cuenta en el siguiente
intervalo.
Ejemplo
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11,
13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
MARCA DE CLASE
La marca de clase es el punto medio de cada intervalo.
Ejemplo
12
3. Determinar el número de observaciones que caen dentro de cada intervalo de clase, es
decir, encontrar las frecuencias de clase. Lo mejor para esto es utilizar una hoja de
conteo.
(a) Sus bases sobre un eje horizontal (el eje X) con centros en las marcas de clase y
longitud igual al tamaño de los intervalos de clase.
(b) Superficies proporcionales a las frecuencias de clase.
Si los intervalos de clase tienen todo igual tamaño, las alturas de los rectángulos son
proporcionales a las frecuencias de clase y se acostumbra en tal caso a tomar las alturas
numéricamente iguales a las frecuencias de clase. Si los intervalos de clase no son de
igual tamaño, estas alturas deberán ser calculadas.
2. Un polígono de frecuencias es un gráfico de línea trazado sobre las marcas de clase.
Puede obtenerse uniendo los puntos medios de los techos de los rectángulos en el
histograma.
13
Cuadro. Distribución de frecuencia relativa de matrículas primarias por género en
Balochistán.
La frecuencia total de todos los valores menores que el límite real superior de clase de
un intervalo de clase dado se conoce como frecuencia acumulada hasta ese intervalo de
clase inclusive. Por ejemplo, la frecuencia acumulada hasta el intervalo de clase 66 - 68
inclusive en la Tabla 1, es 5 + 18 + 42 = 65, significando que 65 estudiantes tienen
alturas menores que 68,5 pulgadas.
Un gráfico que muestre las frecuencias acumuladas menores que cualquier límite real
superior de clase trazado sobre los límites reales superiores de clase se llama polígono
de frecuencias acumuladas u ojiva y se muestra para la distribución de la altura de los
estudiantes.
En algunos casos es preferible considerar una distribución de frecuencias acumuladas de
todos los valores mayores o iguales al límite real inferior de clase de cada intervalo de
14
clase. En este caso consideramos las alturas de 59,5 pulgadas o más, 62,5 pulgadas o
más, etc., ésta se llama a veces distribución acumulada «o más», mientras que la
considerada anteriormente es la distribución acumulada «menor que». De la una se
obtiene fácilmente la otra. Las correspondientes ojivas se llaman «o más» y «menor
que». Siempre que nos refiramos a distribuciones acumuladas u ojivas sin especificar,
se entenderá que son del tipo «menor que».
Los datos recogidos pueden considerarse usualmente como pertenecientes a una muestra
de una población grande. Ya que son posibles muchas observaciones sobre esa
población, es teóricamente posible (para datos continuos) escoger intervalos de clase
muy pequeños y tener todavía números razonables de observaciones en cada clase. Así
que cabe esperar que el polígono de frecuencias o el polígono de frecuencias relativas
para una gran población tengan tantos pequeños segmentos que aparezca como casi una
curva continua, a las que nos referiremos como curva de frecuencias o curva de
frecuencias relativas, respectivamente.
Es sensato esperar que dichas curvas teóricas sean aproximables suavizando los
polígonos de frecuencias o los polígonos de frecuencias relativas de la muestra, tanto
mejor la aproximación cuanto mayor sea el tamaño de la muestra. Por esa razón, una
curva de frecuencias se cita a veces como un polígono de frecuencias suavizado.
De forma análoga, se obtienen ojivas suavizadas de los polígonos de frecuencias
acumuladas u ojivas. Suele ser más fácil suavizar una ojiva que un polígono de
frecuencias.
1.
Las curvas de frecuencias simétricas o en forma de campana, se caracterizan
porque las observaciones equidistantes del máximo central tienen la misma
frecuencia. Ejemplo importante es la curva normal.
2.
En las curvas de frecuencia poco asimétricas, o sesgadas, la cola de la curva a un
lado del máximo central es más larga que al otro lado. Si la cola mayor está a la
derecha, la curva se dice asimétrica a la derecha o de asimetría positiva. En caso
contrario, se dice asimétrica a la izquierda o de asimetría negativa.
3.
En una curva en forma de J o de J invertida, hay un máximo en un extremo.
15
4.
Una curva de frecuencia en forma de U tiene máximos en ambos extremos.
5.
Una curva de frecuencia bimodal tiene dos máximos.
6.
Una curva de frecuencia multimodal tiene más de dos máxim.
DESCRIPCIÓN DE DATOS
Esta parte se orienta al tratamiento de datos estadísticos, esto es, al análisis estadístico
de poblaciones finitas. Para estas poblaciones, analiza una o más características, con el
objeto de resumir el comportamiento de cada una de ellas dentro de la población, o la
relación entre varias.
Los datos ayudan a los encargados de la toma de decisiones a hacer conjeturas bien
fundamentadas acerca de las causas y, por lo tanto, sobre los efectos probables de
ciertas características de algunas situaciones. Por lo demás, el conocimiento de las
tendencias adquirido con la experiencia permite conocer los posibles resultados y
planear con anticipación.
Algunas veces puede ser satisfactorio presentar los datos tal como se encuentran y
obtener información directamente de ellos; otras veces solo habrá que agruparlos y
presentarlos en forma gráfica o tabulada, aquí el uso de las tecnologías computacionales
es mucha utilidad y rapidez.
16
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia
es la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.
2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de
las dos puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8 Mo = 4
Ejemplo:
Calcular la moda de una distribución estadística que viene dada por la siguiente tabla:
17
La clase modal es la que tiene mayor altura.
Mediana
Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados
de menor a mayor.
La mediana se representa por Me.
La mediana se puede hallar sólo para variables cuantitativas.
Cálculo de la mediana
1 Ordenamos los datos de menor a mayor.
2 Si la serie tiene un número impar de medidas la mediana es la puntuación central de la
misma.
2, 3, 4, 4, 5, 5, 5, 6, 6 Me= 5
3 Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos
puntuaciones centrales.
7, 8, 9, 10, 11, 12Me= 9.5
Cálculo de la mediana para datos agrupados
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta
la mitad de la suma de las frecuencias absolutas.
18
Es decir tenemos que buscar el intervalo en el que se encuentre .
100 / 2 = 50
Clase modal: [66, 69)
Media aritmética
La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado
entre el número total de datos.
Ejemplo
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
19
Media aritmética para datos agrupados
Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es:
Las suma de las desviaciones de los números 8, 3, 5, 12, 10 de su media aritmética 7.6
es igual a 0:
8 − 7.6 + 3 − 7.6 + 5 − 7.6 + 12 − 7.6 + 10 − 7.6 =
= 0. 4 − 4.6 − 2.6 + 4. 4 + 2. 4 = 0
2 La media aritmética de los cuadrados de las desviaciones de los valores de la variable
con respecto a un número cualquiera se hace mínima cuando dicho número coincide con
la media aritmética.
3 Si a todos los valores de la variable se les suma un mismo número, la media aritmética
queda aumentada en dicho número.
20
4 Si todos los valores de la variable se multiplican por un mismo número la media
aritmética queda multiplicada por dicho número.
2. INTRODUCCIÓN
3. CUANTILES
Los cuantiles son medidas de posición que se determinan mediante un método que
determina la ubicación de los valores que dividen un conjunto de observaciones en
partes iguales.
Los cuantiles son los valores de la distribución que la dividen en partes iguales, es decir,
en intervalos que comprenden el mismo número de valores. Cuando la distribución
21
contiene un número alto de intervalos o de marcas y se requiere obtener un promedio de
una parte de ella, se puede dividir la distribución en cuatro, en diez o en cien partes.
Los más usados son los cuartiles, cuando dividen la distribución en cuatro partes; los
deciles, cuando dividen la distribución en diez partes y los centiles o percentiles, cuando
dividen la distribución en cien partes. Los cuartiles, como los deciles y los percentiles,
son en cierta forma una extensión de la mediana.
Para algunos valores u , se dan nombres
u Q(u)
0.5 Mediana
0.25, 0.75 Cuartiles
0.1, ... , 0.99 Deciles
0.01, ..., 0.99 Centiles
CUARTILES
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro
partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente
la mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto
(25%) de todos los valores de la sucesión (ordenada); el tercer cuartil, es el valor en el
cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos.
DATOS AGRUPADOS
Como los cuartiles adquieren su mayor importancia cuando contamos un número grande
de datos y tenemos en cuenta que en estos casos generalmente los datos son resumidos
en una tabla de frecuencia. La fórmula para el cálculo de los cuartiles cuando se trata de
datos agrupados es la siguiente:
k= 1,2,3
Dónde:
Lk = Límite real inferior de la clase del cuartil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
fk = Frecuencia de la clase del cuartil k
c = Longitud del intervalo de la clase del cuartil k
Si se desea calcular cada cuartil individualmente, mediante otra fórmula se tiene lo
siguiente:
El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte de los datos;
es decir, aquel valor de la variable que supera 25% de las observaciones y es superado
por el 75% de las observaciones.
22
Fórmula de Q1, para series de Datos agrupados:
Dónde:
L1 = límite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase
El segundo cuartil Q2, (coincide, es idéntico o similar a la mediana, Q2 = Md), es el
menor valor que es mayor que la mitad de los datos, es decir el 50% de las
observaciones son mayores que la mediana y el 50% son menores.
Dónde:
L1 = límite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = interval de clase
El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de los datos,
es decir aquel valor de la variable que supera al 75% y es superado por el 25% de las
observaciones.
Dónde:
L1 = límite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase.
Otra manera de verlo es partir de que todas las medidas no son sino casos particulares
del percentil, ya que el primer cuartil es el 25% percentil y el tercer cuartil 75%
percentil.
Cuando n es impar:
23
Para el tercer cuartil
Cuando n es par:
Cuando n es impar:
DECILES
Los deciles son ciertos números que dividen la sucesión de datos ordenados en diez
partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos
ordenados en diez partes iguales, son también un caso particular de los percentiles. Los
deciles se denotan D1, D2,..., D9, que se leen primer decil, segundo decil, etc.
Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el
aprovechamiento académico.
DATOS AGRUPADOS
Para datos agrupados los deciles se calculan mediante la fórmula.
k= 1,2,3,... 9
Dónde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra fórmula para calcular los deciles:
El cuarto decil, es aquel valor de la variable que supera al 40%, de las observaciones y
es superado por el 60% de las observaciones.
24
Donde (para todos):
L1 = limite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase.
Cuando n es par:
Cuando n es impar:
Siendo A el número del decil
.
CENTILES O PERCENTILES
Los percentiles son, tal vez, las medidas más utilizadas para propósitos de ubicación o
clasificación de las personas cuando atienden características tales como peso, estatura,
etc.
Los percentiles son ciertos números que dividen la sucesión de datos ordenados en cien
partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes
iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99), leídos primer
percentil,..., percentil 99.
DATOS AGRUPADOS
Cuando los datos están agrupados en una tabla de frecuencias, se calculan mediante la
fórmula:
k= 1,2,3,... 99
Dónde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
25
Otra forma para calcular los percentiles es:
Primer percentil, que supera al uno por ciento de los valores y es superado por el
noventa y nueve por ciento restante.
Cuando n es impar:
Siendo A, el número del percentil.
Es fácil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con el
percentil 50 y el tercer cuartil con el percentil 75.
3. EJEMPLO
Determinación del primer cuartil, el séptimo decil y el 30 percentil, de la siguiente tabla:
Salarios No. De fa
(I. De Clases) Empleados (f1)
26
200-299 85 85
300-299 90 175
400-499 120 295
500-599 70 365
600-699 62 427
700-800 36 463
Siendo,
El primer cuartil:
115.5 – 85 = 30.75
Li = 300, Ic = 100 , fi = 90
El 7 decil:
Posición:
324.1 – 295 = 29.1
Li = 500, fi = 70
El percentil 30
Posición:
138.9 – 85 = 53.9
fi = 90
27
Estos resultados nos indican que el 25% de los empleados ganan salarios por debajo de
$ 334; que bajo 541.57 gana el 57%de los empleados y sobre $359.88, gana el 70% de
los empleados.
PLANTEAMIENTO TÉORICO-CONCEPTUAL:
El conocimiento de la forma de la distribución y del respectivo promedio de una
colección de valores de una variable, puede servir para tener una idea bastante clara de
la conformación, pero no de de la homogeneidad de cada una de los valores con
respecto a la medida de tendencia central aplicada.
En el caso de las variables con valores que pueden definirse en términos de
alguna escala de medida de igual intervalo, puede usarse un tipo de indicador que
permite apreciar el grado de dispersión o variabilidad existente en el grupo de variantes
en estudio.
A estos indicadores les llamamos medidas de dispersión, por cuanto que están referidos
a la variabilidad que exhiben los valores de las observaciones, ya que si no hubiere
variabilidad o dispersión en los datos interés, entonces no habría necesidad de la gran
mayoría de las medidas de la estadística descriptiva.
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en
un valor representativo, las medidas de dispersión nos dicen hasta que punto estas
medidas de tendencia central son representativas como síntesis de la información. Las
medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los
valores de la distribución respecto al valor central. Distinguimos entre medidas de
dispersión absolutas, que no son comparables entre diferentes muestras y las relativas
que nos permitirán comparar varias muestras.
LA DISPERSIÓN.
Al igual que sucede con cualquier conjunto de datos, la media, la mediana y
la moda sólo nos revelan una parte de la información que necesitamos acerca de las
28
características de los datos. Para aumentar nuestro entendimiento del patrón de los
datos, debemos medir también su dispersión, extensión o variabilidad.
La dispersión es importante porque:
Proporciona información adicional que permite juzgar la confiabilidad de la medida de
tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central
es menos representativa de los datos.
EL RANGO O RECORRIDO ( R ):
Es la medida de variabilidad más fácil de calcular. Para datos finitos o sin agrupar, el
rango se define como la diferencia entre el valor más alto (Xn ó Xmax.) y el más bajo
(X1 ó Xmin) en un conjunto de datos.
Ejemplo:
Se tienen las edades de cinco estudiantes universitarios de Ier año, a saber: 18,23, 27,34
y 25., para calcular la media aritmética (promedio de las edades, se tiene que:
R = Xn-X1 ) = 34-18 = 16 años
Con datos agrupados no se saben los valores máximos y mínimos. Si no hay intervalos
de clases abiertos podemos aproximar el rango mediante el uso de los límites de clases.
Se aproxima el rango tomando el límite superior de la última clase menos el límite
inferior de la primera clase.
Ejemplo:
Si se toman los datos del ejemplo resuelto al construir la tabla de distribución de
frecuencia de las cuentas por cobrar de Cabrera’s y Asociados que fueron los
siguientes:
29
Clases P.M. fi fr fa↓ fa↑ fra↓ fra↑
Xi
7.420 – 21.835 14.628 10 0.33 10 30 0.33 1.00
21.835 – 36.250 29.043 4 0.13 14 20 0.46 0.67
36.250 – 50.665 43.458 5 0.17 19 16 0.63 0.54
50.665 – 65.080 57.873 3 0.10 22 11 0.73 0.37
65.080 – 79.495 72.288 3 0.10 25 8 0.83 0.27
79.495 – 93.910 86.703 5 0.17 30 5 1.00 0.17
Total XXX 30 1.00 XXX XXX XXX XXX
LA VARIANZA (S2 ó δ2 ):
La varianza es una medida de dispersión relativa a algún punto de referencia. Ese punto
de referencia es la media aritmética de la distribución. Más específicamente, la varianza
es una medida de que tan cerca, o que tan lejos están los diferentes valores de su propia
media aritmética. Cuando más lejos están las Xi de su propia media aritmética, mayor es
la varianza; cuando más cerca estén las Xi a su media menos es la varianza. Y se define
y expresa matemáticamente de la siguiente manera:
30
LA VARIANZA PARA DATOS NO AGRUPADOS
Dado un conjunto de observaciones, tales como X1, X2, … , Xn, la varianza denotada
usualmente por la letra minúscula griega δ (sigma) elevada al cuadrado (δ2)y en otros
casos S2 según otros analistas, se define como: el cuadrado medio de las desviaciones
con respecto a su media aritmética"
Matemáticamente, se expresa como:
Ejemplo:
Se tienen las edades de cinco estudiantes universitarios de Ier año, a saber: 18,23, 25,
27, y 34. Al calcular la media aritmética (promedio de las edades, se obtuvo 25.4 años,
encontrar la varianza de las edades de estos estudiantes:
Para calcular se utiliza una tabla estadística de trabajo de la siguiente manera:
( Xi - )2
Xi ( Xi - )
18 (18 – 25.5)=-7.4 (-7.4)2=54.76
23 (23 – 25.5)=-2.4 (-2.4)2= 5.76
25 (25 – 25.5)=-0.4 (-0.4)2= 0.16
27 (27 – 25.5)= 1.6 ( 1.64)2= 2.16
34 (34 – 25.5)= 8.6 ( 8.6)2 =73.96
Total xxxx 137.20
31
LA VARIANZA PARA DATOS AGRUPADOS
Si en una tabla de distribución de frecuencias. Los puntos medios de las clases son X1,
X2, … , Xn; y las frecuencias de las clases f1, f2, … , fn; la varianza se calcula así:
Σ(Xi- )2f1
δ2 = ----------------
Σfi
Sin embargo la formula anterior tiene algún inconveniente para su uso en la práctica,
sobre todo cuando se trabaja con números decimales o cuando la media aritmética es un
número entero. Asimismo cuando se trabaja con máquinas calculadoras, La tarea de
computar la varianza se simplifica utilizando la formula de computación que se da a
continuación:
ΣXi2fi - [(ΣXifi)2/N]
δ2 = ----------------------------
N donde N=Σfi
Ejemplo:
Se tienen los datos de una muestra de 30 cuentas por cobrar de la tienda Cabrera’s y
Asociados dispuestos en una tabla de distribución de frecuencias, a partir de los cuales
se deberá calcular la varianza, para lo cual se construye la siguiente tabla estadística de
trabajo, si se calculó anteriormente la media aritmética y se fijó en 43.458 (ver ejemplo
del cálculo en "media aritmética para datos agrupados) de la siguiente manera.
32
Total XXX 30 19,053.936 1,304.190 78,346.396
= 21,649.344 / 30 = 721.645
PROPIEDADES DE LA VARIANZA:
s siempre un valor no negativo, que puede ser igual o distinta de 0. Sera 0 solamente
cuando Xi=
La varianza es la medida de dispersión cuadrática optima por ser la menor de todas.
Si a todos los valores de la variable se le suma una constante la varianza no se modifica.
Veámoslo:
Si todos los valores de la variable se multiplican por una constante la varianza queda
multiplicada por el cuadrado de dicha constante. Veámoslo:
Siendo
Ni è el nº de elementos del subconjunto (i)
33
S2i è la varianza del subconjunto (i)
LA DESVIACIÓN ESTÁNDAR (S ó δ)
Es una medida de la cantidad típica en la que los valores del conjunto de datos difieren
de la media. Es la medida de dispersión más utilizada, se le llama también desviación
típica. La desviación estándar siempre se calcula con respecto a la media y es un
mínimo cuando se estima con respecto a este valor.
Se calcula de forma sencilla, si se conoce la varianza, por cuanto que es la raíz cuadrada
positiva de esta. A la desviación se le representa por la letra minúscula griega "sigma" (
δ ) ó por la letra S mayúscula, según otros analistas.
Cálculo de la Desviación Estándar
δ = √δ2 ó S = √S2
Ejemplo:
Del cálculo de la varianza de las edades de cinco estudiantes universitarios de primer
año se obtuvo δ2=27.44, como la desviación estándar es la raíz cuadrada positiva,
entonces δ = √27.44 = 5.29 años.
Igual procedimiento se aplica para encontrar le desviación estándar de las cuentas por
cobrar de la Tienda Cabrera’s y Asociados, recordemos que la varianza obtenida fue de
721.645, luego entonces la desviación estándar es igual a δ =√721.645 = 26.86 balboas.
A su vez la desviación estándar, también tiene una serie de propiedades que se deducen
fácilmente de las de la varianza (ya que la desviación típica es la raíz cuadrada positiva
de la varianza):
La desviación estándar es siempre un valor no negativo S será siempre ³ 0 por
definición. Cuando S = 0 è X = xi (para todo i).
Es la medida de dispersión óptima por ser la más pequeña.
La desviación estándar toma en cuenta las desviaciones de todos los valores de la
variable
Si a todos los valores de la variable se le suma una misma constante la desviación
estándar no varía.
Si a todos los valores de la variable se multiplican por una misma constante, la
desviación estándar queda multiplicada por el valor absoluto de dicha constante.
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor
representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de
tendencia central son representativas como síntesis de la información. Las medidas de
dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la
distribución respecto al valor central. Distinguimos entre medidas de dispersión
absolutas, que no son comparables entre diferentes muestras y las relativas que nos
permitirán comparar varias muestras.
El problema de las medidas de dispersión absolutas es que normalmente son un
indicador que nos da problemas a la hora de comparar. Comparar muestras
34
de variables que entre sí no tienen cantidades en las mismas unidades, de ahí que en
ocasiones se recurra a medidas de dispersión relativas.
Un problema que se plantea, tanto la varianza como la desviación estándar,
especialmente a efectos de comparaciones entre distribuciones, es el de la dependencia
respecto a las unidades de medida de la variable. Cuando se quiere comparar el grado de
dispersión de dos distribuciones que no vienen dadas en las mismas unidades o que las
medias no son iguales se utiliza el llamado "Coeficiente de Variación de Pearson", del
que se demuestra que nos da un número independiente de las unidades de medidas
empleadas, por lo que entre dos distribuciones dadas diremos que posee menor
dispersión aquella cuyo coeficiente de variación sea menor., y que se define como la
relación por cociente entre la desviación estándar y la media aritmética; o en otras
palabras es la desviación estándar expresada como porcentaje de la media aritmética.
Dónde: C.V. representa el número de veces que la desviación típica contiene a la media
aritmética y por lo tanto cuanto mayor es CV mayor es la dispersión y menor la
representatividad de la media.
Propiedades del Coeficiente de Variación:
Ejemplo:
Suponga que Usted trabaja en una compañía de ventas, que ofrece como premio de
incentivo al mejor vendedor del trimestre anterior las entradas al palco empresarial en la
serie final de béisbol de las grandes ligas en los Estados Unidos (E,E,U,A,).
De los registros de ventas se tienen los siguientes datos de ventas, expresados en
porcentajes de cumplimiento de las metas fijadas mensualmente:
Vendedor A 95 105 100
Vendedor B 100 90 110
El promedio trimestral de cumplimiento de las metas de ventas de ambos vendedores es
igual y equivale al 100%, pero Ud. Sólo le puede dar el premio de incentivo a uno de
ellos. ¿Cuál usted escogería?. ¿En base a que criterio’. Explique.
Este problema se resuelve utilizando el coeficiente de variación, para estos efectos es
necesario encontrar la desviación estándar trimestral de las ventas de cada uno de la
siguiente manera:
35
Vendedor A
Xi ( Xi - ) ( Xi -
)2
95 95 – 100 = -5 (-5)2 = 25
105 105 – 100 = 5 ( 5)2 = 25
100 100 – 100 = 0 ( 0)2 = 0
Total XXX 50
δ 4.08
C.VA= --------- = ----------- = 0.0408
100
Vendedor B
Xi ( Xi - ) ( Xi - )2
100 100 – 100 = 0 ( 0 )2 = 0
90 90 – 100 = -10 (-10)2 =
100
110 110 – 100 = 10 ( 10)2 =
100
Total XXX 200
36
BIBLIOGRAFIA
http://colposfesz.galeon.com/est501/suma/sumahtml/conceptos/estadistica.htm
http://www.vitutor.com/estadistica/descriptiva/a_1.html
http://www.ceibal.edu.uy/contenidos/areas_conocimiento/mat/estadistica/poblac
in_y_muestra.html
http://metodologiaeninvestigacion.blogspot.com/2010/07/estadistica-descriptiva-e-
inferencial.html
http://www.monografias.com/trabajos43/medidas-dispersion/medidas-
dispersion2.shtml#ixzz3tz3DAfHg
: http://www.monografias.com/trabajos43/medidas-dispersion/medidas-
dispersion.shtml#ixzz3tz2YRrOo
http://www.monografias.com/trabajos27/datos-agrupados/datos-
agrupados.shtml#ixzz3tz19vBCg
: http://www.monografias.com/trabajos43/medidas-tendencia-central/medidas-tendencia-
central2.shtml#ixzz3tyybGNtZ
http://www.monografias.com/trabajos72/distribucion-
frecuencias/distribucion-frecuencias2.shtml#ixzz3tyvvrGjf
: http://www.monografias.com/trabajos72/distribucion-frecuencias/distribucion-
frecuencias.shtml#ixzz3tyxEZUK1
37
EVALUACIÓN DEL PROCESOS DE APRENDIZAJE:
BUZÓN DE SUGERENCIAS
38
ANEXOS
39
40
FECHA DE ENTREGA
FIRMA
------------------------------------------------------------
41