Você está na página 1de 27

I Unidad: Estadstica Descriptiva

Introduccin
Hace ms de cien aos, H.G. Wells, escritor e historiador ingls, dijo que algn da
el razonamiento cuantitativo sera tan importante para la gran mayora de los
ciudadanos como la capacidad de leer. No menciono el rea de los negocios, ya
que la revolucin industrial apenas iniciaba. No obstante, Wells tena razn. Si
bien la experiencia en los negocios, cierta habilidad para hacer pronsticos
razonados y la intuicin constituyen atributos fundamentales en los gerentes con
xito, los problemas que en la actualidad se presentan en los negocios tienden a
ser demasiado complejos como para tomar decisiones solo con estos criterios.
Una de las herramientas utilizadas para la toma de decisiones es la estadstica,
pero la estadstica no solo sirve a la gente dedicada a los negocios, su aplicacin
en la llamada medicina cientfica que nace por la necesidad de analizar el
resultado de los tratamientos mdicos sobre el efecto positivo que tenan en la
recuperacin de un paciente. Tras el descubrimiento de los procedimientos para
invertir las deficiencias bioqumicas que causan algunas afecciones y la
elaboracin de los antibiticos fue posible una curacin de las personas a travs
de prueba y error, ms tarde a esto se le llamara Diseo Experimental.
Si se desea analizar el impacto que tiene una dieta en los trabajadores de las
zonas francas, nos podremos percatar que no tiene el mismo impacto en los
trabajadores del campo, con frecuencia queremos analizar el efecto que tiene una
actividad laboral en las enfermedades musculo esquelticas desarrolladas por los
trabajadores en su puesto.
En el campo ingenieril nos interesa conocer la resistencia a la tencin de un
armado de acero o la compactacin de una carretera, y de esta manera podemos
pronosticar su esperanza de vida. En los procesos productivos de una empresa
manufacturera debe tomarse en cuenta la calidad del producto. Dentro de la
evolucin de la calidad, se pueden distinguir cinco etapas que estn ntimamente
ligadas al desarrollo de la propia administracin.

Pgina 1

I Unidad: Estadstica Descriptiva

Estadstica: Ciencia que trata de la recopilacin, organizacin, presentacin,


anlisis e interpretacin de datos numricos (estadsticas) con el fin de realizar
una toma de decisiones ms efectiva
Importancia de estudio la estadstica
1. Toda informacin de inters para el hombre se
puede estudiar cuantitativamente

2. Las tcnicas estadsticas se usan para obtener y


procesar informacin vital.

3. Los resultados estadsticos permiten y facilitan la


toma de decisiones que nos afectan.

DIVICIONES DE LA ESTADISTICA
Estadstica Descriptiva: Procedimientos estadsticos que sirven para organizar y
resumir conjunto de datos numricos, trata de la presentacin de datos en graficas
o en distribucin de frecuencia y se aplican diversos promedios y medidas de
dispersin.
Estadstica Inferencial: Procedimientos estadsticos que sirven para deducir o
inferir algo acerca de un conjunto de datos numricos (poblacin), seleccionados
de un grupo menor de ellos (muestra).
Funciona tomando una muestra de una poblacin y efectuando estimaciones
acerca de una caracterstica de esa poblacin con base en los resultados del
muestreo.
Poblacin: Conjunto de todos los posibles individuos, personas, objetos o
mediciones de inters cientfico.
Muestra: Una porcin o parte de la poblacin de inters.

Pgina 2

I Unidad: Estadstica Descriptiva

Tipos de muestreo Los autores proponen diferentes criterios de clasificacin de


los diferentes tipos de muestreo, aunque en general pueden dividirse en dos
grandes grupos: mtodos de muestreo probabilsticos y mtodos de muestreo no
probabilsticos.
A continuacin se describen los distintos tipos para estos dos grandes grupos, si
bien en general, para los estudios que nosotros llevaremos a cabo, trabajaremos
con muestreos probabilsticos.
Mtodos de muestreo probabilsticos:Los mtodos de muestreo probabilsticos
son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos
en los que todos los individuos tienen la misma probabilidad de ser elegidos para
formar parte de una muestra y, consiguientemente, todas las posibles muestras de
tamao n tienen la misma probabilidad de ser elegidas.
Slo estos mtodos de muestreo probabilsticos nos aseguran la representatividad
de la muestra extrada y son, por tanto, los ms recomendables. Dentro de los
mtodos de muestreo probabilsticos encontramos los siguientes tipos:
Muestreo aleatorio simple: El procedimiento empleado es el siguiente:
Se asigna un nmero a cada individuo de la poblacin y
A travs de algn medio mecnico (bolas dentro de una bolsa, tablas de
nmeros aleatorios, nmeros aleatorios generadas con una calculadora u
ordenador, etc) se eligen tantos sujetos como sea necesario para completar
el tamao de muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica
cuando la poblacin que estamos manejando es muy grande.

Pgina 3

I Unidad: Estadstica Descriptiva

Muestreo aleatorio sistemtico: Este procedimiento exige, como el anterior,


numerar todos los elementos de la poblacin, pero en lugar de extraer n nmeros
aleatorios slo se extrae uno. Se parte de ese nmero aleatorio i, que es un
nmero elegido al azar, y los elementos que integran la muestra son los que
ocupan los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de
k en k, siendo k el resultado de dividir el tamao de la poblacin entre el tamao
de la muestra: k = N/n. El nmero i que empleamos como punto de partida ser un
nmero al azar entre 1 y k.
El riesgo se este tipo de muestreo est en los casos en que se dan periodicidades
en la poblacin ya que al elegir a los miembros de la muestra con una periodicidad
constante (k) podemos introducir una homogeneidad que no se da en la poblacin.
Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos
en los que los 5 primeros son varones y los 5 ltimos mujeres, si empleamos un
muestreo aleatorio sistemtico con k=10 siempre seleccionaramos o slo
hombres o slo mujeres, no podra haber una representacin de los dos sexos.
Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan
los anteriores ya que simplifican los procesos y suelen reducir el error muestral
para un tamao dado de la muestra. Consiste en considerar categoras tpicas
diferentes entre s (estratos) que poseen gran homogeneidad respecto a alguna
caracterstica (se puede estratificar, por ejemplo, segn la profesin, el municipio
de residencia, el sexo, el estado civil, etc). Lo que se pretende con este tipo de
muestreo es asegurarse de que todos los estratos de inters estarn
representados adecuadamente en la muestra. Cada estrato funciona
independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formarn parte de
la muestra. En ocasiones las dificultades que plantean son demasiado grandes,
pues exige un conocimiento detallado de la poblacin (tamao geogrfico, sexos,
edades,...).
La distribucin de la muestra en funcin de los diferentes estratos se denomina
afijacin, y puede ser de diferentes tipos:
Afijacin Simple: A cada estrato le corresponde igual nmero de elementos
mustrales.
Afijacin Proporcional: La distribucin se hace de acuerdo con el peso (tamao)
de la poblacin en cada estrato.
Afijacin ptima: Se tiene en cuenta la previsible dispersin de los resultados, de
modo que se considera la proporcin y la desviacin tpica. Tiene poca aplicacin
ya que no se suele conocer la desviacin.
Pgina 4

I Unidad: Estadstica Descriptiva

Muestreo aleatorio por conglomerados: Los mtodos presentados hasta ahora


estn pensados para seleccionar directamente los elementos de la poblacin, es
decir, que las unidades mustrales son los elementos de la poblacin. En el
muestreo por conglomerados la unidad muestra es un grupo de elementos de la
poblacin que forman una unidad, a la que llamamos conglomerado. Las unidades
hospitalarias, los departamentos universitarios, una caja de determinado producto,
etc., son conglomerados naturales. En otras ocasiones se pueden utilizar
conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los
conglomerados son reas geogrficas suele hablarse de muestreo por reas. El
muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto
nmero de conglomerados (el necesario para alcanzar el tamao muestral
establecido) y en investigar despus todos los elementos pertenecientes a los
conglomerados elegidos.
Para finalizar con esta exposicin de los mtodos de muestreo probabilsticos es
necesario comentar que ante lo compleja que puede llegar a ser la situacin real
de muestreo con la que nos enfrentemos es muy comn emplear lo que se
denomina muestreo polietpico. Este tipo de muestreo se caracteriza por operar
en sucesivas etapas, empleando en cada una de ellas el mtodo de muestreo
probabilstico ms adecuado.
Variables: Si conforme se
observa una caracterstica. Se
encuentra que toma valores
diferentes
en
personas,
sucesos o lugares, se dice que
esta caracterstica es una
variable, se hace esto por la
sencilla
razn
que
la
caracterstica no es la misma
cuando se observa en los
diferentes poseedores de ella
Algunos ejemplos de variables
incluyen las estaturas de los adultos del sexo masculino, los pesos de los nios en
edad preescolar y las edades de los pacientes que se ven en una clnica dental.
Variables Cuantitativas: una variable cuantitativa es aquella que puede medirse,
por ejemplo, se puede obtener mediciones de la estatura de los adultos del sexo
masculino, los pesos de los nios en edad preescolar y las edades de los
Pgina 5

I Unidad: Estadstica Descriptiva

pacientes que se ven en una clnica dental. Estos son ejemplos de variables
cuantitativas.
Variables Cualitativas: Algunas caractersticas pueden no ser medidas en el
sentido en que se miden la estatura, el peso, la edad. Muchas caractersticas solo
pueden catalogarse, como por ejemplo, cuando a una persona enferma se le da
un diagnostico medico, Cuando a una persona se le designa dentro de un grupo
socioeconmico cuando se dice que una persona, lugar u objeto posee o no
posee alguna caracterstica de inters. Estas variables se conocen como variables
cualitativas.
Niveles de medicin
Existen
Cuatro
niveles
de
medicin: el nominal, ordinal, por
intervalo y de razn; la medicin
mas baja o ms primaria
corresponde al nivel de medicin
nominal. La ms alta o el nivel que
proporciona la mayor informacin
relacionada con la observacin es
la medicin de razn.

Nivel de Medicin Nominal: Las


observaciones acerca de una variable
cualitativa solo se clasifican y cuentan,
no existe una forma particular para
ordenar las etiquetas, por ejemplo el
gnero se puede clasificar, supn que
se realiza un conteo de los estudiantes
que entran a un partido de futbol,
cuntos son hombres y cuantos
mujeres, al realizar un inspeccin al
listado
de
consultas
externas,
clasificaremos
cuntas
de
ellas
corresponden
a
enfermedades
cardiacas y cuantas corresponden a enfermedades renales.
Las caractersticas de las variables de nivel nominal son:
1. Las categoras que se usan para las variables son mutuamente excluyentes
y exhaustivas. Un objeto pertenece a una y solo una categora.
2. Las categoras no guardan un orden lgico entre ellas que permitan
ordenarlas.

Pgina 6

I Unidad: Estadstica Descriptiva

Nivel de Medicin Ordinal: Consiste en smbolos letras, nombres o incluso


nmeros. Aqu, si importa la categora ya que a como su nombre lo indica, en
dependencia de la categora se puede decir
si es mejor una de otra.
Las caractersticas de las variables del nivel
ordinal son:
1. Las categoras son mutuamente
excluyentes y exhaustivo.
2. Las categoras pueden ordenarse de
mayor a menor (o viceversa), de
acuerdo con la caracterstica especial
que poseen.
Nivel de Medicin de Intervalo: esta escala de
intervalo posee todas las caractersticas de la
escala ordinal, con la propiedad adicional de que los
nombres o smbolos asignados son generalmente
nmeros y la diferencia entren dos de ellos dan
resultados significativos y que hay una unidad de
medida comn y constante. Ejemplo de esta escala
es la lectura de la temperatura Celsius o Fahrenheit.
Las propiedades de la escala de intervalo son:
1. Las categoras son mutuamente excluyentes
y exhaustivas.
2. Las categoras estn ordenadas de acuerdo
con la cantidad de la caracterstica que
poseen.
3. Diferencias iguales en las caractersticas estn representadas por
diferencias iguales en los nmeros asignados a las categoras.
Nivel de Medicion de Razon: Esta escala es el nivel de medicion mas alto, tiene
todas las caracteristicas de intervalo pero ademas tiene un punto cero natural o
teorico .
Las propiedades de la escala de la razon son:
1. Las categorias son mutuamente excluyentes
y exhaustivas.
2. Las categorias estan ordenadas de acuerdo
con la cantidad de las caracteristicas que
poseen.
3. Diferencias iguales en la caracteristica estan
presentadas por diferencias iguales en los
numeros asignados a la caracteristica.
4. El punto cero refleja la ausencia de esa
caracteristica.
Pgina 7

I Unidad: Estadstica Descriptiva

DISTRIBUCION DE FRECUENCIA
Una distribucin de frecuencia es un conjunto de puntuaciones ordenadas en sus
respectivas categoras. Una distribucin de frecuencias ordenara los datos si estos
se dividen en clases y se registrara el nmero el nmero de observaciones en
cada clase.
Ejemplo: Variable: cooperacin de personal para el proyecto de calidad de la
empresa
Categoras
Cdigos
Frecuencia
s
Si se ha obtenido la cooperacin
1
91
No se ha obtenido la cooperacin
2
5
No responden
3
26
Total
122
A veces las categoras de las frecuencias, son tantas que es necesario resumirlas
en clases
Ejemplo
Ingreso Familiar ($)
Frecuencias
10,000.00 - 11,999.00
12
12,000.00 - 13.999.00
14
14,000.00 - 15,999.00
24
16,000.00 - 17,999.00
15
18,000.00 - 19,999.00
13
20,000.00 - 21,999.00
7
22,000.00 - 23,999.00
6
24,000.00 - 25,999.00
4
26,000.00 - 27,999.00
3
28,000.00 - 29,999.00
2
Total
100
Las distribuciones de frecuencias pueden completarse agregando las frecuencias
relativas y las frecuencias acumuladas, las frecuencias relativas son los
porcentajes de casos en cada categora, y las frecuencias acumuladas son las que
se van acumulando en cada categora, desde la ms baja hasta la ms alta.
Ejemplo.
Categoras
Se ha dado la cooperado
No ha dado la cooperado
No responde
Total

Cdigo

fi
1
2
3

91
5
26
122

f%
74.6
4.1
22.3
100

fa
91
96
122

fa%
74.6
78.7
100

Pgina 8

I Unidad: Estadstica Descriptiva

Comentario Prcticamente tres cuartas partes de las organizaciones si han


obtenido la cooperacin del personal. Llama la atencin que poco ms de una
quinta parte, no quiso comprometerse con su respuesta. Las organizaciones que
no han logrado la cooperacin del personal representan menos del 5%.
Una de las tcnicas ms comnmente usadas para considerar cuando se va a
agrupar ciertos datos, es cuantos intervalos van a incluirse. al seleccionar el
numero de intervalos se debe calcular a travs de la formula K= 1+3.322log(n),
donde K representa el numero de intervalos de clases y n el nmero de casos en
el conjunto de datos bajo consideracin.
A continuacin se presenta una gua que puede tomarse en cuenta para
determinar el nmero de intervalos de clases K en un conjunto de datos.
Tabla 1.1
No de Casos a Tabular (n)
No de clases que se deben utilizar (k)
15 29
5
30 59
6
60 99
7
100 199
8
200 499
9
500 999
10
1,000 1,999
11
2,000 3,999
12
4,000 7,999
13
8,000 14,999
14
15,000 34,999
15
35,000 69,999
16
70,000 149,999
17
Amplitud Total (Rango). Se trata de la diferencia entre los valores mayor y
menor de un conjunto de datos.
Rango= valor ms alto valor ms bajo
El rango nos sirve para calcular el intervalo de clase (C)

Ejemplo. Los siguientes datos representan los resultados de 80 observaciones en


un proceso de produccin automatizado.
Pgina 9

I Unidad: Estadstica Descriptiva

105
97
245
163
207
134
218
199
160
196

221
154
228
131
180
178
157
151
175
201

183
153
174
154
190
76
101
142
149
200

186
174
199
115
193
167
171
163
87
176

121
120
181
160
194
184
165
145
160
150

181
168
158
208
133
135
172
171
237
170

180
167
176
158
156
229
158
148
150
118

143
141
110
133
123
146
169
158
135
149

Rango= 245 76 =169.


K con respecto a la tabla 1.1 el nmero de casos se encuentra entre 60 99 por lo
tanto K es igual a 7 con lo que:
C = Rango/ k = 169/7 = 24.14 = 25.
Ahora podemos presentar la tabla de distribucin de frecuencia de manera ms
tcnica.
Clase (C)
76 100
101 - 125
126 - 150
151 - 175
176 - 200
201 - 225
226 - 250
Total

L.R.

wi

75.5 100.5
100.5 125.5
125.5 150.5
150.5 175.5
175.5 200.5
200.5 225.5
225.5 250.5

88
113
138
163
188
213
238

fi
3
8
16
27
17
5
4
80

f%
3,75
10
20
33,75
21,25
6,25
5
100

fa .
3
11
27
54
71
76
80

fa%
3,75
13,75
33,75
67,5
88,75
95
100

Limites Reales o Naturales


Lim. real inf.= lm. inf - 0.5
Lm. real sup.= Lim.sup. + 0.5
PRESENTACION GRAFICA DE LOS DATOS
Notacin:

Pgina 10

I Unidad: Estadstica Descriptiva

n representa el numero de observacin es un conjunto de datos, las


observaciones estn representadas por una variable con subndice por ejemplo
(X1, X2, ... , Xn).
Diagrama de tallo y hojas
Es una buena manera de obtener una buena prestacin visual informativa del
conjunto de datos X1, X2, , Xn donde cada numero Xi (i=1, 2, , n) est formado
al menos por dos dgitos, para construir un diagrama de este tipo, los nmeros Xi
se dividen en dos partes, un tallo formado por uno o ms de los dgitos principales
y una hoja le cual contiene el resto de los dgitos para ilustrar el ejemplo anterior
consideremos la observacin xi =76, entonces 76 se puede dividir en un tallo 7 y
una hoja 6. lo usual es seleccionar entre 5 y 20 tallos.
Tallo
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

Hojas

Frecuencia

6
7
7
5, 1
5, 8, 0
1, 0, 3
4, 1, 3, 5, 3, 5
2, 9, 5, 8, 3, 1, 6, 9
4, 7, 1, 3, 4, 0, 8, 8, 6, 8, 0, 8
3, 0, 7, 3, 0, 5, 0, 8, 7, 9
8, 5, 4, 4, 1, 6, 2, 1, 0, 6
0, 3, 6, 1, 4, 1, 0
9, 6, 0, 9, 3, 4
7, 1, 0, 8
8
1, 8, 9
7
5
Total

1
1
1
2
3
3
6
8
12
10
10
7
6
4
1
3
1
1
80

Histograma

Pgina 11

I Unidad: Estadstica Descriptiva

Tambin es til presentar la distribucin de


frecuencia en forma grafica, este recibe el
nombre de histograma.
Para realizar un histograma, el eje horizontal se
utiliza para presentar la escala de medicin y
para dibujar las fronteras de las clases, el eje
vertical representa la escala de frecuencia.
Diagrama de Barras
El diagrama de barras se asemeja mucho a un
histograma, excepto que es una grafica de barras
de frecuencias de una variable cualitativas.
Consideremos la tabla del ejemplo del nivel de
medicin ordinal para realizar este grafico.

Ojiva
(Polgono
de
Frecuencias
acumuladas)
Se utiliza para determinar cuntas
observaciones se encuentran por debajo
de ciertos valores

Diagrama de Pastel
Como su nombre lo indica este diagrama
tiene
la forma de un pastel y las
frecuencias se van formando en
porciones.

MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIN PARA DATOS NO


AGRUPADOS
Pgina 12

I Unidad: Estadstica Descriptiva

MEDIDAS DE TENDENCIA CENTRAL:


Media Aritmtica (Promedio). Es la medida de tendencia central ms utilizada y
puede definirse como el promedio aritmtico de una distribucin. Es una medida
solamente aplicable a mediciones por intervalo o de razn.
Media Aritmtica Simple.

Poblacin
En el ejemplo el promedio es:

Muestra

=
Mediana
Es el valor cntrico en un conjunto de valores ordenados de menor a mayor o de
mayor a menor, una forma fcil de localizar la posicin del elemento medio para
los datos agrupados es por medio de (n+1)/2.
Es una medida de tendencia central propia de los niveles de medicin
ordinal, por intervalo y de razn.
No es influenciada por valores externos.
El 50% de las observaciones son mayores que la mediana.
No necesita ser uno de los valores del conjunto de datos.
Es nica para un conjunto de observaciones.
76
87
97
101
105
110
115
118
120
121

123
131
133
133
134
135
135
141
142
143

145
146
148
149
149
150
150
151
153
154

154
156
157
158
158
158
158
160
160
160

163
163
165
167
167
168
169
170
171
171

172
174
174
175
176
176
178
180
180
181

181
183
184
186
190
193
194
196
199
199

200
201
207
208
218
221
228
229
237
245

Pgina 13

I Unidad: Estadstica Descriptiva

Posicin de la Mediana=(n+1)/2.= (80 + 1) /2 = 40.5


La mediana se encuentra entre los valores X40 y X41 por lo tanto se encuentra
entre los valores 160 y 163.
Mediana=(X40 + X41)/2. = (160 + 163) /2 = 161.5
Moda. Es el valor de la observacin que aparece con ms frecuencia.

La moda es til en especial al describir a los niveles nominal y ordinal de


medicin (Aunque puede determinarse para todos los niveles de datos).
Un conjunto de datos puede tener ms de una moda.
En el ejemplo que nosotros tenemos el dato que mas se repite es el valor 158 por
lo tanto la moda es 158
MEDIDAS DE DISPERSION
Examinaremos varias medidas de dispersin o variabilidad de los datos, la
amplitud total, la varianza, la desviacin estndar y coeficiente de variacin.
Por qu estudiar la dispersin?
1. Al aplicar una medida de dispersin es posible evaluar la confiabilidad del
promedio que se esta utilizando, una dispersin pequea indica que los
datos se encuentran acumulados cerca mente, por ejemplo, alrededor de la
media aritmtica, por tanto la media se considera bastante representativa
de los datos. Esto es, la media es un promedio confiable.
2. Una medida de dispersin permite apreciar cuan dispersas estn dos o mas
distribuciones.
Varianza y Desviacin Estndar
La varianza y la desviacin estndar se basan en las desviaciones con respecto a
la media.
Varianza. Media aritmtica de las desviaciones cuadrticas con respecto a la
media
Varianza Poblacional

o bien
Pgina 14

I Unidad: Estadstica Descriptiva

Donde
2 : Es el smbolo para la varianza de una poblacin.
: Es el valor de la observacin en la poblacin.
: Es la media Poblacional
: Es el nmero total de observaciones en la poblacin
En general es difcil interpretar el significado del valor de una varianza, por las
unidades en las que se expresa son valores elevados al cuadrado; es mas
frecuente el uso de la raiz cuadrada
Desviacin Estndar. Es la raz cuadrada de la varianza

bien
Varianza Muestral. La formula para la varianza muestral utilizada como estimador
de la varianza poblacional es

o bien
Desviacin Estndar muestral. La desviacin estndar de una muestra se
denota como

o bien
La desviacin estndar se interpreta como cuanto se desva en promedio de la
media un conjunto de puntuaciones.
La desviacin estndar solo se utiliza en variables medidas por intervalo o de
razn.

Pgina 15

I Unidad: Estadstica Descriptiva

MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIN PARA DATOS


AGRUPADOS
MEDIDAS DE TENDENCIA CENTRAL:
Al trabajar con datos que han sido agrupados en una distribucin de frecuencia, no
se conoce cuales son las observaciones individuales, en la tabla de frecuencia de
los pacientes atendidos en el Hospital Manolo Morales se sabe solamente que
hay tres pacientes cuyos pesos se encuentran entre 76 y 100 libras, no se tienen
cifras exactas de esos tres pacientes. Sin los valores especficos, los
procedimientos mostrados anteriormente para calcular las medidas descriptivas,
simplemente no se aplican, deben encontrarse mtodos alternativos. Deben
tenerse en mente que los clculos hechos utilizando datos agrupados son solo
aproximaciones.
Media Aritmtica Ponderada.
Al trabajar con la media de los datos agrupados, se supone que las observaciones
en cada clase son iguales al punto medio de la clase. Dada esta suposicin se
debe tener en cuenta la frecuencia y los puntos medios de cada clase cuando se
calcule la media utilizando datos agrupados

en donde

f
n

es la frecuencia o numero de observaciones en cada clase


W
es el punto medio de cada clase
es el tamao de la muestra y es igual a las frecuencias

sumadas

Pgina 16

I Unidad: Estadstica Descriptiva

Clase (C)
76 100
101 - 125
126 - 150
151 - 175
176 - 200
201 - 225
226 - 250
Total

Wi
88
113
138
163
188
213
238

Fi
3
8
16
27
17
5
4
80

Facum. .
3
11
27
54
71
76
80

wifi
Wi2fi
264
23232
904
102152
2208
304704
4401
717363
3196
600848
1065
226845
952
226576
12990 2201720

Mediana
Si se han registrado datos en una tabla de frecuencias, no pueden colocarse en un
arreglo ordenado para calcular la mediana. Primero se debe hallar la clase de la
mediana de la distribucin de frecuencias. La clase mediana es la clase cuya
frecuencia acumulada es mayor que o igual a n/2.
Debido a que n es 80, se necesita localizar la primera clase con una frecuencia
acumulada de 40 o ms. La cuarta clase tiene una frecuencia acumulada de 54 ,
la mediana puede determinarse entonces como:

En donde:
Lmd Es el lmite inferior de la clase de la mediana (151)
F
Es la frecuencia acum. de la clase que antecede a la clase de la
mediana (27)
fmd
es la frecuencia de la clase de la mediana (27)
C
Es el intervalo de clase de la clase de la mediana.

Pgina 17

I Unidad: Estadstica Descriptiva

Moda.
Ya que por definicin la moda es la observacin que ocurre con mayor frecuencia,
se hallara en la clase que tenga la frecuencia ms alta , llamada la clase modal.
para estimar la moda en el caso de datos agrupados se utiliza la siguiente frmula:

En donde
Lmo
Da
antecede.
Db
C

Es el lmite inferior de la clase modal


Es la diferencia entre la frec de la clase modal y la clase que le
Es la diferencia entre la frec de la clase modal y la clase que le sigue.
Es el intervalo de clase de la clase modal.

MEDIDAS DE DISPERSION
Varianza y Desviacin Estndar
Si los datos estn agrupados en una tabla de distribucin de frecuencia, la
varianza y la desviacin estndar pueden calcularse como

Coeficiente de variacin.
El coeficiente de variacin es una medida muy til cuando:
1. Los datos estn en unidades diferentes (como salario y das de asistencia).
2. Los datos estn en la misma unidad, pero las medidas muy distantes
(ingreso de un ministro, ingeniero, o un maestro de primaria).
3. Cuando se desea comparar la variabilidad de dos conjunto de datos.
El coeficiente de variacin indica la magnitud relativa de la desviacin estndar en
comparacin con la media de la distribucin, expresada como porcentaje.
Poblacin

Pgina 18

I Unidad: Estadstica Descriptiva

Muestra

Para nuestro ejemplo el coeficiente de variacin es


.
CUARTILES Y PERCENTILES.
Cuartiles
Los cuarteles dividen los datos en cuatro partes iguales, los deciles en 10 partes y
los percentiles en 100 partes.
1. El primer cuartil Q1 es el valor que corresponde al punto por debajo del cual
se encuentra el 25% de las observaciones.
2. El segundo cuartil Q2 corresponde a la mediana, es decir, separa el 50%
superior de un conjunto de observaciones, del 50% inferior. El segundo
cuartil es exactamente la mediana.
3. El tercer cuartil Q3 es el valor que corresponde al punto por encima del cual
se encuentra el 25% de las observaciones.
Ejemplo:
A continuacin se presentan 20 observaciones en orden del tiempo de fallas, en
horas, de un estetoscopio elctrico.
204
228
252
300
324
444
624
720
816
912
1176
1296
1392
1488
1512
2520
2856
3192
3528
3710
Me = Q2
Posicin de la mediana (n+1)/2 = 21/2 = 10.5 Por lo tanto la mediana se encuentra
entre las observaciones 10 y 11
Q2= (912+1176)/2 = 1044.
Lo que corresponde al primer cuartil el cual debe tener al menos 25% de los datos
por debajo de l, por lo menos 5 observaciones en su valor o por debajo de el y al
menos 75% de los datos o al menos 15 observaciones en su valor o por encima
de el. Por lo tanto, el primer cuartil se encuentra entre la quinta y la sexta
observacin.

Pgina 19

I Unidad: Estadstica Descriptiva

De igual manera, sabiendo que Q 3 debe tener al menos el 75% de los datos por
debajo de l, es decir 15 observaciones y al menos 25% de los datos, es decir 5
observaciones por encima de l, entonces Q 3 se encuentra entre las
observaciones 15 y 16.

.
Percentiles
Cuando un conjunto ordenado se divide en cien partes iguales, los puntos de
divisin reciben el nombre de percentiles. En trminos ms generales, el 100kesimo percentil pk se define de la siguiente manera:
El 100k-esimo percentil pk es un valor tal, que al menos el 100k% de las
observaciones estn en el valor o por debajo de l y al menos el 100(1-k)% estn
en el valor o por encima de l.
El procedimiento para encontrar el valor de cualquier percentil a travs de los
datos clasificados es el siguiente:
Encontrar el nmero de la posicin i del percentil, mediante del clculo de nk. Si
nk no es entero entonces i es el siguiente entero ms grande; si nk es entero,
entonces i es igual a nk+0.5.
Si i es entero, encuentre desde la observacin ms pequea hasta llegar a la iesima observacin. Si i no es entero, entonces contiene una fraccin igual a con
lo que el valor pk es el promedio de la observacin nk y nk+1.
Ejemplo. Encontrar los percentiles 10 y 88
a) k = 0.10
pk=p0.10
nk=20*0.10= 2 : nk es entero por tanto
i=nk+0.5=2.5
Por tanto el percentil 10 se encuentra entre las observaciones 2 y 3.
p0.10= (x2+x3)/2 =(228 + 252)/2 = 240.
b) k= 0.88
pk = p0.88
nk=20*0.88= 17.6 no es entero, por tanto
i es el siguiente entero ms grande i = 18.
Por tanto el percentil 88 se encuentra en la observacin 18
p0.88=3192.

Pgina 20

I Unidad: Estadstica Descriptiva

EJERCICIOS
1) Los siguientes datos son los niveles de glucosa en la sangre
nios en ayunas:
56
61
57
77
62
75
63
55
60
57
61
57
67
62
69
67
65
72
65
61
68
73
65
62
66
61
69
76
72
57
75
68
69
64
66
65
65
76
65
58
68
71
72
58
73
55
73
79
65
60
65
80
66
80
68
55
72
73
73
75
75
74
66
68
73
74
68
59
69
55
67
65
67
56
67
62
65
75
62
63

extrada a 100
64
68
75
81
65
81
66
73
67
63

60
59
80
64
64
56
71
65
63
59

2) En 60 grandes ciudades se tomaron muestras de partculas de materia en


suspensin (microorganismos por metro cbico).
68
63
42
27
30
36
28
32
79
27
22
23
24
25
44
65
43
25
74
51
36
42
28
31
28
25
45
12
57
51
12
32
49
38
42
27
31
50
38
21
16
24
69
47
23
22
43
27
49
28
23
32
19
46
63
30
47
43
49
12
Para los ejercicios 1 y 2 Prepare:
a) Una Tabla de distribucin de frecuencias (use las tcnicas para su
elaboracin).
b) Un Diagrama de tallo y hojas.
c) Un Histograma
d) Un polgono de frecuencias acumuladas.
e) Calcule la Media aritmtica.
f) Calcule la Media Ponderada.
g) Calcule la Mediana.
h) Calcule la Moda.

3) Regresa a la situacin en que la seora Katherine Ball de AutoUSA desea


tablas, diagramas y graficas para mostrar el precio tpico de venta en diversas
Pgina 21

I Unidad: Estadstica Descriptiva

concesionarias. La siguiente tabla contiene exclusivamente el precio de 80


vehculos vendidos el mes pasado en Whitner Autoplex. Cul es el precio
tpico de venta? Cul es el precio de venta ms alto? Cules el precio de
venta ms bajo? Alrededor de que valor tienden a acumularse los precios de
venta?
$23197

$23372

$20454

18021
20047
19873
20004
20203
24052
20356
20962
21740
24220
21556

28683
24285
25251
17357
23765
25799
21442
22845
22374
30655
21639

30872
24324
25277
20155
25783
15794
21722
26285
24571
22442
24296

$2359
1
19587
24609
28034
19688
26661
18263
19331
27896
25449
17891

$26651

$27453

$17266

23169
28670
24533
23657
32277
35925
22817
29076
28337
20818

35851
15546
27443
26613
20642
17399
19766
32492
20642
26237

19251
15935
19889
20895
21981
17968
20633
18890
23613
20445

4) El gerente de Bilo SUpermaeket en Mt. Pleasant, Rhode Island, reuni la


siguiente informacin sobre la cantidad de veces que un cliente visita la tienda
durante un mes. Las respuestas de 51 clientes fueron las siguientes:
5
1
8
1

3
3
1
4
4
5
6
4
2
6
6
6
7
1
14 1
2
4
4
4
5
6
3
5
3
4
5
6
4
7
6
5
9
11 3
12 4
7
6
5
15 1
10 8
9
2
12
a) Comience a partir de 0 como lmite inferior de la primera clase, utilice un
intervalo de clase de 3 y organice los datos en una distribucin de
frecuencia.
b) Describa la distribucin. Dnde tienden a acumularse los datos?
c) Convierta la distribucin en una distribucin de frecuencias relativas.

5)

La divisin de servicios alimenticios de Cedar River Amusement Park, Inc.,


estudia la cantidad que gastan al da en alimento y bebidas las familias que
visitan el parque de diversiones. Una muestra de 40 familias que visito el
parque ayer revela que estas gastan las siguientes cantidades (en $):
Pgina 22

I Unidad: Estadstica Descriptiva

77
41
60

18 63 84 38 54 50 59 54 56 36 26 50 34 44
58 58 53 51 62 43 52 53 63 62 62 65 61 52
60 45 66 83 71 63 58 61 71
a) Organice los datos como distribucin de frecuencias utilizando siete clases
y el 15 como lmite inferior de la primera clase. Qu intervalo de clases
eligi?
b) Dnde tienden a acumularse los datos?
c) Describa la distribucin.
d) Determine la distribucin de frecuencia relativa.
6) Los tiempos de vida (en ao) de 30baterias de la marca A y 30 de la marca B se
dan en las tablas siguientes.
Marca A
6.9
8.4

5.6
7.6

4.8
7.1

4.2
3.2

6.3
4.9

6.5
4.5

6.8

9.3

5.1

4.4

6.3

5.9

5.8

5.0

3.2

5.4

5.7

6.6

5.0

6.2

4.2

6.1

5.4

4.6

Marca B
4.7
4.9

6.2

6.4

5.8

5.4

5.4

4.3

5.3

5.8

6.9

5.9

5.5

5.7

6.4

4.9

6.5

5.5

6.2

6.9

5.8

4.9

6.6

5.5

6.5

5.3

5.4

4.9

4.7

6.7

a) Elabore un histograma de frecuencia para cada una de las marcas de


batera.
b) Compare los histogramas del inciso a) y descrbelo brevemente.
c) Si tuviera que comprar una batera Cual marca elegira? Argumenta la
respuesta primero mediante las medidas y las desviaciones medias, y luego
con las medidas y las desviaciones estndar.

Pgina 23

I Unidad: Estadstica Descriptiva

7) Los siguientes datos provienen de un artculo en el Journal of American


Medical Association que analizo si la temperatura del cuerpo humano era
realmente 98.60 F.

Pgina 24

a)Identifica las variables y qu tipo de variable son


b) Elabore una tabla de distribucin de frecuencia para la temperatura corporal y el
pulso en hombre y mujeres.
c) Realice las grficas que corresponda a cada variable.
d) Calcule las medidas de tendencia central (Media, Moda, Mediana).

8) Explicacin de las Variables:


EDAD: en aos
SEXO: 0 (Mujeres) 1 (Varones)
OH Bebedor/a habitual: 1 (S) 0 (No)
TALLA en cm.
PESO En Kg.
GLU Glucemia
CT Colesterol Total (mg/dl)
HDL Fraccin de colesterol unido a lipoprotenas de alta densidad: High
Density Lipoproteins (mg/dl)
QUET: ndice de Quetelet (peso/talla). Tambin se llama ndice de masa
corporal. Es una buena medida de la obesidad. Sera idneo que se
encontrase entre 20 y 25. A partir de un Quetelet de 30 hablamos de obesidad,
y de obesidad mrbida a partir de 35.
e) ES MUY IMPORTANTE QUE INTERPRETES LOS RESULTADOS DE
CADA EJERCICIO.
Uno de los objetivos de la estadstica es resumir y presentar informacin
cuantitativa de forma clara, por lo que es especialmente relevante que, en la
resolucin de los ejercicios, se exprese de forma evidente el planteamiento del
problema, el mtodo seguido para su resolucin, los resultados y las conclusiones
que se obtengan.
a) Clasifica todas las variables de la tabla 1, segn sean cuantitativas,
cualitativas, discretas o continuas.
b) Haz una tabla con las frecuencias absolutas, relativas y acumuladas, a
partir de los datos de edad de la tabla 1.
c) Haz una tabla con las frecuencias absolutas, relativas y acumuladas, a
partir de los datos de glucemia de los varones de la tabla 1.
d) Representa grficamente la distribucin de la variable talla de la tabla 1.
e) Qu puedes decir sobre las medidas de tendencia central de la variable
CT en las mujeres de la tabla 1?

CASO EDAD SEXO OH

TALLA PESO GLU

CT

HDL

TG

QUET

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46

78
37
43
46
20
35
36
61
75
24
53
37
57
24
22
28
28
21
36
34
35
26
21
71
35
29
50
39
39
47
39
69
41
34
20
63
39
33
21
29
30
33
59
65
47
29

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1

142
156
158
158
155
173
159
155
150
165
169
160
152
174
159
161
164
164
160
151
158
167
157
154
173
169
167
174
167
164
180
168
166
164
174
173
168
169
175
167
168
165
158
177
164
167

67.00
97.50
60.00
81.00
55.50
77.50
60.50
80.00
43.50
66.20
66.80
65.20
85.50
64.00
54.90
57.80
75.50
64.00
55.00
57.00
66.00
47.70
57.40
61.60
97.50
81.00
67.50
88.00
82.00
70.00
81.00
71.40
82.00
74.00
51.50
87.00
84.00
59.00
85.00
81.60
59.20
70.00
77.00
63.50
69.50
78.00

106
90
98
101
80
89
110
117
85
84
96
100
137
73
78
86
85
87
88
105
93
82
72
96
138
101
103
102
97
240
87
109
125
112
100
142
92
91
108
90
93
111
135
125
109
105

188
212
202
275
358
207
219
196
196
182
218
193
260
196
154
239
283
193
217
163
242
179
232
233
211
229
221
214
273
264
238
235
255
198
123
177
262
266
286
195
266
246
247
318
338
371

35
37
40
43
43
56
57
58
59
60
64
69
69
70
70
75
80
39
42
52
54
61
77
34
36
40
41
42
45
49
67
77
30
35
36
37
37
40
41
42
45
48
49
50
51
52

209
183
110
164
160
84
59
153
85
110
65
43
164
62
41
112
191
85
82
47
66
75
131
362
620
66
207
78
239
140
59
43
1288
70
100
128
343
1076
330
95
114
81
144
185
387
146

33
40
24
32
23
26
24
33
19
24
23
25
37
21
22
22
28
24
21
25
26
17
23
26
33
28
24
29
29
26
25
25
30
28
17
29
30
21
28
29
21
26
31
20
26
28

Você também pode gostar