Você está na página 1de 138

UNIDAD I REPASO DE MATEMTICA APLICADA A LA ESTADSTICA

Introduccin a las tcnicas del anlisis grfico


Una de las formas ms fciles de visualizar las caractersticas esenciales de un fenmeno, estudiado
experimentalmente, consiste en presentar en grficas los resultados numricos correspondientes a las
mediciones efectuadas, porque, adems de su anlisis, se puede obtener informacin adicional por
extrapolacin, interpolacin, clculo de pendientes, etc. En este captulo se dan algunos elementos bsicos
para aprender y aplicar convenientemente las diversas tcnicas para graficar.
1. VARIABLES
Una variable es una cantidad a la cual puede asignrsele, durante un proceso, un nmero ilimitado de
valores.
Cuando una cantidad tiene un valor fijo, durante un proceso, se llama constante. Se distinguen dos tipos
de constantes: las absolutas y las arbitrarias; las primeras tienen el mismo valor en todos los procesos por
ejemplo, , e, g, en tanto que las segundas pueden tener un valor diferente en cada proceso particular. En
la estadstica se acostumbra llamar parmetros a estas ltimas.
2. FUNCIONES
Cuando dos variables x e y estn relacionadas de tal forma que a cada valor de x corresponde uno de y, se
dice que y es una funcin de x. Se emplea la notacin y=. f(x), para significar este hecho.
A la variable x, en la funcin y = f(x), se le llama independiente porque toma el valor que se le asigna
arbitrariamente: la otra variable se llama dependiente, ya que debe tomar los valores que satisfagan la
relacin particular.
3. SISTEMA COORDENADO RECTANGULAR
En la figura 1.1 se muestra un sistema coordenado rectangular, que consta de un par de lneas rectas
mutuamente perpendiculares. A la horizontal se le llama eje X o eje de las abscisas, y a la vertical, eje Y o
eje de las ordenadas; al punto donde se cruzan ambas se le da el nombre de origen, y a las cuatro regiones
en las cuales los ejes dividen al plano se les llama: primero, segundo, tercero y cuarto cuadrante,
respectivamente.

y
Segundo cuadrante

Primer cuadrante

o
Tercer cuadrante

Cuarto cuadrante

Figura 1.1. El sistema coordenado rectangular divide el plano en cuatro cuadrantes.


La localizacin de puntos sobre los ejes es fcil al subdividir estos en segmentos iguales, numerndolos
progresivamente desde el origen, y alejndose de el (vase fig. 1.2). La direccin positiva del eje X es
hacia la derecha, y la direccin positiva del eje Y, hacia arriba.

y
3
2
1

-4

-3 -2

-1

x
1

-1
-2
-3

Figura 1.2. Los segmentos en que se subdivide el eje X no necesariamente deben ser iguales a los del eje
Y.

Ntese que los segmentos del eje X no necesariamente son iguales a los del eje Y; por otro lado, el origen
tampoco es siempre el cero, ni las subdivisiones de magnitud unitaria (vase fig. 1.3).

0.90
0.88
0.86

41

37

45

Figura 1.3. Las subdivisiones de cada eje no siempre son unitarias.

Gracias a los sistemas de coordenadas, es posible localizar puntos en el plano, dando dos valores. En la
figura 1.4 se tiene un sistema coordenado rectangular, en el cual se identifican los puntos P (3,2), Q (-l, 4)
y R (2, - 2). En general, cualquier punto S se representa mediante la notacin S(x, y), siendo x el valor de
la abscisa e y de la ordenada; la pareja (x, y) recibe el nombre de coordenadas del punto. As pues las
coordenadas del punto Q son x = -1, y = 4; el primer nmero corresponde a la abscisa y el segundo a la
ordenada.

y
Q

4
3
2

-2

-1

-1
-2

-3

Figura 1.4. Los sistemas coordenados rectangulares permiten la localizacin de puntos en el plano.

Problemas de aplicacin grupo uno


1. Trcense, en un sistema coordenado rectangular, los puntos A (- 1, -1), B (-4,5), C (2, - 5) y D (4,3).
Indicar en qu cuadrante se encuentra cada uno.
2. Trcense, en un sistema coordenado rectangular, los puntos P (1,3), Q (2,6), R (3,9) y S (4, 12).
4. GRFICAS
La utilidad de los sistemas coordenados rectangulares no slo reside en que permite la localizacin de
puntos en el plano, sino tambin en que ayuda al trazado de grficas.
Una grfica es una curva constituida por puntos [x, y) que satisfacen una ecuacin de tipo y = f(x). Esto
significa que la lnea es el lugar geomtrico de los puntos que cumplen con la relacin establecida entre
las variables.
Supngase la funcin:
Y = 3x2 - 5
En ella la variable independiente es x, y como tal pueden drsele valores arbitrarios, pero y es la variable
dependiente cuyos valores resultan de sustituir los de x en la funcin. Entonces
Si x = 0, y = 3 (0) - 5 = -5; si x = 1, y = 3 (1) - 5 = -2,
Y as sucesivamente. Con las parejas de valores obtenidos, se forma una tabulacin, en donde se
presentan los valores de cada variable (vase tabla 1.1).
TABLA 1.1
x
0
1
2
3
4

Y
-5
-2
7
22
43

Por supuesto, sta no es la nica tabulacin posible, ya que x puede tomar valores negativos,
fraccionarios, muy grandes, etc.; pero siempre dar lugar aun valor para y a travs de la funcin. Como se
ve, la tabulacin est constituida por parejas ordenadas de valores, que representan puntos en el plano y,
por tanto, pueden trazarse en un sistema coordenado rectangular (vase fig. 1.5).

Figura 1.5. Representacin grfica de la funcin y = 3x2 5. Siendo iguales las escalas en ambos ejes.
Antes se dijo que la longitud de los segmentos en que se subdivide X no necesariamente es igual a la de
los segmentos en que se subdivide el eje Y. De acuerdo con esto, la misma grfica de la figura 1.5 puede
hacerse segn se muestra en la figura 1.6 en donde las unidades en el eje de las abscisas son mayores que
el eje de las ordenadas

Figura 1.6. La misma funcin de la figura 1.5 en un sistema con la escala horizontal ms grande que la
vertical.
Tambin es posible trazar una grfica sin conocer la funcin que representa. Esto sucede cuando en vez
de dicha funcin se tiene la tabulacin, lo cual es tpico de los resultados de experimentos; inclusive del
anlisis de la grfica se puede llegar, con la aplicacin de ciertas tcnicas que se vern posteriormente, al
establecimiento de la funcin satisfaciendo as el objetivo de muchas investigaciones empricas.
Problemas de aplicacin grupo dos
1. Refirindose al ejercicio 2 del grupo 1, hgase la grfica correspondiente
Manualmente o utilizando cualquier programa y realice el anlisis de las mismas.
Al realizar estos ejercicios se observa, en el primero, que la grfica es una lnea recta que, prolongndose
un poco por su extremo inferior, pasa por el origen, en tanto que en el segundo se trata de una curva de la
cual no puede asegurarse lo mismo, es decir, no es rigurosamente vlido continuarla desde el punto P
hacia abajo.

Al hecho de prolongar en una pequea cantidad una lnea recta o curvapor cuales quiera de sus
extremos se le llama extrapolacin, y es una tcnica que permite obtener coordenadas, en forma
aproximada, propias de la grfica, que no se tenan inicialmente. En cuanto a la magnitud de dicha
prolongacin, al decirse que sea pequea significa que no ir ms all de una distancia que comprometa la
regularidad o simetra de la curva. Como esto es muy vago, sobre todo tratndose de curvas, se deja a
criterio del experimentador la decisin de llevar, hasta donde l juzgue prudente, una extrapolacin. Slo
puede decirse que el hacerlo no ser un problema muy grave una vez que llegue a adquirir la habilidad
suficiente para apreciar el tipo de curva que est manejando y el intervalo en que refleja un
comportamiento familiar a travs

|curvas, representativas de funciones algebraicas elementales

(parbolas, hiprbolas, etc.)

Existe tambin la tcnica de interpolacin, consistente en obtener una de las coordenadas, por ejemplo x,
fijando la otra es decir, y a travs de la correspondencia que establece entre ambas la grfica
correspondiente (vase fig. 1.7).
La recta PQ se indica a travs de los puntos A (3.6) y B (6.9); por extrapolacin se tiene P (0,3) y por
interpolacin, C (5,8), eligiendo inicialmente y = 8 y observando a partir de la grfica que, dada esa
ordenada, la abscisa x es 5.
5. PENDIENTE DE LA RECTA
Pendiente de la recta, que pasa por los puntos P (x 1,y1) y el punto Q (x 2,y2) se define como: m =

y 2 y1 y

x 2 x 1 x

.
.
.

y
10
9

7
6

5
4
3
2

Figura 1.7. El punto P resulta de extrapolar la recta AB, y el punto C se obtiene por interpolacin

Problemas de aplicacin grupo tres.


1. Trcese la grfica cuya tabulacin aparece en la tabla siguiente y extraplese para x = 0, cunto vale
y?
X
4.2
7.9
15.5

Y
4.5
11.8
27.1

2. En la grfica del problema anterior obtngase, por interpolacin, la ordenada del punto cuya abscisa
es igual a 10
3. Obtngase la pendiente de la recta del problema 1, empleado las coordenadas del punto que resulta de
ese problema y las del punto del problema 2
6. PROPORCIONALIDAD
Muchas de los datos experimentales con las cuales se trabaja, se expresan mediante funciones del
siguiente tipo:
Y = axn
Siendo a y n constantes reales positivas o negativas. Esta expresin significa a que Y y x n son
proporcionales. En el caso particular en que n = 1, la proporcionalidad entre ambas variables es directa.
Siempre que la n sea negativa, la proporcionalidad ser inversa. A la constante a se le conoce con el
nombre de constante de proporcionalidad. Ejemplo el precio de un artculo es directamente proporcional
al valor de la materia prima.
Problemas de aplicacin grupo cuatro
1.

Ponga tres ejemplos de proporcionalidad lineal, cuadrtica e inversa en el campo en el que usted se
desempea e indique cuales son las variables, el valor de n y el valor de la constante de
proporcionalidad a.

2.

Hallar las ecuaciones que gobiernan a cada una de las curvas que se indica a continuacin y diga a
que relacin existe entre las variables.

4
1

6
5
y

7. SUMATORIA Y PROPIEDADES
Corresponde a una de las tantas operaciones que se realizan en la estadstica, ya que siempre se tendr que
sumar numerosos trminos, los cuales muchas veces deben ser expresados por smbolos o formulas, con
el fin de simplificar su presentacin.
El signo de la sumatoria es (sigma), letra griega que indica suma de, o sumatoria de. Por definicin se
tendr que:
n

i 1

x i x1 x 2 x 3 ........ x n

En trminos generales una operacin de sumatoria se expresa as:


n

i 1

i
; Se observa al sigma le acompaa i = 1, que representa el lmite inferior, donde i no

necesariamente debe ser igual a 1; n corresponde al limite superior y, finalmente, i es el elemento


genrico de la suma.

i 1

La expresin

se lee: sumatoria de i igual a uno, hasta cinco de i, lo que quiere decir que i toma

valores desde uno hasta cinco y el resultado final ser la suma de estos valores.

Aplicaciones
5

a).

i 1

= 1+2+3+4+5 = 15
n

S n es demasiado grande se puede aplicar la siguiente forma


50

i
i 1

Ejemplo.
n

b)

i 1

i 1

12 2 2 3 2 4 2 5 2 55

i 1

o aplicando la formula anterior tenemos

5(5 1)(10 1)
55
6
2

Ejemplo

13 2 3 3 3 4 3 5 3 225

i 1

5(5 1)
i

i 1
5

n( n 1)
2
=

50(51)
1275
2

n(n 1)
i

c) i 1
n

i 1

n( n 1)( 2n 1)
6

Ejemplo.

o aplicando la formula anterior


2

225

d) En el caso de que sea una constante


5

Ejemplo

10 10 10 10 10 10 50
i 1

Siendo n = 5 y k = 10, se podr realizar la operacin mediante el producto de nk = 5(10) = 50, y la


propiedad se expondr as: La sumatoria de una constante, es igual al producto del lmite superior n por la
n

constante k

k nk
i 1

e) La sumatoria de una constante por una variable

5i 5(1) 5(2) 5(3) 5(4) 5(5) 5 10 15 20 25 75


i 1

Aqu es ms fcil aplicar la propiedad que dice: la sumatoria de una constante por una variable es igual
al producto de la constante por la sumatoria de la variable.
n

i 1

i 1

i 1

i 1

ki k i 5i 5 i 51 2 3 4 5 51 2 3 4 5 75
f) Si la sumatoria cobija varios trminos, dado que estn dentro del parntesis, o que uno de ellos
multiplique al parntesis, se tendrn tantas sumatorias como trminos tenga el parntesis,
resolviendo cada uno de ellos en forma independiente, para luego obtener un solo total.
5

i 1

i 1

i 1

i 1

(i 2 3i 8) i 2 3 i 8 (12 2 2 3 2 4 2 5 2 ) 3(1 2 3 4 5) 40 140


Si se expresa en la siguiente forma:
5

3i 8

i 1

, la sumatoria solo cobija el primer trmino y el desarrollo de esta expresin nos quedara

as: 55 + 3i + 8.
5

Ahora, si una sumatoria se expresa en la siguiente forma:

(i

3i )4

i 1

, la sumatoria cobijara a la

totalidad de los elementos que se encuentran dentro del parntesis. Por consiguiente,
5

(i 2 3i)4
i 1

Ser igual a

i 1

i 1

i 1

(4i 2 12i) 4 i 2 12 i

= 4 (12 + 22 + 32 + 42 + 52 ) + 12 (1 + 2 + 3 + 4 + 5) = 4 (55) + 12 (15)


= 220 + 180 = 400
g) La sumatoria de n elementos se podr expresar de diferentes formas
8

i 4 5 6 7 8 30
i4

; Se observa que no siempre el lmite inferior de la sumatoria ser igual

a uno. En este caso se debe tener cuidado con el uso de la propiedad de la sumatoria de una constante.
Veamos:
8

10 10 10 10 10 10 10 60 6(10) 60
i 3

; Es decir, se tendr:

(8 3) 110 6(10) 60 , o sea: k (n i) 1


4

X
i 1

X1 X 2 X 3 X 4
. Hasta aqu sera la solucin, salvo que se indique que cada trmino

toma un determinado valor, por ejemplo:

X 1 2 ; X 2 5 ; X 3 8 ; X 4 10 ; en este caso, la

sumatoria se dar reemplazando cada trmino por su respectivo valor:

10

X
i 1

X 1 X 2 X 3 X 4 2 5 8 10 15

5X
i 1

5( X 1 X 2 X 3 X 4 ) 5(2 5 8 10) 5(15) 75

Cuando el smbolo de la sumatoria se expresa sin lmites explcitos (inferior y superior), se entiende que
la sumatoria abarca desde el lmite inferior i = 1 hasta n.
8. PRODUCTORIA
El producto se simboliza por la letra griega (pi mayscula), que se lee producto de, y tiene una
aplicacin parecida a la de la sumatoria, con la diferencia que en vez de ser sumados, los trminos se
multiplican entre s; por lo tanto, la productoria tendr un lmite inferior y superior, adems del elemento
genrico del producto.
n

i 1

Se lee productoria de i igual a uno hasta n de i

Veamos algunas operaciones:


5

i 1 2 3 4 5 120

i 1

. Para esta operacin se pueden utilizar calculadoras de bolsillo que

tengan el signo !, que se lee factorial y se expresa as:

5! 5 4 3 2 1 120 .
4

i 2 12 2 2 3 2 4 2 12 4 9 16 576

i 1

Como en el caso de la sumatoria, tambin en la productoria se cuenta con propiedades.


Algunas de ellas son:
a) La productoria de una constante es igual a una potencia, en la que la base es la constante y el
exponente el lmite superior de la productoria.
5

2 2 5 32 2 2 2 2 2

i 1

b) El producto de una constante por una variable es igual a la constante elevada al valor que toma
el lmite superior por la productoria de la variable i, desde el lmite inferior hasta el lmite superior.
5

i 1

i 1

2i 2 5 i 2 5 (1 2 3 4 5) 32(120) 3840

9. RAZN
Gran parte de esta compilacin se dedicar a describir el comportamiento de un hecho o de un conjunto
de observaciones, mediante la elaboracin de cuadros, grficas y la aplicacin de diferentes medidas.
Todo ello encaminado hacia caractersticas cuantitativas, olvidndonos un poco de las cualitativas, que en
algunos casos abarcan gran parte de la informacin que se investiga. Es ese el motivo por el cual se ha

11

considerado necesario explicar algunos conceptos, tales como: razn, proporcin, porcentajes y tasas, que
de alguna manera sern utilizados en las diferentes unidades.
La razn, la proporcin, el porcentaje y la tasa tienen en comn la relacin de dos cantidades que las
simbolizamos por A y B, una como numerador y otra como denominador.

A
La relacin resultante se expresa as: B , con los siguientes efectos:
a)

Si A no est contenida en B, corresponde a una razn.

b) Si A est contenida en B, corresponde a una proporcin.


c)

Si A est contenida en B y el cociente se multiplica por 100, corresponde a un porcentaje.

d) Si A representa un evento y B es el total a riesgo de sufrir el evento A, aparecido y medido en un


perodo dado, se le denomina tasa. En otras palabras, es la razn aquella que mide la probabilidad de
ocurrencia de un resultado en un universo siendo utilizado de preferencia en demografa y en
actividades financieras.
Recordemos que las caractersticas cualitativas se expresan mediante palabras, y para que sean
consideradas dentro del campo estadstico, requieren ser cuantificadas mediante el conteo, es decir, se
debe determinar cuntas veces se repite la caracterstica. Su agrupacin en una tabla o cuadro nos permite
describir o comparar el hecho, y lo podemos hacer, en parte, mediante el uso de estos conceptos,
denominados por algunos como medidas de intensidad, siendo siempre una medicin relativa.

10. RAZN
Es aquella que mide la relacin entre dos cantidades, permitiendo su comparacin, calculada
generalmente por cociente. Se consideran varios tipos de razones, dependiendo de las caractersticas que
se quieran comparar.
a)

Razn de coexistencia. Se refiere bien a la intensidad de un fenmeno en dos lugares diferentes, o


bien a los dos fenmenos en un mismo lugar.

b) Razn de composicin. Mide la relacin entre la intensidad de un fenmeno y la de otro fenmeno


ms amplio, del que el primero forma parte.
c)

Razn de derivacin. Con esta se compara la intensidad de un fenmeno con la de otro, que es
prerrequisito de su existencia.

d) Razn de repeticin. Mide la recurrencia de un fenmeno durante cierto tiempo.


La mayora de los textos de estadstica clasifican en dos los tipos de razones:
a) Razn de dos nmeros de la misma poblacin.
b) Razn de dos nmeros de distinta poblacin.

12

La razn se simboliza mediante R y se obtiene dividiendo una cantidad qu s puede simbolizar con Y i,
por otra cantidad que simbolizamos mediante Xi.

Y
X

Y
X

Supongamos que se tom una muestra de 10 establecimientos comerciales (n = 10), los que fueron
investigados. Una parte de los resultados est en la siguiente tabla:

NUMERO
DE ORDEN
1
2
3
4
5
6
7
8
9
10

VALOR MENSUAL VENTAS


( $)
2220,70
3366,00
1187,60
2234,80
4411,50
1154,50
1198,80
2222,90
2287,00
1154,80
21 438,60

NUMERO DE EMPLEADOS
Total

Hombres

Mujeres

12
15
9
9
12
7
8
6
6
10
94

8
10
7
3
9
3
2
5
4
7
58

4
5
2
6
3
4
6
1
2
3
36

Se puede observar que el nmero de observaciones es n = 10 y que puede calcularse el promedio mensual
de ventas por establecimiento, mediante la aplicacin de la media aritmtica X = 21 438,60/10 =
2143,86 dlares. Sin embargo, si se quiere determinar el promedio de ventas mensuales por empleado,
debe utilizarse la razn: R = 21438,60 94 = 228,07 dlares por empleado en el mes. Otro ejemplo de
razn utilizando la anterior informacin sera establecer la relacin hombres empleados/mujeres
empleadas: R = 58/36 =1,61. Significa que por cada mujer empleada hay 1,61 hombres, y que
multiplicadas ambas cifras por dos nos dara una forma ms clara de interpretarla, es decir, que por cada 2
mujeres hay aproximadamente tres hombres, luego la relacin ser de 2 a 3.
Cuando veamos las medidas de asimetra y de apuntamiento, encontraremos que su expresin matemtica
corresponde a una razn de momentos, en la cual el numerador y denominador son momentos o funciones
simples de momentos.
11. PROPORCIN
Es una forma especial de la razn, en la cual la cantidad dada en el numerador es la frecuencia de una
cierta caracterstica y la del denominador ser el nmero total de unidades consideradas, sea cual fuere el

13

tamao de la muestra. En una caracterstica cuantitativa, la proporcin corresponde a la frecuencia


relativa que se ver en la elaboracin de una tabla de frecuencias.
12. PORCENTAJES
Cuando la proporcin se multiplica por 100, el resultado obtenido se denomina porcentaje, generalmente
utilizado en la presentacin de los datos, ya sean cualitativos o cuantitativos
Supongamos que una empresa industrial tiene clasificado su personal por aos y sexo.
AOS
2 005
2 006

SEXO
Masculino
780
880

TOTAL
Femenino
320
620

1 100
1 500

La relacin hombre/mujer en esta empresa para el ao de 2 005 fue 780 / 320 = 2,44, es decir, que por
cada dos mujeres contratadas se contrataron 5 hombres en ese perodo; en cambio, para 2 006, esa
relacin baj, ya que por cada dos mujeres hay aproximadamente tres hombres. La razn se calcul as: R
= 880/620 = 1,42.
En cuanto a la aplicacin de la proporcin, encontramos que para el ao de 2 005 la proporcin de
hombres fue 0,7090, y la de mujeres es el complemento (0,2910), ya que la suma debe ser igual a uno.
Consideremos que a simboliza el nmero de elementos que presenta la caracterstica investigada, y b la
cantidad de elementos que no la presenta.
a + b = n = total de elementos investigados.
p = a/n = a / (a+b);

p = 780/1.100 = 0,7090

La proporcin de elementos que no presenta la caracterstica se simboliza mediante la letra q, y su valor


debe ser el complemento de p, ya que p + q = 1.
q = 320 1.100 = 0,2910
Con los resultados anteriores, pueden determinarse los porcentajes de hombres y mujeres que laboran en
la empresa, multiplicando por 100 las proporciones obtenidas:
(780 1.100) 100 = 70,90%; (320 1.100) 100 = 29,10%

13. TASAS
Se le considera como un tipo especial de razn, con la cual se desea hacer una descripcin de los cambios
sucedidos en un hecho, generalmente en un perodo dado.
Los componentes de una tasa son:

14

a)

El numerador corresponde al nmero de unidades que posee algn tipo particular de eventualidad que
ocurre durante un perodo determinado.

b) El denominador es el nmero de algn tipo de unidades relacionadas con la anterior.


c)

El cociente anterior se multiplica por cien o por mil.

Se utiliza en muchos campos, como en economa, administracin, especialmente en las reas financiera y
contable, en evaluacin de proyectos, en demografa, entre otros.
Vale la pena recordar algunas de las tasas que el estudiante ha escuchado o que posiblemente las utiliza.
Tasa de inters

Tasa de descuento

Tasa efectiva

Tasa social de rendimiento

Tasa nominal

Tasa de rendimiento para la inversin

Tasa interna de retorno

Tasa marginal de reinversin de las utilidades

Tasa de desempleo

Tasa de cambio normalizada

UNIDAD II: GENERALIDADES


Objetivos:

Conocer el origen de la palabra estadstica

Conocer y comprender el desarrollo histrico

Conocer y distinguir las escuelas que se han formado alrededor de esta ciencia

15

Entender y manejar lo conceptos de estadstica descriptiva e inferencia

Conocer las instituciones que producen estadstica

Precisar la importancia y la aplicacin de la estadstica.

Estar en capacidad para determinar qu hechos son propios de la estadstica.

Identificar casos de mal uso de la estadstica.

ETIMOLOGA
No se ha logrado un acuerdo sobre el origen etimolgico de la palabra Estadstica. Para algunos autores,
se deriva del latn status que significa estado, en el sentido poltico. Si se tiene en cuenta que en un
principio los gobiernos la utilizaban para la recoleccin de datos, tambin significa posicin o situacin
de personas o cosas. Para otros, se deriva del vocablo griego statera que significa balanza, dado en parte
a la funcin que cumple en la medicin o peso de los hechos que son objeto de estudio; otros, sostienen
que proviene del alemn staat que tambin significa estado, considerado como una organizacin poltica.

Por lo anterior, se observa que no hay claridad sobre el origen de la palabra Estadstica; sin embargo,
puede afirmarse que la etimologa latina es la ms aceptada, por ser la que ms explica la finalidad de esta
disciplina.
DESARROLLO HISTRICO
Desde la antigedad se encuentran estadsticas rudimentarias relacionadas con registros, censos, ya sea en
el campo econmico, social o educacional. Es as como se tienen informes de su aplicacin e importancia
en tiempos anteriores a la era Cristiana. Se dice
que 2.000 aos antes de Cristo, en China, ya se haban hecho registros y recuentos de la poblacin,
cultivos, fortunas, etc. En otros pueblos, como Siria, Persia, Egipto, se conocan censos de poblaciones y
catastro de territorios. La Biblia tambin nos habla de recuentos estadsticos; lo mismo, Moiss habla de
un registro de los israelitas, de las personas dedicadas a las faenas agrcolas. El nacimiento de Cristo
coincide con la realizacin del empadronamiento o censo de los israelitas.
En pocas del Imperio Romano se tiene conocimiento de estadsticas en todos aquellos hechos en que los
gobernantes requeran informacin sobre las diferentes provincias en las que estaba dividido su Estado.
Dentro del mundo de habla hispana, se tienen informes del ao 727, en el cual los rabes levantaron
diversas estadsticas en la Pennsula Ibrica, as como tambin durante el reinado de los Reyes Catlicos
y de Felipe II, se realizaron censos.
En pocas posteriores al Imperio Romano se hizo ms frecuente y menos rudimentaria la realizacin de
investigaciones, con el fin de producir informaciones ms completas que sirvieran, a la vez, para efectuar
previsiones futuras.

16

En la Edad Media se encuentran estadsticas ms sistematizadas, a tal punto que en algunos lugares se dio
comienzo a organizaciones estatales.
Para algunos, el anlisis estadstico se inicia con el tendero ingls John Graunt (1620- 1674), quien
intenta analizar las causas de las defunciones en Londres, en la primera mitad del siglo XVII. Otros
mencionan a Herman Conring (1600-1681), quien se dedic a describir y a examinar aquellos hechos
sobresalientes del Estado.
En 1 749, aparece lo que se considera la primera obra en que la estadstica es tratada en forma sistemtica,
como ciencia, y es Godofredo de Achenwall o Anchersen (1719-1772) quien la introduce como asignatura
universitaria, con el nombre de Estadstica.
Sin necesidad de citar a "todos aquellos que de una u otra forma contribuyeron al desarrollo de la
estadstica, se debe resaltar a quienes ms aportaron deas bsicas para su fundamentacin, entre ellos
Laplace (1749-1827), quien aplic el clculo de probabilidades al anlisis estadstico; Karl Friedrich
Gauss (1777-1855), quien estableci la distribucin gaussiana de errores resultantes, con su forma de
campana y su simetra, denominada como Curva Normal de Errores. E! belga Adolph Quetelet (17961874) aplic mtodos modernos a conjuntos, y es reconocido como el padre moderno de la estadstica;,
W.S. Gosset (1876-1937), un estadstico de !a Cervecera Guiness, de Dublin, quien escribi con el
seudnimo de "Student" y contribuy con la teora de las muestras pequeas; Sir Ronald A. Fisher (18901962) contribuy a ampliar !a anterior teora y, adems de los diferentes e importantes aportes, se le
menciona con frecuencia por el hallazgo de la Distribucin F.; as mismo Karl Pearson (1857-1936), con
su peridico Biomtrica, influy enormemente en el desarrollo de la estadstica y contribuy con
numerosos mtodos, medidas o procedimientos, siendo el ms sobresaliente el de la Distribucin Chicuadrado; Florence Nightingale (1820-1910), defensora de los mtodos estadsticos, sostena que el
fracaso de muchos directores, empresarios y gobernantes se deba a la insuficiencia de conocimientos
estadsticos.
Adems de los anteriores vale la pena mencionar, como los que ms han influido en los modernos
procedimientos estadsticos, a: Jacobo y James Bernoulli, Poisson, Pierre de Fermat, Pierre Laplace,
Charles Darwin, Francisco Galton, Gregor Mendel, Karl Pearson, David Duncan, Blaise Pascal, Charles
Spearman, Karl Gauss y Frank Yates.
ESCUELAS
Podemos considerar tres grandes escuelas, importantes, que han influido en el desarrollo de la estadstica:
a) La Escuela Administrativa, localizada en Alemania, cre la primera ctedra y cursos de estadstica,
dndole importancia a la informacin requerida por el Estado. Se consideran como los principales
representantes de esta escuela a: Vito de Seckendorff (1626-1689); Hermann Conring, quien inici un
curso de estadstica en la Universidad de Helmstadt, preocupado por los casos ms notables del Estado; su
discpulo Godofredo de Achenwall quien le dio el nombre de estadstica y la separ de la sociologa.

17

b) La Escuela Probabilstica algunos la consideran originaria de Italia, otros de Francia, dada la atencin
prestada a los juegos de azar, que se efectuaban para la recreacin de la nobleza, con el consiguiente
desarrollo de la Teora de las Probabilidades.
Sus principales representantes son: Pascal (1623-1662), Fermat (1601-1665), Laplace (1749-1827),
Poisson (1781 -1840), los Bernoulli y Gauss.
c) La Escuela Demogrfica, creada en Inglaterra, se preocupa por problemas actuariales. Dentro de sta
sobresalen: Sir William Petty, Edmund Halley, Jhon Graunt, King y Devenaut, entre otros. A principios de
este siglo hay una gran preocupacin por su aplicacin en los campos de la agronoma y biometra, lo
cual leda a la estadstica mayor relevancia, colocando as los cimientos y siendo sus principales
exponentes: Galton, Karl Pearson, Gosset y Fisher.
Algunos consideran las siguientes escuelas como las menos importantes: la escandinava, la
norteamericana y la hind, que tambin han colaborado en la fundamentacin estadstica.
ESTADSTICA DESCRIPTIVA E INFERENCIAL
La palabra Estadstica se menciona y se utiliza a diario, sin que se tenga una definicin o significado
igual para personas de formacin e intereses distintos, encontrndonos con una gran variedad de
interpretaciones. Sin embargo, la relacionan con todos o algunos de los siguientes trminos: recoleccin,
clasificacin, tabulacin, descripcin e interpretacin de resultados, estimaciones, proyecciones y
adopcin de decisiones frente a la incertidumbre.
Se podra decir que la palabra estadstica est asociada a trminos o frases tales como: anlisis de datos;
realizacin de experimentos; procesos aleatorios; mtodos cuantitativos; prueba de hiptesis; diseos de
experimentos; decisiones prcticas. Por otra parte, en numerosas ocasiones nos encontramos con muchos
datos, y el problema que se nos presenta es: cmo se pueden organizar, resumir, presentar e
interpretarlos? La estadstica es una buena herramienta para resolver el interrogante. A pesar de la buena
impresin que a primera vista ofrece la estadstica, tambin presenta motivos de impopularidad,
especialmente cuando se hacen encuestas sobre simpatizantes por un candidato o por el gobernante del
momento; los indicadores econmicos entre ellos el ndice de precios al consumidor, utilizado para
indicar las variaciones en los precios de los artculos de primera necesidad y para calcular el porcentaje de
inflacin o prdida del poder de compra del dinero respecto a un perodo determinado.
Para la mayora de tratadistas, la estadstica es un mtodo de investigacin, no slo para la observacin de
un hecho, sino tambin para la formulacin de hiptesis, el diseo de experimentos, la comprobacin de
ciertas teoras, cuando no se puede hacer experimentalmente.
Otros la definen, a menudo, como un conjunto de mtodos para la toma de decisiones en condiciones de
incertidumbre.

18

Algunos la sintetizan, como e! profesor ROS, quien nos da una definicin que abarca a muchas otras, al
decir que la Estadstica "es la ciencia que estudia los hechos colectivos, mediante la observacin
numrica, el anlisis matemtico y la interpretacin lgica, investigando especialmente sus causas y leyes
empricas".
Podramos dar nuestra propia definicin, que sintetice gran parte de las definiciones existentes, diciendo
que la Estadstica es un conjunto de mtodos aplicados en la recoleccin, clasificacin, presentacin
e interpretacin de datos numricos, obtenidos de la observacin de hechos, que permiten, a la vez,
inferir hacia conclusiones lgicas. Vale la pena recalcar que la estadstica moderna es la teora de la
informacin que tiene como objetivo la inferencia.
Por lo anterior, observamos que este conjunto de mtodos cumple dos funciones, igualmente
importantes: la de describir e inferir, permitiendo su clasificacin en:
Estadstica descriptiva. Como su nombre lo indica, describe el comportamiento de un hecho, a travs de
la recoleccin, ordenamiento, clasificacin, presentacin mediante cuadros y grficas, anlisis e
interpretacin y utilizacin de medidas.
La estadstica descriptiva podra resumirse como un conjunto de instrumentos que colaboran en la
depuracin de los datos, en su presentacin clara y en su simplificacin para la interpretacin, anlisis y
publicacin. Se podra agregar que un cuadro claro, acompaado de una grfica que visualice, ms la
aplicacin de una o varias medidas bien empleadas, permite descubrir y describir la "verdad" que encierra
un conjunto de datos.
Algunos consideran que si slo se investigara la totalidad de las observaciones de una poblacin objetivo,
bastara con la aplicacin de la estadstica descriptiva, cuyo proceso sera, como ya se ha dicho
repetidamente, la recoleccin, presentacin y anlisis de la informacin obtenida. Sabemos, adems, que
en la mayora de los casos eso no es posible por varios motivos, entre otros: costo y tiempo, que obligan a
realizar investigaciones ms pequeas denominadas muestras, a travs de las cuales se estiman los valores
de esa poblacin, para los cuales el investigador requiere determinar la extensin, validez y confianza del
proceso, valindose para ello de la inferencia estadstica.
Estadstica inductiva o inferencia. Son aquellas tcnicas aplicadas en investigaciones parciales,
denominadas muestras, que permiten la obtencin de ciertos resultados mediante la aplicacin de
medidas, considerados como estimadores de los valores estadsticos de la poblacin, es decir, los
parmetros.

19

La estadstica inductiva parte de los datos depurados y condensados, que facilitan el anlisis, el
establecimiento de relaciones y correlaciones, la aplicacin de mediciones especiales que permiten inferir
y contrastar hiptesis en aquellos campos donde no existen verificaciones fsicas.
Estadstico es aquella persona que aplica mtodos estadsticos y maneja cifras, que representan
informacin de hechos, recogidos a travs de la observacin o experimentacin.
Estadsticas son todas aquellas informaciones que aparecen en publicaciones en forma de cifras, cuadros
o grficas, las cuales han sido ordenadas en forma sistemtica, para mostrar el comportamiento de un
hecho que ha sido objeto de estudio.
IMPORTANCIA
La importancia que hoy tiene la estadstica radica en sus grandes aplicaciones en las diferentes
actividades. En la vida cotidiana leemos, interpretamos o usamos datos, muchas veces sin tener
conocimiento de lo que es la estadstica, pero la persona con algunos principios estadsticos, sacar mejor
provecho de la informacin. Si se trata de un profesional, la importancia de estos instrumentos ser mejor,
ya que ser utilizada en su campo de accin.
La estadstica es considerada como una herramienta de vital importancia en la toma de decisiones, pues
nos suministra informacin para la valoracin de planes y programas; adems, su adecuada utilizacin
depender en especial del conocimiento, habilidad y experiencia de quien la emplea.
Vale la pena repetir lo dicho por Salomn Fabricanl, sobre su importancia: "todo el mundo parece
coincidir en que la estadstica puede ser til para comprender, evaluar y controlar el funcionamiento de la
sociedad". Por otra parte, H. G. Wells deca: "el pensamiento estadstico un da ser tan necesario para
una ciudadana el eficiente como el saber leer y escribir". Todo lo anterior queda corroborado si
observamos que la mayor parle de los acontecimientos que diariamente ocurren en la sociedad, en
cualquier campo, se encuentran estrechamente ligados a la concepcin de nmero y medida. Es tan
cierto esto que podramos afirmar, sin temor a equivocarnos, que la mayor parte de las actividades del
hombre o de las instituciones, por no decir que todas, no importa la rama que desarrollen, estn afectadas
en mayor o menor grado por decisiones basadas en antecedentes de tipo cuantitativo.
El profesional podr comprender la importancia que tiene la estadstica si observa desprevenidamente
algunos de estos puntos de reflexin:
a)

los mtodos estadsticos se utilizan a diario, tanto en el sector pblico como en el privado;

b) las noticias que frecuentemente se dan en los diferentes medios de comunicacin requieren la
interpretacin estadstica;

20

c)

algunas de las materias del plan de estudios necesitan de la aplicacin de estos conocimientos;

d) para saber su rendimiento acadmico a travs del promedio de calificaciones o la posicin en el


curso, se utiliza la estadstica.
CAMPOS DE APLICACIN
Es tan vasto el campo de aplicacin dado a la estadstica que sera larga su enumeracin, y que podramos
resumirlo diciendo que todas las ciencias, en una o en otra forma, la aplican. Sin embargo, podramos
decir que en las Actividades econmicas el empresario, el industrial o el hombre de negocios, en general,
la utiliza, ya sea para el anlisis financiero, en las ventas o en los procesos de la produccin; tambin en la
investigacin de mercados, para el lanzamiento de un producto, para averiguar su grado de aceptacin o
para la proyeccin de su produccin y de sus ventas; tambin cuando desea aceptar o rechazar un lote de
su produccin o de la materia prima comprada; en la elaboracin del presupuesto, o como parte integrante
en el desarrollo de polticas y decisiones de carcter administrativo.
El Estado la utiliza frecuentemente para trazar polticas econmicas y administrativas; en la elaboracin
de planes de desarrollo, ya sea para lodo el pas, para una regin o un sector en especial; en la elaboracin
del presupuesto de inversin y de funcionamiento; en la formulacin de polticas, ya sea en lo fiscal,
aduanero, carcelario, educativo, etc. Tambin es utilizada en las campaas electorales, para determinar el
grado de aceptacin o popularidad que presenta el candidato a una corporacin pblica.
En la Salud y medicina, el Estado, los fabricantes de drogas, las instituciones o profesionales del campo
de la salud, realizan investigaciones encaminadas al tratamiento de ciertas enfermedades, como por
ejemplo el Sida, o al mejoramiento de los productos existentes, buscando que sean ms efectivos, o para
determinar los posibles efectos secundarios que puedan tener; tambin en el desarrollo de programas
sanitarios, en la prevencin de enfermedades.
En el sector Agrcola, por ejemplo, observamos la aplicacin de la Teora Mendeliana de la herencia, en la
obtencin de nuevas variedades de mayor rendimiento o ms resistentes frente a plagas o enfermedades;
en la aplicacin de fertilizantes e insecticidas, etc. Se observa en este campo, as como en la biologa, la
utilizacin de mtodos estadsticos para la realizacin de investigaciones que permitan detectar las
reacciones, no slo de las plantas sino de los animales. Hoy da es preocupacin permanente el aumento y
mejoramiento de los recursos alimenticios, para atender a una poblacin creciente y, en gran parte, en
condiciones nutricionales nada satisfactorias, lo cual requiere del apoyo de los mtodos estadsticos.
En Fsica y qumica se emplea con frecuencia, siendo una de sus aplicaciones la contrastacin de
hiptesis con base en resultados obtenidos a travs de experimentos, aplicando la tcnica estadstica
conocida como Diseo Experimental.

21

La estadstica tiene un vasto campo de aplicacin, tanto en las empresas comerciales como en las
industriales. Si consideramos que la empresa es una organizacin dentro de la cual se realiza una serie de
operaciones, casi siempre con la meta de obtener beneficios del capital invertido, concluimos que requiere
una informacin organizada que sirva de control y que permita hacer planes futuristas.
Podramos decir que la estadstica, dentro de la empresa, cumple, entre otras, las siguientes funciones:
a)

permite obtener una visin general de la empresa y de algunos de sus aspectos en particular;

b) facilita descubrir las relaciones causa-efecto en las distintas manifestaciones econmicas;


c)

ayuda a analizar y a separar lo que es normal de lo que no lo es, es decir, permite ejercer control en
muchas de las actividades u operaciones de la empresa.

La estadstica aplicada en la empresa es importante para: la planeacin de operaciones, el control de


calidad del producto, la determinacin del mercado, en las actividades financieras, en el control y
elaboracin del presupuesto, en la realizacin de inventario, en la administracin de personal, etc.
As, podramos seguir mencionando una gama de actividades, profesiones o campos donde la aplicacin
de la estadstica es necesaria para: el economista, el contador, el auditor, el ingeniero en todas sus ramas,
el actuario, el socilogo, el gelogo, el mercadotecnista, el periodista, etc., tendrn que aplicar estas
tcnicas en su ejercicio profesional.
Hoy el uso del microcomputador y algunas calculadoras manuales, facilitan la utilizacin de paquetes
estadsticos, tales como: SAS, MICROSTAT, TSP, SPSS y otros ms, necesarios para el manejo de
abundantes datos numricos, permitiendo su agilizacin y la aplicacin de una variedad de medidas que
estos paquetes ofrecen, que facilitan el proceso de anlisis y la toma de decisiones.
Se podr decir que en todos los campos, la utilizacin de los mtodos estadsticos se encamina hacia:
a)

aquellos procesos que permitan recolectar, agrupar, concentrar o describir con mayor facilidad ese
cmulo de informacin, a travs de lo que algunos llaman "reduccin de datos";

b) el anlisis de los datos, mediante la observacin directa o el desarrollo de experimentos, con el fin de
realizar estimaciones o comprobacin de hiptesis;
c)

determinar o indicar los cambios que sufren los datos a travs del tiempo, o estimar su
comportamiento futuro.

22

HECHOS QUE ABARCA LA ESTADSTICA


Dentro de la mltiple utilidad que ofrece la estadstica, vale la pena recordar que todas aquellas
actividades que se realizan en procura de un mejoramiento econmico, en salud y educacin, elevando,
por consiguiente, las condiciones de vida, estn ligadas a los programas de desarrollo de un pas a travs
de sus instituciones, las cuales necesitan detectar y disear polticas basadas en informaciones recogidas,
tratadas y analizadas mediante la aplicacin de mtodos estadsticos. Sin embargo, muchas veces se
critica al gobierno de no contar con informacin estadstica confiable, sin saber que estos hechos de
ocurrencia diaria o peridica, requieren cumplir ciertas condiciones, para que formen parte de las
estadsticas. Ellas son:
a)

Deben manifestarse al exterior, es decir, no se refiere a observar su presentacin, como por ejemplo
el contrabando, pues para ello bastara visitar los Sanandresitos. La manifestacin, o su observacin,
debe hacerse mediante registros. Si en los registros se presentan deficiencias, ellas se reflejarn en las
estadsticas. Muchos usuarios critican las estadsticas del sector oficial as como las del sector
privado, encontrndolas poco confiables o deficientes, pero no se dan cuenta de que la falta de
conciencia o el desinters de algunas personas hace que muchas de las informaciones no se registren;
tal es el caso de los robos, violaciones domiciliarias, entre otras, donde la gente no acude a colocar el
denuncio correspondiente. As que los indicadores sobre estos hechos slo harn referencia a las
informaciones registradas, y slo sobre ellas se aplicarn los instrumentos de medicin. As se
podr decir que aquellos hechos que no son registrados, no sern abarcados por la estadstica.

b) Adems de ser registrados, requieren para su estudio que correspondan a hechos colectivos,
descartando los individuales; es decir, lo sucedido a una persona no ser analizado en forma
particular, debiendo formar parte de un grupo, masa o colectivo de datos para su estudio. El registro
de la produccin por parte de una empresa, slo tendr un inters particular, pero si el gobierno es
quien piensa intervenir el mercado, la informacin formar parte del sector que se analiza.
c)

Se podr agregar otra condicin como es la de su frecuente repeticin. Un hecho que se presente en
forma aislada, es decir, que ocurre una vez y difcilmente vuelve a ocurrir, no es observado por la
estadstica y queda slo como un registro histrico. Cuando decimos que el hecho debe repetirse, no
nos referimos a que ocurra a cada momento; es posible, en algunos casos, que transcurra cierto
tiempo parque se repita, tal como sucede con aquellos productos estacionales, o en l caso de la
matrcula que ocurre cada ao o cada semestre. Debido a su presentacin en forma peridica, se les
considera como hechos distantes en el tiempo.

d) Adems de su frecuente repeticin, deben ser a la vez de distinta frecuencia. Si la frecuencia es


constante, de este hecho no se ocupa la estadstica. Por ejemplo, las transacciones comerciales, el
volumen o valor de las ventas que se registran todos los das, los nacimientos, defunciones, etc., si
son de inters para la estadstica, pues la intensidad es diferente de un perodo a otro. Si por el
contrario el valor o la cantidad fuera igual a cada momento, bastara con registrarlo una vez. No se

23

requiere que el hecho se presente en el mismo lugar, puede estar ocurriendo en diferentes sitios; por
lo tanto, la estadstica abarca tambin aquellos hechos distantes en el espacio.
e)

Finalmente, se podr decir que aquellos hechos cuyas caractersticas cualitativas pueden
cuantificarse, son tenidos en cuenta por la estadstica. El amor a la patria o al trabajo no se pueden
medir, pero s el nmero de personas por cargos, ocupacin, sexo, profesin, el nmero de artculos
vendidos por departamento, marcas, modelos, sucursales, etc., son ejemplos de caractersticas
cualitativas que s abarca la estadstica.

CUESTIONARIO
1.

Qu se entiende por reduccin de datos?

24

2.

D tres ejemplos, relacionados con una empresa o con su trabajo respecto a:


a)

Finalidad de la estadstica.

b) Hechos de frecuente repeticin.


c)
3.

Hechos distantes en el tiempo.

Explique brevemente las razones que usted sostiene para que se ensee la estadstica en cursos de
formacin econmica, contable, administrativa y financiera.

4.

Describa las aplicaciones estadsticas en los siguientes campos:


a) Deportes

5.

d) Investigacin de mercados

b) Publicidad

e) Economa o finanzas

c) Plantel de enseanza

f) Poltica

Identifique y describa con ejemplos las condiciones bsicas que debe reunir un hecho para ser
estudiado por la estadstica.

6.

D tres ejemplos de hechos que no abarca la estadstica y justifique.

7.

Para ilustrar la importancia y aplicacin que tiene la estadstica d ejemplos, para cada una, de las
siguientes funciones que desarrolla una empresa:

a)

Administracin de propiedad raz

b)

Direccin de personal

c)

Direccin de produccin
8.

Diga en cules de los siguientes casos debe aplicarse la estadstica:


a)

La calificacin de Pedro Pica piedra en un curso de artesana.

b) El consumo de gasolina por los vehculos de servicio pblico de la ciudad, en un perodo.


c)

Unidades producidas por una fbrica en un mes.

d) Asistencia de pacientes a una clnica, segn enfermedad.

ALGUNOS CONCEPTOS BSICOS

25

Para el buen desarrollo y entendimiento de los diferentes temas que trataremos ms adelante, es necesario
hacer claridad sobre los conceptos que se utilizan en estadstica y tenerlos presentes a cada momento.
POBLACIN
En la forma ms simple, puede decirse que este trmino estadstico se refiere a un conjunto finito o
infinito de elementos. Es sinnimo de agregado y, cuando lo empleamos, no nos estamos refiriendo
nicamente a un conjunto de seres vivientes, a la poblacin de una regin o a una ciudad, como se podra
entender en principio.
El termino poblacin, tambin conocido como universo, se refiere a la totalidad o conjunto de medidas, o
al recuento de todos los elementos que presentan una caracterstica comn.
De acuerdo con el nmero de elementos que constituyen la poblacin, la clasificamos en finita o infinita.
En el primer caso, se tendr un nmero limitado de elementos o unidades; en el segundo, ser ilimitado.
Definir la cobertura, es decir, identificar y determinar el tamao de la poblacin que va a ser objeto de
estudio, es de gran importancia en una de las primeras etapas de la investigacin estadstica.
El conjunto de estudiantes de un plantel, podramos considerarlo como una poblacin finita; pero si nos
referimos a todos los estudiantes de un pas, no slo en el presente, sino en el pasado, tendramos una
poblacin infinita. En una empresa comercial seran numerosas las poblaciones de estudio que
podramos mencionar. Algunas de ellas podran ser: lotes de unidades producidas durante un
perodo; cuentas por cobrar o de difcil cobro; nmero de empleados que laboran, etc.
UNIDAD O ELEMENTO
Es el objeto, institucin, regin, persona, familia, animal, etc., que va a ser sometido a estudio, en cuanto
a aquellas caractersticas que ms nos interesan. Esta unidad debe estar claramente definida, entendida
por todos, sin equvocos; adems, debe permitir ser medida o contada, adecuada al tipo de estudio y,
finalmente, que nos permita hacer comparaciones.
CARACTERSTICA
Los elementos que conforman la poblacin objetivo deben poseer ciertos rasgos o cualidades
denominadas caractersticas y son las estudiadas en cada una de ellas; por lo tanto, todas las deben poseer,
es decir, debe ser comn su presentacin, para que guarden relacin con el objetivo de la investigacin.
En los ejemplos dados en la definicin de poblacin, mencionbamos los estudiantes de un plantel; stos
como conjunto, constituyen la poblacin objeto; el estudiante es el elemento y las caractersticas que se
van a estudiar podran ser: calificaciones, asistencia, edad, sexo, curso, nivel o grado, procedencia,
aficiones, etc. En el caso de la empresa comercial, las poblaciones seran el total de unidades o lotes
producidos en un perodo; las cuentas por cobrar, el nmero de trabajadores, etc. Los elementos
son: unidades, cuentas y empleados de la empresa, respectivamente, y las caractersticas que se van a

26

estudiar, entre otras, seran: calidad, peso, resistencia, dureza del artculo; valor de las cuentas, tiempo de
vencimiento, concepto de la deuda; horas trabajadas; accidentes de trabajo; asistencia, antigedad,
salarios devengados, cargos, estudios realizados, tiempo de experiencia, visitas al mdico, tiempo de
incapacidades, etc.
Observando las anteriores caractersticas notamos que se conforman dos grupos: el primero se expresa
mediante palabras, tales como: sexo (masculino, femenino); grado (primero, segundo,..., undcimo);
aficiones (canto, lectura, deportes, teatro,...); calidad (defectuosos, no defectuosos); estudios (economa,
administracin, .), entre otros. Consideradas como caractersticas cualitativas, su cuantificacin se
obtiene mediante el recuento: cuntos hombres y mujeres hay; cuantos alumnos hay en cada grado, etc.
Estas son conocidas tambin como atributos, y pueden admitir varias formas de presentacin,
denominndolas modalidad o categoras.
El segundo grupo est conformado por aquellas caractersticas que se expresan en forma numrica, tales
como: peso, valor, tiempo, nmero de accidentes o visitas al mdico. A las anteriores se les considera
como caractersticas cuantitativas, conocidas tambin como variables, las que, a su vez, tericamente
se clasifican en variables discretas y continuas. Las primeras son aquellas que admiten nicamente
valores enteros: el nmero de accidentes o visitas al mdico, son ejemplos. Las continuas admiten
fracciones, como por ejemplo, peso: 30 libras y 10 onzas; tiempo de experiencia dada en aos, meses y
das, etc. Las variables discretas se cuantifican mediante el recuento; en cambio en las variables
continuas se procede mediante la medicin.
INVESTIGACIN TOTAL
Denominada tambin censo o investigacin exhaustiva, se presenta cuando investigamos la totalidad de
los elementos que constituyen la poblacin objetivo.
Cuando nos referimos a un censo de poblacin, de viviendas, agropecuario o industrial, por ejemplo,
estamos indicando una enumeracin completa de unidades, ya sean personas, familias, viviendas,
establecimientos industriales o explotaciones agrcolas en un tiempo dado, con unas caractersticas
especficas.
La investigacin total, en muchos casos, es impracticable, como por ejemplo:
a)

cuando el nmero de observaciones es demasiado grande o infinito, siendo imposible investigar a la


totalidad de los elementos;

b) cuando se requiere demasiado tiempo en su observacin, presentndose el inconveniente de estar


desactualizados cuando se van a utilizar;
c)

cuando los costos son elevados, superando los recursos disponibles para su realizacin;

d) en casos tales como en el control de calidad, el elemento sometido a prueba puede destruirse,
impidiendo la investigacin de la totalidad; se podrn aadir algunas situaciones ms: cuando la

27

empresa no cuenta con personal suficiente para su realizacin; tambin, cuando existe dificultad en la
recoleccin de la informacin.
MUESTRA
Es la parte seleccionada de la poblacin, que contiene una caracterstica igual a la que no qued
seleccionada.
Podramos ampliarla, diciendo que corresponde a una parte de la poblacin o subconjunto de un conjunto
de elementos, que resulta de la aplicacin de algn proceso estadstico, generalmente seleccin
deliberada, con el objeto de investigar las caractersticas de los elementos de la poblacin o del conjunto
del cual proviene.
Utilizamos la investigacin por muestreo, cuando no es posible la investigacin total.
Este procedimiento es menos costoso, ms rpido, requiere menos personal y nos puede proporcionar
mayor precisin en los resultados.
Nos referimos a la observacin parcial o muestra cuando investigamos parte de los elementos de una
poblacin. Algunos la denominan como subpoblacin, sin ninguna diferenciacin; otros, por el contrario,
y con la cual no nos identificamos, la consideran como aquella parle seleccionada, cuyos elementos
presentan una caracterstica tan especial, que el resto de la poblacin no la tiene. Lo anterior no
corresponde a la definicin de muestra y ms bien concuerda con el concepto de estrato.
La muestra ser representativa de la poblacin si las probabilidades de seleccin de los elementos
son todas iguales, durante todo el proceso, y que denominaremos como muestra aleatoria.
En el caso de que algunos de los elementos de la poblacin tengan ms probabilidad de presentacin que
otros, la denominaremos como muestra no aleatoria. Este es el caso de la mayora de las encuestas de
opinin, donde los elementos se seleccionan en forma caprichosa o por conveniencia; por esta razn, sus
resultados no merecen confianza.
Por muestreo se entiende la utilizacin de cualquiera de los procedimientos establecidos para obtener una
muestra. No debe perderse el objetivo del muestreo, que es considerar el mayor nmero de elementos con
el menor costo posible.
MUESTREO ALEATORIO
Se tienen diferentes mtodos de muestreo al azar, cuya aplicacin depender de las condiciones en que se
presente la poblacin y de las caractersticas que se van a investigar en sus unidades. Haremos mencin
de algunos de ellos, en forma bastante sintetizada:
Muestreo aleatorio simple. Como su nombre lo indica, los elementos de la poblacin deben tener igual
probabilidad de ser seleccionados para formar parte de la muestra. En este mtodo debe elaborarse un

28

listado, completo, actualizado y correctamente identificado, de los elementos que forman parte de la
poblacin, y que van a ser seleccionados por algn mtodo al azar, como el sorteo, extrayendo de un
recipiente fichas o papeletas, cada una de ellas identificando a la unidad, procedimiento similar al del
bingo; adems, se podr utilizar la calculadora, oprimiendo primero la tecla INV y, luego, punto,
despreciando el 0, que aparece en pantalla; tambin se puede hacer mediante las Tablas de Nmeros
Aleatorios, construidas especficamente para esto.
Muestreo estratificado. Aplicado cuando la poblacin requiere ser dividida en subpoblaciones o estratos,
buscando que cada uno de ellos sea lo ms homogneo posible, y donde un elemento dado no pueda
pertenecer a ms de un estrato. Una vez establecidos los estratos, se elige en cada uno de ellos una
muestra al azar.
Muestreo sistemtico. Es muy aplicado en aquellos casos en los que la caracterstica investigada est
ordenada, ya sea alfabticamente, por valor o cantidad, o en forma cronolgica. El procedimiento de
aplicacin es bastante simple: se calcula un intervalo de seleccin, obtenido al dividir el tamao de la
poblacin por el nmero de elementos en la muestra. Al seleccionar al azar un nmero dentro de ese
intervalo, ste es el que se constituye en punto de iniciacin o primer elemento seleccionado, y luego se le
va sumando el valor del intervalo.

N
n = intervalo de seleccin

Muestreo por conglomerados. Se emplea a menudo para reducir el costo de muestrear una poblacin
dispersa en un rea geogrfica extensa. Tambin se utiliza cuando es imposible elaborar un marco con
elementos finales o de anlisis; por tanto, se toma la unidad, es decir aquella que contiene ms unidades o
elementos y que constituye el denominado conglomerado. En este caso seleccionamos al azar
conglomerado y tomamos de ellos los elementos de la muestra.
Muestreo por etapas. Cuando de un marco se extrae una muestra de conglomerados, para luego de esa
muestra extraer otra muestra y as sucesivamente hasta llegar a la unidad o al elemento de anlisis, se le
denomina muestreo por etapas. Algunos lo denominan muestreo por reas o geogrfico.
El muestreo aleatorio tiene grandes aplicaciones en el campo de la auditoria y la contabilidad, y los
ms conocidos son:
a) muestreo de estimacin de atributos;
b) muestreo de aceptacin y
c) muestreo de descubrimiento.
Vale la pena mencionar algunas pruebas que se realizan en auditoria.
Pruebas de cumplimiento, cuyo propsito es comprobar la efectividad de un sistema de control; para
ello debe reunir evidencia suficiente sobre la eficacia de un control interno, mas no sobre la transaccin
en particular.

29

Pruebas sustantivas, cuyo objetivo es obtener evidencia acerca de la validez y tratamiento contable
apropiado de las transacciones, para detectar los errores o irregularidades que pudo haberse cometido.
MUESTREO NO PROBABILSTICA
En este mtodo las unidades no se seleccionan al azar, sino en forma caprichosa, por conveniencia o con
alguna intencin; de ah se deduce que sus resultados no son confiables. Dentro de este mtodo se tiene,
entre otros, el muestreo voluntario, el muestreo de juicios y el muestreo por cuotas.
Muestreo voluntario. Es aquel en el cual las unidades o elementos seleccionados llenan un cupn que
aparece en alguna publicacin o realizan una llamada, para dar la informacin solicitada en forma
voluntaria.
Muestreo de juicios. Llamado tambin intencional, ya que las unidades se seleccionan a juicio del
investigador, ya sea por conveniencia o con alguna intencin. Algunos las denominan muestras dirigidas.
Muestreo por cuotas. A cada persona encargada de recolectar la informacin se le asigna cierto nmero
de unidades o elementos mustrales, en donde la seleccin de ellos depende de la decisin que tome el
entrevistador, aunque para ello se le dan ciertas indicaciones.
PARMETROS Y ESTIMADORES
En cuanto a las caractersticas de las unidades de la poblacin, frecuentemente nos interesa la aplicacin
de algunas de estas medidas:
La media o promedio, por ejemplo, de horas trabajadas, el ingreso medio de los empleados, el
rendimiento medio de algodn por hectrea.
El total de establecimientos comerciales en una ciudad, es de granos recolectados en una cosecha, el total
de faltas de asistencia de alumnos a clase durante un perodo.
La proporcin de nias que estudian bachillerato comercial; de establecimientos dedicados a la
distribucin de cierto artculo; la de bachilleres que prestan el servicio militar obligatorio.
La razn del gasto en alimentos y vivienda, la relacin o razn de hombres y mujeres, cuando decimos
que por cada hombre hay dos mujeres en el establecimiento escolar.
A estas y otras medidas aplicadas a las caractersticas de la poblacin se les denomina parmetros o
valores estadsticos de la poblacin y aplicadas a las caractersticas de las unidades en la muestra se
les llama estimadores; algunos las identifican como estadgrafos.
Pitman establece diferencia entre estimador y estimacin. Al primero lo considera como la norma de
procedimiento utilizada para estimar una constante perteneciente a una poblacin; y la segunda, para los
resultados o valores obtenidos.

30

El estimador se clasifica en puntual cuando hace referencia a un solo valor o punto calculado; y por
intervalos cuando corresponde a dos puntos dentro de los cuales se considera estar contenido el
parmetro, con cierto grado de confiabilidad establecido por el investigador.
Un intervalo de confianza nos indica los lmites de precisin en una inferencia. Recordemos que uno
de los objetivos de la estadstica es sacar conclusiones o generalizar acerca del parmetro, mediante el
clculo de estimadores, en una muestra extrada de una poblacin.
SERIES DE TIEMPO
Conocidas tambin con el nombre de Series Cronolgicas. En las actividades diarias hay cantidades de
investigaciones que se realizan una vez y no vuelven a repetirse; son investigaciones aisladas no
peridicas. En cambio, existen otras; que requieren que su observacin sea peridica, guardando un
orden cronolgico, es decir, que son registradas a travs del tiempo, a medida que se van produciendo.
Estas, series son de gran utilidad tanto parar el gobierno como para las empresas, permitiendo observar e
indicar los cambios o variaciones que se producen en el dato, durante un determinado perodo; por otra
parte, facilita predecir su comportamiento futuro, suponiendo que las condiciones observadas durante su
registro van a ser las mismas en el lapso estimado.
Son ejemplos: las ventas, produccin, matrcula, desercin, exportaciones, etc. El anlisis de cada una de
ellas permite tomar decisiones.
PROBABILIDAD
Es uno de esos trminos imposibles de ser definidos adecuadamente. Sin embargo, diremos que es la
creencia que tenemos de la ocurrencia de un suceso, para lo cual nos basamos en la experiencia. Puede
decirse que es un valor comprendido entre uno y cero, el cual resulta de dividir el nmero de xitos por el
total de casos posibles. Se define como probabilidad clsica o emprica.
La probabilidad apriori es aquella que podemos determinar sin necesidad de realizar el experimento. Tal
es el caso del lanzamiento de una moneda, evento en el cual consideramos la aparicin de cara como
xito, igual a 0,5.
NMEROS NDICES
Son cifras relativas expresadas en trminos porcentuales, que indican las variaciones en las cantidades,
valores o precios durante el perodo que se est investigando, respecto a otro que se considera base.
Los rasgos ms importantes de la construccin de un nmero ndice son: su cobertura, el perodo base, el
sistema de ponderacin y el mtodo de promediacin de las observaciones.

GLOSARIO
Atributo

Cobertura

31

Caractersticas

Muestreo de atributos

Caractersticas cualitativas

Muestreo de aceptacin

Caractersticas cuantitativas

Nmeros ndices

Censo

Observacin parcial

Elementos

Perodo base

Estimacin

Poblacin

Estimador

Poblacin objetivo

Estimacin puntual

Poblacin finita

Estimacin por intervalo

Poblacin infinita

Error

Promedio

Intervalo de confianza

Proporcin

Investigacin total

Probabilidad

Investigacin exhaustiva

Probabilidad apriori

Medicin

Razn

Media

Recuento

Muestra

Series de tiempo

Muestreo

Series cronolgicas

Muestreo aleatorio

Sesgo

Muestreo por cuotas

Subpoblacin

Muestreo voluntario

Unidad

Muestreo no aleatorio

Universo

Muestreo aleatorio simple

Variables

Muestreo aleatorio estratificado

Variables discretas

Muestreo sistemtico

Variables continuas

CUESTIONARIO
1.

En cada uno de los casos sealados, en la siguiente lista, indicar si es variable o atributo; al mismo
tiempo, establecer la medida ms indicada (media, total, proporcin).

32

a)

Biologa: peso de un ser vivo.

b) Agricultura: cultivo de legumbres.


c)

Economa: ventas efectuadas por una empresa.

d) Demografa: nmero de hijos de una familia.


e)
2.

Demografa: estado civil.

El directorio de una ciudad data de 4 aos atrs y tiene las direcciones a lo largo de cada calle, con
los nombres de las personas que viven en cada direccin. Cules son las deficiencias de este marco,
si se utiliza para tomar una encuesta por muestreo? Pueden ser corregidas tales deficiencias durante
los trabajos de terreno? Al usar el directorio, extraera usted una lista de direcciones o una lista de
personas?

3.

4.

Explique brevemente qu diferencias puede haber entre:


a) Estadstica y estadsticas.

c) Variable discreta y continua.

b) Parmetro y estimador.

d) Caracterstica cuantitativa y cualitativa.

Mencione algunos aspectos relacionados:


a)

Con las limitaciones que hay para la realizacin de un censo.

b) Con la finalidad o aplicacin de la Estadstica.


5.

Utilizando como poblacin los estudiantes de su plantel, identifique 10 caractersticas. Diga cules
son atributos y cules variables. En las variables distinga las discretas y las continuas.

6.

Seale con una (A) las series constituidas por datos cualitativos y con una (V) las que son
cuantitativas:

7.

a) Nacionalidad

d) Profesin

h) Gasto en alimentacin

b) Temperatura

f) Nmero de tornillos producidos i) Llamadas diarias

c) Estado civil

g) Filiacin poltica

Los directivos de una fbrica estudian un programa de vivienda para sus empleados y solicitan
informacin a un grupo de 30 de ellos de un total de 350 empleados, sobre el nmero de habitaciones
que requerir su vivienda, en el caso de salir favorecido en el programa. Es de aclarar que la
investigacin se hace nicamente a aquellos que tiene ms de cuatro aos de antigedad y en la
actualidad no tienen vivienda. Cul es la:
a) Poblacin?

8.
a)

b) Muestra?

d) Caracterstica?

e) Cmo clasifica la caracterstica

Diga cuales de los siguientes casos corresponden al muestreo aleatorio:


Si de las jaulas de un criadero de gallinas se toma una muestra de 25 animales, seleccionando
aquellos que alcanza la mano.

33

b)

Si se toman las hojas de registro de matrcula de los alumnos de un instituto y se selecciona una
muestra de 20 hojas a intervalos regulares.

c)

Si de una muestra de frutas que se encuentran en un recipiente bastante grande, se toma como
muestra la porcin correspondiente a los 10 centmetros de la parte superior de la vasija.

d)

Si para conocer el sentimiento popular sobre una medida de orden pblico, se, entrevistan a 30
personas que pasan por; un sitio importante de la ciudad.

FUENTES DE INFORMACIN
Las fuentes de informacin se clasifican en internas y externas.
Las fuentes internas: all los datos se producen y se registran internamente dentro de la empresa, donde se
puede obtener informacin sobre ventas, produccin, cuentas por cobrar, consumo de materia prima,
horas trabajadas, etc.
Quiz por desconocimiento, o ignorancia, muchos no le dan importancia a las fuentes de informacin
interna, y slo las consideran como operaciones corrientes que forman parte de la rutina de los
departamentos de contabilidad, ventas, produccin, recursos humanos, etc., desconociendo que la
verdadera investigacin comienza precisamente all para iniciar, de esta manera, la bsqueda de
informacin externa, por no encontrarse sta dentro de los archivos y documentos de la empresa.
Las fuentes externas: son aquellas que nos suministran informaciones o datos de lo que sucede fuera de la
empresa. Estas informaciones se obtienen de boletines, revistas, peridicos, publicaciones especializadas
o informes realizados por otras entidades o empresas.
Tambin las fuentes de informacin se clasifican en primarias y secundarias. Cuando una persona, entidad
o empresa realiza una investigacin, con las consiguientes etapas de recoleccin, procesamiento y
anlisis, esta informacin se constituye en fuente primaria; en cambio, para otra persona, entidad o
empresa diferente a quien la produce, se convierte en fuente secundaria.
Algunos denominan a las fuentes primarias mtodos de observacin directa, ya que la informacin la
recoge el interesado, mediante la aplicacin de un formulario o cuestionario. Gracias a ellas se observan o
se registran los datos directamente de la fuente de informacin, o sea, de la unidad que es objeto de
estudio.
CLASES DE INVESTIGACIN
La investigacin se podr clasificar en dos clases: descriptiva y experimental.
Investigacin descriptiva. Se realiza sobre hechos reales con e] fin de explicar, de modo sistemtico,
sus caractersticas. Esta clase de investigacin comprende etapas como la recoleccin, descripcin,
anlisis e interpretacin de los datos; tambin puede referirse al anlisis de datos provenientes de fuentes
secundarias. Se puede decir que, generalmente, se utilizan el mtodo de casos y el estadstico.

34

En el Departamento de Mercados de una empresa, la investigacin descriptiva podra estar encaminada,


por ejemplo, a describir las caractersticas del mercado de un producto o de la empresa en general; la
aplicacin de algunas medidas para determinar la proporcin de personas que prefieren esa marca, es
decir, conocer la reaccin de los consumidores frente al producto, o el comportamiento futuro de las
ventas, etc.
Investigacin experimental. Corresponde a una observacin dirigida en condiciones rigurosamente
controladas, determinando las relaciones de causa y efecto. Debe quedar claro que el experimento es una
situacin provocada, siendo esencial el empleo de un diseo adecuado, evitando de esta manera
situaciones que invaliden la investigacin.
Se podr sintetizar diciendo que la investigacin experimental difiere de la investigacin descriptiva,
porque la primera tiene su base en realidades fsicas, y la segunda sobre abstracciones; adems, si las
condiciones no varan, no se puede actuar sobre ellas y no se pueden reproducir, como se reproduce una
experiencia en el laboratorio para comprobar su desarrollo.
Algunos las denominan modelos metodolgicos, y las clasifican en; a) Histrico; b) Experimental; c)
Descriptivo; d) Correlacional; e) Expost-facto sobre hechos cumplidos; f) Cuasi experimental; g) Terico;
h) Participativo; i) Evaluativo; j) Estudios de casos; y k) De investigacin bibliogrfica.
ETAPAS EN UNA INVESTIGACIN
En cuanto al modelo descriptivo, que tambin lo llamaremos estadstico, requiere para su ejecucin
observar algunas etapas, entre las cuales mencionaremos las ms importantes:
1.

Planteamiento o formulacin del problema.

2.

Formulacin de objetivos.

3.

Unidad de investigacin.

4.

Formulacin de hiptesis.

5.

Mtodo de investigacin (censo o diseo de la muestra).

6.

Recoleccin de datos.

7.

Clasificacin, tabulacin y descripcin de los resultados.

8.

Generalizacin o inferencia final.

9.

Presentacin del informe y publicacin.

1.

Planteamiento o formulacin del problema. El conocimiento del problema es lo que plantea la


necesidad de realizar una investigacin. Por ejemplo, un empresario siempre estar atento a la
situacin interna de la empresa, y constituye la tarea diaria de direccin. Evala los resultados de
gestin frente a los objetivos trazados, que se van visualizando a travs de informaciones recogidas
en los diferentes departamentos, sobre: ventas, participacin del mercado, costos, liquidez, imagen,

35

etc., que en algunos casos pueden mostrar anormalidad, sntomas sobre los cuales se deben disear
los correctivos por aplicar, con base en la formulacin de una serie de hiptesis.
La decisin de realizar una investigacin nace cuando se siente la necesidad de disear correctivos o
fijar polticas a corto o largo plazo, que mejoren la situacin de la empresa, y cuando no se dispone
de una informacin adecuada, lo cual requiere de la elaboracin de un plan de investigaciones, que
permita la recoleccin y anlisis de esos resultados.
Se debe tener muy en cuenta que las conclusiones estadsticas dependern en gran parte de la
informacin recogida y sta, a su vez, depender de la formulacin del problema.
2.

Formulacin de objetivos. Tendrn que estar claramente definidos, indicndose lo que se desea
hacer. Qu se va a investigar? Cmo se va a realizar? Cmo se pueden obtener los datos? Si
mediante una investigacin parcial o total. Cul sera el diseo de muestreo? Qu cobertura
tendra? Dnde se va a investigar? En qu lugar? Qu reas debern ser incluidas? Cundo es el
momento ms indicado para llevarlo a cabo? Cundo se necesitan? Para qu se requiere la
informacin? A quin va dirigida? Cul es la unidad de investigacin?

3.

La unidad de investigacin se tendr definida cuando los objetivos de la investigacin se han


determinado con precisin. Se podr saber si hay necesidad de otras unidades de seleccin para poder
llegar al elemento final, o sea, el objeto de estudio. Nos permite elaborar el marco o marcos, es decir,
conformar y actualizar el listado de unidades o elementos de la poblacin que sern seleccionados al
azar o en forma sistemtica. De esta manera, se establecer con exactitud la cobertura, el tiempo
necesario, la naturaleza cuantitativa y cualitativa del hecho. No olvidar que las unidades deben ser
accesibles al observador.
Lo anterior se podra resumir diciendo que la claridad del objetivo nos dar una visin perfecta de lo
que se va a hacer, es decir: a) el fin de la observacin; b) la eleccin y definicin de la unidad; c) la
lista de los elementos y de las caractersticas; d) el momento en que se va a realizar; e) el mtodo de
observacin; f) las condiciones en que se desarrollar; g) la eleccin de las medidas que se
emplearn.

4.

Formulacin de hiptesis. Las hiptesis son supuestos que se hacen en una investigacin para luego
ser comprobados. Las hiptesis estadsticas son aquellos supuestos hechos respecto a valores de la
poblacin o parmetros, y cuya comprobacin requiere la aplicacin de mtodos estadsticos.
Aquellas que no hacen referencia a un valor: media, proporcin, razn, etc., son simplemente
hiptesis. Son ejemplos de hiptesis descriptivas: que el rendimiento del curso en el presente perodo
lectivo es bueno; que en un Gobierno de coalicin, la inmoralidad de los funcionarios disminuir; que
si hay inversin social, la situacin de orden pblico mejorar, etc.
En cambio si dijramos que los salarios en el ao venidero aumentarn por encima del ndice de
precios al consumidor, o que los precios en diciembre subirn en una proporcin inferior a la del ao
pasado, todos ellos sern ejemplos de hiptesis estadsticas.

36

5.

Mtodo de investigacin. Se vio anteriormente, que la investigacin puede ser total (censo) o parcial
(muestra), dependiendo de ciertos factores que tambin se mencionaron: como costo, tamao de la
poblacin, tiempo.

Sabiendo, adems, que cada elemento tendr cierta cantidad de informacin, se

deber seleccionar la estrictamente necesaria, dependiendo tambin del nmero de unidades que se
va a investigar, su dispersin geogrfica y el grado de variabilidad que la caracterstica presenta.
El diseo de la encuesta por muestreo nos ayudar a controlar la cantidad de informacin y su
variacin, y en la decisin sobre cul es el mtodo ms indicado en esa investigacin. Se proceder
luego a establecer el mtodo de medicin o recoleccin de datos, siendo los ms usuales entre otros:
las entrevistas personales, por telfono, la observacin directa, cuestionarios enviados por correo,
Internet, etc. Cada uno de ellos presentar ventajas y desventajas. Cualquiera de estos mtodos que se
vaya a aplicar, se tendr muy en cuenta al elaborar preguntas que minimicen la falla de respuestas, o
contestaciones incorrectas. Al disear un cuestionario vale la pena considerar ciertos aspectos: a)
Incluir nicamente las preguntas que sean necesarias, puesto que un elevado nmero incrementar su
costo y tiempo; b) hacer preguntas claras, concisas, utilizando trminos a nivel del informante, para
que sean entendidas por todas aquellas personas involucradas en el estudio; c) no hacer preguntas que
de antemano estamos seguros no van a ser contestadas; d) iniciar con las preguntas generales, para
luego seguir con las especficas.
Las preguntas, hasta donde sea posible, deben ser cerradas, teniendo el informante dos posibilidades
de respuestas: s o no. Tambin podran corresponder a una respuesta numrica simple, por ejemplo,
la edad, para que una persona coloque en un espacio indicado, el nmero de aos o para que elija uno
de los intervalos preestablecidos. Se acostumbra, con mucha frecuencia, utilizar preguntas de
seleccin mltiple, donde la persona podr sealar ms de una, como en la pregunta referente al
deporte o deportes que practica, las preguntas poco recomendables por la dificultad que presentan en
su tabulacin son las abiertas, que permiten la libre expresin, de acuerdo con la opinin que se tenga
en el momento de la entrevista.
Antes de aplicar el cuestionario, es necesario someterlo a prueba realizando una pequea preencuesta, lo cual permitir hacer las correcciones que sean necesarias, mejorar su diseo tanto en las
preguntas como en las instrucciones. Se podra agregar que la encuesta preliminar o piloto permite,
entre otros aspectos, familiarizar al entrevistador con el formulario y con la unidad a la que se va
aplicar el instrumento; conocer la reaccin de los informantes; determinar el tiempo que dura la
entrevista. De esta manera se estimar el tiempo necesario en la recoleccin. Algo que es
indispensable en cualquier investigacin hoy da, es tener conocimiento sobre la poblacin objeto de
estudio, para poder estimar la varianza o la proporcin, indispensables para determinar el tamao
ptimo de la muestra.
6.

Viene luego la recoleccin de datos, distribuyendo o aplicando los instrumentos de medicin, de los
cuales ya hicimos referencia. Se recomienda la supervisin permanente del trabajo de los
encuestadores, quienes con anterioridad recibieron un riguroso entrenamiento sobre la forma de
entrevistar, el manejo del instrumento y el propsito de la encuesta. Por otra parte, es el momento de
volver a la fuente de informacin cuando se detecten inconsistencias, para as corregir fallas de algn

37

entrevistador, o para hacer planes para las no respuestas o unidades que no fueron detectadas o
localizadas.
7.

Recolectada, verificada y controlada la informacin, debe precederse a su organizacin y manejo.


La informacin, la cual podr procesarse en forma manual o mecnica, dependiendo de la cantidad
de unidades o de preguntas determinadas.

Tambin la disponibilidad de equipo o dinero nos

permitir agruparlas de acuerdo con los criterios preestablecidos, que estarn acordes con la forma de
presentacin, anlisis y descripcin del hecho, de manera que faciliten la obtencin de conclusiones o
recomendaciones.
8.

Luego de organizada la informacin, se proceder al anlisis de los datos, comenzando por la


aplicacin de aquellas medidas que permitan la obtencin de estimadores que faciliten la
comprobacin de las hiptesis establecidas.

9.

Finalmente, llegamos a la etapa de elaboracin del informe y su publicacin, ya sea para uso interno
de la empresa o para los particulares.
La redaccin y entrega del informe final, corresponde a la ltima etapa de la investigacin y a la
culminacin de todos los trabajos que la misma caus.
A pesar de que el informe constituye un todo indivisible, podemos considerar tres partes
perfectamente identificables: introduccin, conclusiones y apndices.
Introduccin. En esta parte del informe se utilizar un lenguaje sencillo y ameno, dejando aparte los
tecnicismos, de manera que sea entendible; adems, debe mantenerse una secuencia que guarde
armona con el proceso utilizado en la investigacin. Se har claridad sobre el planteamiento del
problema que nos condujo a la realizacin del estudio, la fijacin de objetivos, eleccin del mtodo
de investigacin aplicado, incluido el mtodo de seleccin utilizado; el tamao de la muestra
calculada, as como el diseo del cuestionario, las preguntas que dieron lugar, la indicacin de la
fecha en que se inici y termin la recoleccin de la informacin. En las pginas siguientes, en forma
breve y descriptiva, se har la exposicin de los puntos ms importantes, apoyados en cuadros,
grficas y otros resultados que sean consecuencia de la aplicacin de mtodos estadsticos.
Conclusiones. Constituye la parte fundamental del informe, ya que en ella aparecen relacionados los
resultados obtenidos, la confrontacin con lo esperado, la exposicin de cmo deben ser
interpretados y qu es lo que de ellos se deduce. El informe, adems, debe remitir al lector, cuando
sea necesario, a consultar los cuadros y grficas que hagan ms comprensible la explicacin y, sobre
todo, presentar recomendaciones.
Apndices. Integra toda la documentacin que se ha citado en la introduccin y en las conclusiones,
para que el lector del informe pueda consultar rpidamente y con facilidad cualquier informacin
contenida en el mismo.

38

PROCESO EN LA SELECCIN DE ELEMENTOS


Cuando nos referimos al Muestreo Aleatorio Simple (MAS), se mencionaron y explicaron, en forma
simple, algunos de los mtodos para la seleccin de unidades; sin embargo, parece recomendable
detenernos en ello y dar una explicacin un poco ms amplia, que permita su aplicacin inmediata a
travs de ejercicios desarrollados en clase.
Para la utilizacin de cualquiera de los mtodos de seleccin es necesario tener en cuenta los siguientes
aspectos:
Elaborar un listado completo y actualizado de los elementos o unidades que conforman la poblacin
objetivo. Por ejemplo, si se considera como poblacin los alumnos matriculados en un plantel; si se
va a investigar el total de drogueras existentes en una ciudad; a los trabajadores de una empresa; o el
total de manzanas de una zona o barrio, en todas estas poblaciones se deber elaborar un listado o
croquis que se constituye en el marco de referencia, y del cual se extraern los elementos que
constituirn la muestra.
En la elaboracin de un marco, se podr utilizar el libro o actas de matrcula que tenga el plantel; el
listado de drogueras inscritas en la Secretara de Salud o en la Cmara de Comercio; la nmina que
utiliz la empresa para el pago de los salarios. La oficina de Catastro nos puede suministrar el
croquis donde se localizan las zonas, barrios o vivienda que son objeto de estudio.
Las unidades o elementos estarn identificados en el marco, ya sea mediante el nombre, su direccin
o el cdigo que utiliza el elemento. Generalmente, se procede a la enumeracin de la poblacin. Si
sta est constituida por 82 elementos, sern numerados desde 01 hasta 82; si es 480 elementos, se
numerarn desde 001 hasta 480, utilizando tres dgitos para cada cifra; si la poblacin es 1350
elementos, se utilizarn cuatro dgitos, y as sucesivamente.
Confeccionado el marco e identificada cada unidad, se har la seleccin aplicando cualquiera de los
siguientes mtodos; sorteo, tablas de nmeros aleatorios, seleccin sistemtica o la utilizacin de
calculadoras.
Sorteo. Se procede en forma similar a la realizacin de un sorteo o al juego de lotera. Para ello,
preparamos fichas, papeletas, cartoncitos o balotas. Cada balota, por ejemplo, identificar un
elemento. Introducidas en un recipiente, se extrae de una en una, con reposicin o sin el la, teniendo
en cuenta revolverlas en cada extraccin.
Seleccin sistemtica. Denominada tambin seleccin a intervalos regulares, se emplea de
preferencia cuando las unidades estn ordenadas en cuanto al valor o al tiempo de ocurrencia. En las
oficinas se cuenta con gavetas que contienen archivos diseados en tarjetas, que permiten extraer
varias de ellas a intervalos regulares.
El procedimiento que se sigue es calculando un intervalo de seleccin, siendo: I = N/n; N es el tamao
de la poblacin, y n el tamao de la muestra. Supongamos que N=50 y n=10. El valor de I ser 50/10
igual a 5. Luego, seleccionamos un nmero al azar dentro de este intervalo, es decir, entre 1 y 5.

39

Supongamos que se obtuvo 3. Este ser el primer elemento seleccionado; el segundo ser 8; e! tercero
13, y as sucesivamente se le ir sumando a cada nmero resultante el valor del intervalo, hasta
completar el valor de n.
Uso de las tablas de nmeros aleatorios. Este mtodo es el ms utilizado, ya que garantiza que
todos los elementos tengan igual probabilidad de ser seleccionados, pues se eliminan aquellos
factores negativos, como son el factor humano y las condiciones fsicas del material utilizado en la
elaboracin de las fichas. En los diferentes textos de estadstica se podrn observar estas tablas,
presentadas en formas diferentes, con cifras de 2, 4, 6, 8 o 10 dgitos, en busca de hacer ms fcil su
observacin. Para ello, ver tabla. Para la lectura de esta tabla se harn algunas recomendaciones:
Seleccionamos una tabla al azar (para nosotros, va a ser la tabla indicada mas abajo).
Luego, sin mirar la tabla seleccionada, colocamos el dedo en un lugar determinado, el que ser
considerado como punto de partida.
Determinamos cuntos dgitos se tendrn que utilizar, de acuerdo con el tamao de la poblacin.
Se establece la direccin que se seguir en su lectura.
Slo sern seleccionados aquellos nmeros que formen parte del marco muestral.
La seleccin se har con reposicin o sin ella. En el primer caso el elemento podr ser
seleccionado ms de una vez; en el segundo, una vez tenido en cuenta, no podr ser nuevamente
seleccionado.
Hagamos un pequeo ejercicio. Supongamos que en una poblacin de 250 elementos se va a
seleccionar una muestra de 25. Asignamos nmeros a cada elemento desde 001 hasta 250. Luego,
seleccionamos una de las tablas al azar.
Luego, determinamos el punto de partida, por ejemplo, la fila 16 y columna 11. Tenemos el primer
nmero: 524, y si leemos de izquierda a derecha, el segundo ser 962; luego, 094, 008. Tambin se
hubiesen podido obtener los siguientes nmeros: 524, 249, 496, 620,209,.... Si hubiramos ledo por
columnas se tendran: 524, 601, 100, 557, siendo 421 el ltimo en la columna. La forma de continuar
depende de lo establecido antes de iniciar la seleccin, es decir, si se toma en la parte inferior, el
nmero ser 681; luego, el 044, y as sucesivamente hacia arriba y en esa misma columna; o por el
contrario, haber comenzado desde la parte superior con los nmeros 646, 676, 686 ...
03 70 22 67 59
08 45 79 46 89
37 80 05 75 64
90 63 56 69 37
22 69 38 02 88
05 79 69 67 64

98 10 64 6 8 08
74 73 67 6 0 15
08 51 68 6 8 27
19 74 48 6 3 31
89 71 43 0 1 87
36 14 82 65 26

48 91 53 03 82 64 24 06 31 03
94 64 97 27 25 62 23 94 40 54
15 85 82 52 08 52 96 26 92 88
09 81 37 66 56 99 08 59 19 48

79 06 89 48 41
70 37 61 44 07
71 75 45 32 27
52 36 84 40 66
41 79 42 99 29
40 51 63 42 48

15 72 10 87 24
27 89 81 54 26
36 35 26 58 88
02 66 03 41 87
11 08 47 32 19
25 48 34 12 04

97 44 82 24 89 88 48 66 54 10
56 32 97 78 90 38 86 41 75 19
93 11 03 23 52 08 23 57 85 43
29 69 21 64 95 52 08 15 24 45

96 04 20 68 00
57 17 63 27 74
67 74 48 90 94
65 29 12 36 64
45 29 59 69 90
33 26 52 26 52
41 27 09 11 61
42 90 85 36 68
53 90 42 22 22
59 25 22 76 96

40

43 83 99 02 76
31 98 09 80 62
81 35 42 62 84
97 95 56 39 75
37 63 35 93 23

12 16 45 52 66
75 26 64 57 26
37 02 59 78 16
65 47 61 86 33
17 30 14 51 51

35 70 93 09 52
46 41 47 90 97
17 96 05 71 39
14 88 55 33 69
17 28 21 74 67

15 40 34 35 62
29 46 10 51 42
08 05 34 05 92.
10 87 79 94 46
3211 57 19 27

65 42 27 20 59
73 28 98 89 91
22 43 89 66 89
17 61 72 27 01
38 70 73 82 92

39 22 96 00 48
61 29 84 34 51
38 84 18 10 29
64 29 48 04 08
64 02 32 99 63

52 4 9 62 09 4 0
60 1 9 77 82 16
10 0 9 66 06 78
55 7 2 25 25 77
62 4 2 89 32 20

08 30 27 54 70
64 45 02 27 04
37 09 60 50 21
54 26 27 24 39
81 14 08 40 45

46 06 52 12 80
65 55 90 95 04
22 72 01 52 70
36 67 06 40 00
82 15 37 49 38

36 12 38 68 05
20 39 29 96 28
29 65 05 37 16
99 35 70 69 58
96 51 19 08 27

13 83 39 51 30
83 30 90 09 35
46 63 53 97 63
54 43 40 02 41
27 18 65 62 01

31 4 9 94 83 66
41 1 2 87 93 66
18 8 6 37 56 20
55 7 0 52 96 87
97 4 5 79 51 37

02 50 95 18 98
85 96 20 65 34
35 62 66 11 37
02 82 61 21 88
74 47 20 11 48

98 84 90 58 81
13 13 05 41 01
20 91 89 97 51
50 65 98 42 09
77 93 73 86 50

00 40 91 12 46
91 48 95 59 45
64 78'06 95 65
03 61 20 83 01
46 61 95 01 24

45 42 16 13 20
35 92 97 02 34
60 55 35 57 24
43 17 21 09 60
07 85 74 58 28

34 5 1 08 71 52
93 3 2 95 81 13
52 9 5 84 90 64
58 8 6 12 31 11
38 7 4 68 32 61

39 17 71 39 84
92 05 40 70 95
38 39 72 70 17
66 61 43 96 00
87 14 71 83 47

17 27 72 49 42
11 66 61 24 08
28 42 85 96 67
53 97 00 15 20
60 11 96 70 08

81 62 32 87 22
77 32 73 66 79
41 11 83 17 78
37 96 73 56 63
67 04 34 46 08

33 00 29 08 87
97 14 00 42 23
68 58 32 80 82
39 87 38 16 06
37 73 01 84 87

42 5 9 40 24 97
72 0 3 19 02 41
40 4 9 71 83 37
82 9 2 62 32 75
42 8 8 30 93 75

44 99 13 56 87
11 23 36 98 32
93 49 99 69 72
67 64 50 49 39
01 18 34 73 30

65 02 47 97 89
29 91 42 03 58
38 14 26 88 95
49 55 53 92 97
58 44 28 18 01

23 51 45 37 83
62 23 74 45 06
48 69 35 40 63
04 48 60 53 90
00 38 26 38 57

15 62 38 72 92
77 81 15 14 67
18 87 05 09 96
08 58 53 63 66
16 07 79 57 61

03 7 6 09 3 0 75
55 2 4 22 2 0 55
45 1 4 72 4 1 46
13 0 7 04 4 8 71
42 1 9 68 1 5 12

77 80 04 24 54
36 93 67 69 37
12 67 46 72 02
39 07 46 96 40
60 21 59 12 07

67 60 i 3 79 26
72 22 46 46 32
59 06 10 49 12
20 86 72 11 81
04 99 84 22 39

21 60 03 48 14
56 15 75 25 12
73 28 23 52 48
74 11 15 23 17
75 16 69 13 84

GLOSARIO
Encuesta
Encuesta preliminar
Formulacin del problema
Fuentes internas
Fuentes externas
Fuentes primarias
Fuentes secundarias
Hiptesis
Investigacin bibliogrfica
Investigacin descriptiva
Investigacin experimental
Marco
Marco muestral
Mtodos estadsticos
Mtodos de medicin
Modelo experimental
Modelo histrico
Modelo correlacional
Modelo expost-facto

Modelo terico
Modelo participativo
Modelo evaluativo
Objetivos generales
Objetivos especficos
Observacin directa
Preguntas abiertas
Preguntas cerradas
Preguntas de seleccin mltiple
Preguntas de control
Proporcin
Recoleccin
Tabulacin

41

CUESTIONARIO
1.

Analice el uso de las preguntas cerradas. Comprelas con las preguntas abiertas. D tres ejemplos de
cada una. Formlese dos preguntas en forma cerrada y abierta.

2.

Los entrevistados comnmente reciben llamadas por telfono, de personas que realizan encuestas
durante la hora de la comida.
Quienes planean la encuesta, probablemente piensan que muchos de los entrevistados se encuentran
en casa en esos momentos. Analice los pros y contras de dicho procedimiento

3. Mencione como mnimo tres caractersticas de inters en el caso que tenga como unidad:
a) familia;
b) predio agrcola;
c) establecimiento industrial;
d) paciente de una clnica de previsin social;
e) producto terminado.
4.

Se requiere informacin para el lanzamiento de un nuevo producto y se cuenta, apenas, con los siguientes
datos:
a) Demanda de productos similares por las amas de casa, en la ciudad.
b) Produccin nacional de este artculo, informacin tomada de las publicaciones del ministerio
c) Costo de la produccin, en la empresa.
d) Anlisis de los precios de la materia prima, obtenido de la Asociacin de Productores.
Determinar si los datos son internos o externos; adems, si las fuentes son primarias o secundarias.

5.

Qu es un marco muestral?

6.

Analice la importancia do realizar una prueba preliminar, antes do iniciar la encuesta.

7.

Una poblacin consta de 1.200 unidades numeradas desde 0001 hasta 1.200. Es necesario seleccionar una
muestra aleatoria simple sin reemplazamiento de tamao 25. Cmo lo hara usted si le pidieran que lo
hiciera aplicando la seleccin sistemtica?

8.

En un peridico o una revista reciente, donde usted pueda tomar ejemplos de la aplicacin de la
estadstica, seleccione un artculo que d respuesta a los siguientes interrogantes:
a) Cul es la poblacin investigada?
b) La investigacin fue total o parcial?
c) Qu tipo de datos se utiliz?
d) Qu fuente de datos considera para usted este informe?
e) Qu estadstica se aplic, descriptiva o de inferencias?

9.

Se debe responder "verdadero" si el enunciado lo es. Si, por el contrario, no es vlido, hay que sustituir la
palabra destacada por otra, con la cual el enunciado adquiere validez.
a) Un parmetro es la medida de alguna caracterstica estudiada en las unidades de una muestra.
b) El nmero de peces de una laguna corresponde a una poblacin finita.
c) El nmero de pacientes atendidos en una clnica de la ciudad, segn enfermedad diagnosticada, es un
ejemplo de variable.

10. Diga si son ciertas o falsas las siguientes aseveraciones:


a) El muestreo sistemtico consiste en seleccionar uno por uno los elementos de la muestra en un orden
indeterminado.
b) Una muestra aleatoria es aquella en la cual ciertas unidades tienen mayor posibilidad que otras de ser
seleccionadas.
c) La muestra debe ser representativa del universo de procedencia.
d) El marco del muestreo lo constituye una lista o relacin actualizada de todos y cada uno de los
elementos.
e) La seleccin de informantes por parte de los entrevistadores, conlleva el riesgo de introducir
propensiones o vicios.

f)

La idea bsica de la estratificacin es la posibilidad de dividir una poblacin heterognea en


subpoblaciones, cada una de las cuales es homognea.

11. En un estudio de actitudes en un conjunto de empleados de, una empresa, se dispone de un listado de
empleados por departamentos, cargos y tiempo de servicio, para un total de 567 empleados. Sin embargo,
por uno u otro motivo el estudio se retarda 14 meses. Si continuara en las mismas condiciones anteriores
al retardo y con el mismo marco, qu problema se puede presentar?

UNIDAD III ELABORACIN DE CUADROS Y GRAFICAS


OBJETIVOS

Desarrollar habilidades para la elaboracin de cuadros e interpretacin de los mismos.


Estar en capacidad de seleccionar, elaborar e interpretar grficas en las investigaciones que realice.
GENERALIDADES
Una vez que se ha recogido toda la informacin, por cualquiera de los mtodos indicados: censo, muestra
o mediante el registro continuo, tal como sucede en las diferentes empresas, se debe proceder a la
organizacin de esos datos, mediante la clasificacin y tabulacin.
El primer procedimiento que debe seguirse consiste en fijar cul va a ser el criterio de clasificacin u
ordenacin que se va a utilizar, ya que su determinacin depende de la clase de datos recolectados.
Algunos de los criterios que pueden tenerse en cuenta son:
a)

Si hacemos una investigacin en una empresa sobre su personal, referente a cargos, profesin, sexo,
departamento en el que labora, se observa que todas esas caractersticas son cualitativas, que se
pueden clasificar cada una de ellas en un orden alfabtico.

b) Si al personal de esa empresa lo clasificamos por lugar de procedencia o de nacimiento, la


clasificacin ser geogrfica, donde no necesariamente requiere un orden alfabtico, pues en esos
casos, en algunos pases, se suele utilizar un orden de presentacin por regiones o zonas, por ejemplo,
de norte a sur, de oriente a occidente.
c)

Los accidentes de trnsito segn las causas que los originan, se pueden ordenar alfabtica y
geogrficamente. Pero si esta caracterstica es representada por das, meses o aos, se le denomina
clasificacin histrica o cronolgica.

FORMAS DE MEDICIN O DE CLASIFICACIN


Se ha visto que las caractersticas se dividen en cualitativas y cuantitativas. Las cualitativas se clasifican
utilizando escalas nominales.
Supongamos la realizacin de una investigacin a fumadores sobre las marcas ms preferidas, cuyos
resultados fueron: Lder, Belmo, Kool, Luky Strike, Marlboro y Lark. Observamos que la caracterstica
"marca de cigarrillos" queda totalmente clasificada por las seis categoras encontradas. Si con la anterior
informacin clasificamos a los fumadores por nivel socio-econmico dentro de tres categoras: alto,
medio y bajo, se estar utilizando una escala ordinal, puesto que clasificamos en orden jerrquico.

Escalas numricas son las que utilizamos para clasificar las caractersticas cuantitativas o variables.
Algunos las dividen en escalas a intervalos regulares, las que son establecidas cuando no existen patrones
de medicin de uso comn, por ejemplo, cuando se requiere medir la inteligencia, hbitos, actitudes,
formas de comportamiento. Las escalas proporcionales, al contrario de las anteriores, estn dadas por
unidades de uso corriente, como cuando clasificamos 50 establecimientos por volumen de ventas, nmero
de empleados, etc.
TABULACIN Y PRESENTACIN DE LOS DATOS
Despus de haber determinado el criterio de clasificacin que se va a seguir, es necesario iniciar el
proceso de tabulacin, que consiste en un recuento de las veces que se repite la caracterstica observada,
por ejemplo, cuntos de los fumadores prefieren cigarrillos de marca Lider?, cuntos de la marca
Belmo? y as sucesivamente.
La tabulacin puede realizarse en forma manual o mecnica. La decisin sobre cul de ellas se debe
elegir, depende de muchos factores, entre otros: el nmero de formularios, la cantidad de preguntas que
tenga el instrumento de recoleccin y la disponibilidad de equipo. De todas formas, se requiere la
elaboracin de un plan de tabulacin, que debe referirse al diseo de una serie de cuadros o tablas, que
deben atender al objetivo de la encuesta, permitiendo la presentacin de los datos en forma clara y su
anlisis, mediante la aplicacin de algunas medidas, o su representacin grfica.
Los cuadros que constituyen el plan de tabulacin, sea esta manual o mecnica, no deben ser
necesariamente iguales a los finales o de publicacin de resultados; sin embargo, es preferible que sean
iguales por economa de tiempo y dinero. Los cuadros, de acuerdo con el nmero de caractersticas que se
van a presentar, se clasifican en simples, de doble entrada y mltiple entrada. Los cuadros simples
siempre representan una sola variable o un atributo; los cuadros de doble entrada se elaboran para
presentar dos variables, dos atributos o una variable y un atribulo; finalmente, una tabla mltiple permite
la presentacin de ms de dos caractersticas. Cuando en un cuadro se combinan variables con atributos,
algunos lo denominan tabla mixta.
En la elaboracin de cuadros finales o de publicacin, es necesario observar algunas recomendaciones:
a)

Si el informe tiene ms de un cuadro, stos deben estar numerados en forma consecutiva.

b) Todo cuadro debe tener un ttulo, lo ms completo posible, de manera que al leerlo tengamos una
visin general sobre su contenido.
c)

La mayora de los tcnicos recomienda que el ttulo debe situarse en la parte superior del cuadro; sin
embargo, otros consideran que debe ir debajo.

d) Las lneas que encierran el cuadro deben ser ms gruesas que las internas. Algunos aconsejan, por
presentacin, cerrar el cuadro por encima y por debajo, es decir, suprimir las lneas laterales.
e)

Los ttulos en las columnas deben ir en maysculas y los subttulos en minsculas.

f)

Cualquier observacin que se haga, debe indicarse en el sitio correspondiente con una llamada, y al
final, debajo del cuadro, hacer la aclaracin. En ese mismo sitio se acostumbra colocar la fuente de la
cual se tom la informacin.

ELABORACIN DE LAS TABLAS DE FRECUENCIAS


Las tablas de frecuencias corresponden a una agrupacin o clasificacin de los datos, con el fin primordial
de determinar la frecuencia con que se repite el atributo o el valor que toma la variable. En este ltimo
caso nos referiremos como distribucin de frecuencias a aquellas tablas que son elaboradas atendiendo al
nmero de observaciones o datos relativamente grande, siendo, a la vez, la aplicacin primaria de la
estadstica.
ATRIBUTOS
Se ha dicho que estas caractersticas se expresan mediante palabras. El trmino se emplea habitualmente
para distinguirlo de la palabra "variable" o caracterstica cuantitativa. As, por ejemplo, el sexo, estado
civil, profesin, cargo, ocupacin, aficiones, estudios realizados y otros ms, se clasifican como atributos,
pero la edad, salario, tiempo de servicio, personas a cargo, retardos en el mes, horas laboradas, etc., son
ejemplos de variable. Con frecuencia los atributos son dicotmicos, de modo que cada miembro de una
poblacin se incluye en uno de los dos grupos conforme posea una caracterstica especfica o no la posea.
Los atributos tambin permiten clasificaciones mltiples, ya que una persona puede tener preferencia por
ms de una opcin, por ejemplo, sobre una marca de un determinado producto. La tabulacin en atributos
es muy sencilla, pues su cuantificacin se hace mediante el conteo del nmero de veces que se presenta o
se repite la caracterstica investigada. Supongamos una encuesta realizada a 20 trabajadores sobre el
hbito de fumar, con tos resultados siguientes:
HABITO DEL CIGARRILLO

NMERO DE FUMADORES

12

PORCENTAJE
%
60

NO
Total...

8
20

40
100

Hay casos en que el total no puede corresponder al tamao de la encuesta, ni al ciento por ciento de su
distribucin porcentual.
Consideremos una encuesta a 80 fumadores sobre las marcas que prefieren, con el siguiente resultado:

MARCA DE CIGARRILLO
Lider
Kool
Luky Strike
Marlboro
Piel roja
Royal

NMERO DE FUMADORES
12
8
6
10
30
16
28

PORCENTAJE
%
15.0
10.0
7.5
12.5
37.5
20.0
35.0

Puede observarse que en vez de darnos un total de 80 fumadores encuestados, el resultado es 110; ello se
debe a que existen fumadores que tienen preferencias por ms de una marca; algo similar ocurre con el

porcentaje que sumado da 137,5, diferente al 100%; en este caso el porcentaje de cada marca tiene como
base el 100%, es decir, se considera como total los 80 fumadores que corresponden al tamao de la
encuesta.
Un cuadro de doble entrada podra ser la clasificacin de 150 empleados, segn estado civil y sexo.
ESTADO CIVIL
Soltero
Casado
Separado
Viudo
Unin libre
Total

SEXO
Masculino Femenino
28
22
52
10
17
5
3
1
10
2
110
40

TOTAL
50
62
22
4
12
150

VARIABLES
Se ha dicho que stas se clasifican en discretas y continuas. Las primeras son todas aquellas que admiten
nicamente valores enteros; las segundas las que admiten valores fraccionarios. As que el procedimiento
que se debe seguir en la elaboracin de una tabla de frecuencias se har atendiendo a la anterior
clasificacin.
Variable discreta
Para la elaboracin de una tabla de frecuencias, tanto para la variable discreta como para la continua,
utilizamos una serie de smbolos, con los cuales tenemos que familiarizarnos, ya que continuamente los
emplearemos, pues son una forma de entendernos, es decir, de hablar un mismo lenguaje. Estos trminos
son:
xi

es una manera de simbolizar el valor de cada observacin, esto es, el valor que toma la variable.
Donde i puede tomar valores desde uno, dos, tres... hasta n, cuando corresponde a datos
originales o no agrupados. En datos agrupados, cuando se ha elaborado una tabla de
frecuencias, i toma valores desde uno hasta m. Puede simbolizar tambin marcas de clase, siendo
el promedio entre el lmite inferior y el superior en un intervalo.

es el nmero de valores que toma la variable en una tabla de frecuencias. En la variable continua
recibe el nombre de nmero de marcas de clase o nmero de intervalos.

corresponde al tamao de la muestra.

es el nmero de elementos que tiene una poblacin.

fi = ni

se denomina frecuencia absoluta y corresponde al nmero de veces que se repite cada valor de la
variable, dentro de los lmites determinados. Siempre son nmeros enteros y su suma debe ser
igual al total de las observaciones investigadas, es decir n.

fi/n=h

es la frecuencia relativa, entendida como los cuocientes obtenidos entre el valor de una
determinada frecuencia absoluta y el total de observaciones. Las frecuencias relativas sern
valores fraccionarios, es decir, comprendidos entre 0 y 1. Adems, la suma de todas estas
frecuencias debe ser igual a uno, o sea, el 100%.

Ni

frecuencia absoluta acumulada, la cual se determina si se desea saber el total de datos u


observaciones desde el origen hasta un valor de la variable dado. Ello se obtiene acumulando o
agregando frecuencias absolutas.

Hi

frecuencia relativa acumulada. Se obtiene en forma anloga a las frecuencias absolutas


acumuladas.

Supongamos un ejemplo de variable discreta para construir una tabla de frecuencias: una empresa tiene
220 empleados, de los cuales selecciona una muestra al azar de 50 de ellos, con el fin de investigar qu
porcentaje y con qu frecuencia hay retardos en la llegada del personal en las horas de la maana; para
ello, se recogen las tarjetas de control de la ltima quincena, cuyos resultados fueron:
x1 = 2

x2 = 1

x3 = 3

x4 = 4

x5 = 0

x6 = 2

x7 = 3

x8 = 1

x9 = 3

x10 = 5

x11 = 6

x12 = 3

x13 = 3

x14 = 4

x15 = 1

x16 = 2

x17 = 2

x18 = 3

x19 = 5

x20 = 3

x21 = 4

x22 = 0

x23 = 2

x24 = 1

x25 = 3

x26 = 4

x27 = 2

x28 = 3

x29 = 1

x30 = 0

x31 = 2

x32 = 5

x33 = 3

x34 = 1

x35 = 2

x36 = 4

x37 = 5

x38 = 1

x39 = 4

x40 = 3

x41 = 0

x42 = 2

x43 = 3

x44 = 6

x45 = 3

x46 = 5

x47 = 4

x48 = 3

x49 = 2

x50 = 4

Cada elemento queda representado por un smbolo; as, si se nos pide cules son los valores para x 11, x26 y
x42, diremos que son 6, 4 y 2, respectivamente.
Ahora determinamos los valores que toma la variable y observamos que son: 0 1 2 3 4 5 6; en total 7, el
cual lo simbolizamos con m = 7.
A continuacin tabulamos, es decir, determinamos cuntas veces se presenta cada valor que toma la
variable.

Vamos a presentar dos tablas, una con los valores de las frecuencias y la otra con los smbolos
respectivos.

xi
0
1
2
3
4
5
6

fi
3
7
10
15
8
5
2
50

fi/n
0,06
0,14
0,20
0,30
0,16
0,10
0,04
1,00

Ni
3
10
20
35
43
48
50
-

Hi
0,060
0,20
0,40
0,70
0,86
0,96
1,00
-

xi
fi
fi/n
Ni
Hi
x1
f1
f1/n
N1
H1
x2
f2
f2/n
N2
H2
x3
f3
f3/n
N3
H3
x4
f4
f4/n
N4
H4
x5
f5
f5/n
N5
H5
x6
f6
f6/n
N6
H6
x7
f7
f7/n
N7
H7

n
1,00
Es necesario tener en cuenta las siguientes propiedades de las frecuencias:
a)

Las frecuencias absolutas son nmeros enteros.

b) La suma de las frecuencias absolutas es igual al nmero de observaciones, en este caso n.


c)

Las frecuencias relativas son nmeros fraccionarios as: 0 < fi/n <1

d) La suma de las frecuencias relativas es igual a uno.


e)

El ltimo trmino de la .frecuencia absoluta acumulada es igual al total de observaciones, en este


caso, n.

f)

El ltimo trmino de la frecuencia relativa es igual a uno.

Variable continua
Corresponde a aquella variable que admite fracciones siendo el resultado de la aplicacin de algn
mtodo de medicin. A los smbolos anteriores dados para una variable discreta, es necesario agregarles
algunos ms, que son propios de esta variable.
xmx

es el valor mximo que toma la variable, cuando los datos se encuentran sin agrupar.

xmn

es el valor mnimo que toma dicha variable.

Rango = Recorrido es la diferencia entre el valor mximo y mnimo que toma la variable. R = xmx
xmn.
m

nmero de intervalos o marcas de clase. Es un valor que en algunos casos se toma por
conveniencia o porque la informacin se ha venido presentando en esa misma forma. Se aconseja
que el valor de m no debe ser menor que cinco ni mayor que 16. Es preferible utilizar la frmula
m = l + 3,3 log n.

es la amplitud del intervalo y no necesariamente debe ser constante. Por facilidad, se utilizar
una amplitud constante: c = rango m, y siempre que su resultado sea fraccionario, por
pequea que ella sea, se aproximar al nmero inmediatamente superior.

Consideremos un estudio realizado a 50 establecimientos comerciales, sobre el volumen de ventas (miles


de $) en el mes, con el siguiente resultado:
x1 = 42

x2 = 56

x3 = 39

x4 = 48

x5 = 54

x6 = 62

x7 = 45

x8 = 45

x9 = 51

x10 = 56

x11 = 37

x12 = 42

x13 = 56

x14 = 61

x15 = 56

x16 = 50

x17 = 42

x18 = 60

x19 = 61

x20 = 46

x21 = 51

x22 = 46

x23 = 54

x24 = 62

x25 = 50

x26 = 36

x27 = 56

x28 = 52

x29 = 63

x30 = 58

x31 = 62

x32 = 48

x33 = 55

x34 = 60

x35 = 54

x36 = 38

x37 = 61

x38 = 50

x39 = 58

x40 = 57

x41 = 65

x42 = 53

x43 = 56

x44 = 57

x45 = 53

x46 = 40

x47 = 65

x48 = 55

x49 = 50

x50 = 46

Pasos que deben seguirse para la confeccin de una tabla de frecuencias, cuando se tiene una variable
continua.

a)

Se ordena los datos en forma ascendente

b) Determinar el valor mximo y mnimo que toma la variable. x mx = 65, o sea la observacin x47 y xmn
= 36, que corresponde a la observacin X26.
c)

Se obtiene el Rango o Recorrido: R = xmx - xmn = 65 - 36 = 29.

d) Se determina el valor de m o nmero de intervalos necesarios para agrupar los datos. Se puede tomar
un valor arbitrario. Recordemos que no se deben elegir muchos ni pocos intervalos o marcas de clase,
generalmente debe utilizarse un nmero no mayor que 16 ni menor que 5. Tambin se puede observar
si la empresa o entidad que realiza el estudio lo utiliz en publicaciones o estudios anteriores, tablas
similares, con el fin de continuarlas presentando en la misma forma, con fines comparativos.
Puede utilizarse la frmula m = 1 +3,3 log n para calcular el nmero de intervalos o marcas de clase.
m = 1 + 3,3 log 50 = 1 + 3,3 (1,698970)
m = 1 + 5,60660 = 6,6066 7 se aproxim al nmero inmediatamente superior.
A pesar de que muchas personas calculan el valor de m =

n , o sea, m =

50 = 7,07 8, el

procedimiento no es muy recomendable.


e)

Determinar el valor de la amplitud, es decir, la diferencia que hay en cada uno de los intervalos de
clase y que simbolizamos por C. Por comodidad y presentacin, se le considera como un nmero
entero; en la mayora de los casos, como constante para cada uno de los intervalos de clase.
C = rango /m = 29/7 = 4,14 5. De todas formas, por pequea que sea la fraccin, siempre se
aproxima al nmero inmediatamente superior.
Si mantenemos constantes los valores de m = 7 y C = 5, notamos que el valor del rango cambia.
5 = rango + 7; el nuevo rango ser 35, es decir, se increment en 6 unidades, y siempre que esto
suceda debe repartirse, sumndole una parte al lmite superior y restando la otra al lmite inferior. En
este caso, como el incremento es 6, le sumamos 3 a 65 y obtenemos 68 como nuevo x mx y le
restamos tambin 3 a 36 que nos da 33 como x mn. El nuevo rango ser igual a 68 - 33 = 35. Lo ms
indicado es repartir el incremento, hasta donde sea posible, en partes iguales, pero no necesariamente.

f)

Una vez establecido el nuevo rango, se coloca como lmite inferior del primer intervalo al valor
mnimo del rango, en este caso 33, y se le va sumando el valor de la amplitud.

Puede observarse que al lmite inferior se le ha agregado 0,1, pero slo se hace con el fin de clasificar los
datos. Es decir, si un valor de x es igual a 48, quedar dentro del tercer intervalo, ya que el cuarto
corresponde para valores superiores a 48.

Confeccionemos la tabla de frecuencias, calculando, a la vez, las marcas de clase.


Yi - 1 Yi
33,1 38
38,1 43
43,1 48
48,1 53
53,1 58
58,1 63
63,1 68

fi
3
5
7
9
15
9
2

fi/n
0,06
0,10
0,14
0,18
0,30
0,18
0,04

Ni
3
8
15
24
39
48
50

Hi
0,06
0,16
0,30
0,48
0,78
0,96
1,00

Yi
35,5
40,5
45,5
50,5
55,5
60,5
65,5

50

1,00

Estos valores en smbolos, corresponden a los de la siguiente tabla:


Yi - 1 Yi
y0 y1
x1 x2

fi
f1
f2

fi/n
f1/n
f2/n

Ni
N1
N2

Hi
H1
H2

Yi
y1
y2

Las marcas de clase, que aparecen en la ltima columna de la tabla, se pueden calcular de varias maneras:
a)

Promediando los valores en cada intervalo. Para ello se suma el lmite inferior con el lmite superior
del intervalo y se divide por dos. (33 + 38) + 2 = 35,5; (38 + 43) + 2 = 40,5, y as sucesivamente.

b) Si la amplitud es constante, basta con obtener la primera marca de clase por el mtodo anterior y se le
va sumando el valor de la constante, que en este caso es igual a 5.
c)

Se divide la constante por 2 y el resultado se le suma al lmite inferior, o se le resta al lmite superior
del intervalo.

CUESTIONARIO
1.

Consultar todo lo referente a grficos estadsticos y sus aplicaciones

2.

Suponga que se realiza una investigacin sobre los precios de un artculo distribuido en la ciudad,
con los siguientes resultados:
$

250

265

250

290

238

260

248

270

232

275

262

262

240

270

272

236

263

258

248

254

280

263

246

236

288

254

270

263

265

240

270

280

260

250

246

260

284

290

272

268

230

300

284

240

254

258

296

278

280

278

Se pide:
a)

Elaborar una tabla de frecuencias, trabajando con una amplitud constante. Obtenga el nmero de
intervalos aplicando
m = 1 + 3,3 log n

b) Dibuje el histograma, el polgono y la ojiva.


c)

Aproximadamente qu porcentaje de establecimientos vende el producto a un precio inferior a


$270?

3.

La seccin de cobro de una empresa comercial registra los das de mora en el cumplimiento de sus
obligaciones, en un mes, a 70 deudores. Los resultados son:
0

20

10

10

10

10

20

10

10

10

16

10

12

25

12

16

12

16

25

a)

Considere los das como variable discreta y elabore una tabla de frecuencias.

b) Dibuje el diagrama de frecuencias absolutas.


c)

La empresa da tres das de gracia en los cuales no se cobra intereses por mora. Qu proporcin
de deudores tendrn que pagar intereses de mora?

4.

Explique la diferencia que puede haber entre un diagrama de barras y un histograma.

5.

Una empresa realiza una encuesta a sus 800 empleados, respecto al traslado de sus cesantas a los
fondos de reciente creacin. El objetivo era determinar cuntos empleados estaban dispuestos a
aceptar el traslado de sus cesantas. Los resultados son:
S

256

NO

474

INDECISOS

70

Convierta los datos en porcentajes y construya:


a) Un diagrama circular.
b) Un diagrama de barras.
c) Un diagrama do barras de componentes en porcentajes (% acumulado).
6.

Una muestra realizada a 250 familias de un barrio, sobre el consumo de chocolate en el desayuno de
acuerdo con las marcas de su preferencia, arroj los siguientes datos:
MARCAS
A

NMERO DE
FAMILIAS
116

B
C
D
E

44
172
80
58

Construya la grfica que mejor reprsenle a este conjunto de observaciones. Explique el por que de
su decisin.
7.

Cundo es aconsejable usar la distribucin de frecuencias para organizar los datos?

8.

En qu casos se debe graficar en papel semilogartmico? Cundo en papel logartmico?

9.

Segn la regla de Sturges de m = 1 + 3,3 1og n, cuntas clases o marcas de clases se obtienen:
a) Si la muestra es 80 observaciones?; b) si la muestra es 1.500?

10. Una programadora de T.V. realiza una encuesta telefnica sobre la aceptacin de uno de sus
programas, de acuerdo con la edad del televidente. Los resultados obtenidos se presentan a
continuacin:
GRUPOS DE EDADES
18 a 30
30 a 50

ACEPTACIN
GUSTO
NO GUSTO
NO VIERON

Menos de 18
156
74
10

112
86
24

Ms de 50

86
50
18

26
20
18

Elabore el grfico que mejor representa la informacin anterior.


11. Supongamos que 30 empleados, de acuerdo con el rendimiento en el trabajo durante una semana,
fueron clasificados as:
A = Excelente

C = Aceptable

B = Bueno

D = Regular

F = Deficiente

Los resultados fueron: C B C A F A D B D C A B F D C A B D C C B A A C B F A D D F


Se pide:
a) Elaborar un cuadro de tabulacin.
b) Presentar la informacin para una futura publicacin.
c) Acompaar al cuadro anterior con una grfica bien representativa.
12. Las personas que trabajan en una empresa han sido clasificadas en los ltimos aos por niveles de
estudio y sexo.

CARACTERSTICA
Con grado universitario

2 000

2 001

2 002

2 003

40

70

62

85

Mujeres
Hombres
Con bachillerato
Mujeres
Hombres
Total

12
28
120
36
84
160

16
54
130
38
92
200

14
48
118
35
83
180

18
67
165
42
123
250

Cmo elaborara un cuadro? Suponga que la informacin que debe presentar a la Gerencia es sobre la
proporcin de empleados vinculados a la empresa en los ltimos aos, por niveles de estudio y sexo.

13. Una encuesta de 30 trabajadores de una empresa sobre el nmero de accidentes de trabajo sufridos
durante su vida laboral, arroj los siguientes resultados:
3
0
a)

2
3

0
0

4
7

3
0

10 5
2

5
2

0
3

2
4

0
0

7
2

6
3

0
2

2
4

Construir una tabla de frecuencias.

b) Elaborar un diagrama de frecuencias absolutas.

Se ha dicho que stas se clasifican en discretas y continuas. Las primeras son todas aquellas que admiten
nicamente valores enteros; las segundas las que admiten valores fraccionarios. As que el procedimiento
que se debe seguir en la elaboracin de una tabla de frecuencias se har atendiendo a la anterior
clasificacin.
Variable discreta
Para la elaboracin de una tabla de frecuencias, tanto para la variable discreta como para la continua,
utilizamos una serie de smbolos, con los cuales tenemos que familiarizarnos, ya que continuamente los
emplearemos, pues son una forma de entendernos, es decir, de hablar un mismo lenguaje. Estos trminos
son:
xi

es una manera de simbolizar el valor de cada observacin, esto es, el valor que toma la variable.
Donde i puede tomar valores desde uno, dos, tres... hasta n, cuando corresponde a datos
originales o no agrupados. En datos agrupados, cuando se ha elaborado una tabla de
frecuencias, i toma valores desde uno hasta m. Puede simbolizar tambin marcas de clase, siendo
el promedio entre el lmite inferior y el superior en un intervalo.

es el nmero de valores que toma la variable en una tabla de frecuencias. En la variable continua
recibe el nombre de nmero de marcas de clase o nmero de intervalos.

corresponde al tamao de la muestra.

es el nmero de elementos que tiene una poblacin.

fi = ni

se denomina frecuencia absoluta y corresponde al nmero de veces que se repite cada valor de la
variable, dentro de los lmites determinados. Siempre son nmeros enteros y su suma debe ser
igual al total de las observaciones investigadas, es decir n.

fi/n=h

es la frecuencia relativa, entendida como los cuocientes obtenidos entre el valor de una
determinada frecuencia absoluta y el total de observaciones. Las frecuencias relativas sern
valores fraccionarios, es decir, comprendidos entre 0 y 1. Adems, la suma de todas estas
frecuencias debe ser igual a uno, o sea, el 100%.

Ni

frecuencia absoluta acumulada, la cual se determina si se desea saber el total de datos u


observaciones desde el origen hasta un valor de la variable dado. Ello se obtiene acumulando o
agregando frecuencias absolutas.

Hi

frecuencia relativa acumulada. Se obtiene en forma anloga a las frecuencias absolutas


acumuladas.

Supongamos un ejemplo de variable discreta para construir una tabla de frecuencias: una empresa tiene
220 empleados, de los cuales selecciona una muestra al azar de 50 de ellos, con el fin de investigar qu
porcentaje y con qu frecuencia hay retardos en la llegada del personal en las horas de la maana; para
ello, se recogen las tarjetas de control de la ltima quincena, cuyos resultados fueron:
x1 = 2

x2 = 1

x3 = 3

x12 = 3

x21 = 4

x30 = 0

x39 = 4

x9 = 3

x10 = 5

x11 = 6

x20 = 3

x29 = 1

x38 = 1

x47 = 4

x17 = 2

x18 = 3

x19 = 5

x28 = 3

x37 = 5

x46 = 5

x8 = 1

x25 = 3

x26 = 4

x27 = 2

x36 = 4

x45 = 3

x7 = 3

x16 = 2

x33 = 3

x34 = 1

x35 = 2

x44 = 6

x6 = 2

x15 = 1

x24 = 1

x41 = 0

x42 = 2

x43 = 3

x5 = 0

x14 = 4

x23 = 2

x32 = 5

x49 = 2

x50 = 4

x4 = 4

x13 = 3

x22 = 0

x31 = 2

x40 = 3

x48 = 3

Cada elemento queda representado por un smbolo; as, si se nos pide cules son los valores para x 11, x26 y
x42, diremos que son 6, 4 y 2, respectivamente.

Ahora determinamos los valores que toma la variable y observamos que son: 0 1 2 3 4 5 6; en total 7, el
cual lo simbolizamos con m = 7.
A continuacin tabulamos, es decir, determinamos cuntas veces se presenta cada valor que toma la
variable.
Vamos a presentar dos tablas, una con los valores de las frecuencias y la otra con los smbolos
respectivos.
xi
0
1
2
3
4
5
6

fi
3
7
10
15
8
5
2
50

fi/n
0,06
0,14
0,20
0,30
0,16
0,10
0,04
1,00

Ni
3
10
20
35
43
48
50
-

Hi
0,060
0,20
0,40
0,70
0,86
0,96
1,00
-

xi
fi
fi/n
Ni
Hi
x1
f1
f1/n
N1
H1
x2
f2
f2/n
N2
H2
x3
f3
f3/n
N3
H3
x4
f4
f4/n
N4
H4
x5
f5
f5/n
N5
H5
x6
f6
f6/n
N6
H6
x7
f7
f7/n
N7
H7

n
1,00
Es necesario tener en cuenta las siguientes propiedades de las frecuencias:
g) Las frecuencias absolutas son nmeros enteros.
h) La suma de las frecuencias absolutas es igual al nmero de observaciones, en este caso n.
i)

Las frecuencias relativas son nmeros fraccionarios as: 0 < fi/n <1

j)

La suma de las frecuencias relativas es igual a uno.

k) El ltimo trmino de la .frecuencia absoluta acumulada es igual al total de observaciones, en este


caso, n.
l)

El ltimo trmino de la frecuencia relativa es igual a uno.

Variable continua
Corresponde a aquella variable que admite fracciones siendo el resultado de la aplicacin de algn
mtodo de medicin. A los smbolos anteriores dados para una variable discreta, es necesario agregarles
algunos ms, que son propios de esta variable.
xmx

es el valor mximo que toma la variable, cuando los datos se encuentran sin agrupar.

xmn

es el valor mnimo que toma dicha variable.

Rango = Recorrido es la diferencia entre el valor mximo y mnimo que toma la variable. R = xmx
xmn.
m

nmero de intervalos o marcas de clase. Es un valor que en algunos casos se toma por
conveniencia o porque la informacin se ha venido presentando en esa misma forma. Se aconseja
que el valor de m no debe ser menor que cinco ni mayor que 16. Es preferible utilizar la frmula
m = l + 3,3 log n.

es la amplitud del intervalo y no necesariamente debe ser constante. Por facilidad, se utilizar
una amplitud constante: c = rango m, y siempre que su resultado sea fraccionario, por
pequea que ella sea, se aproximar al nmero inmediatamente superior.

Consideremos un estudio realizado a 50 establecimientos comerciales, sobre el volumen de ventas (miles


de $) en el mes, con el siguiente resultado:
x1 = 42

x39 = 58

x2 = 56

x40 = 57

x3 = 39
x4 = 48

x11 = 37

x5 = 54

x12 = 42

x6 = 62

x13 = 56

x7 = 45

x14 = 61

x21 = 51

x8 = 45

x15 = 56

x22 = 46

x9 = 51

x16 = 50

x23 = 54

x10 = 56

x17 = 42

x24 = 62

x31 = 62

x18 = 60

x25 = 50

x32 = 48

x19 = 61

x26 = 36

x33 = 55

x20 = 46

x27 = 56

x34 = 60

x41 = 65

x28 = 52

x35 = 54

x42 = 53

x29 = 63

x36 = 38

x43 = 56

x30 = 58

x37 = 61

x44 = 57

x38 = 50

x45 = 53

x46 = 40

x47 = 65

x48 = 55

x49 = 50

x50 = 46

Pasos que deben seguirse para la confeccin de una tabla de frecuencias, cuando se tiene una variable
continua.

g) Se ordena los datos en forma ascendente


h) Determinar el valor mximo y mnimo que toma la variable. x mx = 65, o sea la observacin x47 y xmn
= 36, que corresponde a la observacin X26.
i)

Se obtiene el Rango o Recorrido: R = xmx - xmn = 65 - 36 = 29.

j)

Se determina el valor de m o nmero de intervalos necesarios para agrupar los datos. Se puede tomar
un valor arbitrario. Recordemos que no se deben elegir muchos ni pocos intervalos o marcas de clase,
generalmente debe utilizarse un nmero no mayor que 16 ni menor que 5. Tambin se puede observar
si la empresa o entidad que realiza el estudio lo utiliz en publicaciones o estudios anteriores, tablas
similares, con el fin de continuarlas presentando en la misma forma, con fines comparativos.
Puede utilizarse la frmula m = 1 +3,3 log n para calcular el nmero de intervalos o marcas de clase.
m = 1 + 3,3 log 50 = 1 + 3,3 (1,698970)
m = 1 + 5,60660 = 6,6066 7 se aproxim al nmero inmediatamente superior.
A pesar de que muchas personas calculan el valor de m =

n , o sea, m =

50 = 7,07 8, el

procedimiento no es muy recomendable.


k) Determinar el valor de la amplitud, es decir, la diferencia que hay en cada uno de los intervalos de
clase y que simbolizamos por C. Por comodidad y presentacin, se le considera como un nmero
entero; en la mayora de los casos, como constante para cada uno de los intervalos de clase.
C = rango /m = 29/7 = 4,14 5. De todas formas, por pequea que sea la fraccin, siempre se
aproxima al nmero inmediatamente superior.
Si mantenemos constantes los valores de m = 7 y C = 5, notamos que el valor del rango cambia.
5 = rango + 7; el nuevo rango ser 35, es decir, se increment en 6 unidades, y siempre que esto
suceda debe repartirse, sumndole una parte al lmite superior y restando la otra al lmite inferior. En
este caso, como el incremento es 6, le sumamos 3 a 65 y obtenemos 68 como nuevo x mx y le
restamos tambin 3 a 36 que nos da 33 como x mn. El nuevo rango ser igual a 68 - 33 = 35. Lo ms
indicado es repartir el incremento, hasta donde sea posible, en partes iguales, pero no necesariamente.
l)

Una vez establecido el nuevo rango, se coloca como lmite inferior del primer intervalo al valor
mnimo del rango, en este caso 33, y se le va sumando el valor de la amplitud.

Puede observarse que al lmite inferior se le ha agregado 0,1, pero slo se hace con el fin de clasificar los
datos. Es decir, si un valor de x es igual a 48, quedar dentro del tercer intervalo, ya que el cuarto
corresponde para valores superiores a 48.
Confeccionemos la tabla de frecuencias, calculando, a la vez, las marcas de clase.

Yi - 1 Yi
33,1 38
38,1 43
43,1 48
48,1 53
53,1 58
58,1 63
63,1 68

fi
3
5
7
9
15
9
2

fi/n
0,06
0,10
0,14
0,18
0,30
0,18
0,04

Ni
3
8
15
24
39
48
50

Hi
0,06
0,16
0,30
0,48
0,78
0,96
1,00

Yi
35,5
40,5
45,5
50,5
55,5
60,5
65,5

50

1,00

Estos valores en smbolos, corresponden a los de la siguiente tabla:


Yi - 1 Yi
y0 y1
x1 x2

fi
f1
f2

fi/n
f1/n
f2/n

Ni
N1
N2

Hi
H1
H2

Yi
y1
y2

Las marcas de clase, que aparecen en la ltima columna de la tabla, se pueden calcular de varias maneras:
d) Promediando los valores en cada intervalo. Para ello se suma el lmite inferior con el lmite superior
del intervalo y se divide por dos. (33 + 38) + 2 = 35,5; (38 + 43) + 2 = 40,5, y as sucesivamente.
e)

Si la amplitud es constante, basta con obtener la primera marca de clase por el mtodo anterior y se le
va sumando el valor de la constante, que en este caso es igual a 5.

f)

Se divide la constante por 2 y el resultado se le suma al lmite inferior, o se le resta al lmite superior
del intervalo.

CUESTIONARIO
1. Consultar todo lo referente a grficos estadsticos y sus aplicaciones
2.

Suponga que se realiza una investigacin sobre los precios de un artculo distribuido en la ciudad,
con los siguientes resultados:
$

250

265

250

290

238

260

248

270

232

275

262

262

240

270

272

236

263

258

248

254

280

263

246

236

288

254

270

263

265

240

270

280

260

250

246

260

284

290

272

268

230

300

284

240

254

258

296

278

280

278

Se pide:
a)

Elaborar una tabla de frecuencias, trabajando con una amplitud constante. Obtenga el nmero de
intervalos aplicando
m = 1 + 3,3 log n

b) Dibuje el histograma, el polgono y la ojiva.


c)

Aproximadamente qu porcentaje de establecimientos vende el producto a un precio inferior a


$270?

3.

La seccin de cobro de una empresa comercial registra los das de mora en el cumplimiento de sus
obligaciones, en un mes, a 70 deudores. Los resultados son:
0

20

10

10

10

10

20

10

10

10

16

10

12

25

12

16

12

16

25

d) Considere los das como variable discreta y elabore una tabla de frecuencias.
e)

Dibuje el diagrama de frecuencias absolutas.

f)

La empresa da tres das de gracia en los cuales no se cobra intereses por mora. Qu proporcin
de deudores tendrn que pagar intereses de mora?

4.

Explique la diferencia que puede haber entre un diagrama de barras y un histograma.

5.

Una empresa realiza una encuesta a sus 800 empleados, respecto al traslado de sus cesantas a los
fondos de reciente creacin. El objetivo era determinar cuntos empleados estaban dispuestos a
aceptar el traslado de sus cesantas. Los resultados son:
S

256

NO

474

INDECISOS

70

Convierta los datos en porcentajes y construya:


a) Un diagrama circular.
b) Un diagrama de barras.
c) Un diagrama do barras de componentes en porcentajes (% acumulado).
6.

Una muestra realizada a 250 familias de un barrio, sobre el consumo de chocolate en el desayuno de
acuerdo con las marcas de su preferencia, arroj los siguientes datos:
MARCAS
A
B
C
D
E

NMERO DE
FAMILIAS
116
44
172
80
58

Construya la grfica que mejor reprsenle a este conjunto de observaciones. Explique el por que de
su decisin.
7.

Cundo es aconsejable usar la distribucin de frecuencias para organizar los datos?

8.

En qu casos se debe graficar en papel semilogartmico? Cundo en papel logartmico?

9.

Segn la regla de Sturges de m = 1 + 3,3 1og n, cuntas clases o marcas de clases se obtienen:
a) Si la muestra es 80 observaciones?; b) si la muestra es 1.500?

10. Una programadora de T.V. realiza una encuesta telefnica sobre la aceptacin de uno de sus
programas, de acuerdo con la edad del televidente. Los resultados obtenidos se presentan a
continuacin:
GRUPOS DE EDADES
ACEPTACIN
GUSTO
NO GUSTO
NO VIERON

Menos de 18
156
74
10

18 a 30

30 a 50

Ms de 50

112
86
24

86
50
18

26
20
18

Elabore el grfico que mejor representa la informacin anterior.


11. Supongamos que 30 empleados, de acuerdo con el rendimiento en el trabajo durante una semana,
fueron clasificados as:
A = Excelente

C = Aceptable

B = Bueno

D = Regular

F = Deficiente

Los resultados fueron: C B C A F A D B D C A B F D C A B D C C B A A C B F A D D F


Se pide:
a) Elaborar un cuadro de tabulacin.
b) Presentar la informacin para una futura publicacin.
c) Acompaar al cuadro anterior con una grfica bien representativa.
12. Las personas que trabajan en una empresa han sido clasificadas en los ltimos aos por niveles de
estudio y sexo.
CARACTERSTICA
Con grado universitario
Mujeres
Hombres
Con bachillerato
Mujeres
Hombres
Total

2 000

2 001

2 002

2 003

40
12
28
120
36
84
160

70
16
54
130
38
92
200

62
14
48
118
35
83
180

85
18
67
165
42
123
250

Cmo elaborara un cuadro? Suponga que la informacin que debe presentar a la Gerencia es sobre la
proporcin de empleados vinculados a la empresa en los ltimos aos, por niveles de estudio y sexo.

13. Una encuesta de 30 trabajadores de una empresa sobre el nmero de accidentes de trabajo sufridos
durante su vida laboral, arroj los siguientes resultados:
3
0
c)

2
3

0
0

4
7

3
0

10 5
2

5
2

0
3

2
4

0
0

7
2

6
3

0
2

2
4

Construir una tabla de frecuencias.

d) Elaborar un diagrama de frecuencias absolutas.

UNIDAD IV MEDIDAS DE TENDENCIA CENTRAL

OBJETIVOS
Identificar y aplicar en cada caso particular el promedio ms indicado.
Desarrollar habilidades para el clculo y utilizacin de los diferentes promedios.
Utilizar, interpretar y analizar los resultados obtenidos.
GENERALIDADES
Las medidas de posicin, generalmente denominadas promedios, son consideradas como medidas
destinadas a reducir el conjunto de datos de una caracterstica observada o investigada a un slo nmero
representativo. Se puede decir tambin que el resultado de las medidas solo pretende explicar mediante
un valor tpico, un conjunto de datos.
Algunos establecen diferencias entre estos promedios y los clasifican en medidas de Posicin y de
Tendencia Central. A los primeros los definen como un valor tpico, dentro de la variable, que representa
al conjunto de observaciones; a los segundos, como un valor central. De todas formas es un valor que
calculamos para describir una caracterstica que suele agrupar muchas clases de datos, y que se
diferencian en la forma en que se definen tpicamente, y en la cantidad y tipo de informacin que pierden
al resumir la informacin.

Por otra parte, el promedio es un concepto ms familiar que puede considerarse como indeterminado. Por
lo general, un valor promedio intenta representar o resumir las caractersticas relevantes de un conjunto
de valores, siendo los ms conocidos: media aritmtica, mediana y moda; y otros de menor importancia,
tales como: la media geomtrica, media armnica, media cbica, media cuadrtica, los cuartiles, deciles,
percentiles. Por lo general, son medidas de posicin o promedio, por consiguiente, la expresin
promedios no slo hace referencia a la media, sino; tambin a las medidas mencionadas.
Es necesario recordar que si estos promedios son calculados con valores de una poblacin, se les
denomina parmetros; si se aplican a los valores que toma la caracterstica de las unidades de una
muestra, sern llamados estimadores.
Vale la pena preguntarnos si es posible calcular un promedio que sea capaz de representar, lo mejor
posible, un conjunto de datos. La respuesta es afirmativa, conociendo las ventajas y desventajas que
presentan las diferentes medidas.
Algunos autores establecen diferencias en cuanto a la forma de medicin. Una de ellas es el promedio
objetivo, que se utiliza para remediar la imperfeccin de los elementos de medida de que se dispone en un
momento dado. Por ejemplo, la distancia entre un punto y otro con posibilidades de obtener resultados
diferentes, ya sea por dificultad o por imperfeccin del instrumento de medicin utilizado; pero si
promediamos esos resultados, se obtiene una cifra que puede estimarse como representativa, siendo
considerada como promedio objetivo. Otro es el promedio subjetivo, el cual es diferente del anterior y se
obtiene al medir varios elementos o unidades, calculando una sola cifra que indicara el promedio del
conjunto; por ejemplo, el promedio de venta diaria en un establecimiento comercial.
Como puede observarse, la finalidad de estas unidades es presentar aquellas medidas ms utilizadas e
indicar cmo son calculadas y en que casos debe aplicarse.

MEDIA ARITMTICA ( X )
Frecuentemente se omite la calificacin aritmtica, de modo que solo se menciona la palabra media. Es la
medida ms utilizada, la ms conocida, la ms fcil de calcular. Sus frmulas admiten tratamiento
algebraico. Por tal razn es considerada como la ms importante dentro de los promedios, a pesar de ser
demasiado sensible a cambios en la variable o cuando el extremo es demasiado grande. Se simboliza
indistintamente, empleando una rayita sobre la letra que indica la variable x o y , con minscula para
indicar el estimador y con mayscula para el parmetro. Otra forma de simbolizar la media es
utilizando la letra M (mayscula) colocando como subndice y entre parntesis la letra que identifica la
variable: M(x); M(y); M(z); tambin algunos utilizan la a (minscula). En poblaciones, como parmetro, es
empleada con mucha frecuencia la letra griega miu o mu ().

MEDIA ARITMTICA SIMPLE


Algunos la denominan como media no ponderada, y se obtiene dividiendo la suma de todos los valores
que toma la variable, por el nmero de observaciones.

x
n

suma de todos los valores observados


nmero de observacio nes

= nmero total de observaciones en el conjunto.

= media, para el conjunto de observaciones.

= indica suma de los elementos o valores de la variable.

x i = valores de la variable, donde i toma valores de 1 hasta n.


La anterior frmula denominada por algunos como media simple o no ponderada, se emplea cuando los
datos estn sin agrupar, es decir, se trabaja con los datos originales provenientes del instrumento de
recoleccin utilizado, sin que se haya iniciado el proceso de concentracin, tabulacin o elaboracin de
cuadros o tablas.
MEDIA ARITMTICA PONDERADA
Se aplica cuando los datos estn agrupados en una tabla de frecuencias. El trmino ponderacin se da a la
importancia o peso que tiene cada valor de la variable dentro del conjunto, y corresponde a la frecuencia
absoluta o relativa, siendo su mayor importancia cuando ms alta sea la frecuencia. La frmula es casi
igual a la anterior, solo que en este caso se multiplica cada valor de la variable por su respectiva
frecuencia:

x f

i i

suma de los productos


nmero de observacio nes

Cuando slo se dispone de la frecuencia relativa, tambin puede calcularse la Media Aritmtica,
aplicando la siguiente frmula:

fi
n

x xi

= suma de los productos

Ahora aplicaremos las dos frmulas anteriores, en variables discretas y continuas; para ello, se
considerar la informacin dada por las tablas de la unidad anterior

xi
0
1
2
3
4
5
6

fi
3
7
10
15
8
5
2

xifi
0
7
20
45
32
25
12

fi/n
0,06
0,14
0,20
0,30
0,16
0,10
0,04

xi(fi/n)
0
0,14
0,40
0,90
0,64
0,50
0,24

x f

141
2,82
n
50
f
x x i i 2,82
n

i i


50
141
1,00
2,82
los dos resultaos anteriores son iguales
Tabla de variable discreta Clculo de la media aritmtica ponderada

xi 1 xi
fi
xi
xifi
fi/n
xi(fi/n)
33,1 38
3
35,5
106,5
0,06
2,13
38,1 43
5
40,5
202,5
0,10
4,05
43,1 48
7
45,5
318,5
0,14
6,37
48,1 53
9
50,5
454,5
0,18
9,09
53,1 58
15
55,5
832,5
0,30
16,95
58,1 63
9
60,5
544,5
0,18
10,89
63,1 68
2
65,5
131,0
0,04
2,62

50

2.590,0
1,00
51,80
Tabla de variable contina. Clculo de la media aritmtico ponderada

2.590
51,8
50
x 51,8
x

Si comparamos los anteriores resultados con los obtenidos para datos no agrupados, observamos que en la
variable discreta son iguales; en cambio en la variable continua, por lo general, difieren. Ello se debe a la
prdida de informacin, primero, al agrupar los datos en intervalos de clase; luego, al calcular la media
utilizando las marcas de clase.
DESVIACIONES
Son diferencias que se obtienen entre los valores de la variable y un punto fijo, que puede ser un
promedio, por lo general, la media, o un valor arbitrario, es decir, cualquier valor que caprichosamente se
quiera tomar, ya sea positivo o negativo, dentro o fuera del recorrido, denominado media supuesta u
origen de trabajo, y que lo simbolizaremos mediante A u Ot.
Se consideran tres clases de desviaciones: respecto a la media; a una media supuesta; y a la media
supuesta tomada en unidades de amplitud del intervalo.

DESVIACIONES RESPECTO A LA MEDIA ARITMTICA


Se obtienen calculando las diferencias entre cada uno de los valores que toma la variable y la media, la
cual se simboliza mediante di. En datos no agrupados se obtiene de la siguiente forma:

Supongamos los valores 6, 8, 6, 10, 5, para los cuales se sabe que la media es igual a x = 7, y las
desviaciones, aplicando la frmula de di = xi - x sern: 6 - 7 = -1; 8 - 7 = 1; 6 - 7 = -1; 10 - 7 = 3; 5 - 7
= -2.
En datos agrupados, el procedimiento de clculo es como sigue:
di = xi - x
xi

fi

xi - x

(xi - x )fi

0
3
-2,82
-8,46
1
7
-1,82
-12,74
x
2
10
-0,82
-8,20
3
15
0,18
2,70
4
8
1,18
9,44
5
5
2,18
10,90
6
2
3,18
6,36

50
0
Tabla Variable discreta- Desviacin respecto a la media
xi 1 xi

fi

x f

i i

141
2,82
50

x fi 0

xi

(xi - x )
(xi - x )fi
33,1 38
3
35,5
-16,3
-48,9
38,1 43
5
40,5
-11,3
-56,5
43,1 48
7
45,5
-6,3
-44,1
48,1 53
9
50,5
-1,3
-11,7
53,1 58
15
55,5
3,7
55,5
58,1 63
9
60,5
8,7
78,3
63,1 68
2
65,5
13,7
27,4

50

0
Tabla Variable continua- Desviacin respecto a la media

x 51,8

Observe detenidamente que, en datos no agrupados, la suma de las desviaciones respecto a la media
aritmtica, debe ser siempre igual a cero; en cambio en datos agrupados o tablas de frecuencia debe estar
multiplicada cada desviacin por su respectiva frecuencia, para que la sumatoria sea igual a cero.

DESVIACIONES RESPECTO A LA MEDIA SUPUESTA U ORIGEN DE TRABAJO


El procedimiento es exactamente igual al clculo anterior, con la diferencia que en vez de tomar el valor
de la media elegimos un valor cualquiera; sin embargo, es preferible tener en cuenta un valor de la tabla,
ojala un valor central. Vale la pena aclarar que estas desviaciones se calculan de preferencia en datos
agrupados. Con las mismas tablas anteriores, calcularemos sus desviaciones respecto al origen de trabajo,
tanto para la variable discreta como para la continua:
DESVIACIONES
xi
xi A
0
-4
1
-3
2
-2
A=4
3
-1
4
0
5
1
6
2
Tabla Variable discreta- Desviaciones respecto a un origen de trabajo

DESVIACIONES
xi
xi - A

35,5
-10
40,5
-5
45,5
0
A = 45,5
50,5
5
55,5
10
60,5
15
65,5
20
Tabla Variable continua - Desviaciones respecto a un origen de trabajo
La media supuesta se simboliza por A o por Ot; considerando el valor 4 para la variable discreta y 45,5
para la continua.
Una de las tantas utilizaciones que se le da a estas desviaciones, corresponde al clculo de la media
aritmtica, mediante el denominado primer mtodo abreviado. Veamos su frmula y su aplicacin con las
tablas anteriores.
xi
0
1
2
3
4
5
6

fi
3
7
10
15
8
5
2
50

xi - A
-4
-3
-2
-1
0
1
2
-

(xi - A)fi
-12
-21
-20
-15
0
5
4
-59

fi
3
5
7
9
15
9
2
50

xi - A
-10
-5
0
5
10
15
20
-

(xi - A)fi
-30
-25
0
45
150
135
40
315

Tabla variable discreta Clculo de la


media aritmtica o mtodo abreviado
xi
35,5
40,5
45,5
50,5
55,5
60,5
65,5

Tabla variable continua Clculo de la


media aritmtica o mtodo abreviado

La frmula que utilizaremos para calcular la media aritmtica en ambos casos ser:

xA

Af i

d f

i i

Reemplazando se tiene: x = 4 + (- 59 50) = 4 1,18 = 2,82 en la variable discreta x = 45,5 + (315

50) = 45,5 + 6,3 = 51,8 en la variable continua


DESVIACIONES RESPECTO A UN ORIGEN DE TRABAJO TOMADAS EN UNIDADES DE
AMPLITUD
Generalmente se aplica en datos agrupados cuando la variable es continua y la amplitud del intervalo es
constante. Se calcula dividiendo cada una de las desviaciones respecto a la media supuesta por la
respectiva amplitud. Como siempre, se trabaja con amplitud constante; su calculo es mas abreviado; basta
colocar cero al frente del origen y a partir de ese punto, hacia arriba, se tendr: -1 -2 -3 y as
sucesivamente. Se procede lo mismo hacia abajo, pero tomando nmeros positivos: 1 2 3 4...
Se simboliza mediante di y su frmula de clculo es:

xi A di

c
c
di =
Tambin se aplica para calcular algunas medidas, entre ellas la media aritmtica, conocida como segundo
mtodo abreviado, cuya frmula es:

x Ac

d f

\
i i

Su aplicacin es la siguiente:
xi
fi
di
di/c
difi
35,5
3
-10
-2
-6
A = 45,5
40,5
5
-5
-1
-5
45,5
7
0
0
0
x 45,5 5 (63 50)
50,5
9
5
1
9
55,5
15
10
2
30
x 45,5 6,30 51,8
60,5
9
15
3
27
65,5
2
20
4
8

50
63
Tabla variable continua Clculo de la media aritmtica segn mtodo abreviado

PROPIEDADES DE LA MEDIA ARITMTICA


Es de gran importancia conocer y manejar las propiedades de este promedio, a fin de simplificar y agilizar
procedimientos de clculo, o para entender algunos mtodos estadsticos.

a)

La suma de las desviaciones respecto a la media siempre debe ser igual a cero. En datos no
agrupados ser

x 0

y en datos agrupados ser

x fi 0

. Ya estas

propiedades las habamos demostrado cuando se habl de las desviaciones respecto a la media.
b) La media aritmtica de una constante es igual a la constante. Propiedad fcil de entender y de
explicar mediante un ejemplo como el siguiente: si en un curso todos los estudiantes obtienen la
misma nota, esa ser el promedio.

M k k n nk n k
c)

La media aritmtica de una constante por una variable ser igual al producto de la constante por
la media aritmtica de la variable.

M kx kx n k x n k x
d) La media de una variable ms una constante es igual a la suma de la media ms la constante

M x k M x M k x k
e)

. Esta propiedad es vlida para la diferencia:

M x k x k

La media de la suma de dos o ms muestras es igual a la media de estas medias

ponderadas, es decir, las medias deben estar multiplicadas por su respectivo nmero de elementos, y la
suma de estos productos dividida por el total de elementos.

x 1n 1 x 2 n 2 x 3 n 3
n

Veamos la aplicacin de algunas de estas propiedades en la tabla correspondiente a la variable continua.

xi
35,5
40,5
45,5
50,5
55,5
60,5
65,5

xi
46
51
56
61

fi
3
5
7
9
15
9
2
50

fi
3
5
7
9

xi fi
168
255
392
549

66
71
76

15
9
2
50

990
639
152
3.115

xi
fi
xi fi
71
3
213
81
5
405
91
7
637
101
9
909
111
15
1.665
121
9
1.089
131
2
262

50
3.115
(1) Informacin correspondiente a la tabla inicial, de la cual sabemos que el promedio es igual a:

x = 51,8.
(2) Se le ha sumado 10,5 a cada uno de los valores de la variable de la tabla anterior y con ella se calcula
la nueva media aritmtica.

x 3.115 50 62,3
M x k 51,8 10,5 62,3
(3) Se ha multiplicado por dos cada uno de los valores de la variable tabla anterior y se ha calculado
nuevamente la media aritmtica.

x 5.180 50 103,6

M kx 51,8 2 103,6
(4) Dividamos la distribucin de la tabla anterior en dos submuestras, la primera de ellas con 15
elementos y la segunda con 35. Luego, calculamos la media para cada una de las submuestras.
xi
35,5
40,5
45,5

fi
3
5
7

xifi
106,5
202,5
318,5

15

627,5

x 1 627,5/15 41,83
Primera Submuestra
xi
50,5
55,5
60,5
65,5

fi
9
15
9
2
15

xifi
454,5
832,5
544,5
131,0
1.962,5

x 2 1.962,5 35 56,071

Segunda Submuestra

La media para el total ser

41,83(15) 56,07(35) 2.590

51,8
50
50

MEDIANA (Me)
Es aquel valor de la variable que divide la frecuencia total en dos partes iguales, es decir, aquel valor de la
variable que supera y a la vez es superado por ms de la mitad de las observaciones en un conjunto
ordenado. La mediana es el valor central.
Se le considera como una medida de tendencia central, ya que se localiza en el centro, superando la mitad
y siendo superada por la otra mitad de las observaciones. Este promedio es menos importante que la
media aritmtica y su clculo es un poco ms complicado, ya que en cada situacin en particular debe
aplicarse una determinada frmula, tan rgida que no admite tratamiento algebraico alguno, pero presenta
la ventaja de no ser afectada por cambios que se le hagan a la variable, manteniendo su ordenamiento, aun
cuando existan valores demasiado grandes.
Para la determinacin de la mediana no se requiere conocer el valor de todos los datos; solo es preciso
saber cul es la observacin central y que los valores restantes, mitad de ellos sean menores y la otra
mitad mayores que ste. Tambin se puede aplicar en datos incompletos, por ejemplo, en aquellas
distribuciones cuya variable tiene valores extremos no definidos con intervalos titulados "menos de" o
"ms de".
Veamos su aplicacin en cada caso en particular:

DATOS NO AGRUPADOS
Para el clculo de la mediana, cuando los datos no estn agrupados en una tabla de frecuencias, debe
tenerse en cuenta si el nmero de observaciones es impar o par. En cada caso se siguen los siguientes
pasos:
a)

Se ordenan los datos de menor a mayor o de mayor a menor.

b) Se determina el valor central, ya sea mediante la observacin directa de los datos o a travs de la
aplicacin de la frmula: (n + 1)/2. El resultado nos seala el nmero de la observacin en que se
localiza la Mediana
Nmero impar de observaciones
Si slo se dispone de un nmero impar de datos, la mediana estar localizada en el centro. Consideremos
nuevamente los datos 6, 8, 6,10 y 5. Se ha dicho que primero los ordenamos de menor a mayor o de

mayor a menor, de la siguiente manera: 5 6 6 8 10. Observemos que uno de los seis ocupa el centro; por
lo tanto, a ese valor le corresponde la mediana. Me = 6. Ahora disponemos de dos resultados: x = 7 y Me
= 6. Qu sucede si el ltimo valor en vez de 10 es 100? La mediana sigue siendo 6 y la media se altera,
pasa a ser 25 para el mismo conjunto de datos, debido a lo sensible que es la media, a cualquier cambio
que se haga en la variable.
En el mismo ejercicio podemos calcular la mediana aplicando la frmula (n + 1) 2 = (5 + 1) 2 = 3,
lo cual indica que la mediana est localizada en el tercer dato de la variable ordenada.
Nmero par de observaciones
Si disponemos de un conjunto par de datos, se toma convencionalmente la mediana, a la media de las dos
observaciones centrales. Si estos dos valores son iguales, se tomar uno de ellos. Con los datos: 6; 8; 6;
10; 5; 10, los ordenamos de mayor a menor; 10 10 8 6 6 5. La mediana ser el promedio entre la tercera y
la cuarta observacin obtenida de la siguiente manera: (6 + 1) 2 = 3,5, es decir, que promediamos

8 6

2 = 7. Este ser el valor de la mediana: Me = 7.

DATOS AGRUPADOS
Cuando trabajarnos con tablas de frecuencias, debe establecerse si la variable es discreta o continua;
luego, miraremos si al dividir por dos el total de observaciones, el valor se encuentra en la columna de las
frecuencias absolutas acumuladas. Se nos presentan dos situaciones al calcular la mediana. En cada caso
debe aplicarse una frmula diferente, con base en las siguientes recomendaciones:
a)

Se obtienen las frecuencias absolutas acumuladas, sumando las sucesivas frecuencias, ya sea de
arriba hacia abajo, o en sentido contrario, sin que este procedimiento afecte el resultado.

b) Dividimos por dos el total de observaciones: n 2.


c)

El resultado anterior lo buscamos en la columna de las frecuencias absolutas acumuladas. Al respecto


recordemos que se presentan dos situaciones: la primera, cuando el valor puede observarse; dicho
valor lo simbolizaremos por Nj-1 y al inmediatamente superior en valor por N j, por lo cual se dice que
Nj-1 = n/2. La segunda situacin se da cuando el valor no se observa en dicha columna; en este caso
Nj-1 corresponder al valor inmediatamente inferior a n/2 y Nj al inmediatamente superior en valor y
se dir que Nj-1 < n/2. Adems, la frmula que debe aplicarse es diferente al tipo de variable, discreta
o continua.

VARIABLE DISCRETA
Procedemos a calcular la mediana, de acuerdo con las dos situaciones descritas anteriormente:

xi
0
1
2
3
4
5
6

xj-1
xj

fi
3
7
15
10
8
5
2
50

Nj
3
10
25
35
43
48
50
-

Nj-1
Nj

(1) Variable discreta Clculo de la mediana

xi
0
1
2
3
4
5
6

xj

(2)

fi
3
7
10
15
8
5
2
50

Nj
3
10
20
35
43
48
50
-

Nj-1
Nj

Variable discreta Clculo de la mediana

(1) Aparece en la columna de las frecuencias el valor obtenido al calcular n/2 = 25; por lo tanto, se dir
que Nj-1 = n/2. En este caso la frmula que debe emplearse es:

Me

x j1 x j

Me

23
2,5
2

(2) Como en la columna de las frecuencias absolutas acumuladas no aparece el valor 25, consideremos
como Nj-1 a 20, es decir, el valor inmediatamente inferior, y como Nj al inmediatamente superior a 25,
o sea, 35. Se dir en este caso Nj-1 < n/2, y la frmula a emplear ser:
Me = xj

Me = 3

VARIABLE CONTINUA

xj-1

xj 1 xj
33,1 38
38,1 43
43,1 48
48,1 53
53,1 58
58,1 63
63,1 68

fi
3
5
7
10
15
9
1
50

Nj
3
8
15
25
40
49
50
-

Nj-1
Nj

(1) Variable continua Clculo de la mediana


xj 1 xj

fi

Nj

xj-1

33,1 38
38,1 43
43,1 48
48,1 53
53,1 58
58,1 63
63,1 68

3
5
7
9
15nj
9
2
50

3
8
15
24
39
48
50
-

Nj-1
Nj

(1)
el valor deClculo
n/2 = 25
la columna de las frecuencias absolutas acumuladas, siendo Nj-1
(2) Localizamos
Variable continua
de en
la mediana
= n/2. La frmula que debe aplicarse ser:
Me = xj-1 = 53
Observe que el valor de x j-1 lo hemos localizado al frente de N j ya que 53 es el centro de la
distribucin, en cuanto al nmero de observaciones.
(2) En este caso, el valor 25 no se encuentra en la columna, por lo tanto, se dir que N j-1 < n/2. Para su
clculo se aplicar la siguiente frmula:

Me x j1

n
N j1
2
c
nj

Me 53 5

25 24
53,33
15

NOTA: Nj es el smbolo que utilizaremos para indicar la columna de las frecuencias absolutas acumuladas
por ser ms fcil de manejar.

MODA (Md)
Es una medida de posicin que sacrifica una mayor cantidad de informacin que la mediana. Su resultado
es ms general y en algunos casos poco til. Es definida como aquel valor de la variable que ms se
repite, es decir que tiene la mxima frecuencia de la distribucin. Se simboliza por Md, siendo igual a Xj.

DATOS SIN AGRUPAR


Apliquemos la moda en los datos siguientes: 6; 8; 6; 10; 5. Observamos que el 6 es el valor de la variable
que ms se repite, por lo tanto: Xj = Md = 6.
Consideremos otro conjunto de 6 observaciones, cuyos valores son: 6; 8; 6; 10; 5; 10. Se presentan dos
valores de la variable con igual nmero de repeticiones, 6 y 10. En este caso hay dos modas, luego se dice
que la distribucin es bimodal.
Cuando ningn valor se repite ms de una vez, puede afirmarse que no hay moda. Si un solo valor de la
variable se repite ms veces que los dems, ser unimodal; si hay ms de dos modas, ser plurimodal.

DATOS AGRUPADOS
As corno se calcul la moda, en datos no agrupados, en una forma simple e inmediata, casi por simple
observacin y sin frmula alguna, podemos proceder igual en datos agrupados, tanto para la variable
discreta como para la continua. En esta ltima debe ser calculada utilizando las marcas de clase y slo
cuando la amplitud del intervalo sea constante; cuando no lo sea, es preferible aplicar otra medida
diferente.
En las tablas que se presentan a continuacin, se han calculado las modas en cada una de las
distribuciones, siendo Md = 3 en la variable discreta y Md =55,5 en la variable continua, utilizando para
ello las marcas de clase.

Md

xi
0
1
2
3
4
5
6

fi
3
7
10
15
8 nj
5
2 Md = xj = 3
50

Variable discreta Clculo de la moda

xi
fi
35,5
3
40,5
5
45,5
7
50,5
9
Md
55,5 15 nj
60,5
9
65,5
2 Md = xj = 55,5

50
RELACIN ENTRE MEDIA, MEDIANA y MODA
Variable continua
Clculo de la en
moda
Hagamos
algunas comparaciones
cuanto a la aplicacin de estas medidas, que hemos considerado
como las ms importantes y de mayor utilidad.
a)

La media aritmtica es la ms conocida y aplicada. Es frecuente que numerosas personas


desconozcan la existencia de otras medidas, o si las conocen tienen dificultad no slo en su clculo,
sino en su verdadera aplicacin.

b) En una distribucin simtrica y adems unimodal, la media, la mediana y la moda son iguales. En
este caso, se prefiere el uso de la media.
c)

Los tres promedios dependen de la forma que tome la distribucin. Si es simtrica, o ligeramente
asimtrica, debe utilizarse la media; en cambio cuando esto no ocurre, la mediana es la ms indicada.

d) Si una distribucin tiene ms de un mximo en la frecuencia, la sola aplicacin de la media, o la


mediana, puede ocultar propiedades interesantes.
e)

La media no se puede calcular en distribuciones con intervalos abiertos, por tanto, la mediana y la
moda son las ms indicadas.

f)

Dos medianas o dos modas no se pueden promediar para obtener el valor promedio de dos muestras
combinadas, pero s se puede realizar con la media aritmtica.

g) En una distribucin de frecuencias, cuando la amplitud del intervalo no es constante, no es


aconsejable la aplicacin de la moda, siendo preferible el uso de la media o mediana.
h) La media es la ms estable o la ms confiable, ya que presenta menos fluctuacin entre el resultado
en una muestra comparada con el de otras obtenidas de la misma poblacin, por tanto proporciona
una mejor estimacin del parmetro.
i)

Las relaciones entre estas medidas se podrn describir:

x Me Md
x Me Md

Cuando es simtrica
Cuando es asimtrica
Cuando es asimtrica

x Me Md
j)

La media aritmtica es sensible a cualquier cambio que se haga en los valores que toma la variable, y
en especial cuando uno de ellos es exageradamente grande. La mediana y la moda no se afectan
mientras el cambio no se realice en su propio valor.

k) Se considera que en gran parte de las distribuciones, la distancia entre la media y la moda es tres
veces la distancia entre la media y la mediana. Esta relacin fue establecida por K Pearson y sirve
para calcular una de ellas en funcin de las otras dos.

x M d 3( x M e )

M d 3M e - 2x

Una distribucin es Simtrica cuando las frecuencias absolutas y relativas, equidistantes a un valor
central, son guales, en caso contrario la distribucin es Asimtrica. Se ha dicho que en una distribucin
simtrica la mediana, media y moda tendrn el mismo valor, el cual se localiza en el centro de la variable.
Veamos como ejemplo una distribucin simtrica, cuya media, moda y mediana es igual a 6.

Xi
0
2
4
6
8
10
12

fi
2
8
15
20
15
8
2
70

fi/n
0,03
0,11
0,22
0,28
0,22
0,11
0,03
1,00

x6
Me 6
Md 6

MEDIA GEOMTRICA (Mg)

La media geomtrica de n cantidades positivas es la raz positiva ensima del producto de dichas
cantidades. Se simboliza por Mg, Mo, G, y es aplicada en todos aquellos casos en los que la variable
muestra un crecimiento geomtrico, como en el de la poblacin de un pas o el de un capital colocado
a una tasa de inters compuesto, es decir, con tendencia exponencial. Siguiendo el procedimiento de
explicacin para los anteriores promedios, veamos cules son las frmulas que deben aplicarse en este
caso y cul el procedimiento que debe seguirse para su clculo:

DATOS NO AGRUPADOS
De acuerdo con la definicin, la frmula para aplicar, si se dan los dalos siguientes: 6; 8; 6; 10 y 5, es:

Mg

x i

Mg

6 8 6 10 5

x1 x 2 x 3 ...x n
5

14.400 6,79

La letra griega (pi) se lee como multiplicacin de, es decir, corresponde al producto de los elementos
o valores que tome la variable. La anterior frmula presenta varios inconvenientes en su clculo. Algunos
de ellos son:
(a) si un valor de la variable es 0, el producto ser igualmente cero.
(b) ninguna observacin puede ser negativa, pues nos dara una raz imaginaria. Como solucin, es
preferible trabajar con logaritmos:
(c)

log Mg

log x
n

log x 1 log x 2 log x 3 ...


n

Aplicando esta frmula a los datos originales, el resultado debo ser exactamente igual al obtenido con la
formula anterior.

log 6 log 8 log 6 log 10 log 5


5
0,77815 0,90309 0,77815 1,00000 0,69897 4,15836
log Mg

5
5
log Mg 0,831672
log Mg

Ahora obtenemos el antilogaritmo: Mg = antilog 0,831672 = 6,79; Mg = 6,79


Ya se mencion la aplicacin de este promedio en algunos datos que se agrupan en orden cronolgico,
como la poblacin de una regin, que adems presenta un crecimiento geomtrico y en el que se desea
determinar la poblacin promedio entre dos perodos. Expliqumoslo con un ejemplo: en 1983, la
poblacin de una regin fue 6 millones, y en 1993 alcanza a 8,6 millones. Cul fue la poblacin media
para 1988?

Mo 6(8,6) 51,6 7,18

Millones de habitantes.

DATOS AGRUPADOS
Las frmulas de clculo anteriores se modifican un poco, pues deben estar ponderadas, es decir, la
variable debe estar multiplicada por las respectivas frecuencias absolutas.

Mg x

log Mg

f i /n
i

log x i

Por comodidad utilizaremos esta ltima frmula, tanto para la variable discreta como para la continua. El
procedimiento ser:
xi
0
1
2
3
4
5
6

fi
3
5
7
9
15
9
2
50

log xi
0
0
0,301030
0,477121
0,602060
0,698970
0,778151
-

fi log xi
0
0
3,01030
7,15682
4,81648
3,49485
1,55630
20,03475

log Mo

fi

xi

log xi

fi log xi

log x i

n
20,03475
log Mo
50
Mo antilog 0,400695
Mo 2,52

Variable discreta Clculo de la media geomtrica


xi 1 xi fi

33,1 38
38,1 43
43,1 48
48,1 53
53,1 58
58,1 63
63,1 68

3
5
7
9
15
9
2
50

35,5
1,55023
4,65069
85,77854
40,5
1,60746
8,03728 log Mo
50
45,5
1,65801
11,60608
50,5
1,70329
15,32962 log Mo 1,715571
55,5
1,74429
26,16439
Mo antilog 1,715571
60,5
1,78175
16,03580
65,5
1,81624
3,63248 Mo 51,95
20,03475 85,77854
Variable continua Clculo de la media geomtrica

PROBLEMA DE APLICACIN
1.

El ingreso por habitante de un pas es 1.200 dlares al ao. El sector obrero est constituido por el
38% de la poblacin y percibe 1/7 del ingreso total. Cul ser el ingreso per cpita de este sector?

Y Y/P Ingreso total/poblacin


Y = ingreso total = 1.200 poblacin = 1.200 P
171,43
451,13
0
,
38
Para el sector obrero ser = (1/7) (1.200P) / 0,38P =

CUESTIONARIO
1.

Encontrar la media, mediana y moda, en cada uno de los siguientes conjuntos de observaciones:
A) 20 18 16 10 18 13 12 12 18 20
B) 11 13 13 15 15 15 17 17 19
C) 10 11 12 15 14 14 14 130
a)

En cul de los tres casos la media tiene poca representatividad?

b) En cada uno de los casos compruebe que la suma de las desviaciones respecto a la media
aritmtica es igual a cero.
c)

Con el ejercicio A) contestar qu pasara con los resultados obtenidos con la aplicacin de las
tres medidas: (1) si cada uno de los valores de la variable lo multiplicramos por 3?; (2) si a
cada valor se le suma 5?

2.

Con base en las siguientes medidas de posicin, indicar en cules de los siguientes puntos existe una
relacin:
a)

x = 78

mediana = 84

moda = 90

b)

x = 80

mediana = 84

moda = 78

3.

c)

x = 84

mediana = 84

moda = 84

d)

x = 84

mediana = 84

moda = 52

moda = 116

Si los resultados obtenidos al aplicar tres promedios son: media = 50; mediana = 46 y moda = 40,
qu pasar con los promedios si cada uno de los valores de la variable se multiplica por 10?

4.

Suponga que usted es el gerente de mercadeo de una empresa, donde se distribuye el mismo producto
con dos marcas diferentes, asegurando que ambas tienen la misma duracin media de 9 aos. Se
realiza una encuesta entre los compradores de estos productos, para determinar cul ha sido su
duracin. Los resultados obtenidos fueron: Producto A: 10; 7; 8; 9; 10; 8; 11; 7; 7; 11; 9; 8; 10; 10; 9;
11; 9; 8; 9. Producto B: 19; 4; 3; 4; 3; 9; 10; 3; 19; 5; 9: 4; 9; 5; 9: 4; 9; 5; 9; 4; 9; 10; 19; 4; 5; 9.
a)

Cul medida "promedio" se utiliz para cada marca?

b) Cul marca aconsejara usted?


c)

Como vendedor, en qu marca se sentir ms seguro, al afirmar que la vida media de duracin
es 9 aos?

5.

Una muestra de 22 empresas, editoras de textos, revela los siguientes porcentajes del gasto en
promocin, respecto al total de ventas del producto.
21 18 25 20 16 18 16 10 18 20 16
14 20 26 12 14 12 14 12 12 12 18
Calcule: media, mediana y moda.

6.

Los siguientes dalos representan el nmero de interrupciones diarias, en un mes. Los factores son de
diversa ndole, tales como falta de fluido elctrico, dao en las mquinas, enfermedad o malestar del
operario, etc. Los resultados se presentan en la siguiente tabla de frecuencias:
Xi
0
1
2
4
5
7
10

7.

fi
10
8
4
2
3
2
1
30

Calcule el promedio de interrupciones


diarias en la fbrica, durante el mes.

En un almacn de repuestos para automotores se seleccion una muestra al azar de 80 cuentas de los
archivos de crdito y se construy la siguiente tabla.
VALOR DEUDA
(MILES $)
Hasta 20
20,1 40
40,1 60

NUMERO DE
DEUDORES
14
26
20

Se pide:
a) Calcular la mediana y la moda.
b) Cmo procedera usted si le pidieran
calcular la media aritmtica?

60,1 80
80,1 100
100,1 y ms

8.

10
6
4
80

Supongamos que se realiz una encuesta sobre la tasa de desempleo en 40 de las principales ciudades
del pas, con los siguientes resultados:
NUMERO DE
CIUDADES
6
10
16
5
3
40

9.

TASA DE
DESEMPLEO
2 - 5%
5,1 - 8%
8,1 - 11%
11,1 - 14%
14,1 - 18%

Se pide calcular:
a) Media, mediana y moda.
b) Media geomtrica y armnica.
c) Las desviaciones respecto a la media y
comprobar que su sumatoria es igual a

Una compaa aumenta sus ventas (millones $) en los.cero.


ltimos aos en la siguiente forma:
AOS
1.988
1.989
1.990
1.991
1.992

VENTAS
2
4
11
16
28

Calcular la media geomtrica.

10. Consideremos que una empresa cuenta con tres departamentos con diferente nmero de empleados.
Se realiza una encuesta para determinar el nmero de unidades producidas por hora, con los
siguientes resultados:

DEPARTAMENTO I
UNIDADES
NUMERO DE
TRABAJADORES
3
2
5
3
7
6
8
12
10
4
11
2
12
1

30

DEPARTAMENTO II
UNIDADES
NUMERO DE
TRABAJADORES
2
3
4
7
5
14
7
9

8
10

3
4
40

DEPARTAMENTO III
UNIDADES
NUMERO DE
TRABAJADORES
4
6
5
2
7
12
8
10
9
14
10
2
12
3
13
1

50

a)

Calcular el promedio (media) de rendimiento para cada uno de los departamentos.

b) Obtener el promedio para el total de los 120 empleados.


11. Con los siguientes datos de una distribucin simtrica, correspondiente a 150 observaciones, se
elabor una tabla de frecuencias agrupados en cinco intervalos de igual magnitud. Solo se conoce
parcialmente la informacin de la tabla, siendo: f 3 = 50; f2 = fi + 10; x5 = 80; x1 = 30. Se pide
reconstruir la tabla y calcular la media, mediana y moda.
12. En qu situacin la media, mediana y moda son iguales?
13. Un control de produccin realizado en 50 lotes sobre el nmero de unidades defectuosas, dio el
siguiente resultado:
5

10

12

11

10

a)

Calcular la media, mediana y moda con los datos originales.

b) Agrupar los datos en una tabla de frecuencia, calcular los promedios mencionados en la unidad y
comparar sus resultados.

UNIDAD V. MEDIDAS DE DISPERSIN

OBJETIVOS:
Conocer e identificar las medidas de dispersin.
Desarrollar habilidades en el clculo y aplicacin prctica de estas medidas.
Comprender la utilidad e identificar los problemas que requieran su uso

GENERALIDADES
El comportamiento de un conjunto de datos se ha podido describir, en parte, mediante la elaboracin de
cuadros, grficas y el clculo de algunos promedios, tal como se present en unidades anteriores. Sin
embargo, estos ltimos quedan incompletos, ya que en algunos casos particulares nos estn dando
resultados que distorsionan el comportamiento de ese conjunto de datos o, en el mejor de los casos, no
nos mide nada. Esta es la razn que nos lleva hacia el conocimiento de otras medidas que complementan
e indican cmo se distribuyen o se dispersan los valores observados a ambos lados del promedio, es decir,
cmo se concentran alrededor del valor central o valor tpico.
El promedio calculado, por s mismo, tiene escaso valor significativo, si no se determina el grado de
variabilidad de los datos. No es extrao, pues, que las distribuciones tengan el mismo promedio pero con
diferente grado de dispersin la finalidad en esta unidad es calcular el grado de concentracin de las
observaciones alrededor de un promedio, mediante la aplicacin de ciertas medidas de dispersin,
determinando, al igual que en el promedio, cul de ellas es la ms indicada en determinado caso. Veamos
algunas de esas medidas.
RECORRIDO (R)
Esta medida se conoce tambin con el nombre de rango. Puede definirse como la diferencia entre el
mayor y el menor valor que toma la variable. Esta medida, tan sencilla de calcular y ms conocida como
oscilacin, slo brinda una ligera aproximacin del grado de variabilidad, pues presenta el inconveniente
que slo toma en cuenta los valores extremos, sin importar el conjunto de valores intermedios; por tanto,
en algunos casos puede arrojar un resultado totalmente distorsionado por su gran sensibilidad a valores
extremos, mostrndose engaador e inestable.
DATOS NO AGRUPADOS
S observamos los siguientes datos: 6; 8; 6; 10; 5, el RANGO ser igual a 10 - 5 = 5.
R = Xmx Xmn
DATOS AGRUPADOS
Apliquemos esta medida en datos agrupados, tanto en la variable discreta corno en la continua, con la
misma informacin que se ha utilizado en los promedios.

xi
R = x7 x1
R=60=6

fi
0
1
2
3
4
5
6

3
7
15
10
8
5
2

R = 68 33 =35
50

Variable discreta
xi 1 xi
33,1 38
38,1 43
43,1 48
48,1 53
53,1 58
58,1 63
63,1 68

fi
3
5
7
9
15
9
2
50

Variable contina

Se puede ver en los ejemplos anteriores que los valores intermedios de la variable, algunos de ellos con
peso o frecuencia de alguna importancia, no fueron tomados en cuenta para el clculo del rango.
VARIANZA (S2 2)
Es una de las medidas de dispersin ms til, con un significado fcil de captar. Es definida,
generalmente, como la media de los cuadrados de las diferencias entre los valores que toman la variable y
su media aritmtica. Se define tambin como el cuadrado de la desviacin tpica o estndar. Se simboliza
mediante S2 2.
La definicin anterior nos hace pensaren la existencia de una sola frmula para calcular la dispersin. Sin
embargo, existe ms de una expresin matemtica para la misma idea, algunas de ellas prcticas para
casos simples; otras, para datos agrupados o para el uso de la calculadora. Veamos algunas de ellas.

DATOS NO AGRUPADOS
Para los siguientes datos originales: 6; 8; 6; 10; 5, obtengamos la varianza por las siguientes frmulas, de
las cuales el alumno escoger la que considere ms fcil de manejar.

a)

S
b)

c)

35
7
5

(x

2
i

2
i

S2

x)

nx

16
3,2
5

261 5(7) 2

3,2
5
261
(7) 2 3,2
5
xi
6
8
6
10
5
35

xi - x
-1
1
-1
3
-2
0

(xi - x )2
1
1
1
9
4
16

xi2
36
64
36
100
25
261

DATOS AGRUPADOS
Aplicamos las frmulas anteriores, pero ponderadas para las variables discreta y continua. Para esta
ltima, debe trabajarse con las marcas de clase.
xi

fi

xi - x

(xi - x )2

(xi - x )2 fi

xi2 fi

0
1
2
3
4
5
6

3
7
10
15
8
5
2
50

S2
a)

b)

-2.82
7,9524
23,8572
-1,82
3,3124
23,1868
-0,82
0,6724
6,7240
0,18
0,0324
0,4860
1,18
1,3924
11,1392
2,18
4,7524
23,7620
3,18
10,1124
20,2248
109,3800
Variable discreta - Clculo de la varianza

S2

n
f nx

2
i i

fi

109,38
2,19
50

507 50(2,82) 2
2,19
50

n
2
i

c)

x fi

2
i

507
5

0
7
40
135
128
125
72
507

x =2,82

2,82 2 2,19

En datos agrupados, tanto en la variable discreta como en la continua, se puede trabajar con desviaciones
respecto a una media supuesta u origen de trabajo, y se denomina primer mtodo abreviado para el
clculo de la varianza.

xi
0
1
2
3
4
5
6

fi
3
7
10
15
8
5
2
50

di= (xi A)
-4
-3
-2
-1
0
1
2
-

(xi -A)2
16
9
4
1
0
1
4
-

difi
-12
-21
-20
-15
0
5
4
-59

di2 fi
48
63
40
15
0
5
8
179

A=4

2
i i

179 59
S2

50 50
S 2 3,58 (1,18) 2

2
i i

S 2 2,19
Variable discreta Clculo de la varianza Primer Mtodo abreviado
Calculemos la varianza por los diferentes mtodos ya vistos, pero aplicados a una variable continua.
xi

fi

35,5
40,5
45,5
50,5
55,5
60,5
65,5

3
5
7
9
15
9
2
50

x 51,80

xi2
xi - x
(xi - x )2
(xi - x )2 fi
-16,3
265,69
797,07
1.260,25
-11,3
127,69
638,45
1.640,25
-6,3
39,69
277,83
2.070,25
-1,3
1,69
15,21
2.550,25
3,7
13,69
205,35
3.080,25
8,7
75,69
681,21
3.660,25
13,7
187,69
375,38
4.290,25
2.990,50
Variable continua Clculo de la varianza

xi2 fi
3.780,75
8.201,25
14.491,75
22.952,25
46.203,75
32.942,25
8.580,50
137.152,50

137.152,50 - 50(51,8)
2.990,5
59,81
S2
59,81
50
50
a)
b)
137.152,5
S2
(51,8) 2 59,81
50
c)
S2

Trabajemos ahora con el segundo Mtodo abreviado para calcular la varianza, el que slo se aplica
cuando la amplitud del intervalo es constante. Tambin como en los casos anteriores, debe trabajarse con
las marcas de clase.
xi
35,5
40,5
45,5
50,5
55,5
60,5
65,5

fi
di
di/c
di fi
di 2 fi
3
-10
-2
-6
12
5
-5
-1
-5
5
A = 45,5
7
0
0
0
0
9
5
1
9
9
C=5
15
10
2
30
60
9
15
3
27
81
2
20
4
8
32
50
63
199
Variable continua - Clculo de la varianza - Segundo Mtodo abreviado

/ 2
i

fi

fi

5 (199/50) (63/50)
2

/
i

S 2 25 3,98 1,5876 25 2,3924 59,81


Puede observarse que cualquiera que sea la frmula de la varianza que se aplique en una distribucin, el
resultado siempre va a ser el mismo.
PROPIEDADES DE LA VARIANZA
Es de gran importancia saber manejar las propiedades de la varianza, ya que en algunos casos simplifica
las operaciones; en otros, nos va a servir como base de algn proceso matemtico. Estas propiedades son:

a)

La varianza siempre debe ser positiva. S2

b) La varianza de una constante es igual a cero.


c)

V k 0

La varianza de una variable ms una constante es igual a la varianza de la variable.

V x k V x V k S 2x
Esta propiedad es vlida para la diferencia.

V x k S2x

d) La varianza de una constante por una variable es igual al producto de la constante elevada al
cuadrado por la varianza de la variable.

V xk k 2 S 2x

Es una de las propiedades que ms se dificulta, no slo para su aplicacin, si no para entenderla.
Consideremos que se tiene un conjunto de datos cuya variable est dada en horas, siendo su
promedio 7 y la varianza igual a 3,2. Se desea convertir esos resultados en minutos, sin tener que
volver aplicar las frmulas, con los datos transformados en minutos slo utilizando las propiedades.
La nueva media ser:

M xk k x 60(7) 420

minutos en promedio. Ahora la varianza se calcular:

V xk k 2 S 2 60 2 (3,2) 3.600(3,2) 11.520


e)

minutos.

La varianza de dos o ms submuestras se obtiene mediante la siguiente aplicacin:

S2

S12 n 1 S 22 n 2 ( x 1 x ) 2 n 1 ( x 2 x ) 2 n 2

n
n

Debe recordarse que

x1n1 x 2 n 2
n

Supongamos que los datos para la variable discreta que tanto se ha utilizado corresponden a la primera
submuestra con media x1 2,82 y varianza

S12 2,19 , mientras que en la segunda submuestra son

x 2 51,8 y S22 59,81 . Con la informacin anterior, va a calcularse la media y la varianza, para el
conjunto de las 100 observaciones. Siendo:

2,82(50) 51,8(50)
27,31
100

2,19(50) 59,81(50)

(2,82 27,31) 2 50 (51,8 27,31) 2 50

100
31 599,7601 630,7601

100

DESVIACIN TPICA O ESTNDAR ( S)


La varianza como medida de dispersin presenta el inconveniente de que el resultado corresponde a la
unidad en que est medida la variable, pero elevada al cuadrado, ya que as lo exige las diferentes
frmulas aplicadas, siendo necesario contar con una medida de dispersin cuyo resultado sea dado en la
misma unidad en que est dada la variable. Esto se logra si se extrae la raz cuadrada de la varianza. Este
mtodo se conoce como Desviacin tpica o estndar y se simboliza con S siendo la medida de
dispersin ms utilizada.

S S2

(x
(x

x)2

(datos no agrupados)

x)2fi
n

(datos agrupados)

Con las varianzas obtenidas para las diferentes variables, calculemos sus desviaciones tpicas:

S 2,19 1,48 , y en la variable continua de la tabla

En la variable discreta de la tabla ser:

S 59,81 7,73
La desviacin estndar tiene una interpretacin bien precisa, por ejemplo, en la Distribucin Normal,
puede visualizarse con el siguiente grfico:

X
68.3%
95.5%
99.7%
Distribucin normal
El total del rea bajo la curva es igual a uno, o sea, el 100%. El rea corresponde a la proporcin de
observaciones en la distribucin, es decir:

x + 1S se tendr el 68,26%
x + 2S se tendr el 95,50%
x + 3S se tendr el 99,70% de las observaciones
La media de una distribucin normal () divide en dos partes iguales la curva, correspondindole a cada
lado el 50%. Si nos alejamos del centro a la derecha, una desviacin estndar se incluir en esta rea,
aproximadamente del 34,13% de las observaciones. Como es simtrica, si se toma una vez la desviacin
tpica a lado y lado del promedio, el total ser 68,26%.

Dentro del dominio de la variable, la media aritmtica, en general, se dice que debe comprender
tres veces la desviacin estndar; por lo tanto, se concluye que en una distribucin normal, la
desviacin tpica debe aproximarse a la tercera parte de la media aritmtica.
La Distribucin Normal, o de Gauss, es la distribucin terica de variable continua ms utilizada.
Adems, se trata de una distribucin simtrica, unimodal y asinttica al eje horizontal o abscisa, que
permite analizar numerosas variables resultantes de investigaciones de carcter socio-econmico que
presentan un comportamiento aproximado a la distribucin normal.
Se podrn comparar las desviaciones tpicas o las varianzas de dos o ms distribuciones, si se quiere
determinar cul de ellas tiene una menor o mayor variabilidad absoluta, siempre y cuando que las
variables estn dadas en las mismas unidades de medida.
COEFICIENTE DE VARIACIN (CV)
Se dijo que puede calcularse la variabilidad absoluta siempre y cuando las distribuciones estn dadas en
las mismas unidades de medicin. Por lo tanto, se requiere de una medida de dispersin para cuando sean
diferentes, siendo el coeficiente de variacin el ms indicado, calculado como el cociente entre la
desviacin tpica y la media aritmtica. Se simboliza por CV, d V.

Desviacin tpica
Coeficiente de variacin = Media aritmtica

CV

S
x

El coeficiente de variacin se expresa en trminos porcentuales.

CV (S x )100
El coeficiente permite comparar la variabilidad de dos o ms distribuciones dadas en unidades de medidas
diferentes, con el fin de determinar cul de ellas tiene una mayor o menor variabilidad relativa.
Si partimos de la consideracin hecha a partir de la Distribucin Normal, se dir que una distribucin,
cualquiera que tenga un Coeficiente de Variacin menor o igual al 33%, tiende a ser homognea, es decir,
la media obtenida ser lo bastante representativa del total de las observaciones y si, por el contrario, el
CV se hace mayor al 33%, nos indicar que cada vez ser ms heterognea. Por lo tanto, la media ir
perdiendo su representatividad; de ah que en el muestreo se procede, en estos casos, a dividir la
poblacin en grupos ms homogneos, denominados estratos, permitiendo la aplicacin del muestreo
aleatorio estratificado.
PUNTAJE TPICO "O" ESTANDARIZADO (Z t)
Algunos lo denominan como puntaje de la Z, y es expresado como desviaciones respecto a la media
muestral, en unidades de desviacin tpica. Es muy aplicado en la transformacin de valores de una
variable, expresado en cierta escala, en unidades de otra escala Z, proceso denominado como tipificacin
o estandarizacin. Igualmente se utiliza para comparar los resultados de ciertos experimentos expresados
en unidades de medida diferente; tambin sirve para indicar la posicin relativa de un elemento de la

distribucin con respecto a la media en unidades de desviacin estndar, como puede observarse en los
resultados de las pruebas que se realiza para indicar la posicin que ocupa el estudiante dentro del
conjunto. Esta medida se simboliza ya sea por Z o t, para la frmula:

xx
S

Si consideramos que un curso obtiene en promedio 6,8 en matemtica y. 7,8 en estadstica, y se quiere
saber en cul de ellas un alumno alcanza mejor posicin relativa,
es decir, en cul obtuvo un mejor rendimiento con relacin al grupo, si las calificaciones de ese alumno
fueron 7,0 y 7,6, respectivamente. Aparentemente se dira que en la segunda, pero dentro del curso
corresponde a la primera. Apliquemos la frmula, si se sabe que las desviaciones tpicas fueron 0,6 y 0,3,
respectivamente.
Zmatemtica = (7,0 - 6,8)/0,6 = 0,33
Zestadstica = (7,6 - 7,8)/0,3 = 0,66
Se dir que hay una mejor posicin relativa cuanto ms cerca a 3 se encuentre, ya que es el mximo valor
que supuestamente toma Z.

OTRAS MEDIDAS DE DISPERSIN


Existen otras medidas de dispersin, cada una de ellas con aplicaciones especficas en determinados
casos, pero slo nos referiremos a dos de ellas: la Desviacin media y la Desviacin mediana.
DESVIACIN MEDIA (Da)
Es una medida de dispersin que se obtiene al calcular la media de las desviaciones respecto a su media,
tomadas en valor absoluto. Esta medida se utiliza muy a menudo por su cuantificacin fcil y rpida, pero
en realidad es de poco uso. Al igual que la desviacin tpica, se toma con el signo positivo y negativo para
indicar su oscilacin alrededor de la media. Sin embargo, es menos exacta y, por lo general, menor. De tal
manera que en una distribucin normal corresponde al 79,79% de la desviacin tpica. Se simboliza
mediante Da o DM siendo:

Da = 0,7979 S

Datos no agrupados
Continuamos til izando los mismos datos: 6; 8; 6; 10; 5, de tal manera que nos permitan comparar los
resultados obtenidos con la aplicacin de las diferentes medidas. La frmula a aplicar es:

Da

xi

xi - x

xi x

6
8
6
10
5

-1
1
-1
3
-2

1
1
1
3
2

x x i n 35 5 7
Da

n
Da S

8
1,6
5

1,6 < 1,79


Datos sin agrupar Desviacin media

DATOS AGRUPADOS
El procedimiento de clculo es parecido al desarrollado para obtener la varianza, con la modificacin de
trabajar con las diferencias entre la variable y la media, en valores absolutos.
xi

fi

xi - x

0
1
2
3
4
5
6

3
7
10
15
8
5
2
50

-2,82
-1,82
-0,82
0,18
1,18
2,18
3,18
-

xi x

xi x

fi
2,82
8,46
x 2,82
1,82
12,74
D a 58,8 50 1,176
0,82
8,20
0,18
2,70
Da S
1,18
9,44
1,18 < 1,48
2,18
10,90
3,18
6,36
58,80
Variable discreta - Desviacin media

Calculemos la desviacin media en una variable continua.


xi

fi

xi - x

35,5
40,5
45,5
50,5
55,5
60,5
65,5

3
5
7
9
15
9
2
50

-16,3
-11,3
-6,3
-1,3
3,7
8,7
13,7
-

xi x

xi x

fi
16,3
48,9
x 51,8
11,3
56,5
D a 322,4 50 6,448
6,3
44,1
1,3
11,7
Da S
3,7
55,5
6,45 < 7,33
8,7
78,3
13,7
27,4
322,4
Variable continua - Desviacin media

DESVIACIN MEDIANA (De)


Si en un problema cualquiera es requerido el clculo de la mediana, en vez de la media aritmtica, debe
utilizarse como medida de dispersin la Desviacin Mediana, simbolizada mediante De o DMe, y su

clculo se desarrolla exactamente igual al de la media, sustituyendo esta por la mediana. Las frmulas
para aplicar en este caso son:

De
De

Me

n
Me f i
n

GLOSARIO
Coeficiente de variacin Dispersin

Rango

Desviacin media

Distribucin normal

Recorrido

Desviacin mediana

Oscilacin

Variacin absoluta

Desviacin estndar

Puntaje tpico o estandarizado

Desviacin tpica

Variacin relativa

Posicin relativa

EJERCICIOS DE APLICACIN
1.

El coeficiente de variacin de 200 empleados de una empresa es 62%. Despus de reajustar todos los
salarios en $1400, este coeficiente de variacin es del 52%. Sin embargo, la gerencia fija un sueldo
mnimo de $6100. Antes del reajuste 40 personas tenan un sueldo medio de $6000 y todos ellos
ganaban menos de $7000; con la nueva poltica de la gerencia, sus sueldos sern elevados a $7100.
Determinar la cantidad de dinero mensual que necesitar la empresa para pagar despus de efectuado
el reajuste.
Solucin
CV = S/ x = 0,62
CV = S/( x +1400) = 0,52;

0,62 x = 0,52 ( x + 1400)


0,62 x = 0,52 x + 0,52 (1400)
0,10 x = 728; x = 728 /0,10 = $7280

$7280 es el salario promedio antes del reajuste.


Por otra parte, hay 40 empleados con un sueldo promedio de $6000 y el ingreso promedio de los 160
restantes ser igual a:

40(6000) 160 x 2
7280
200

200 (7280) = 240 000 + 160 x 2

x2

14560000 240000
7600
160

Si el nuevo promedio de salario es $7100 para los 40 empleados, el resto de empleados, o sea los 160,
devengarn $7600 ms los $1400 de aumento, es decir $9000. El valor total de la nmina ser:
40 (7100) + 160 (9000) = $1 724 000.
2.

Tres empresas de la ciudad realizan concursos de admisin a fin de proveer las vacantes actuales y
entre los inscritos, en las tres empresas, aparece el Seor Pedreros. Gracias a sus influencias el Seor
Pedreros pudo conocer los resultados generales y los de l en particular.
EMPRESA

A
B
C
a)

58
72
68

CALIFICACIN

4,7
3,8
4,2

Seor Pedreros
69
77
64

En cul de las entrevistas, el Seor Pedreros obtuvo una mejor posicin? En cul estuvo mal?

b) Si se sabe que el nmero de aspirantes a la vacante en cada una de las empresas fue: 320; 472;
258, respectivamente, cul es el promedio de calificacin y el coeficiente de variacin para el
total?
Solucin

a) ZA = (69 58) 4,7 = 2,34

obtuvo una mejor posicin

ZB = (77 72) 3,8 = 1,32


ZC = (64 68) 4,2 = -0,95
b)

fue la peor

x = 58 (320) + 72 (472) + 68 (258) = 66,75

4,7 2 (320) 3,8 2 (472) 4,2 2 (258) (58 66,75) 2 320 (72 66,75) 2 472 (68 66,75) 2 258
S

1.050
1.050
2

S 2 17,55 36,11 53,11


S 53,66 7,33
CV 7,33 66,75 0,1097 10,97%

CUESTIONARIO
1.

Con la siguiente informacin correspondiente a una distribucin simtrica; m = 5; c = constante; X 1 =


40; n1 = 3; H2 = 0,30; h5 = 0,05; y X5 = 85; se pide completar la tabla y calcular:

a) Coeficiente ce variacin.
b) Desviacin media y desviacin mediana.
c) Cual es el valor del rango u oscilacin?
2.

Para cinco artculos se tienen las variaciones en sus precios respecto al mes pasado. Estos valores
fueron: -$40; -$120; -$80; +$50; +$220.
Se pide calcular el
a) Coeficiente de variacin.
b) Desviacin media.
c) Desviacin mediana.

3.

En un curso de capacitacin ofrecido por la empresa a sus trabajadores, uno de ellos terico y el otro
prctico, se calific utilizando una escala de O a 10. Uno de los trabajadores obtuvo las calificaciones
de 8,2 y 6,8 en los cursos respectivos. El trabajador pudo averiguar cules haban sido los promedios
y la dispersin en las notas obtenidas en cada curso, con el siguiente resultado;
Curso terico:

Media = 8,7;

Desviacin tpica = 0,8

Curso practico: Media = 5,8;


a)

Varianza = 1,21

En cul de los cursos este trabajador obtuvo una mejor posicin relativa?

b) Cul es el coeficiente de variacin en cada curso?


c)

Cul es el coeficiente de variacin para el curso en general, si adems se sabe que al primero
asistieron 30 trabajadores y al segundo, solo asistieron 20?

4.

Los empleados de tres departamentos de una empresa fueron sometidos a una prueba sobre
conocimiento del rea en la cual trabajan, con los siguientes resultados:
DEPARTAMEN
TO
A
B
C

x
74
82
68

S
6,2
7,8
4,4

N
25
40
35

Una vez publicadas las notas se encontr que haba un error en los clculos, ya que faltaban 10
puntos que se haban ofrecido como compensacin a una pregunta calificada como mal pero que era
correcta. Se pide calcular el coeficiente de variacin para el total de empleados teniendo en cuenta
los 10 puntos que se deben aadir a las calificaciones de cada uno de los empleados.
5.

Un jefe de produccin encuclilla anotado en el libro de control que el peso promedio del artculo
fabricado es 270 gramos, con una desviacin tpica de 8 centmetros. Hay algo incorrecto?

6.

Si se tiene una media muestral x = 25 y varianza de 36, hallar la media muestral, la varianza y
desviacin tpica de y, en los siguientes casos:
a) y = 8 + 20 x

b) y = 5 x - 26

7.

Si en un problema cualquiera se obtiene una varianza de 2,4 horas, pero se nos solicita el resultado en
minutos, cul ser su valor?

8.

Si en una empresa el salario promedio es $210.000, con una desviacin tpica de $8.216, mientras
que en otra empresa de la competencia el salario promedio es $224.500, con una varianza de 92.544.
En cul de las empresas los salarios presentan
a) Una mayor variabilidad absoluta?
b) Una menor variabilidad relativa?

9.

Cuando se aplica el muestreo en un plan de auditora, uno de los aspectos ms importantes que se
deber considerar es la variabilidad de la poblacin objeto de estudio. Esta se mide por:
a) La media; b) desviacin estndar; c) la mediana; d) ninguna de las anteriores.

10. Una firma tiene 40 almacenes distribuidos en el territorio nacional y se cuenta con la siguiente
informacin sobre las ventas mensuales en millones de pesos.
VENTAS (millones

NMERO

$)
10,1 20

ALMACENES
2

20,1 30

30,1 40

13

b) la desviacin media

40,1 50

c) la desviacin mediana

50,1 60

d) compruebe que DM Da < S

60,1 70

4
40

Calcular:
a) el coeficiente de variacin

11. En una prueba realizada a 30 autos, de una nueva marca, se obtiene un rendimiento promedio de 32,4
millas por galn de gasolina, con varianza de 32,04 mpg. a) Exprese estos resultados en trminos de
kilmetros por galn (un km =0,622); b) Exprese los resultados anteriores en kilmetros por litro (un
litro = 1,056 cuartos de galn).
12. Para qu se utiliza el coeficiente de variacin?
13. A los trabajadores de una empresa el prximo ao les ser aumentado el salario mensual en un 20%
ms $12.000. La empresa tiene 850 trabajadores y actualmente devengan un salario medio mensual
de $230.000, con un coeficiente de variacin del 38%.
a) Cul ser la desviacin estndar el prximo ao?
b) En cunto se aumentar el valor de la nmina el prximo ao?
14. Una encuesta a 12 fbricas de helados revela los siguientes porcentajes de utilidad:
25% 20% 22% 20% 25% 30% 18% 16% 30% 16% 20% 16%

Se pide calcular:
a) Coeficiente de variacin
b) Desviacin media

d) Varianza
e) Desviacin mediana

c) Rango
15. En el lanzamiento do un producto se realiz una investigacin para determinar el grado de
aceptacin, utilizando una escala de 10 puntos. Se tom a 12 hombres y 12 mujeres con el siguiente
resultado:
HOMBRES: 7 5 6 9 10 8 7 4 5 7 3 10
MUJERES: 6 4 4 3
a)

6 8 6 5 5 4

Calcule el coeficiente de variacin independiente para hombres y mujeres.

b) Calcule el coeficiente de variacin para el conjunto, es decir, para las 24 personas.


c)

Con los 24 datos, construya una tabla de frecuencia y calcule el coeficiente de variacin, la
desviacin media y la desviacin mediana.

UNIDAD VI MEDIDAS DE ASIMETRA Y APUNTAMIENTO


OBJETIVOS:
Entender y manejar los conceptos de asimetra y apuntamiento.
Desarrollar habilidades en la aplicacin y clculo de estas medidas.
Integrar estos conceptos con las medidas anteriores y ver la importancia que tienen.
GENERALIDADES
En los captulos anteriores nos hemos detenido a estudiar y a explicar la forma de calcular, aplicar y
analizar las diferentes medidas de posicin y de dispersin, en distribuciones de frecuencias. Ahora, nos
dedicaremos a presentar dos nuevos conceptos, estrechamente relacionados con esas medidas, como son
el de asimetra y apuntamiento, con el fin de alcanzar un mayor conocimiento respecto al conjunto de
datos investigados.
Estos conceptos hacen referencia a la comparacin de la curva obtenida con los datos provenientes de una
+
muestra y una curva terica o normal, observada en la mayora de los fenmenos
naturales, en especial
cuando el nmero de observaciones es grande, a fin de determinar su asimetra y apuntamiento.
MEDIDAS DE ASIMETRA O DE DEFORMACIN
Una distribucin es simtrica cuando la media, mediana y moda son iguales, es decir, cuando en una
curva normal las dos colas son iguales. Pero si la distribucin unimodal tiene una cola ms larga hacia
uno de los lados, se dice que es asimtrica o deforme. Si la deformacin o alargamiento de la cola se
presenta hacia los valores mas grandes de la variable, es decir, hacia la derecha, se dir que la distribucin
es asimtrica positiva. En caso contrario, la asimetra ser negativa cuando el alargamiento de la cola
se presenta hacia los valores menores de la variable, o sea hacia la izquierda.
Generalizando tenemos:
Simtrica

cuando M1 = Me = Md;

Asimtrica positiva

cuando Md < Me < M1

Asimtrica negativa

Cuando Md > Me > M1

Simtrica

Asimtrica Positiva

Asimtrica Negativa

M1

Md Me M1

Simtrica M1 = Me = Md

M1 Me Md

Asimtrica positiva Md < Me < M1

Asimtrica negativa Md > Me > M1

Distribuciones de asimetra o de deformacin


Esta deformacin se conoce como SESGO o VAS, y se calcula aplicando diferentes medidas,
especialmente las elaboradas por K. Pearson.

a)

As

x Md
s

b)

As

3( x Me)
s

Si As es igual a cero, la distribucin ser normal o simtrica; si el resultado es negativo o positivo,


significa que es asimtrica, sealando a qu lado de la curva se presenta la deformacin. El valor obtenido
corresponde al grado de deformacin, es decir, entre ms alejado se encuentre de cero, ms asimtrica
ser. Veamos el manejo de estas frmulas, si consideramos los resultados de algunas medidas aplicadas
anteriormente para una variable continua.

x = 51,8;

s = 7,73;Md = 55,5;

Me = 53,33

a) As = (51,8 55,5) / 7,73 = -0,48


b) As = 3(51,8 53,33) / 7,73 = -0,59
Los dos resultados, con pequeas diferencias, nos indican que la distribucin es ligeramente asimtrica
negativa.
Tambin puede calcularse l grado de asimetra mediante la aplicacin de los momentos:

As

m3
s3

m3
m2

m3

x fi
n

m3: corresponde al momento de orden tres respecto a la media;


m2: es el momento de orden dos y corresponde a la varianza; por lo tanto, se debe obtener su raz
cuadrada para hallar la desviacin tpica, la que, a su vez, se eleva al cubo, para la aplicacin de la
frmula.
Los momentos son medidas de potencias de variable.
Calculemos la deformacin con la siguiente tabla de datos correspondiente a una variable continua.
xi
35,5
40,5
45,5
50,5
55,5
60,5
65,5

fi

xi - x
(xi - x )2
(xi - x )2 fi
(xi - x )3 fi
3
-16,3
265,69
797,07
-12.992,241
5
-11,3
127,69
638,05
7.214,485
7
-6,3
39,69
277,83
-1.750,329
x =51,8
9
-1,3
1,69
15,21
-19,773
15
3,7
13,69
205,35
759,795
9
8,7
75,69
681,21
5.296,527
2
13,7
187,69
375,38
5.142,706
50
2.990,50
-10.147,800
Variable continua - Clculo del momento de orden tres respecto a la media

m2 = S2 = 59,81

S=

59,81 =7,73

As

m3
S3

m3

As

x fi

10.147,800
202,956
50

202,956 202,956

0,44
461,89
7,73 3

Nota: Tambin nos muestra una ligera asimetra hacia la izquierda.

MEDIDAS DE APUNTAMIENTO
Es conocida tambin como curtosis y permite establecer el grado de apuntamiento o achatamiento de la
curva de la distribucin respecto a la normal. Esta medida propuesta tambin por Pearson y basada en los
momentos unidimensionales, es dudosa si se considera que una simple razn mida adecuadamente el
apuntamiento de una distribucin. La frmula que se aplicar es:

Ap

m4
S4

m4

m4

2 2

x fi
n

m4 momento de orden 4 respecto a la media.


Calculemos el apuntamiento en una variable continua utilizando la tabla anterior
xi

fi

xi - x
(xi - x )2
(xi - x )2 fi
(xi - x )4 fi
35,5
3
-16,3
265,69
797,07
211.773,5283
40,5
5
-11,3
127,69
638,05
81.523,6805
45,5
7
-6,3
39,69
277,83
11.027,0727
x =51,8
50,5
9
-1,3
1,69
15,21
25,7049
55,5
15
3,7
13,69
205,35
2.811,2415
60,5
9
8,7
75,69
681,21
51.560,7849
65,5
2
13,7
187,69
375,38
70.455,0722

50
2.990,50
429.117,0722
Variable continua - Clculo del momento do orden cuatro, respecto la media
Apuntadaoomesocrtica
leptocrtica >=33
Normal
Achatada o platicrtica < 32.990,50

m 2 s 2 59,81

m4

Ap

m4

2 2

x fi
n

50

8.582,34

59,81

429.117,085
8.582,34
50

Ap

8.582,34
2,40
3.577,24

m4

m4

S S
4

2 2

Para la interpretacin de esta medida debe tenerse en cuenta lo siguiente:


a)

Si Ap = 3, la distribucin es normal.

b) Si Ap > 3, la curva es apuntada, ms alta que la normal y nos indica una concentracin alrededor del
promedio.
c)

Si Ap < 3, es achatada, por lo tanto hay ms dispersin respecto al promedio.

En el ejercicio que nos ocupa encontramos que 2,4 < 3, siendo la curva algo achatada.
A las tres formas anteriores se les denomina leptocrtica, platicrtica y mesocrtica.

MOMENTOS
Es necesario referirnos a ellos en forma rpida, ya que se ha mencionado en varias ocasiones. En trminos
generales, un momento es el valor medio de una potencia de una variable. Hay varias clases de
momentos, a saber:
a) Momentos respecto a la variable.
b) Momentos respecto a la media aritmtica.
c) Momentos respecto a un origen de trabajo o media supuesta.
d) Momentos respecto a la media supuesta, tomada en unidades de amplitud.
La media aritmtica es un momento de orden uno, respecto a la variable.

ar

x f

r
i i

a1

x f

1
i i

La varianza es un momento de orden dos, respecto a la media.

mr

m2

x fi
n

s2

La frmula para momentos respecto a un origen de trabajo o media supuesta, ser:

/
r

A f i
r

d f

r
i i

En el caso de momentos respecto a un origen de trabajo, tomada en unidades de amplitud, estar dada por
la frmula

m r//

// r
i
i

Siendo

d i//

d i/ x i A

C
C

En todos los casos r significa el orden del momento y la potencia a la cual se eleva la variable. Se tendr
que r toma valores de 1, 2, 3, 4...

CUESTIONARIO
1.

Qu significa:
a) que una variable tenga un apuntamiento mayor a la normal?
b) que la distribucin de una variable sea asimtrica a la derecha?

2.

Con los siguientes datos:


Xi-1 xi
48,1 56
56,1 64
64,1 72
72,1 80
80,1 88
88,1 96

fi
38
22
14
6
3
2
85

Se pide:
a) Construir un histograma y un polgono de frecuencias.
b) Calcular la media, mediana y moda. Utilizar la
informacin anterior para determinar el grado de
asimetra y hacia que lado se presenta la deformacin.
c) Calcular el grado de apuntamiento y de asimetra,

3.

Con los siguientes datos

i-1

X x
120,1 136
136,1 142
142,1 148
148,1 154
154,1 160
160,1 168

4.

fi
2
6
14
26
38
54
140

utilizando las frmulas de los momentos.


Con esta distribucin responder todas y cada una de las
preguntas formuladas en el ejercicio anterior.

Con los siguientes datos, responda las preguntas formuladas en los ejercicios anteriores.
Xi-1 xi
-0,5 0,5
0,5 ,15
1,5 2,5
2,5 3,5
3,5 4,5
4,5 5,5
5,5 6,5
6,5 7,5

fi
1
7
21
35
35
21
7
1
128

Xi-1 xi
-0,5 0,5
0,5 ,15
1,5 2,5
2,5 3,5
3,5 4,5
4,5 5,5
5,5 6,5
6,5 7,5

fi
35
21
7
1
1
7
21
35
128

UNIDAD VII SERIES DE TIEMPO


OBJETIVOS:
Comprender la importancia que tiene el anlisis de las series de tiempo.
Adquirir habilidad en la seleccin de la tendencia que mejor se ajusta a la serie.
Estar en capacidad de proyectar y analizar su comportamiento futuro.
Poder elaborar grficas que incluyan datos originales y tendencias.
GENERALIDADES
Las series de tiempo, denominadas tambin series cronolgicas, corresponden a un conjunto de
observaciones ordenadas respecto a una caracterstica cuantitativa de un fenmeno individual o colectivo,
que se toma en diferentes perodos, guardando un estricto orden cronolgico, ya que los datos se van
registrando a medida que va ocurriendo el fenmeno.

Estas series, en parte, son analizadas a travs del uso de los nmeros ndices, se hallan dentro de las
distribuciones bidimensionales, es decir, estn constituidas por dos variables: una de ellas corresponde al
tiempo, identificada por X, que puede ser aos, semestres, meses, quincenas, semanas, das, horas; la otra
variable, simbolizada por Y, se refiere al fenmeno que se investiga, que puede ser: produccin, ventas,
costos, inversin, horas trabajadas, accidentes de trabajo, matrcula, precios, etc., informacin que nos
permite analizar aspectos de su comportamiento pasado, presente y futuro.
El anlisis que se hace a una serie no slo corresponde a aspectos econmicos, sino que encierra mltiples
aspectos de la vida diaria, social, poltica, educativa, etc., o sea, todos aquellos fenmenos que varan a
travs del tiempo y que requieren la aplicacin de mtodos que permitan conocer los efectos de los
cambios, como ayuda en el proceso de control y planeacin de esos aspectos, adems, predecir su
comportamiento futuro.
Si consideramos una variable, por ejemplo produccin, esta ser el resultado de varios aspectos, tales
como: la tendencia, las variaciones estacionales, las cclicas y las aleatorias. Veamos en qu consiste cada
una de ellas.
Tendencia o tendencia secular. Esta ltima es una expresin alternativa para la tendencia de una serie, la
cual corresponde a un movimiento suave y constante que se extiende durante perodos extensos.
Generalmente, se representa por una lnea recta, parablica, exponencial o cualquier otro tipo de lnea,
dependiendo del comportamiento de la variable.
Variacin estacional. Se considera, generalmente, como parte del movimiento que se atribuye al efecto
de las estaciones del ao, es decir, a circunstancias climticas o a simples costumbres sociales: las ventas
en navidad, la demanda de hotelera en temporada alta, etc.; sin embargo, puede corresponder a
variaciones que se presentan en perodos ms cortos; por ejemplo, el movimiento de pasajeros en

transporte urbano, en el cual se observan unos perodos denominados "picos", de alta demanda, que se
repiten todos los das laborables, en las mismas horas y en las mismas condiciones.
Variaciones cclicas. Ligadas a los ciclos econmicos, corresponden a movimientos peridicos, ms o
menos regulares, que se extienden por varios aos, sin que se pueda determinar cundo se inicia y termina
su ciclo. Estas variaciones corresponden a perodos de prosperidad, recesin, depresin y recuperacin.
Variaciones aleatorias. Denominadas tambin accidentales o irregulares, resultan de sucesos no
previsibles, generalmente ocasionados por situaciones excepcionales, pero que se pueden identificar.
Ejemplos: huelgas, inundaciones, terremotos, crisis poltica o situaciones generadas por factores externos.
Parte del anlisis de estas series consiste en la descomposicin de la serie en los factores antes
mencionados. Sin embargo, se dice que todas ellas contienen variaciones aleatorias, y que no
necesariamente abarcan la totalidad de los factores. En algunos casos, su clculo aislado se hace difcil, ya
que resultan inseparables. Se puede afirmar que es posible, la mayora de las veces, determinar la
cuantificacin de la tendencia y las variaciones estacionales, en un determinado perodo. En cambio las
variaciones cclicas y las aleatorias slo se podrn determinar por residuo. De todas formas, siempre va a
ver cierta dificultad para descomponer esos factores, ya que son movimientos poco uniformes en el
tiempo, y que en muchos casos no permiten su identificacin.
TENDENCIA
La tendencia es considerada como el principal componente de una serie de tiempo. En muchos casos, slo
existe preocupacin por su comportamiento, olvidando en forma desprevenida las incidencias que, en
algunas situaciones, pueden verse afectadas por los otros tres componentes. Para identificar la tendencia,
es recomendable, en primer lugar, hacer su representacin grfica. Para ello nos valemos de un plano
cartesiano. De esta manera, se podr observar el comportamiento de la serie, al mismo tiempo que nos
permite visualizar mejor la tendencia, es decir, la lnea ms adecuada para su representacin, la que puede
ser una recta, una parbola, una exponencial o cualquier otra lnea. Dentro de los mtodos utilizados
para describir la tendencia, se tienen:
MTODO LIBRE O DE MANO ALZADA
Es conocido tambin como mtodo grfico y, como su nombre lo indica, consiste en utilizar la serie,
partiendo de la elaboracin del respectivo grfico; luego, con base en la experiencia y un perfecto
conocimiento del desarrollo pasado y presente, prolongar la lnea, para de esta manera expresar el
comportamiento futuro. Este mtodo es muy subjetivo, ya que el resultado depende de quien trace o
prolongue la lnea. A pesar de lo anterior, es justificada con el argumento de estar basada en el pleno
conocimiento de su comportamiento y no de un sistema rgido, como son los mtodos matemticos.
Ahora, consideremos una informacin arbitraria, que presente variaciones, y que nos permita graficar no
slo los valores observados, sino la tendencia, mediante los diferentes mtodos que sern expuestos en
esta unidad.

Ejercicio: Supongamos que una empresa comercial desea proyectar sus ventas (miles de unidades); para
ello, organiza la informacin por aos de la siguiente forma:
AOS:
VENTAS:

1987
36

1988
1989
1990
1991
55
40
48
72
Tabla 1.Ventas (miles de unidades) 1987-1993

1992
50

1993
68

Se pide elaborar la grfica correspondiente a los datos originales y efectuar la estimacin para los dos
aos siguientes, mediante los diferentes mtodos que a continuacin se presentan:
Solucin:

VENTAS (miles de unidades)

REALES Y ESTIMADAS - 1987 - 1993


80
60

Realunidades)
VENTAS (miles de

40

Estimado

20
0
1986 1988 1990 1992 1994
AOS
Grafico 1. Representacin grfica de las ventas (miles de unidades)
En la grfica 1. aparecen representados los datos originales de la tabla, y adems d los valores estimados
(tendencia) segn criterio del autor, quien consider necesario ajustar una recta, en tal forma que divida
la lnea poligonal en dos partes, es decir, que pase aproximadamente por el centro.

MTODO ANALTICO
Se realiza mediante la aplicacin de una funcin matemtica que exprese la tendencia.
Los mtodos ms conocidos y aplicados son los siguientes:
A) Recta o funcin lineal

Y = a + bX
Y = a + bX + cX2

B) Parbola de segundo grado


C) Funcin exponencial

Y = abx

El problema es saber elegir la funcin matemtica que mejor represente o describa la tendencia de esa
serie temporal y la seleccin de esa lnea, la cual, adems de la visualizacin grfica, depende de la
experiencia, sentido comn, habilidad y, sobre todo, del buen juicio del investigador. Por otra parte, en el
proceso de proyeccin debe suponerse que el comportamiento pasado y presente, continuar sindolo,
ms o menos, en la misma forma en el futuro. Por lo tanto, las proyecciones son vlidas para uno o dos
perodos, aceptndose para un perodo no mayor de cinco aos, pues en la mayora de estas series su
comportamiento tiende a cambiar, haciendo fracasar las proyecciones, en especial cuando los cambios son
fuertes.

TENDENCIA RECTILNEA
Como su nombre lo indica, la serie se describe mediante una recta, si el crecimiento, o decrecimiento, de
las cantidades, en cada uno de los perodos, es ms o menos constante. Veamos el procedimiento que debe
seguirse. Para ello, partimos de la informacin de tabla 1..
La ecuacin de la recta est dada por Y = a + bX
a: corresponde al coeficiente de posicin. Tambin se le considera como un punto localizado en el eje
de la ordenada; por tal razn, se le denomina como origen en la ordenada. Puede simbolizarse por a,
A o 0.
b: es la pendiente o coeficiente angular. Nos determina la tasa de crecimiento o el ngulo de inclinacin
de la recta. Puede ser positiva, si la recta es ascendente; o negativa, cuando es descendente. Tambin
puede simbolizarse por b, B o 1.
X: corresponde a la variable tiempo, simbolizada tambin por t.
Y: es la variable que se va a predecir o estimar y se simboliza por Y*.
El mtodo de los mnimos cuadrados facilita el clculo de los parmetros a y b, y mediante la utilizacin
de un sistema de ecuaciones normales, permite la aplicacin de cualquiera de los mtodos que el
estudiante conoce para dar solucin, como son el de sustitucin, igualacin y eliminacin.
Las ecuaciones son:

1) Y = na + bX
2) XY = aX + bX2

Calculemos estos coeficientes; para ello se tomar como origen de la serie el primer perodo, siendo X =
0 y su sumatoria diferente de cero (X 0), situacin que implica la necesidad de aplicar las ecuaciones
anteriores. Hagamos su clculo y proyeccin para 1997. Ver tabla 2.

AOS
1987
1988
1989
1990
1991
1992
1993

X
-3
-2
-1
0
1
2
3
0

X
0
1
2
3
4
5
6

X2
0
1
4
9
16
25
36

XY
0
55
80
144
288
250
408

40,08
44,29
48,50
52,71
56,93
61,14
65,35

369 21
X2
9
4
1
0
1
4
9

91

1.225
XY
-108
-110
-40
0
72
100
204

369,00

Y
36
55
40
48
72
50
68

28

118

Taba 2. Ajuste rectilneo - Origen en el

Tabla 2. Ajuste rectilneo Cambio de

primer periodo de la serie

origen

Reemplazando en las ecuaciones se tendr que:


1) 369 = 7a + 21b
2) 1.225 = 21a + 91b
En estas ecuaciones se podr eliminar a. Para ello, multiplicamos la primera ecuacin por -3 y la restamos
de la segunda.
2) 1125 = 21a + 91b
1) -1107 = -21a 63b
118 =

+ 28b;

siendo b = 118 28 = 4,21

Este resultado significa qu por cada unidad de tiempo, en este caso un ao, la variable crece en 4,21, o
sea, 4210 unidades.

Ahora, reemplacemos ese valoren la primera ecuacin:


1) 369 = 7a + 21 (4,21)
a = (369 88,41) 7 = 40,08
el cual corresponde a la cantidad en miles, estimada para el perodo base, en este caso
1987. Con esos dos valores, se tendr que la recta estar dada por:
= 40,08 + 4,21 X ;

= valor preeditor

El valor estimado para 1997, teniendo en cuenta que X = 1997 1987 = 10, ser:
= 40,08 + 4,21 (10) = 82,18 = 82180 unidades. Corresponde a las unidades que se estima se vendern
en 1997, de acuerdo al comportamiento de la serie. El origen se puede trasladar a cualquier punto o
perodo, y su resultado ser exactamente igual. Cuando la serie es impar y continua lo recomendable es
trasladar el origen al perodo central, de tal manera que la X = O, con lo cual se logra agilizar y
simplificar las operaciones de clculo. Con la informacin de la tabla 3., calculemos el valor de los
parmetros, obtengamos la ecuacin de la recta y estimemos el valor de Y para 1997, tomando como
origen a 1990.
b = XY X2 = 118 28 = 4,21
a = Y n = 369 7 = 52,71
= a + bX = 52,71 + 4,21X

El valor de X ser igual a:


X = 1997 1990 = 7
Reemplazando en la ecuacin, nos queda que:
= 52,71 + 4,21 (7) = 82,18.
Para el clculo de la tendencia se hace indispensable determinar el valor correspondiente al grado de
correlacin, mediante la aplicacin del denominado Coeficiente de correlacin. Es una medida de
interdependencia entre la variable que se va a predecir y el tiempo, correspondiendo a un nmero entre 1
y +1 con un valor intermedio cero, que indica la ausencia de correlacin. Estos valores lmites indican la
existencia de correlacin perfecta negativa y positiva, respectivamente; el signo nos indica si la recta es
descendente o ascendente. Se le conoce tambin como coeficiente de correlacin de Pearson, debido a la
parte que le correspondi en la introduccin del mismo en la teora general, y se simboliza por r o R.
Expliquemos cual debe ser el procedimiento a seguir para su clculo.
AOS
1987
1988
1989
1990
1991
1992
1993

Y
36
55
40
48
72
50
68

40,08
44,29
48,50
52,71
56,93
61,14
65,35

Y
-4,08
10/71
-8,50
-4,71
15,07
-11,14
2,65

(Y )2
16,6464
114,7041
72,2500
22,1841
227,1049
124,0996
7,0225

Y2
1.296
3.025
1.600
2.304
5.184
2.500
4.624

369
369,00
0,00
584,0116
20.533
Tabla 3. Clculo de la varianza residual y del coeficiente de correlacin
Primero calculamos los cuadrados de las diferencias entre los valores reales y estimados, los sumamos y
luego los dividimos por el nmero de perodos. Medida conocida como varianza residual, mide la
dispersin de los datos que no queda explicada por la recta de estimacin.

S 2y x

(Y Y) 2
n

584,0116 7 83,43

Tambin se puede calcular en forma ms sencilla, a pesar de que sus resultados presentan una ligera
diferencia, mediante la aplicacin de la frmula:

2
yx

S 2y x 83,75

a Y b YX
n

S 2y x

20.533 40,08(369) 4,21(1.225)


83,75
7

, en el caso que utilicemos los datos de la tabla 2. cuando X 0

Ahora con los datos de la tabla 3. cuando X = 0, ser:

S 2y x

20.533 52,71(369) 4,21(118)


83,75
7
;

luego calculamos la varianza de la variable Y:

S 2y x

nY

S 2y 20.533 7(369 7) 2 / 7 154,49


El coeficiente de correlacin al cuadrado o coeficiente de determinacin ser igual a:

r 2 1 (S 2y x S 2y )

, r2 = 1 (83,43 154,49) = 0,46. El coeficiente de correlacin lineal ser:

r r 2 0,46 0,68
Valor bastante alejado de la unidad; por lo tanto, se puede decir que existe poca correlacin y que esa
recta es poco explicativa para los datos de esta.
Hay un procedimiento que nos permite determinar el coeficiente de correlacin lineal en forma directa:

n XY X Y
n X X n Y Y
2

7(1.225) 21 369
826

0,68
2
2
1
.
218
7(91) 21 7 20.533 (369)

TENDENCIA PARABLICA
Se emplea, en especial, cuando la serie presenta variaciones acentuadas y cuando asume la forma de una
parbola. La ecuacin correspondiente est dada por Y = a + bX + cX 2. La tarea consiste en determinar
los valores para los parmetros a, b y c. Para ello, nos valemos de un sistema de ecuaciones normales,
siendo:
1) Y = na + bX + cX2
2) XY = aX + bX2 + cX3
3) X2Y = aX2 + bX3 + cX4
a

se puede decir que corresponde al coeficiente de posicin

es el coeficiente angular en un punto de la curva

nos determina la direccin de la curva

Utilicemos la informacin de la tabla 1. y trabajemos, en primer lugar, tomando como origen el primer
perodo de la serie, es decir, 1987, donde X = 0 y la X 0.

AOS
1987
1988
1989
1990
1991
1992
1993

Y
36
55
40
48
72
50
68

369

X2Y
0
55
160
432
1152
1250
2448

39,61
44,30
48,79
53,09
57,21
61,13
64,87

21 91
441
2275
1225
5497
Tabla 4. Clculo de la tendencia parablica

369,00

X
0
1
2
3
4
5
6

X2
0
1
4
9
16
25
36

X3
0
1
8
27
64
125
216

X4
0
1
16
81
256
625
1296

XY
0
55
80
144
288
250
408

Con la informacin de la tabla 4. reemplazamos en las ecuaciones anteriormente dadas:


1) 369 = 7a + 2lb + 91c
2) 1225 = 21a + 91b + 441c
3) 5497 = 91a + 441b + 2275c
Consideremos las dos primeras ecuaciones a fin de eliminar el parmetro a.
Para ello, multiplicamos la primera ecuacin por -3 y se la restamos a la segunda.
2) 1.225 = 21a + 91b + 441c
1) -1107 = -21a 63b 273c
4)

118 =

28b + 168c

La ecuacin resultante la hemos sealado como ecuacin 4); ahora trabajamos con las ecuaciones primera
y tercera. Para ello, multiplicamos a la primera ecuacin por -13 y se la restamos a la tercera.
3) 5.497 = 91a + 441b + 2.275c
1) -4797 = -91a 273b 1183c
5)

700 =

168b + 1092c

Tenemos dos ecuaciones: 4) y 5), cada una con dos incgnitas; por lo tanto, se podr eliminar el
parmetro b multiplicando la ecuacin 4) por -6 y la restamos de la 5):
5) 700 = 168b + 1092c
4) -708 = -168b 1.008c
-8 =

84c,

siendo c = -8 84 = -0,095

Se podr reemplazar en la ecuacin 4) de la siguiente manera, a fin de despejar el valor


del parmetro b.
4) 118 = 28b + 168 (-0,095)
b = (118+ 15,96) 28 = 4,78

Ahora, reemplazamos los valores correspondientes a los coeficientes b y c, en la ecuacin 1):


1) 369 = 7a + 21 (4,78) + 91 (-0,095), y se tiene que
a = (369 100,38 + 8,645) 7 = 39,61
La ecuacin general nos queda: = 39,61 + 4.78X 0,095X2.
Si se sabe que el valor de X para 1997 es X = 1997 - 1987 = 10, se tendr que:
= 39,61 + 4,78 (10) 0,095 (100) = 77,91
Procedamos a. cambiar el origen. Recordemos que puede estar ubicado en cualquier perodo, sin
embargo, tomamos a 1990 para que la X = 0.
AOS
1987
1988
1989
1990
1991
1992
1993

Y
36
55
40
48
72
50
68

369

Y
-3,61
10,07
-8,797
-5,09
14,79
-11,13
3,13

(Y )2
13,0321
114,4900
77,2641
25,9081
218,7441
123,8769
9,7969

0
28
0
196
118
1.468
369,00
0,00
Tabla 5. Clculo de la tendencia parablica con cambio de origen

583,1122

X
-3
-2
-1
0
1
2
3

X2
9
4
1
0
1
4
9

X3
-27
-8
-1
0
1
8
27

X4
81
16
1
0
1
16
81

XY
-108
-110
-40
0
72
100
204

X2Y
324
220
40
0
72
200
612

39,61
44,30
48,79
53,09
57,21
61,13
64,87

Vamos a utilizar el sistema de ecuaciones expuesto anteriormente, suprimiendo aquellos trminos donde
X = 0.
1) Y = na + cX2

1) 369 = 7a + 28c

2) XY = bX2

2) 118 = 28b

3) X2Y = aX2 + cX4

3) 1.468 = 28a + 196c

Calculamos primero el coeficiente b.


b = 118 28 = 4,21. Puede observarse que anteriormente dio 4,78, y cada vez que cambiemos el origen,
este valor tambin cambiar, ya que ser la pendiente en el punto en que se tome el origen. Ahora,
emplearemos las otras dos ecuaciones, eliminando al coeficiente a; para ello, multiplicamos la ecuacin
1) por -4 y se la restamos a la ecuacin 3).
3) 1.468 = 28a + 196c
1) -1.476 = -28a 112c
-8 =

84c;

Siendo c = -8 84 = -0,095; este valor no vara, aun cuando cambiemos el origen. Una vez calculado el
parmetro c lo reemplazamos en la primera ecuacin, siendo:
1) 369 = 7a + 28 (-0,095)
a = [369 + 2,66] 7 = 53,09
La ecuacin general quedar as:
= 53,09 + 4,21X 0.095X2
El valor estimado de para 1997, sabiendo que X = 1997 1990 = 7, ser:
= 53,09 + 4,21(7) 0,095(49) =77,91
Existen otras frmulas que simplifican las anteriores operaciones cuando la X = 0:
b = XY n

X XY
c
n X X
a Y c X n
369
n X 2 Y

b = 118 7 = 4,21

2 2

7(l.468) (28)(369)
-0,095
7(l96) (28) 2

a 369 (- 0,095)(28) 7 53,09

Procedamos a calcular el Coeficiente de correlacin parablico, aplicando algunas frmulas.


Comencemos por determinar la varianza residual o no explicada, que tiene el mismo concepto dado en la
recta.

S 2y x (Y - Y) 2 n

S 2y x 583,1182 7 83,30

Tambin podemos calcular la varianza residual directamente, de la siguiente forma:

2
yx

S 2y x

a XY b YX c X 2 Y

n
20.533 23,09(369) 4,21(118) 0,095(1.468)

83,64
7

Sabemos que el valor de la varianza de Y, calculado para la recta, es igual a

S 2y 154,49

. Conociendo

la varianza residual y la varianza de la variable se puede calcular el coeficiente de correlacin al cuadrado


de la siguiente manera:

r 2 1 (S 2y x S 2y )
El valor de ser igual a

, r2 = 1 (83,30 154,49) = 0,4608

r 0,4608 0,68

Tambin se hubiera podido calcular directamente el coeficiente de correlacin, si calculamos la varianza


explicada, es decir, la media de los cuadrados de las diferencias entre los valores estimados y la media
aritmtica.
AOS

Y
1987
1988
1989
1990
1991
1992
1993

36
55
40
48
72
50
68

39,61
44,30
48,79
53,09
57,21
61,13
64,87

369

369,00

13,10
-8,41
-3,92
0,38
4,50
8,42
12,16

( Y )2

Y 369 7 52,71

171,7223
70,8002
15,4000
0,1412
20,2114
70,8242
147,7614

S a2 y

(Y Y) 2 n

S a2 y 496,8607 7 70,98

R 2 S a2 y S 2y
R 2 70,98 154,49 0,459

r 0,459 0,68

0,00
496,8607
Tabla 6.Clculo de la varianza residual

Comprobado que el coeficiente de correlacin parablico se puede calcular de diferentes maneras con el
mismo resultado, procedamos a la representacin grfica.

VENTAS (miles de unidades)

REALES Y ESTIMADAS - 1987 - 1993


80
60

VENTAS (miles de Real


unidades) 40
20
0
1986 1988 1990 1992 1994
AOS
Grfica 3.Ventas reales y estimadas - Ajuste parablico 1987-1993 Ventas (miles unidades)
Se puede observar en la grfica 3. que al trazar la lnea de las cantidades estimadas no toma la forma de una
parbola como debe ser, ello se debe a que los datos originales no tienen un comportamiento parablico.

TENDENCIA EXPONENCIAL

Describe la tendencia de una serie si los crecimientos y decrecimientos muestran un porcentaje casi constante
de un perodo a otro; por ejemplo, una serie que crece en un 5% mensual o del 28 % anual. La tasa de
crecimiento de la variable debe ser geomtrica.
La ecuacin general es Y = abx
Es ms fcil su aplicacin si empleamos los logaritmos:
log Y = log a + X log b
Para el clculo de los parmetros, cuando la X 0, se debe utilizar un sistema de ecuaciones normales.

AOS
1987
1988
1989
1990
1991
1992
1993

Y
36
55
40
48
72
50
68

369

X
0
1
2
3
4
5
6

X2
0
1
4
9
16
25
36

log Y
1,55631
1,74036
1,60206
1,68124
1,85733
1,69897
1,83251

X log Y
0
1,74036
3,20412
5,04372
7,42930
8,49485
10,99505

21
91
11,96878 36,90743
Tabla 7.Ajuste exponencial cuando X 0

log
1,60256
1,63832
1,67407
1,70983
1,74558
1,78133
1,81709

40,04
43,48
47,21
51,27
55,66
60,44
65,33

11,96878

363,73

1) log Y = n log a + (X2) log b


2) X log Y = (X) log a + (X2)log b
Reemplazando, se tiene que:
1) 11,96878 = 7 log a + 21 log b
2) 36,90743 = 21 log a +91 log b; eliminamos al parmetro log a multiplicando la primera
ecuacin por -3, y luego la restamos de la segunda ecuacin.
2) 36,90743 = 21 log a + 91 log b
1) -35,90634 = -21 log a 63 log b
1,00109 =

28 log b

Siendo: log b = 1,00109 28 = 0,035753 y b = antilog 0,035753 = 1,0858.


Sabiendo que b = 1 + r, se tendr que r = 0,0858 = 8,58% tasa correspondiente al crecimiento geomtrico
anual.
Conocido el valor de log b, lo reemplazamos en la primera ecuacin:

1) 11,96878 = 7 log a + 21 (0,035753)


log a = [11,96878 0,750813] 7 = 1,60257 y su antilogaritmo es = 65,63.
La ecuacin general nos queda as:

log = 1,60257 + 0.035753X


El valor estimado para 1997, sabiendo que X = 10, ser:
log = 1,60257 + 0,035753 (10) = 1,960097 = 91,22
= 91,22
Hagamos la misma estimacin, mediante el ajuste exponencial cuando la X = 0. Para
ello, trasladamos el origen al perodo 1990, y se tendr la siguiente informacin:
ANO
S
1987
1988
1989
1990
1991
1992
1993

X2

36
55
40
48
72
50
68
369

-3
-2
-1
0
1
2
3
0

9
4
1
0
1
4
9
28

X logY

log

2
(log Yi log Y) (log
Y log Y) 2

-4,66891 1,60256
-3,48072 1,63832
-1,60206 1,67407
0
1,70983
1,85773 1,74558
1,69897 1,78139
1,83251 1,81709
1,00110 11,9687
0,0738597
6
8
Tabla 8. Ajuste exponencial cuando X = 0

log b = X log Y X2 = 1,001106 28 = 0,0357537;

0,035793

b =1,0858 ;

r = 8,58%
log a = log Y n = 11,96878 7 = 1,70983;

a = 51,27

La ecuacin general ser: log = 1,70983 + 0,0357537X ; el valor estimado para 1997, sabiendo que X =
7, ser: log = 1,70983 + 1,001106 (7) = 1,96010
Ahora se puede obtener el antilogaritmo de 1,96010, siendo igual a
= 91,22
Se observa en los dos cuadros anteriores que log = log Y, en cambio Y . Esto hace que el
clculo del coeficiente de correlacin se dificulte, ya que es necesario trabajar con logaritmos de los
valores reales y de los valores estimados. Lo mismo sucede con el clculo de la media aritmtica y la
varianza, que corresponde a los logaritmos de la variable.
Directamente puede calcularse el coeficiente de correlacin al cuadrado, de la siguiente manera:

r
2

log Y log Y

log Y

log Y

r2

0,035793
0,48
0,0738596

r 0,48 0,70
Tambin se puede calcular as:

2
Slog

log
Y

log
Y

yx
i

2
S log
n
y log Yi log Y
2

2
Slog
yx 0,109653 7 0,0156647
2
S log
y 0,07385967 7 0,0105513

Ahora se tendr que el coeficiente de correlacin al cuadrado es:


2
2
r 2 1 (S log
yx S log y )

r 2 1 (0,0156647 0,105513) 0,48

r 0,48 0,70
La representacin grfica debe elaborarse en papel semilogartmico, colocando en el eje horizontal o
abscisa la variable tiempo, y en el eje vertical los logaritmos de la variable Y. En el ejemplo realizado no
se requiere, ya que la variable no muestra un crecimiento geomtrico y, por lo tanto, no es necesario el
clculo de la tendencia geomtrica; solo se desarroll el ejercicio con el fin de mantener la serie e indicar
el procedimiento que debe seguirse y poder comparar estos resultados con los otros dos ajustes.

VENTAS (miles de unidades)

REALES Y ESTIMADAS - 1987 - 1993


80
60

VENTAS (miles Real


de unidades) 40

Estimado

20
0
19861988199019921994
AOS
Grafico 4.Ventas reales y estimadas 1987 - 1933 Ajuste exponencial
EJERCICIOS DE APLICACIN
1.

Con los siguientes datos correspondientes a una serie lineal, calcule:


AOS
1981
1984
1987
1990
1993

2.

Y
?
?
220
240
30

220
254

Se pide:
a) Calcule los valores de Y1 y Y2.
b) Estime el valor de
c) Calcule el coeficiente de correlacin lineal

Si la poblacin de un pas, en 1983, era 17 millones de habitantes, y en 1993, 26 millones, determine:


a) La tasa de crecimiento geomtrico; b) La poblacin estimada para 1997.

3.

Con base en una serie de tiempo se pudieron calcular, mediante un ajuste rectilneo, los salarios
iniciales de los egresados de una facultad, encontrndose que en 1986 eran, en promedio, $72.200 y
en 1993, de $ 380.500. Con base en estos estimativos:
a)

Determine la lasa de crecimiento (aritmtico).

b) Prediga los salarios que tendr el egresado al iniciar su ejercicio profesional, en 1997.

UNIDAD VIII INFERENCIA ESTADSTICA


DESARROLLO BINOMIAL
El binomio de Newton puede describirse en la siguiente forma:

(a b) n a n na n 1b

n(n 1) n 2 2 n(n 1)( n 2) n 3 3


a b
a b bn
1 2
1 2 3

Cada trmino del desarrollo binomial estar dado por la frmula

P C xn p x q n x

Distribucin binomial. Donde: P = probabilidad;

C xn

= combinaciones de n elementos

Ejemplo: En el lanzamiento de cuatro monedas, la probabilidad de que se tengan exactamente dos cara es
igual:

a)

Utilizando la probabilidad elemental se tendr:

nmero de exitos
numero de exitos

espacio muestral total de casos posibles

CCCC

CCCS

CCSS

CSSS

CCSC

CSSC

SCSS

CSCC

SCSC

SSCS

SCCC

SSCC

SSSC

SSSS

SCCS
CSCS
1/16

4/16

6/16

4/16

Nmero de xitos
6
0,375
Total de casos posibles 16
P 37,5%
P

b) Mediante la distribucin binomial, se tiene que:


Cara = p = 1/2;

n = 4 monedas

Sello = q = 1/2;

x = 2, exactamente dos caras

P C xn p x q n x P C 24 (1 / 2) 2 (1 / 2) 2

C xn

n!
4!
24
C 24
C 24
C 24 6
(n x)! x!
(4 2)!2!
4

1/16

1 1
P 6
2 2
P 37,5%

1
P 6
P 0,375
16

DISTRIBUCIN NORMAL
Cuando el valor de n, es demasiado grande, se presenta dificultad en el clculo de las probabilidades, y
por lo tanto se utiliza la distribucin normal.
La distribucin binomial es una distribucin de probabilidad discreta, en cambio la distribucin normal
corresponde a una variable continua, as que los problemas de distribucin binomial (denominado
mtodo exacto), se pueden resolver mediante la distribucin normal (denominado mtodo aproximado},
trasformando la variable discreta en continua. Por otra parte, se debe obtener la media y la desviacin
estndar de una distribucin binomial

np (media) Donde: n = nmero de ensayos, p = probabilidad de xito, q = Fracaso

npq

(desviacin tpica o estndar)

Observemos el ejemplo del lanzamiento de 4 monedas: n = 4; p = ; q = 1/2

1
4 2
2

1 1
4 1
2 2
La distribucin normal grficamente se presenta mediante una curva en forma de campana denominada
indistintamente curva normal, curva de error, curva de probabilidad o campana de Gauss, siendo de gran
utilidad en la inferencia estadstica.

El rea bajo la curva normal es igual al 100/o. La media () se encuentra localizada en el centro,
dividiendo la curva en dos partes iguales, correspondindole a cada una de ellas el 50%.
Para hallar el rea bajo la curva utilizamos la variante estadstica Z, en otras palabras, la
variable X la tipificamos o estandarizamos, mediante la aplicacin de la siguiente frmula.

La adopcin de unidades de Z tiene como fin referir cualquier distribucin normal a un tipo nico cuyos
parmetros sern = 0 y 2 = 1. Si consideramos el lanzamiento de las 4 monedas del ejercicio anterior,
la probabilidad de obtener exactamente dos caras, mediante la aplicacin de la distribucin binomial se
vio que era igual a 0,375 o 37,5%; ahora, mediante la utilizacin de la distribucin normal se tendr:
En primer lugar, la forma de hacer la pregunta vara, ya que en la binomial era P (X = 2) y en la normal
ser P (1,5<X<2,5), trasformando la variable discreta en continua.
Siendo = 2 y = 1 se tendr:

2,5 2
Z
0,5
1
1,5 2
Z
0,5
1
Z

Para Z = 0,5 el rea (ver tabla II) ser igual a 0,1915; por ser simtrico, para Z = 0,5 se tendr el mismo
valor de 0,1915, el rea total de la regin sombreada ser igual a la suma: 0,1915 + 0,1915 = 0,3830 =
38,3%. Se observar que el resultado es bastante aproximado al obtenido mediante la binomial.
LIMITES DE CONFIANZA
El anlisis de una poblacin podra dificultarse dado su tamao, lo cual ocasionara altos costos,
requerira un gran nmero de personas para encuestar y un tiempo demasiado largo, para poder abarcar la
totalidad de las unidades que conforman la poblacin; en algunas investigaciones, el elemento o unidad se
destruye al ser analizado, tal como ocurre, por ejemplo en la vida o duracin de una bombilla, de una
batera para carro, de una pila, en la dureza de un vidrio, de un tornillo, de un alambre, etc., lo cual impide
que tomemos la totalidad de las unidades producidas, ya sea de una mquina o de un conjunto de
mquinas; en otros casos, la poblacin puede ser infinita, como ocurre al analizar las caractersticas de los
peces en un ro. En todos estos casos se hace necesario la realizacin de una muestra, generalmente
aleatoria, que conlleva a tomar tan solo una parte de los elementos que constituyen la poblacin que se va
investigar.
Supongamos que se desea estudiar alguna caracterstica o caractersticas de los empleados de un sector
industrial, por ejemplo: los sueldos.
Podramos recurrir a toda la poblacin (total de empleados en el sector) pero sera muy dispendioso la
recoleccin de esa informacin, debido al nmero tan elevado de empleados. As que se recurre a una
muestra aleatoria de 200 empleados, obtenindose un promedio mensual de $7.200 y desviacin estndar
de $800. El resultado del promedio se infiere, es decir se considera como si fuera el promedio que se

obtiene al tomar la totalidad de los empleados, sin embargo observemos que se podr obtener un nmero
M de muestras posibles de tamao 200 de una poblacin de N elementos, as:

M C nN

N!
( N n)! n! posibles combinaciones

Ejemplo. Supongamos una poblacin pequea de 13 elementos, de la que se van a seleccionar muestras
de 4 elementos. Calcular el nmero de muestras posibles
Resolucin:
N = 13
n=4

M C nN
M=?

M C413
M

N!
( N n)! n!

13! 6.227.020.000

9!4! (362.880)( 24)

6.227.020.000
8.709.120

M = 715 muestras posibles


El anterior resultado nos est indicando que se obtendran 715 medias aritmticas mustrales, con sus
respectivas desviaciones tpicas. Si comparamos las medias aritmticas obtenidas, observamos que son
diferentes unas de otras, por lo tanto no todas las muestras representaran igualmente bien a la poblacin
de la cual se extrajo la muestra.
Se dir de una media aritmtica obtenida a travs de una muestra, que su representatividad con respecto a
la poblacin depender de dos aspectos o caractersticas de la distribucin de la que ha sido extrada; a)
del tamao de la muestra, el cual debe ser determinado en tal forma que sea el ptimo. Sin embargo, el
carcter representativo de la media depende de la raz cuadrada del tamao muestral (

n ); b) de la

desviacin tpica ( s). Si la desviacin tpica es grande, nos estar indicando que los datos se
encuentran muy dispersos en relacin a la media, caso contrario sucede, cuando la desviacin es pequea.
Con las dos caractersticas anteriores se obtiene el error estndar de la media, la que es igual a:

sx

s
n

Cuanto menor sea el error, ms representativa ser la media.

En el ejemplo de los 200 empleados, el error estndar es

s
800

565,7
n
200

sx

Si consideramos que el salario promedio obtenido es de $7.200, siendo uno de los tantos promedios que
se pueden obtener en una muestra al azar sin poder afirmar que sea igual a la media poblacional, lo que
requerir fijar unos lmites de confianza para la media muestral con una probabilidad (por ejemplo del
95%, aceptando que nos equivoquemos 5 veces de 100, o sea con un margen de error del 5/o) dentro de
la cual debe estar la media poblacional. En este caso, la tabla para calcular el rea bajo la curva de
probabilidad nos dice que Z = 1,96 Cmo se halla el valor de z = 1,96? Como el rea total bajo la
curva asumimos que es el 95% = 0.95 este valor de 0.95/2 = 0,475 por ser dos regiones este valor de
0,475 buscamos en la tabla II y vemos a que valor de Z corresponde Z = 1,96 y se tendr que los
lmites para la media poblacional estimada sern:

X xZ

s
n

X 7.200 1,96(56,57)

X superior = 7.200 + 110,88 = 7.310,88

X inferior = 7.200 110,88 = 7.089,12


El resultado anterior nos indica que la media, de todos los trabajadores del sector industrial estudiado,
debe quedar incluida dentro de los lmites con una seguridad del 95%. No es una certeza, ya que hemos
aceptado un error o riesgo a equivocarnos del 5%.
Si conociramos el tamao de la poblacin de la cual se extrajo la muestra, aplicaramos un factor de
correccin para poblaciones finitas, siempre y cuando la fraccin de muestreo f = n/N sea mayor o igual
al 5%.
Siendo 3.500 el nmero total de obreros en el sector, la fraccin de muestreo ser

n
200

0,0571 5,71%
N 3.500
, por lo tanto los lmites de confianza para la media muestral se

calcularn as:

s
1 f
n

X sI x Z

X sI 7.200 110,88 1 0,0571

X sI 7.200 107,67 7.307,67

X sI 7.200 107,67 7.092,33


En el caso de que el tamao de la muestra sea menor o igual a 30 (n 30) se utiliza la tabla III "t" de
Student en vez de la tabla II Z, en la siguiente forma: se determinan los grados de libertad, simbolizado
por la letra griega nu (), siendo = n 1 luego se buscar el valor del error o sea el complemento de la
confianza y se obtendr el valor de t (ver tabla II de "t").
Consideremos que en vez de n = 200, se trabaj con n = 25, por lo tanto = 25 1 = 24. Si la confianza
es del 95%, en la tabla localizamos la columna del 5% o sea 0,05, siendo t = 2,0639. Por otra parte se
considera que < cuando n 30, siendo necesario corregirla de la siguiente manera.
a)

Si la desviacin tpica se ha calculado para n 30 (caso en que el problema da el valor de la


desviacin tpica) se debe corregir as:

ss

n
n 1 ;

25
25 1

s 800

s 800 1,04 800(1,02) 816


y el error estndar ser:

sx

s
816

163,20
n
25

Siendo igual:

s
800
800
sx

163,20
n 1
25 1
24
b) La desviacin tpica se puede calcular directamente corregida

x x

n
ss

n 1

x x

n
n 1

n 1

Los lmites de confianza, siendo n = 25 y = 816 y la confianza de 0,95 sern:

X sI x t

s
n

(sin factor de correccin para poblacin finita dado que f < 0,05)

PRUEBA DE HIPTESIS
Como en la mayora de los casos no se conoce la media poblacional (verdadera), ya que nos tocara
trabajar con todos los elementos que constituyen la poblacin, pero s se puede tener un valor aproximado
como resultado de una larga experiencia debido a continuas evaluaciones que nos permitan tomarlo como
el comportamiento normal de esa distribucin.
As, por ejemplo, se tendr que un fabricante ofrece bateras (pilas) para transistor que tiene una duracin
promedio de 4.000 horas. Un comprador cualquiera adquiere 36 pilas y encuentra que la duracin
promedio es de 3.600 horas, resultado que lo obliga a pensar que est siendo engaado, comprando un
producto de menor calidad, pues la duracin promedio de las 36 pilas fue inferior a la ofrecida por el
fabricante. La desviacin tpica de la duracin de estas pilas fue de 985.
Al nivel del 5%, se quiere saber si el fabricante est ofreciendo un producto de menor calidad.
El proceso que se sigue para la prueba de la hiptesis es el siguiente:
a)

Se plantea la hiptesis nula (Ho) y la hiptesis alternativa (Ha). La prueba puede ser bilateral o
unilateral (derecha o izquierda).

b) Se elige el riesgo o nivel de significacin, que prcticamente es el complemento de lo que llamamos


confianza.
c)

Se dan valores a la variante estadstica.

d) Localizamos el valor obtenido en el punto (c) y tomamos la decisin de aceptar o rechazar la


hiptesis nula; en este ltimo caso, se estar aceptando la hiptesis alternativa.
Aplicando a nuestro problema plateado tenemos:
a)

Planteamiento de la hiptesis
Hiptesis nula Ho: = 4.000 horas

Hiptesis alternativa Ha: < 4.000 horas para prueba unilateral a la izquierda
b)

Margen de error = 0,05 (nivel de significacin)

c)

Desviacin tpica conocida = 985 horas (con distribucin normal y la muestra es aleatoria)

d) Calculo del valor de Z con los siguientes datos

x 3600 horas; = 4000 horas; S = 985 horas; n = 36

s
n

3.600 4.000
2,43
985
36

Como la prueba es unilateral y la campana se divide en 50 % al un lado y 50% al otro lado. Tomamos
slo el 50% de la izquierda es decir el 0,5 y a este valor le restamos el margen de error con el que se
trabaja en este caso 0.05,
0,5000 0,05 = 0,45000 con este valor de rea buscamos el valor de Z en la tabla II Z = 1,64 y
representamos en la campana de Gauss

RC = Regin crtica o de rechazo


ZA = Zona de aceptacin
Siendo que Z calculado = 2,43 cae en la regin crtica, se rechaza la hiptesis nula y se acepta la
hiptesis alternativa. Podemos afirmar al nivel del 5%, que el productor est vendiendo pilas con una
duracin inferior a la garantizada.
La prueba de hiptesis puede ser bilateral, cuando consideramos que el resultado de la muestra puede ser
menor o mayor que el promedio utilizado en la hiptesis nula. Por ejemplo, la pregunta nos planteamos de
la siguiente manera el nivel del 5%, lo asegurado por el fabricante es correcto.
Resolucin
a)

Planteamiento de la hiptesis
Hiptesis nula Ho: = 4.000 horas
Hiptesis alternativa Ha: 4.000 para prueba bilateral o doble cola

b)

Margen de error o nivel de significancia = 0,05

c)

Desviacin tpica conocida o calculada = 985 horas

d) Clculo del valor de Z con los siguientes datos

X =3600 horas; = 4000 horas; S = 985 horas

s
n

3.600 4.000
2,43
985
36

Como la prueba es bilateral al 50% de la campana le restamos /2 es decir 0,05/2 = 0,025 y con este
valor de rea hallamos el valor de Z en la tabla II
0,5 0,025 = 0,4750 con este valor de rea hallamos Z = 1,96; luego identificamos las regiones en la
campana.

Como el valor de Z calculado es -2,43 cae en la zona de rechazo o regin crtica, por esta razn
rechazamos la afirmacin del fabricante.
Si se plantea la hiptesis de que la duracin de las pilas es superior a lo afirmado por el fabricante, la
prueba ser unilateral a la derecha y se plantea de la siguiente manera:
a)

Planteamiento de Hiptesis
Hiptesis nula Ho: = 4000 horas
Hiptesis alternativa Ha: > 4.000 horas

b)

Margen de error = 0,05

c) Desviacin tpica S = 985 horas


d) Clculo del valor de Z con los siguientes datos:

X =3600 horas; = 4000 horas; S = 985 horas; n= 36

s
n

3.600 4.000
2,43
985
36

De igual forma que en el primer caso Z tabulado = 1.64 razn por lo que se rechaza la hiptesis nula.
Cuando n es menor o igual a 30 y el resto de datos se mantienen se procede de la siguiente manera:
S en el ejemplo anterior n = 25 tenemos

X = 3600 horas; = 4000 horas; S = 985 horas; n= 25


Resolucin:
(a) Planteamiento de Hiptesis
Hiptesis nula H0; = 4000 horas
Hiptesis alternativa H; 4000 horas
(b) Margen de error = 0,05

S
(c) Clculo de la desviacin S =

s 985

25
1.005,31
24
horas

Como la muestra es menor que 30 calculamos el valor de t

t
d)

x 3.600 4.000

1,99
s
1.005,31
n
25

Con el valor de los grados de libertad ()


= 25 1 = 24
t = 2,0639
= 0,05

(obtenido en la tabla III de t)

Este valor de t representamos en la campana bilateralmente

En este caso como -1,99 cae en la zona de aceptacin, se podr concluir, al nivel del 5% y con una
muestra menor que 30 el fabricante tiene razn.
Si se trata de una prueba unilateral, el punto crtico de "t" siendo = 0,05, se procede de la siguiente
forma:
= n 1; =25 1; = 24
= 2(0,05); = 0,10 (se toma el doble se unilateral a la izquierda o derecha),
Con = 24 y = 0,10 localizamos el valor de t en la tabla III t = 1,7109 y localizamos las regiones en
la campana.

a) prueba unilateral a la derecha

b) prueba unilateral a la izquierda

DISTRIBUCIN JI CUADRADO
En la aplicacin de la prueba anterior se presentan dos posibilidades, pero en el caso en que se tengan ms
de dos posibilidades, ese procedimiento no es aplicable y se hace necesario la utilizacin de otro tipo de
distribucin, denominado como ji o chi cuadrado,

cuyo nombre se deriva del uso como smbolo de la letra griega , la que se lee ji o chi. La frmula que se
aplica, para el clculo de esta distribucin, es la siguiente:

ni ni *
n1 *

ni = frecuencias observadas o reales


ni* = frecuencias tericas o esperadas
Supongamos que se lanza un dado 120 veces (120 dados una sola vez); la aparicin de las diferentes
caras fueron: el uno, se present 26 veces; el dos, ocurri 23 veces; el tres, 19 veces; el cuatro, 14 veces;
el cinco, 18 veces y el seis, 20 veces. La frecuencia esperada para cada cara es de 20, calculadas as:
E = np
n = 120 lanzamientos
p = 1/6 (probabilidad de presentacin de cada cara)

ni *

1
120
(120)
20
6
6
y as para todas las caras

con la anterior informacin calcularemos el valor de 2


Caras

ni

ni*

ni ni*

(ni ni*)2

(ni ni *) 2
ni *

1
2
3
4
5
6

26
23
19
14
18
20
120

20
20
20
20
20
20
120

6
3
-1
-6
-2
0
0

36
9
1
36
4
0

1,80
0,45
0,05
1,80
0,20
0
4,30

2 = 4,30 (ji cuadrado)


Para la prueba de hiptesis se produce en la siguiente forma:
a) Ho: El dado es correcto (no est cargado)
Ha: El dado no es correcto (est cargado)
b) = 0,05
c) Siendo 2 = 4,30

d) Usando la tabla de 2, el punto crtico 2 calculado ser igual a 11,07.


=n1=61=5
= 0,05
La distribucin es asimtrica positiva, es decir, la curva presenta un alargamiento a la derecha; por otra
parte, slo se tendra una regin crtica, ubicada siempre al lado derecho. En nuestro ejercicio el valor de
ji calculado es 4,30 el cual cae dentro de la zona de aceptacin, por lo tanto, consideramos que el dado es
correcto (no est cargado), en otras palabras, las diferencias que se presentan entre las frecuencias
observadas y las esperadas no son significativas.
Esta distribucin se utiliza frecuentemente cuando los datos estn ordenados en tablas denominadas de
contingencia, que son arreglos en los cuales un conjunto de observaciones se dispone conforme a dos
criterios de clasificacin: columnas y lneas, por ejemplo: dos procedimientos de fabricacin, A y B, han
sido ensayados con el fin de aumentar la duracin de conservacin de productos enlatados.
Los resultados obtenidos son:
FRACASOS

EXITOS

TOTAL

74
54
131

63
66
129

140
120
260

PROCEDIMIENTOS
A
B
Total
A qu conclusin se puede llegar? (nivel del 5%)
Solucin

La anterior tabla es de "2 X 2" ya que se tienen dos columnas (Fracasos y xitos) y dos
Lneas (A y B}. El procedimiento que se sigue es similar al anterior.

p1

140
0,54
200
, o sea que el 54/o corresponde al procedimiento A

p1

120
0,46
200
, o sea que el 46/o corresponde de al procedimiento B

De 260 enlatados 131 fueron fracasos, ahora si lo multiplicamos por 0,54, se obtendr el nmero de
enlatados esperados que fracasen en el procedimiento A; si se multiplica por 0,46, se obtendr el nmero
de fracasos esperados para el procedimiento B, esto mismo sucede con los 129 xitos, que al ser

multiplicados por 0,54 y 0,46, respectivamente, darn el nmero de xitos esperados para A y B,
respectivamente.

ni

ni*

ni ni*

(ni ni*)2

(ni ni *) 2
ni *

77
54
63
66
260

70,74
60,26
69,66
59,34
260,00

6,26
-6,26
-6,66
6,66
0

39,19
39,19
44,36
44,36

0,55
0,65
0,64
0,75
2,59

2 = 2,59 (ji cuadrado calculado)


2
0,05
3,84

(ji cuadrado obtenido en la tabla para = 1)

= (2 1) (2 1) = 1

Siendo 2,59 < 3,84, se acepta la hiptesis, o sea que ninguno de los procedimientos es superior al otro.
Siempre que se tenga una tabla de 2 X 2 es decir que = 1 se debe calcular el valor de n2 utilizando la
correccin de Yates y la frmula ser:

ni

ni*

n i * 0,5

n1 *
ni ni*

n i ni *

ni ni * 0,5

ni * 0,5

ni * 0,5
n1 *

77
54
63
66
260

70,74
60,26
69,66
59,34
260,00

2,20 < 3,84

6,26
-6,26
-6,66
6,66
0

6,26
6,26
6,66
6,66

5,76
5,76
6,16
6,16

33,18
33,76
37,95
37,95

0,47
0,55
0,54
0,64
2,20

Se acepta la hiptesis nula, como en el caso anterior

BIBLIOGRAFA
ESTADSTICA APLICADA A LOS NEGOCIOS Y A LA ECONOMA DE
MARCHAL, WILLIANG edicin # 12

LIND, DOULAS A.

ESTADSTICA PARA LA ADMINISTRACIN Y ECONOMA DE MASN, ROBERT D. edicin # 3


ESTADSTICA APLICADA A LOS NEGOCIOS Y LA ECONOMA DE WEBSTER, ALLEN L. edicin
#3
ESTADSTICA APLICADA A LA ECONOMA DE R. LYMANOTT
BIBLIOTECA VIRTUAL

Você também pode gostar