Escolar Documentos
Profissional Documentos
Cultura Documentos
y
Segundo cuadrante
Primer cuadrante
o
Tercer cuadrante
Cuarto cuadrante
y
3
2
1
-4
-3 -2
-1
x
1
-1
-2
-3
Figura 1.2. Los segmentos en que se subdivide el eje X no necesariamente deben ser iguales a los del eje
Y.
Ntese que los segmentos del eje X no necesariamente son iguales a los del eje Y; por otro lado, el origen
tampoco es siempre el cero, ni las subdivisiones de magnitud unitaria (vase fig. 1.3).
0.90
0.88
0.86
41
37
45
Gracias a los sistemas de coordenadas, es posible localizar puntos en el plano, dando dos valores. En la
figura 1.4 se tiene un sistema coordenado rectangular, en el cual se identifican los puntos P (3,2), Q (-l, 4)
y R (2, - 2). En general, cualquier punto S se representa mediante la notacin S(x, y), siendo x el valor de
la abscisa e y de la ordenada; la pareja (x, y) recibe el nombre de coordenadas del punto. As pues las
coordenadas del punto Q son x = -1, y = 4; el primer nmero corresponde a la abscisa y el segundo a la
ordenada.
y
Q
4
3
2
-2
-1
-1
-2
-3
Figura 1.4. Los sistemas coordenados rectangulares permiten la localizacin de puntos en el plano.
Y
-5
-2
7
22
43
Por supuesto, sta no es la nica tabulacin posible, ya que x puede tomar valores negativos,
fraccionarios, muy grandes, etc.; pero siempre dar lugar aun valor para y a travs de la funcin. Como se
ve, la tabulacin est constituida por parejas ordenadas de valores, que representan puntos en el plano y,
por tanto, pueden trazarse en un sistema coordenado rectangular (vase fig. 1.5).
Figura 1.5. Representacin grfica de la funcin y = 3x2 5. Siendo iguales las escalas en ambos ejes.
Antes se dijo que la longitud de los segmentos en que se subdivide X no necesariamente es igual a la de
los segmentos en que se subdivide el eje Y. De acuerdo con esto, la misma grfica de la figura 1.5 puede
hacerse segn se muestra en la figura 1.6 en donde las unidades en el eje de las abscisas son mayores que
el eje de las ordenadas
Figura 1.6. La misma funcin de la figura 1.5 en un sistema con la escala horizontal ms grande que la
vertical.
Tambin es posible trazar una grfica sin conocer la funcin que representa. Esto sucede cuando en vez
de dicha funcin se tiene la tabulacin, lo cual es tpico de los resultados de experimentos; inclusive del
anlisis de la grfica se puede llegar, con la aplicacin de ciertas tcnicas que se vern posteriormente, al
establecimiento de la funcin satisfaciendo as el objetivo de muchas investigaciones empricas.
Problemas de aplicacin grupo dos
1. Refirindose al ejercicio 2 del grupo 1, hgase la grfica correspondiente
Manualmente o utilizando cualquier programa y realice el anlisis de las mismas.
Al realizar estos ejercicios se observa, en el primero, que la grfica es una lnea recta que, prolongndose
un poco por su extremo inferior, pasa por el origen, en tanto que en el segundo se trata de una curva de la
cual no puede asegurarse lo mismo, es decir, no es rigurosamente vlido continuarla desde el punto P
hacia abajo.
Al hecho de prolongar en una pequea cantidad una lnea recta o curvapor cuales quiera de sus
extremos se le llama extrapolacin, y es una tcnica que permite obtener coordenadas, en forma
aproximada, propias de la grfica, que no se tenan inicialmente. En cuanto a la magnitud de dicha
prolongacin, al decirse que sea pequea significa que no ir ms all de una distancia que comprometa la
regularidad o simetra de la curva. Como esto es muy vago, sobre todo tratndose de curvas, se deja a
criterio del experimentador la decisin de llevar, hasta donde l juzgue prudente, una extrapolacin. Slo
puede decirse que el hacerlo no ser un problema muy grave una vez que llegue a adquirir la habilidad
suficiente para apreciar el tipo de curva que est manejando y el intervalo en que refleja un
comportamiento familiar a travs
Existe tambin la tcnica de interpolacin, consistente en obtener una de las coordenadas, por ejemplo x,
fijando la otra es decir, y a travs de la correspondencia que establece entre ambas la grfica
correspondiente (vase fig. 1.7).
La recta PQ se indica a travs de los puntos A (3.6) y B (6.9); por extrapolacin se tiene P (0,3) y por
interpolacin, C (5,8), eligiendo inicialmente y = 8 y observando a partir de la grfica que, dada esa
ordenada, la abscisa x es 5.
5. PENDIENTE DE LA RECTA
Pendiente de la recta, que pasa por los puntos P (x 1,y1) y el punto Q (x 2,y2) se define como: m =
y 2 y1 y
x 2 x 1 x
.
.
.
y
10
9
7
6
5
4
3
2
Figura 1.7. El punto P resulta de extrapolar la recta AB, y el punto C se obtiene por interpolacin
Y
4.5
11.8
27.1
2. En la grfica del problema anterior obtngase, por interpolacin, la ordenada del punto cuya abscisa
es igual a 10
3. Obtngase la pendiente de la recta del problema 1, empleado las coordenadas del punto que resulta de
ese problema y las del punto del problema 2
6. PROPORCIONALIDAD
Muchas de los datos experimentales con las cuales se trabaja, se expresan mediante funciones del
siguiente tipo:
Y = axn
Siendo a y n constantes reales positivas o negativas. Esta expresin significa a que Y y x n son
proporcionales. En el caso particular en que n = 1, la proporcionalidad entre ambas variables es directa.
Siempre que la n sea negativa, la proporcionalidad ser inversa. A la constante a se le conoce con el
nombre de constante de proporcionalidad. Ejemplo el precio de un artculo es directamente proporcional
al valor de la materia prima.
Problemas de aplicacin grupo cuatro
1.
Ponga tres ejemplos de proporcionalidad lineal, cuadrtica e inversa en el campo en el que usted se
desempea e indique cuales son las variables, el valor de n y el valor de la constante de
proporcionalidad a.
2.
Hallar las ecuaciones que gobiernan a cada una de las curvas que se indica a continuacin y diga a
que relacin existe entre las variables.
4
1
6
5
y
7. SUMATORIA Y PROPIEDADES
Corresponde a una de las tantas operaciones que se realizan en la estadstica, ya que siempre se tendr que
sumar numerosos trminos, los cuales muchas veces deben ser expresados por smbolos o formulas, con
el fin de simplificar su presentacin.
El signo de la sumatoria es (sigma), letra griega que indica suma de, o sumatoria de. Por definicin se
tendr que:
n
i 1
x i x1 x 2 x 3 ........ x n
i 1
i
; Se observa al sigma le acompaa i = 1, que representa el lmite inferior, donde i no
i 1
La expresin
se lee: sumatoria de i igual a uno, hasta cinco de i, lo que quiere decir que i toma
valores desde uno hasta cinco y el resultado final ser la suma de estos valores.
Aplicaciones
5
a).
i 1
= 1+2+3+4+5 = 15
n
i
i 1
Ejemplo.
n
b)
i 1
i 1
12 2 2 3 2 4 2 5 2 55
i 1
5(5 1)(10 1)
55
6
2
Ejemplo
13 2 3 3 3 4 3 5 3 225
i 1
5(5 1)
i
i 1
5
n( n 1)
2
=
50(51)
1275
2
n(n 1)
i
c) i 1
n
i 1
n( n 1)( 2n 1)
6
Ejemplo.
225
Ejemplo
10 10 10 10 10 10 50
i 1
constante k
k nk
i 1
Aqu es ms fcil aplicar la propiedad que dice: la sumatoria de una constante por una variable es igual
al producto de la constante por la sumatoria de la variable.
n
i 1
i 1
i 1
i 1
ki k i 5i 5 i 51 2 3 4 5 51 2 3 4 5 75
f) Si la sumatoria cobija varios trminos, dado que estn dentro del parntesis, o que uno de ellos
multiplique al parntesis, se tendrn tantas sumatorias como trminos tenga el parntesis,
resolviendo cada uno de ellos en forma independiente, para luego obtener un solo total.
5
i 1
i 1
i 1
i 1
3i 8
i 1
, la sumatoria solo cobija el primer trmino y el desarrollo de esta expresin nos quedara
as: 55 + 3i + 8.
5
(i
3i )4
i 1
, la sumatoria cobijara a la
totalidad de los elementos que se encuentran dentro del parntesis. Por consiguiente,
5
(i 2 3i)4
i 1
Ser igual a
i 1
i 1
i 1
(4i 2 12i) 4 i 2 12 i
i 4 5 6 7 8 30
i4
a uno. En este caso se debe tener cuidado con el uso de la propiedad de la sumatoria de una constante.
Veamos:
8
10 10 10 10 10 10 10 60 6(10) 60
i 3
; Es decir, se tendr:
X
i 1
X1 X 2 X 3 X 4
. Hasta aqu sera la solucin, salvo que se indique que cada trmino
X 1 2 ; X 2 5 ; X 3 8 ; X 4 10 ; en este caso, la
10
X
i 1
X 1 X 2 X 3 X 4 2 5 8 10 15
5X
i 1
Cuando el smbolo de la sumatoria se expresa sin lmites explcitos (inferior y superior), se entiende que
la sumatoria abarca desde el lmite inferior i = 1 hasta n.
8. PRODUCTORIA
El producto se simboliza por la letra griega (pi mayscula), que se lee producto de, y tiene una
aplicacin parecida a la de la sumatoria, con la diferencia que en vez de ser sumados, los trminos se
multiplican entre s; por lo tanto, la productoria tendr un lmite inferior y superior, adems del elemento
genrico del producto.
n
i 1
i 1 2 3 4 5 120
i 1
5! 5 4 3 2 1 120 .
4
i 2 12 2 2 3 2 4 2 12 4 9 16 576
i 1
2 2 5 32 2 2 2 2 2
i 1
b) El producto de una constante por una variable es igual a la constante elevada al valor que toma
el lmite superior por la productoria de la variable i, desde el lmite inferior hasta el lmite superior.
5
i 1
i 1
2i 2 5 i 2 5 (1 2 3 4 5) 32(120) 3840
9. RAZN
Gran parte de esta compilacin se dedicar a describir el comportamiento de un hecho o de un conjunto
de observaciones, mediante la elaboracin de cuadros, grficas y la aplicacin de diferentes medidas.
Todo ello encaminado hacia caractersticas cuantitativas, olvidndonos un poco de las cualitativas, que en
algunos casos abarcan gran parte de la informacin que se investiga. Es ese el motivo por el cual se ha
11
considerado necesario explicar algunos conceptos, tales como: razn, proporcin, porcentajes y tasas, que
de alguna manera sern utilizados en las diferentes unidades.
La razn, la proporcin, el porcentaje y la tasa tienen en comn la relacin de dos cantidades que las
simbolizamos por A y B, una como numerador y otra como denominador.
A
La relacin resultante se expresa as: B , con los siguientes efectos:
a)
10. RAZN
Es aquella que mide la relacin entre dos cantidades, permitiendo su comparacin, calculada
generalmente por cociente. Se consideran varios tipos de razones, dependiendo de las caractersticas que
se quieran comparar.
a)
Razn de derivacin. Con esta se compara la intensidad de un fenmeno con la de otro, que es
prerrequisito de su existencia.
12
La razn se simboliza mediante R y se obtiene dividiendo una cantidad qu s puede simbolizar con Y i,
por otra cantidad que simbolizamos mediante Xi.
Y
X
Y
X
Supongamos que se tom una muestra de 10 establecimientos comerciales (n = 10), los que fueron
investigados. Una parte de los resultados est en la siguiente tabla:
NUMERO
DE ORDEN
1
2
3
4
5
6
7
8
9
10
NUMERO DE EMPLEADOS
Total
Hombres
Mujeres
12
15
9
9
12
7
8
6
6
10
94
8
10
7
3
9
3
2
5
4
7
58
4
5
2
6
3
4
6
1
2
3
36
Se puede observar que el nmero de observaciones es n = 10 y que puede calcularse el promedio mensual
de ventas por establecimiento, mediante la aplicacin de la media aritmtica X = 21 438,60/10 =
2143,86 dlares. Sin embargo, si se quiere determinar el promedio de ventas mensuales por empleado,
debe utilizarse la razn: R = 21438,60 94 = 228,07 dlares por empleado en el mes. Otro ejemplo de
razn utilizando la anterior informacin sera establecer la relacin hombres empleados/mujeres
empleadas: R = 58/36 =1,61. Significa que por cada mujer empleada hay 1,61 hombres, y que
multiplicadas ambas cifras por dos nos dara una forma ms clara de interpretarla, es decir, que por cada 2
mujeres hay aproximadamente tres hombres, luego la relacin ser de 2 a 3.
Cuando veamos las medidas de asimetra y de apuntamiento, encontraremos que su expresin matemtica
corresponde a una razn de momentos, en la cual el numerador y denominador son momentos o funciones
simples de momentos.
11. PROPORCIN
Es una forma especial de la razn, en la cual la cantidad dada en el numerador es la frecuencia de una
cierta caracterstica y la del denominador ser el nmero total de unidades consideradas, sea cual fuere el
13
SEXO
Masculino
780
880
TOTAL
Femenino
320
620
1 100
1 500
La relacin hombre/mujer en esta empresa para el ao de 2 005 fue 780 / 320 = 2,44, es decir, que por
cada dos mujeres contratadas se contrataron 5 hombres en ese perodo; en cambio, para 2 006, esa
relacin baj, ya que por cada dos mujeres hay aproximadamente tres hombres. La razn se calcul as: R
= 880/620 = 1,42.
En cuanto a la aplicacin de la proporcin, encontramos que para el ao de 2 005 la proporcin de
hombres fue 0,7090, y la de mujeres es el complemento (0,2910), ya que la suma debe ser igual a uno.
Consideremos que a simboliza el nmero de elementos que presenta la caracterstica investigada, y b la
cantidad de elementos que no la presenta.
a + b = n = total de elementos investigados.
p = a/n = a / (a+b);
p = 780/1.100 = 0,7090
13. TASAS
Se le considera como un tipo especial de razn, con la cual se desea hacer una descripcin de los cambios
sucedidos en un hecho, generalmente en un perodo dado.
Los componentes de una tasa son:
14
a)
El numerador corresponde al nmero de unidades que posee algn tipo particular de eventualidad que
ocurre durante un perodo determinado.
Se utiliza en muchos campos, como en economa, administracin, especialmente en las reas financiera y
contable, en evaluacin de proyectos, en demografa, entre otros.
Vale la pena recordar algunas de las tasas que el estudiante ha escuchado o que posiblemente las utiliza.
Tasa de inters
Tasa de descuento
Tasa efectiva
Tasa nominal
Tasa de desempleo
Conocer y distinguir las escuelas que se han formado alrededor de esta ciencia
15
ETIMOLOGA
No se ha logrado un acuerdo sobre el origen etimolgico de la palabra Estadstica. Para algunos autores,
se deriva del latn status que significa estado, en el sentido poltico. Si se tiene en cuenta que en un
principio los gobiernos la utilizaban para la recoleccin de datos, tambin significa posicin o situacin
de personas o cosas. Para otros, se deriva del vocablo griego statera que significa balanza, dado en parte
a la funcin que cumple en la medicin o peso de los hechos que son objeto de estudio; otros, sostienen
que proviene del alemn staat que tambin significa estado, considerado como una organizacin poltica.
Por lo anterior, se observa que no hay claridad sobre el origen de la palabra Estadstica; sin embargo,
puede afirmarse que la etimologa latina es la ms aceptada, por ser la que ms explica la finalidad de esta
disciplina.
DESARROLLO HISTRICO
Desde la antigedad se encuentran estadsticas rudimentarias relacionadas con registros, censos, ya sea en
el campo econmico, social o educacional. Es as como se tienen informes de su aplicacin e importancia
en tiempos anteriores a la era Cristiana. Se dice
que 2.000 aos antes de Cristo, en China, ya se haban hecho registros y recuentos de la poblacin,
cultivos, fortunas, etc. En otros pueblos, como Siria, Persia, Egipto, se conocan censos de poblaciones y
catastro de territorios. La Biblia tambin nos habla de recuentos estadsticos; lo mismo, Moiss habla de
un registro de los israelitas, de las personas dedicadas a las faenas agrcolas. El nacimiento de Cristo
coincide con la realizacin del empadronamiento o censo de los israelitas.
En pocas del Imperio Romano se tiene conocimiento de estadsticas en todos aquellos hechos en que los
gobernantes requeran informacin sobre las diferentes provincias en las que estaba dividido su Estado.
Dentro del mundo de habla hispana, se tienen informes del ao 727, en el cual los rabes levantaron
diversas estadsticas en la Pennsula Ibrica, as como tambin durante el reinado de los Reyes Catlicos
y de Felipe II, se realizaron censos.
En pocas posteriores al Imperio Romano se hizo ms frecuente y menos rudimentaria la realizacin de
investigaciones, con el fin de producir informaciones ms completas que sirvieran, a la vez, para efectuar
previsiones futuras.
16
En la Edad Media se encuentran estadsticas ms sistematizadas, a tal punto que en algunos lugares se dio
comienzo a organizaciones estatales.
Para algunos, el anlisis estadstico se inicia con el tendero ingls John Graunt (1620- 1674), quien
intenta analizar las causas de las defunciones en Londres, en la primera mitad del siglo XVII. Otros
mencionan a Herman Conring (1600-1681), quien se dedic a describir y a examinar aquellos hechos
sobresalientes del Estado.
En 1 749, aparece lo que se considera la primera obra en que la estadstica es tratada en forma sistemtica,
como ciencia, y es Godofredo de Achenwall o Anchersen (1719-1772) quien la introduce como asignatura
universitaria, con el nombre de Estadstica.
Sin necesidad de citar a "todos aquellos que de una u otra forma contribuyeron al desarrollo de la
estadstica, se debe resaltar a quienes ms aportaron deas bsicas para su fundamentacin, entre ellos
Laplace (1749-1827), quien aplic el clculo de probabilidades al anlisis estadstico; Karl Friedrich
Gauss (1777-1855), quien estableci la distribucin gaussiana de errores resultantes, con su forma de
campana y su simetra, denominada como Curva Normal de Errores. E! belga Adolph Quetelet (17961874) aplic mtodos modernos a conjuntos, y es reconocido como el padre moderno de la estadstica;,
W.S. Gosset (1876-1937), un estadstico de !a Cervecera Guiness, de Dublin, quien escribi con el
seudnimo de "Student" y contribuy con la teora de las muestras pequeas; Sir Ronald A. Fisher (18901962) contribuy a ampliar !a anterior teora y, adems de los diferentes e importantes aportes, se le
menciona con frecuencia por el hallazgo de la Distribucin F.; as mismo Karl Pearson (1857-1936), con
su peridico Biomtrica, influy enormemente en el desarrollo de la estadstica y contribuy con
numerosos mtodos, medidas o procedimientos, siendo el ms sobresaliente el de la Distribucin Chicuadrado; Florence Nightingale (1820-1910), defensora de los mtodos estadsticos, sostena que el
fracaso de muchos directores, empresarios y gobernantes se deba a la insuficiencia de conocimientos
estadsticos.
Adems de los anteriores vale la pena mencionar, como los que ms han influido en los modernos
procedimientos estadsticos, a: Jacobo y James Bernoulli, Poisson, Pierre de Fermat, Pierre Laplace,
Charles Darwin, Francisco Galton, Gregor Mendel, Karl Pearson, David Duncan, Blaise Pascal, Charles
Spearman, Karl Gauss y Frank Yates.
ESCUELAS
Podemos considerar tres grandes escuelas, importantes, que han influido en el desarrollo de la estadstica:
a) La Escuela Administrativa, localizada en Alemania, cre la primera ctedra y cursos de estadstica,
dndole importancia a la informacin requerida por el Estado. Se consideran como los principales
representantes de esta escuela a: Vito de Seckendorff (1626-1689); Hermann Conring, quien inici un
curso de estadstica en la Universidad de Helmstadt, preocupado por los casos ms notables del Estado; su
discpulo Godofredo de Achenwall quien le dio el nombre de estadstica y la separ de la sociologa.
17
b) La Escuela Probabilstica algunos la consideran originaria de Italia, otros de Francia, dada la atencin
prestada a los juegos de azar, que se efectuaban para la recreacin de la nobleza, con el consiguiente
desarrollo de la Teora de las Probabilidades.
Sus principales representantes son: Pascal (1623-1662), Fermat (1601-1665), Laplace (1749-1827),
Poisson (1781 -1840), los Bernoulli y Gauss.
c) La Escuela Demogrfica, creada en Inglaterra, se preocupa por problemas actuariales. Dentro de sta
sobresalen: Sir William Petty, Edmund Halley, Jhon Graunt, King y Devenaut, entre otros. A principios de
este siglo hay una gran preocupacin por su aplicacin en los campos de la agronoma y biometra, lo
cual leda a la estadstica mayor relevancia, colocando as los cimientos y siendo sus principales
exponentes: Galton, Karl Pearson, Gosset y Fisher.
Algunos consideran las siguientes escuelas como las menos importantes: la escandinava, la
norteamericana y la hind, que tambin han colaborado en la fundamentacin estadstica.
ESTADSTICA DESCRIPTIVA E INFERENCIAL
La palabra Estadstica se menciona y se utiliza a diario, sin que se tenga una definicin o significado
igual para personas de formacin e intereses distintos, encontrndonos con una gran variedad de
interpretaciones. Sin embargo, la relacionan con todos o algunos de los siguientes trminos: recoleccin,
clasificacin, tabulacin, descripcin e interpretacin de resultados, estimaciones, proyecciones y
adopcin de decisiones frente a la incertidumbre.
Se podra decir que la palabra estadstica est asociada a trminos o frases tales como: anlisis de datos;
realizacin de experimentos; procesos aleatorios; mtodos cuantitativos; prueba de hiptesis; diseos de
experimentos; decisiones prcticas. Por otra parte, en numerosas ocasiones nos encontramos con muchos
datos, y el problema que se nos presenta es: cmo se pueden organizar, resumir, presentar e
interpretarlos? La estadstica es una buena herramienta para resolver el interrogante. A pesar de la buena
impresin que a primera vista ofrece la estadstica, tambin presenta motivos de impopularidad,
especialmente cuando se hacen encuestas sobre simpatizantes por un candidato o por el gobernante del
momento; los indicadores econmicos entre ellos el ndice de precios al consumidor, utilizado para
indicar las variaciones en los precios de los artculos de primera necesidad y para calcular el porcentaje de
inflacin o prdida del poder de compra del dinero respecto a un perodo determinado.
Para la mayora de tratadistas, la estadstica es un mtodo de investigacin, no slo para la observacin de
un hecho, sino tambin para la formulacin de hiptesis, el diseo de experimentos, la comprobacin de
ciertas teoras, cuando no se puede hacer experimentalmente.
Otros la definen, a menudo, como un conjunto de mtodos para la toma de decisiones en condiciones de
incertidumbre.
18
Algunos la sintetizan, como e! profesor ROS, quien nos da una definicin que abarca a muchas otras, al
decir que la Estadstica "es la ciencia que estudia los hechos colectivos, mediante la observacin
numrica, el anlisis matemtico y la interpretacin lgica, investigando especialmente sus causas y leyes
empricas".
Podramos dar nuestra propia definicin, que sintetice gran parte de las definiciones existentes, diciendo
que la Estadstica es un conjunto de mtodos aplicados en la recoleccin, clasificacin, presentacin
e interpretacin de datos numricos, obtenidos de la observacin de hechos, que permiten, a la vez,
inferir hacia conclusiones lgicas. Vale la pena recalcar que la estadstica moderna es la teora de la
informacin que tiene como objetivo la inferencia.
Por lo anterior, observamos que este conjunto de mtodos cumple dos funciones, igualmente
importantes: la de describir e inferir, permitiendo su clasificacin en:
Estadstica descriptiva. Como su nombre lo indica, describe el comportamiento de un hecho, a travs de
la recoleccin, ordenamiento, clasificacin, presentacin mediante cuadros y grficas, anlisis e
interpretacin y utilizacin de medidas.
La estadstica descriptiva podra resumirse como un conjunto de instrumentos que colaboran en la
depuracin de los datos, en su presentacin clara y en su simplificacin para la interpretacin, anlisis y
publicacin. Se podra agregar que un cuadro claro, acompaado de una grfica que visualice, ms la
aplicacin de una o varias medidas bien empleadas, permite descubrir y describir la "verdad" que encierra
un conjunto de datos.
Algunos consideran que si slo se investigara la totalidad de las observaciones de una poblacin objetivo,
bastara con la aplicacin de la estadstica descriptiva, cuyo proceso sera, como ya se ha dicho
repetidamente, la recoleccin, presentacin y anlisis de la informacin obtenida. Sabemos, adems, que
en la mayora de los casos eso no es posible por varios motivos, entre otros: costo y tiempo, que obligan a
realizar investigaciones ms pequeas denominadas muestras, a travs de las cuales se estiman los valores
de esa poblacin, para los cuales el investigador requiere determinar la extensin, validez y confianza del
proceso, valindose para ello de la inferencia estadstica.
Estadstica inductiva o inferencia. Son aquellas tcnicas aplicadas en investigaciones parciales,
denominadas muestras, que permiten la obtencin de ciertos resultados mediante la aplicacin de
medidas, considerados como estimadores de los valores estadsticos de la poblacin, es decir, los
parmetros.
19
La estadstica inductiva parte de los datos depurados y condensados, que facilitan el anlisis, el
establecimiento de relaciones y correlaciones, la aplicacin de mediciones especiales que permiten inferir
y contrastar hiptesis en aquellos campos donde no existen verificaciones fsicas.
Estadstico es aquella persona que aplica mtodos estadsticos y maneja cifras, que representan
informacin de hechos, recogidos a travs de la observacin o experimentacin.
Estadsticas son todas aquellas informaciones que aparecen en publicaciones en forma de cifras, cuadros
o grficas, las cuales han sido ordenadas en forma sistemtica, para mostrar el comportamiento de un
hecho que ha sido objeto de estudio.
IMPORTANCIA
La importancia que hoy tiene la estadstica radica en sus grandes aplicaciones en las diferentes
actividades. En la vida cotidiana leemos, interpretamos o usamos datos, muchas veces sin tener
conocimiento de lo que es la estadstica, pero la persona con algunos principios estadsticos, sacar mejor
provecho de la informacin. Si se trata de un profesional, la importancia de estos instrumentos ser mejor,
ya que ser utilizada en su campo de accin.
La estadstica es considerada como una herramienta de vital importancia en la toma de decisiones, pues
nos suministra informacin para la valoracin de planes y programas; adems, su adecuada utilizacin
depender en especial del conocimiento, habilidad y experiencia de quien la emplea.
Vale la pena repetir lo dicho por Salomn Fabricanl, sobre su importancia: "todo el mundo parece
coincidir en que la estadstica puede ser til para comprender, evaluar y controlar el funcionamiento de la
sociedad". Por otra parte, H. G. Wells deca: "el pensamiento estadstico un da ser tan necesario para
una ciudadana el eficiente como el saber leer y escribir". Todo lo anterior queda corroborado si
observamos que la mayor parle de los acontecimientos que diariamente ocurren en la sociedad, en
cualquier campo, se encuentran estrechamente ligados a la concepcin de nmero y medida. Es tan
cierto esto que podramos afirmar, sin temor a equivocarnos, que la mayor parte de las actividades del
hombre o de las instituciones, por no decir que todas, no importa la rama que desarrollen, estn afectadas
en mayor o menor grado por decisiones basadas en antecedentes de tipo cuantitativo.
El profesional podr comprender la importancia que tiene la estadstica si observa desprevenidamente
algunos de estos puntos de reflexin:
a)
los mtodos estadsticos se utilizan a diario, tanto en el sector pblico como en el privado;
b) las noticias que frecuentemente se dan en los diferentes medios de comunicacin requieren la
interpretacin estadstica;
20
c)
algunas de las materias del plan de estudios necesitan de la aplicacin de estos conocimientos;
21
La estadstica tiene un vasto campo de aplicacin, tanto en las empresas comerciales como en las
industriales. Si consideramos que la empresa es una organizacin dentro de la cual se realiza una serie de
operaciones, casi siempre con la meta de obtener beneficios del capital invertido, concluimos que requiere
una informacin organizada que sirva de control y que permita hacer planes futuristas.
Podramos decir que la estadstica, dentro de la empresa, cumple, entre otras, las siguientes funciones:
a)
permite obtener una visin general de la empresa y de algunos de sus aspectos en particular;
ayuda a analizar y a separar lo que es normal de lo que no lo es, es decir, permite ejercer control en
muchas de las actividades u operaciones de la empresa.
aquellos procesos que permitan recolectar, agrupar, concentrar o describir con mayor facilidad ese
cmulo de informacin, a travs de lo que algunos llaman "reduccin de datos";
b) el anlisis de los datos, mediante la observacin directa o el desarrollo de experimentos, con el fin de
realizar estimaciones o comprobacin de hiptesis;
c)
determinar o indicar los cambios que sufren los datos a travs del tiempo, o estimar su
comportamiento futuro.
22
Deben manifestarse al exterior, es decir, no se refiere a observar su presentacin, como por ejemplo
el contrabando, pues para ello bastara visitar los Sanandresitos. La manifestacin, o su observacin,
debe hacerse mediante registros. Si en los registros se presentan deficiencias, ellas se reflejarn en las
estadsticas. Muchos usuarios critican las estadsticas del sector oficial as como las del sector
privado, encontrndolas poco confiables o deficientes, pero no se dan cuenta de que la falta de
conciencia o el desinters de algunas personas hace que muchas de las informaciones no se registren;
tal es el caso de los robos, violaciones domiciliarias, entre otras, donde la gente no acude a colocar el
denuncio correspondiente. As que los indicadores sobre estos hechos slo harn referencia a las
informaciones registradas, y slo sobre ellas se aplicarn los instrumentos de medicin. As se
podr decir que aquellos hechos que no son registrados, no sern abarcados por la estadstica.
b) Adems de ser registrados, requieren para su estudio que correspondan a hechos colectivos,
descartando los individuales; es decir, lo sucedido a una persona no ser analizado en forma
particular, debiendo formar parte de un grupo, masa o colectivo de datos para su estudio. El registro
de la produccin por parte de una empresa, slo tendr un inters particular, pero si el gobierno es
quien piensa intervenir el mercado, la informacin formar parte del sector que se analiza.
c)
Se podr agregar otra condicin como es la de su frecuente repeticin. Un hecho que se presente en
forma aislada, es decir, que ocurre una vez y difcilmente vuelve a ocurrir, no es observado por la
estadstica y queda slo como un registro histrico. Cuando decimos que el hecho debe repetirse, no
nos referimos a que ocurra a cada momento; es posible, en algunos casos, que transcurra cierto
tiempo parque se repita, tal como sucede con aquellos productos estacionales, o en l caso de la
matrcula que ocurre cada ao o cada semestre. Debido a su presentacin en forma peridica, se les
considera como hechos distantes en el tiempo.
23
requiere que el hecho se presente en el mismo lugar, puede estar ocurriendo en diferentes sitios; por
lo tanto, la estadstica abarca tambin aquellos hechos distantes en el espacio.
e)
Finalmente, se podr decir que aquellos hechos cuyas caractersticas cualitativas pueden
cuantificarse, son tenidos en cuenta por la estadstica. El amor a la patria o al trabajo no se pueden
medir, pero s el nmero de personas por cargos, ocupacin, sexo, profesin, el nmero de artculos
vendidos por departamento, marcas, modelos, sucursales, etc., son ejemplos de caractersticas
cualitativas que s abarca la estadstica.
CUESTIONARIO
1.
24
2.
Finalidad de la estadstica.
Explique brevemente las razones que usted sostiene para que se ensee la estadstica en cursos de
formacin econmica, contable, administrativa y financiera.
4.
5.
d) Investigacin de mercados
b) Publicidad
e) Economa o finanzas
c) Plantel de enseanza
f) Poltica
Identifique y describa con ejemplos las condiciones bsicas que debe reunir un hecho para ser
estudiado por la estadstica.
6.
7.
Para ilustrar la importancia y aplicacin que tiene la estadstica d ejemplos, para cada una, de las
siguientes funciones que desarrolla una empresa:
a)
b)
Direccin de personal
c)
Direccin de produccin
8.
25
Para el buen desarrollo y entendimiento de los diferentes temas que trataremos ms adelante, es necesario
hacer claridad sobre los conceptos que se utilizan en estadstica y tenerlos presentes a cada momento.
POBLACIN
En la forma ms simple, puede decirse que este trmino estadstico se refiere a un conjunto finito o
infinito de elementos. Es sinnimo de agregado y, cuando lo empleamos, no nos estamos refiriendo
nicamente a un conjunto de seres vivientes, a la poblacin de una regin o a una ciudad, como se podra
entender en principio.
El termino poblacin, tambin conocido como universo, se refiere a la totalidad o conjunto de medidas, o
al recuento de todos los elementos que presentan una caracterstica comn.
De acuerdo con el nmero de elementos que constituyen la poblacin, la clasificamos en finita o infinita.
En el primer caso, se tendr un nmero limitado de elementos o unidades; en el segundo, ser ilimitado.
Definir la cobertura, es decir, identificar y determinar el tamao de la poblacin que va a ser objeto de
estudio, es de gran importancia en una de las primeras etapas de la investigacin estadstica.
El conjunto de estudiantes de un plantel, podramos considerarlo como una poblacin finita; pero si nos
referimos a todos los estudiantes de un pas, no slo en el presente, sino en el pasado, tendramos una
poblacin infinita. En una empresa comercial seran numerosas las poblaciones de estudio que
podramos mencionar. Algunas de ellas podran ser: lotes de unidades producidas durante un
perodo; cuentas por cobrar o de difcil cobro; nmero de empleados que laboran, etc.
UNIDAD O ELEMENTO
Es el objeto, institucin, regin, persona, familia, animal, etc., que va a ser sometido a estudio, en cuanto
a aquellas caractersticas que ms nos interesan. Esta unidad debe estar claramente definida, entendida
por todos, sin equvocos; adems, debe permitir ser medida o contada, adecuada al tipo de estudio y,
finalmente, que nos permita hacer comparaciones.
CARACTERSTICA
Los elementos que conforman la poblacin objetivo deben poseer ciertos rasgos o cualidades
denominadas caractersticas y son las estudiadas en cada una de ellas; por lo tanto, todas las deben poseer,
es decir, debe ser comn su presentacin, para que guarden relacin con el objetivo de la investigacin.
En los ejemplos dados en la definicin de poblacin, mencionbamos los estudiantes de un plantel; stos
como conjunto, constituyen la poblacin objeto; el estudiante es el elemento y las caractersticas que se
van a estudiar podran ser: calificaciones, asistencia, edad, sexo, curso, nivel o grado, procedencia,
aficiones, etc. En el caso de la empresa comercial, las poblaciones seran el total de unidades o lotes
producidos en un perodo; las cuentas por cobrar, el nmero de trabajadores, etc. Los elementos
son: unidades, cuentas y empleados de la empresa, respectivamente, y las caractersticas que se van a
26
estudiar, entre otras, seran: calidad, peso, resistencia, dureza del artculo; valor de las cuentas, tiempo de
vencimiento, concepto de la deuda; horas trabajadas; accidentes de trabajo; asistencia, antigedad,
salarios devengados, cargos, estudios realizados, tiempo de experiencia, visitas al mdico, tiempo de
incapacidades, etc.
Observando las anteriores caractersticas notamos que se conforman dos grupos: el primero se expresa
mediante palabras, tales como: sexo (masculino, femenino); grado (primero, segundo,..., undcimo);
aficiones (canto, lectura, deportes, teatro,...); calidad (defectuosos, no defectuosos); estudios (economa,
administracin, .), entre otros. Consideradas como caractersticas cualitativas, su cuantificacin se
obtiene mediante el recuento: cuntos hombres y mujeres hay; cuantos alumnos hay en cada grado, etc.
Estas son conocidas tambin como atributos, y pueden admitir varias formas de presentacin,
denominndolas modalidad o categoras.
El segundo grupo est conformado por aquellas caractersticas que se expresan en forma numrica, tales
como: peso, valor, tiempo, nmero de accidentes o visitas al mdico. A las anteriores se les considera
como caractersticas cuantitativas, conocidas tambin como variables, las que, a su vez, tericamente
se clasifican en variables discretas y continuas. Las primeras son aquellas que admiten nicamente
valores enteros: el nmero de accidentes o visitas al mdico, son ejemplos. Las continuas admiten
fracciones, como por ejemplo, peso: 30 libras y 10 onzas; tiempo de experiencia dada en aos, meses y
das, etc. Las variables discretas se cuantifican mediante el recuento; en cambio en las variables
continuas se procede mediante la medicin.
INVESTIGACIN TOTAL
Denominada tambin censo o investigacin exhaustiva, se presenta cuando investigamos la totalidad de
los elementos que constituyen la poblacin objetivo.
Cuando nos referimos a un censo de poblacin, de viviendas, agropecuario o industrial, por ejemplo,
estamos indicando una enumeracin completa de unidades, ya sean personas, familias, viviendas,
establecimientos industriales o explotaciones agrcolas en un tiempo dado, con unas caractersticas
especficas.
La investigacin total, en muchos casos, es impracticable, como por ejemplo:
a)
cuando los costos son elevados, superando los recursos disponibles para su realizacin;
d) en casos tales como en el control de calidad, el elemento sometido a prueba puede destruirse,
impidiendo la investigacin de la totalidad; se podrn aadir algunas situaciones ms: cuando la
27
empresa no cuenta con personal suficiente para su realizacin; tambin, cuando existe dificultad en la
recoleccin de la informacin.
MUESTRA
Es la parte seleccionada de la poblacin, que contiene una caracterstica igual a la que no qued
seleccionada.
Podramos ampliarla, diciendo que corresponde a una parte de la poblacin o subconjunto de un conjunto
de elementos, que resulta de la aplicacin de algn proceso estadstico, generalmente seleccin
deliberada, con el objeto de investigar las caractersticas de los elementos de la poblacin o del conjunto
del cual proviene.
Utilizamos la investigacin por muestreo, cuando no es posible la investigacin total.
Este procedimiento es menos costoso, ms rpido, requiere menos personal y nos puede proporcionar
mayor precisin en los resultados.
Nos referimos a la observacin parcial o muestra cuando investigamos parte de los elementos de una
poblacin. Algunos la denominan como subpoblacin, sin ninguna diferenciacin; otros, por el contrario,
y con la cual no nos identificamos, la consideran como aquella parle seleccionada, cuyos elementos
presentan una caracterstica tan especial, que el resto de la poblacin no la tiene. Lo anterior no
corresponde a la definicin de muestra y ms bien concuerda con el concepto de estrato.
La muestra ser representativa de la poblacin si las probabilidades de seleccin de los elementos
son todas iguales, durante todo el proceso, y que denominaremos como muestra aleatoria.
En el caso de que algunos de los elementos de la poblacin tengan ms probabilidad de presentacin que
otros, la denominaremos como muestra no aleatoria. Este es el caso de la mayora de las encuestas de
opinin, donde los elementos se seleccionan en forma caprichosa o por conveniencia; por esta razn, sus
resultados no merecen confianza.
Por muestreo se entiende la utilizacin de cualquiera de los procedimientos establecidos para obtener una
muestra. No debe perderse el objetivo del muestreo, que es considerar el mayor nmero de elementos con
el menor costo posible.
MUESTREO ALEATORIO
Se tienen diferentes mtodos de muestreo al azar, cuya aplicacin depender de las condiciones en que se
presente la poblacin y de las caractersticas que se van a investigar en sus unidades. Haremos mencin
de algunos de ellos, en forma bastante sintetizada:
Muestreo aleatorio simple. Como su nombre lo indica, los elementos de la poblacin deben tener igual
probabilidad de ser seleccionados para formar parte de la muestra. En este mtodo debe elaborarse un
28
listado, completo, actualizado y correctamente identificado, de los elementos que forman parte de la
poblacin, y que van a ser seleccionados por algn mtodo al azar, como el sorteo, extrayendo de un
recipiente fichas o papeletas, cada una de ellas identificando a la unidad, procedimiento similar al del
bingo; adems, se podr utilizar la calculadora, oprimiendo primero la tecla INV y, luego, punto,
despreciando el 0, que aparece en pantalla; tambin se puede hacer mediante las Tablas de Nmeros
Aleatorios, construidas especficamente para esto.
Muestreo estratificado. Aplicado cuando la poblacin requiere ser dividida en subpoblaciones o estratos,
buscando que cada uno de ellos sea lo ms homogneo posible, y donde un elemento dado no pueda
pertenecer a ms de un estrato. Una vez establecidos los estratos, se elige en cada uno de ellos una
muestra al azar.
Muestreo sistemtico. Es muy aplicado en aquellos casos en los que la caracterstica investigada est
ordenada, ya sea alfabticamente, por valor o cantidad, o en forma cronolgica. El procedimiento de
aplicacin es bastante simple: se calcula un intervalo de seleccin, obtenido al dividir el tamao de la
poblacin por el nmero de elementos en la muestra. Al seleccionar al azar un nmero dentro de ese
intervalo, ste es el que se constituye en punto de iniciacin o primer elemento seleccionado, y luego se le
va sumando el valor del intervalo.
N
n = intervalo de seleccin
Muestreo por conglomerados. Se emplea a menudo para reducir el costo de muestrear una poblacin
dispersa en un rea geogrfica extensa. Tambin se utiliza cuando es imposible elaborar un marco con
elementos finales o de anlisis; por tanto, se toma la unidad, es decir aquella que contiene ms unidades o
elementos y que constituye el denominado conglomerado. En este caso seleccionamos al azar
conglomerado y tomamos de ellos los elementos de la muestra.
Muestreo por etapas. Cuando de un marco se extrae una muestra de conglomerados, para luego de esa
muestra extraer otra muestra y as sucesivamente hasta llegar a la unidad o al elemento de anlisis, se le
denomina muestreo por etapas. Algunos lo denominan muestreo por reas o geogrfico.
El muestreo aleatorio tiene grandes aplicaciones en el campo de la auditoria y la contabilidad, y los
ms conocidos son:
a) muestreo de estimacin de atributos;
b) muestreo de aceptacin y
c) muestreo de descubrimiento.
Vale la pena mencionar algunas pruebas que se realizan en auditoria.
Pruebas de cumplimiento, cuyo propsito es comprobar la efectividad de un sistema de control; para
ello debe reunir evidencia suficiente sobre la eficacia de un control interno, mas no sobre la transaccin
en particular.
29
Pruebas sustantivas, cuyo objetivo es obtener evidencia acerca de la validez y tratamiento contable
apropiado de las transacciones, para detectar los errores o irregularidades que pudo haberse cometido.
MUESTREO NO PROBABILSTICA
En este mtodo las unidades no se seleccionan al azar, sino en forma caprichosa, por conveniencia o con
alguna intencin; de ah se deduce que sus resultados no son confiables. Dentro de este mtodo se tiene,
entre otros, el muestreo voluntario, el muestreo de juicios y el muestreo por cuotas.
Muestreo voluntario. Es aquel en el cual las unidades o elementos seleccionados llenan un cupn que
aparece en alguna publicacin o realizan una llamada, para dar la informacin solicitada en forma
voluntaria.
Muestreo de juicios. Llamado tambin intencional, ya que las unidades se seleccionan a juicio del
investigador, ya sea por conveniencia o con alguna intencin. Algunos las denominan muestras dirigidas.
Muestreo por cuotas. A cada persona encargada de recolectar la informacin se le asigna cierto nmero
de unidades o elementos mustrales, en donde la seleccin de ellos depende de la decisin que tome el
entrevistador, aunque para ello se le dan ciertas indicaciones.
PARMETROS Y ESTIMADORES
En cuanto a las caractersticas de las unidades de la poblacin, frecuentemente nos interesa la aplicacin
de algunas de estas medidas:
La media o promedio, por ejemplo, de horas trabajadas, el ingreso medio de los empleados, el
rendimiento medio de algodn por hectrea.
El total de establecimientos comerciales en una ciudad, es de granos recolectados en una cosecha, el total
de faltas de asistencia de alumnos a clase durante un perodo.
La proporcin de nias que estudian bachillerato comercial; de establecimientos dedicados a la
distribucin de cierto artculo; la de bachilleres que prestan el servicio militar obligatorio.
La razn del gasto en alimentos y vivienda, la relacin o razn de hombres y mujeres, cuando decimos
que por cada hombre hay dos mujeres en el establecimiento escolar.
A estas y otras medidas aplicadas a las caractersticas de la poblacin se les denomina parmetros o
valores estadsticos de la poblacin y aplicadas a las caractersticas de las unidades en la muestra se
les llama estimadores; algunos las identifican como estadgrafos.
Pitman establece diferencia entre estimador y estimacin. Al primero lo considera como la norma de
procedimiento utilizada para estimar una constante perteneciente a una poblacin; y la segunda, para los
resultados o valores obtenidos.
30
El estimador se clasifica en puntual cuando hace referencia a un solo valor o punto calculado; y por
intervalos cuando corresponde a dos puntos dentro de los cuales se considera estar contenido el
parmetro, con cierto grado de confiabilidad establecido por el investigador.
Un intervalo de confianza nos indica los lmites de precisin en una inferencia. Recordemos que uno
de los objetivos de la estadstica es sacar conclusiones o generalizar acerca del parmetro, mediante el
clculo de estimadores, en una muestra extrada de una poblacin.
SERIES DE TIEMPO
Conocidas tambin con el nombre de Series Cronolgicas. En las actividades diarias hay cantidades de
investigaciones que se realizan una vez y no vuelven a repetirse; son investigaciones aisladas no
peridicas. En cambio, existen otras; que requieren que su observacin sea peridica, guardando un
orden cronolgico, es decir, que son registradas a travs del tiempo, a medida que se van produciendo.
Estas, series son de gran utilidad tanto parar el gobierno como para las empresas, permitiendo observar e
indicar los cambios o variaciones que se producen en el dato, durante un determinado perodo; por otra
parte, facilita predecir su comportamiento futuro, suponiendo que las condiciones observadas durante su
registro van a ser las mismas en el lapso estimado.
Son ejemplos: las ventas, produccin, matrcula, desercin, exportaciones, etc. El anlisis de cada una de
ellas permite tomar decisiones.
PROBABILIDAD
Es uno de esos trminos imposibles de ser definidos adecuadamente. Sin embargo, diremos que es la
creencia que tenemos de la ocurrencia de un suceso, para lo cual nos basamos en la experiencia. Puede
decirse que es un valor comprendido entre uno y cero, el cual resulta de dividir el nmero de xitos por el
total de casos posibles. Se define como probabilidad clsica o emprica.
La probabilidad apriori es aquella que podemos determinar sin necesidad de realizar el experimento. Tal
es el caso del lanzamiento de una moneda, evento en el cual consideramos la aparicin de cara como
xito, igual a 0,5.
NMEROS NDICES
Son cifras relativas expresadas en trminos porcentuales, que indican las variaciones en las cantidades,
valores o precios durante el perodo que se est investigando, respecto a otro que se considera base.
Los rasgos ms importantes de la construccin de un nmero ndice son: su cobertura, el perodo base, el
sistema de ponderacin y el mtodo de promediacin de las observaciones.
GLOSARIO
Atributo
Cobertura
31
Caractersticas
Muestreo de atributos
Caractersticas cualitativas
Muestreo de aceptacin
Caractersticas cuantitativas
Nmeros ndices
Censo
Observacin parcial
Elementos
Perodo base
Estimacin
Poblacin
Estimador
Poblacin objetivo
Estimacin puntual
Poblacin finita
Poblacin infinita
Error
Promedio
Intervalo de confianza
Proporcin
Investigacin total
Probabilidad
Investigacin exhaustiva
Probabilidad apriori
Medicin
Razn
Media
Recuento
Muestra
Series de tiempo
Muestreo
Series cronolgicas
Muestreo aleatorio
Sesgo
Subpoblacin
Muestreo voluntario
Unidad
Muestreo no aleatorio
Universo
Variables
Variables discretas
Muestreo sistemtico
Variables continuas
CUESTIONARIO
1.
En cada uno de los casos sealados, en la siguiente lista, indicar si es variable o atributo; al mismo
tiempo, establecer la medida ms indicada (media, total, proporcin).
32
a)
El directorio de una ciudad data de 4 aos atrs y tiene las direcciones a lo largo de cada calle, con
los nombres de las personas que viven en cada direccin. Cules son las deficiencias de este marco,
si se utiliza para tomar una encuesta por muestreo? Pueden ser corregidas tales deficiencias durante
los trabajos de terreno? Al usar el directorio, extraera usted una lista de direcciones o una lista de
personas?
3.
4.
b) Parmetro y estimador.
Utilizando como poblacin los estudiantes de su plantel, identifique 10 caractersticas. Diga cules
son atributos y cules variables. En las variables distinga las discretas y las continuas.
6.
Seale con una (A) las series constituidas por datos cualitativos y con una (V) las que son
cuantitativas:
7.
a) Nacionalidad
d) Profesin
h) Gasto en alimentacin
b) Temperatura
c) Estado civil
g) Filiacin poltica
Los directivos de una fbrica estudian un programa de vivienda para sus empleados y solicitan
informacin a un grupo de 30 de ellos de un total de 350 empleados, sobre el nmero de habitaciones
que requerir su vivienda, en el caso de salir favorecido en el programa. Es de aclarar que la
investigacin se hace nicamente a aquellos que tiene ms de cuatro aos de antigedad y en la
actualidad no tienen vivienda. Cul es la:
a) Poblacin?
8.
a)
b) Muestra?
d) Caracterstica?
33
b)
Si se toman las hojas de registro de matrcula de los alumnos de un instituto y se selecciona una
muestra de 20 hojas a intervalos regulares.
c)
Si de una muestra de frutas que se encuentran en un recipiente bastante grande, se toma como
muestra la porcin correspondiente a los 10 centmetros de la parte superior de la vasija.
d)
Si para conocer el sentimiento popular sobre una medida de orden pblico, se, entrevistan a 30
personas que pasan por; un sitio importante de la ciudad.
FUENTES DE INFORMACIN
Las fuentes de informacin se clasifican en internas y externas.
Las fuentes internas: all los datos se producen y se registran internamente dentro de la empresa, donde se
puede obtener informacin sobre ventas, produccin, cuentas por cobrar, consumo de materia prima,
horas trabajadas, etc.
Quiz por desconocimiento, o ignorancia, muchos no le dan importancia a las fuentes de informacin
interna, y slo las consideran como operaciones corrientes que forman parte de la rutina de los
departamentos de contabilidad, ventas, produccin, recursos humanos, etc., desconociendo que la
verdadera investigacin comienza precisamente all para iniciar, de esta manera, la bsqueda de
informacin externa, por no encontrarse sta dentro de los archivos y documentos de la empresa.
Las fuentes externas: son aquellas que nos suministran informaciones o datos de lo que sucede fuera de la
empresa. Estas informaciones se obtienen de boletines, revistas, peridicos, publicaciones especializadas
o informes realizados por otras entidades o empresas.
Tambin las fuentes de informacin se clasifican en primarias y secundarias. Cuando una persona, entidad
o empresa realiza una investigacin, con las consiguientes etapas de recoleccin, procesamiento y
anlisis, esta informacin se constituye en fuente primaria; en cambio, para otra persona, entidad o
empresa diferente a quien la produce, se convierte en fuente secundaria.
Algunos denominan a las fuentes primarias mtodos de observacin directa, ya que la informacin la
recoge el interesado, mediante la aplicacin de un formulario o cuestionario. Gracias a ellas se observan o
se registran los datos directamente de la fuente de informacin, o sea, de la unidad que es objeto de
estudio.
CLASES DE INVESTIGACIN
La investigacin se podr clasificar en dos clases: descriptiva y experimental.
Investigacin descriptiva. Se realiza sobre hechos reales con e] fin de explicar, de modo sistemtico,
sus caractersticas. Esta clase de investigacin comprende etapas como la recoleccin, descripcin,
anlisis e interpretacin de los datos; tambin puede referirse al anlisis de datos provenientes de fuentes
secundarias. Se puede decir que, generalmente, se utilizan el mtodo de casos y el estadstico.
34
2.
Formulacin de objetivos.
3.
Unidad de investigacin.
4.
Formulacin de hiptesis.
5.
6.
Recoleccin de datos.
7.
8.
9.
1.
35
etc., que en algunos casos pueden mostrar anormalidad, sntomas sobre los cuales se deben disear
los correctivos por aplicar, con base en la formulacin de una serie de hiptesis.
La decisin de realizar una investigacin nace cuando se siente la necesidad de disear correctivos o
fijar polticas a corto o largo plazo, que mejoren la situacin de la empresa, y cuando no se dispone
de una informacin adecuada, lo cual requiere de la elaboracin de un plan de investigaciones, que
permita la recoleccin y anlisis de esos resultados.
Se debe tener muy en cuenta que las conclusiones estadsticas dependern en gran parte de la
informacin recogida y sta, a su vez, depender de la formulacin del problema.
2.
Formulacin de objetivos. Tendrn que estar claramente definidos, indicndose lo que se desea
hacer. Qu se va a investigar? Cmo se va a realizar? Cmo se pueden obtener los datos? Si
mediante una investigacin parcial o total. Cul sera el diseo de muestreo? Qu cobertura
tendra? Dnde se va a investigar? En qu lugar? Qu reas debern ser incluidas? Cundo es el
momento ms indicado para llevarlo a cabo? Cundo se necesitan? Para qu se requiere la
informacin? A quin va dirigida? Cul es la unidad de investigacin?
3.
4.
Formulacin de hiptesis. Las hiptesis son supuestos que se hacen en una investigacin para luego
ser comprobados. Las hiptesis estadsticas son aquellos supuestos hechos respecto a valores de la
poblacin o parmetros, y cuya comprobacin requiere la aplicacin de mtodos estadsticos.
Aquellas que no hacen referencia a un valor: media, proporcin, razn, etc., son simplemente
hiptesis. Son ejemplos de hiptesis descriptivas: que el rendimiento del curso en el presente perodo
lectivo es bueno; que en un Gobierno de coalicin, la inmoralidad de los funcionarios disminuir; que
si hay inversin social, la situacin de orden pblico mejorar, etc.
En cambio si dijramos que los salarios en el ao venidero aumentarn por encima del ndice de
precios al consumidor, o que los precios en diciembre subirn en una proporcin inferior a la del ao
pasado, todos ellos sern ejemplos de hiptesis estadsticas.
36
5.
Mtodo de investigacin. Se vio anteriormente, que la investigacin puede ser total (censo) o parcial
(muestra), dependiendo de ciertos factores que tambin se mencionaron: como costo, tamao de la
poblacin, tiempo.
deber seleccionar la estrictamente necesaria, dependiendo tambin del nmero de unidades que se
va a investigar, su dispersin geogrfica y el grado de variabilidad que la caracterstica presenta.
El diseo de la encuesta por muestreo nos ayudar a controlar la cantidad de informacin y su
variacin, y en la decisin sobre cul es el mtodo ms indicado en esa investigacin. Se proceder
luego a establecer el mtodo de medicin o recoleccin de datos, siendo los ms usuales entre otros:
las entrevistas personales, por telfono, la observacin directa, cuestionarios enviados por correo,
Internet, etc. Cada uno de ellos presentar ventajas y desventajas. Cualquiera de estos mtodos que se
vaya a aplicar, se tendr muy en cuenta al elaborar preguntas que minimicen la falla de respuestas, o
contestaciones incorrectas. Al disear un cuestionario vale la pena considerar ciertos aspectos: a)
Incluir nicamente las preguntas que sean necesarias, puesto que un elevado nmero incrementar su
costo y tiempo; b) hacer preguntas claras, concisas, utilizando trminos a nivel del informante, para
que sean entendidas por todas aquellas personas involucradas en el estudio; c) no hacer preguntas que
de antemano estamos seguros no van a ser contestadas; d) iniciar con las preguntas generales, para
luego seguir con las especficas.
Las preguntas, hasta donde sea posible, deben ser cerradas, teniendo el informante dos posibilidades
de respuestas: s o no. Tambin podran corresponder a una respuesta numrica simple, por ejemplo,
la edad, para que una persona coloque en un espacio indicado, el nmero de aos o para que elija uno
de los intervalos preestablecidos. Se acostumbra, con mucha frecuencia, utilizar preguntas de
seleccin mltiple, donde la persona podr sealar ms de una, como en la pregunta referente al
deporte o deportes que practica, las preguntas poco recomendables por la dificultad que presentan en
su tabulacin son las abiertas, que permiten la libre expresin, de acuerdo con la opinin que se tenga
en el momento de la entrevista.
Antes de aplicar el cuestionario, es necesario someterlo a prueba realizando una pequea preencuesta, lo cual permitir hacer las correcciones que sean necesarias, mejorar su diseo tanto en las
preguntas como en las instrucciones. Se podra agregar que la encuesta preliminar o piloto permite,
entre otros aspectos, familiarizar al entrevistador con el formulario y con la unidad a la que se va
aplicar el instrumento; conocer la reaccin de los informantes; determinar el tiempo que dura la
entrevista. De esta manera se estimar el tiempo necesario en la recoleccin. Algo que es
indispensable en cualquier investigacin hoy da, es tener conocimiento sobre la poblacin objeto de
estudio, para poder estimar la varianza o la proporcin, indispensables para determinar el tamao
ptimo de la muestra.
6.
Viene luego la recoleccin de datos, distribuyendo o aplicando los instrumentos de medicin, de los
cuales ya hicimos referencia. Se recomienda la supervisin permanente del trabajo de los
encuestadores, quienes con anterioridad recibieron un riguroso entrenamiento sobre la forma de
entrevistar, el manejo del instrumento y el propsito de la encuesta. Por otra parte, es el momento de
volver a la fuente de informacin cuando se detecten inconsistencias, para as corregir fallas de algn
37
entrevistador, o para hacer planes para las no respuestas o unidades que no fueron detectadas o
localizadas.
7.
permitir agruparlas de acuerdo con los criterios preestablecidos, que estarn acordes con la forma de
presentacin, anlisis y descripcin del hecho, de manera que faciliten la obtencin de conclusiones o
recomendaciones.
8.
9.
Finalmente, llegamos a la etapa de elaboracin del informe y su publicacin, ya sea para uso interno
de la empresa o para los particulares.
La redaccin y entrega del informe final, corresponde a la ltima etapa de la investigacin y a la
culminacin de todos los trabajos que la misma caus.
A pesar de que el informe constituye un todo indivisible, podemos considerar tres partes
perfectamente identificables: introduccin, conclusiones y apndices.
Introduccin. En esta parte del informe se utilizar un lenguaje sencillo y ameno, dejando aparte los
tecnicismos, de manera que sea entendible; adems, debe mantenerse una secuencia que guarde
armona con el proceso utilizado en la investigacin. Se har claridad sobre el planteamiento del
problema que nos condujo a la realizacin del estudio, la fijacin de objetivos, eleccin del mtodo
de investigacin aplicado, incluido el mtodo de seleccin utilizado; el tamao de la muestra
calculada, as como el diseo del cuestionario, las preguntas que dieron lugar, la indicacin de la
fecha en que se inici y termin la recoleccin de la informacin. En las pginas siguientes, en forma
breve y descriptiva, se har la exposicin de los puntos ms importantes, apoyados en cuadros,
grficas y otros resultados que sean consecuencia de la aplicacin de mtodos estadsticos.
Conclusiones. Constituye la parte fundamental del informe, ya que en ella aparecen relacionados los
resultados obtenidos, la confrontacin con lo esperado, la exposicin de cmo deben ser
interpretados y qu es lo que de ellos se deduce. El informe, adems, debe remitir al lector, cuando
sea necesario, a consultar los cuadros y grficas que hagan ms comprensible la explicacin y, sobre
todo, presentar recomendaciones.
Apndices. Integra toda la documentacin que se ha citado en la introduccin y en las conclusiones,
para que el lector del informe pueda consultar rpidamente y con facilidad cualquier informacin
contenida en el mismo.
38
39
Supongamos que se obtuvo 3. Este ser el primer elemento seleccionado; el segundo ser 8; e! tercero
13, y as sucesivamente se le ir sumando a cada nmero resultante el valor del intervalo, hasta
completar el valor de n.
Uso de las tablas de nmeros aleatorios. Este mtodo es el ms utilizado, ya que garantiza que
todos los elementos tengan igual probabilidad de ser seleccionados, pues se eliminan aquellos
factores negativos, como son el factor humano y las condiciones fsicas del material utilizado en la
elaboracin de las fichas. En los diferentes textos de estadstica se podrn observar estas tablas,
presentadas en formas diferentes, con cifras de 2, 4, 6, 8 o 10 dgitos, en busca de hacer ms fcil su
observacin. Para ello, ver tabla. Para la lectura de esta tabla se harn algunas recomendaciones:
Seleccionamos una tabla al azar (para nosotros, va a ser la tabla indicada mas abajo).
Luego, sin mirar la tabla seleccionada, colocamos el dedo en un lugar determinado, el que ser
considerado como punto de partida.
Determinamos cuntos dgitos se tendrn que utilizar, de acuerdo con el tamao de la poblacin.
Se establece la direccin que se seguir en su lectura.
Slo sern seleccionados aquellos nmeros que formen parte del marco muestral.
La seleccin se har con reposicin o sin ella. En el primer caso el elemento podr ser
seleccionado ms de una vez; en el segundo, una vez tenido en cuenta, no podr ser nuevamente
seleccionado.
Hagamos un pequeo ejercicio. Supongamos que en una poblacin de 250 elementos se va a
seleccionar una muestra de 25. Asignamos nmeros a cada elemento desde 001 hasta 250. Luego,
seleccionamos una de las tablas al azar.
Luego, determinamos el punto de partida, por ejemplo, la fila 16 y columna 11. Tenemos el primer
nmero: 524, y si leemos de izquierda a derecha, el segundo ser 962; luego, 094, 008. Tambin se
hubiesen podido obtener los siguientes nmeros: 524, 249, 496, 620,209,.... Si hubiramos ledo por
columnas se tendran: 524, 601, 100, 557, siendo 421 el ltimo en la columna. La forma de continuar
depende de lo establecido antes de iniciar la seleccin, es decir, si se toma en la parte inferior, el
nmero ser 681; luego, el 044, y as sucesivamente hacia arriba y en esa misma columna; o por el
contrario, haber comenzado desde la parte superior con los nmeros 646, 676, 686 ...
03 70 22 67 59
08 45 79 46 89
37 80 05 75 64
90 63 56 69 37
22 69 38 02 88
05 79 69 67 64
98 10 64 6 8 08
74 73 67 6 0 15
08 51 68 6 8 27
19 74 48 6 3 31
89 71 43 0 1 87
36 14 82 65 26
48 91 53 03 82 64 24 06 31 03
94 64 97 27 25 62 23 94 40 54
15 85 82 52 08 52 96 26 92 88
09 81 37 66 56 99 08 59 19 48
79 06 89 48 41
70 37 61 44 07
71 75 45 32 27
52 36 84 40 66
41 79 42 99 29
40 51 63 42 48
15 72 10 87 24
27 89 81 54 26
36 35 26 58 88
02 66 03 41 87
11 08 47 32 19
25 48 34 12 04
97 44 82 24 89 88 48 66 54 10
56 32 97 78 90 38 86 41 75 19
93 11 03 23 52 08 23 57 85 43
29 69 21 64 95 52 08 15 24 45
96 04 20 68 00
57 17 63 27 74
67 74 48 90 94
65 29 12 36 64
45 29 59 69 90
33 26 52 26 52
41 27 09 11 61
42 90 85 36 68
53 90 42 22 22
59 25 22 76 96
40
43 83 99 02 76
31 98 09 80 62
81 35 42 62 84
97 95 56 39 75
37 63 35 93 23
12 16 45 52 66
75 26 64 57 26
37 02 59 78 16
65 47 61 86 33
17 30 14 51 51
35 70 93 09 52
46 41 47 90 97
17 96 05 71 39
14 88 55 33 69
17 28 21 74 67
15 40 34 35 62
29 46 10 51 42
08 05 34 05 92.
10 87 79 94 46
3211 57 19 27
65 42 27 20 59
73 28 98 89 91
22 43 89 66 89
17 61 72 27 01
38 70 73 82 92
39 22 96 00 48
61 29 84 34 51
38 84 18 10 29
64 29 48 04 08
64 02 32 99 63
52 4 9 62 09 4 0
60 1 9 77 82 16
10 0 9 66 06 78
55 7 2 25 25 77
62 4 2 89 32 20
08 30 27 54 70
64 45 02 27 04
37 09 60 50 21
54 26 27 24 39
81 14 08 40 45
46 06 52 12 80
65 55 90 95 04
22 72 01 52 70
36 67 06 40 00
82 15 37 49 38
36 12 38 68 05
20 39 29 96 28
29 65 05 37 16
99 35 70 69 58
96 51 19 08 27
13 83 39 51 30
83 30 90 09 35
46 63 53 97 63
54 43 40 02 41
27 18 65 62 01
31 4 9 94 83 66
41 1 2 87 93 66
18 8 6 37 56 20
55 7 0 52 96 87
97 4 5 79 51 37
02 50 95 18 98
85 96 20 65 34
35 62 66 11 37
02 82 61 21 88
74 47 20 11 48
98 84 90 58 81
13 13 05 41 01
20 91 89 97 51
50 65 98 42 09
77 93 73 86 50
00 40 91 12 46
91 48 95 59 45
64 78'06 95 65
03 61 20 83 01
46 61 95 01 24
45 42 16 13 20
35 92 97 02 34
60 55 35 57 24
43 17 21 09 60
07 85 74 58 28
34 5 1 08 71 52
93 3 2 95 81 13
52 9 5 84 90 64
58 8 6 12 31 11
38 7 4 68 32 61
39 17 71 39 84
92 05 40 70 95
38 39 72 70 17
66 61 43 96 00
87 14 71 83 47
17 27 72 49 42
11 66 61 24 08
28 42 85 96 67
53 97 00 15 20
60 11 96 70 08
81 62 32 87 22
77 32 73 66 79
41 11 83 17 78
37 96 73 56 63
67 04 34 46 08
33 00 29 08 87
97 14 00 42 23
68 58 32 80 82
39 87 38 16 06
37 73 01 84 87
42 5 9 40 24 97
72 0 3 19 02 41
40 4 9 71 83 37
82 9 2 62 32 75
42 8 8 30 93 75
44 99 13 56 87
11 23 36 98 32
93 49 99 69 72
67 64 50 49 39
01 18 34 73 30
65 02 47 97 89
29 91 42 03 58
38 14 26 88 95
49 55 53 92 97
58 44 28 18 01
23 51 45 37 83
62 23 74 45 06
48 69 35 40 63
04 48 60 53 90
00 38 26 38 57
15 62 38 72 92
77 81 15 14 67
18 87 05 09 96
08 58 53 63 66
16 07 79 57 61
03 7 6 09 3 0 75
55 2 4 22 2 0 55
45 1 4 72 4 1 46
13 0 7 04 4 8 71
42 1 9 68 1 5 12
77 80 04 24 54
36 93 67 69 37
12 67 46 72 02
39 07 46 96 40
60 21 59 12 07
67 60 i 3 79 26
72 22 46 46 32
59 06 10 49 12
20 86 72 11 81
04 99 84 22 39
21 60 03 48 14
56 15 75 25 12
73 28 23 52 48
74 11 15 23 17
75 16 69 13 84
GLOSARIO
Encuesta
Encuesta preliminar
Formulacin del problema
Fuentes internas
Fuentes externas
Fuentes primarias
Fuentes secundarias
Hiptesis
Investigacin bibliogrfica
Investigacin descriptiva
Investigacin experimental
Marco
Marco muestral
Mtodos estadsticos
Mtodos de medicin
Modelo experimental
Modelo histrico
Modelo correlacional
Modelo expost-facto
Modelo terico
Modelo participativo
Modelo evaluativo
Objetivos generales
Objetivos especficos
Observacin directa
Preguntas abiertas
Preguntas cerradas
Preguntas de seleccin mltiple
Preguntas de control
Proporcin
Recoleccin
Tabulacin
41
CUESTIONARIO
1.
Analice el uso de las preguntas cerradas. Comprelas con las preguntas abiertas. D tres ejemplos de
cada una. Formlese dos preguntas en forma cerrada y abierta.
2.
Los entrevistados comnmente reciben llamadas por telfono, de personas que realizan encuestas
durante la hora de la comida.
Quienes planean la encuesta, probablemente piensan que muchos de los entrevistados se encuentran
en casa en esos momentos. Analice los pros y contras de dicho procedimiento
3. Mencione como mnimo tres caractersticas de inters en el caso que tenga como unidad:
a) familia;
b) predio agrcola;
c) establecimiento industrial;
d) paciente de una clnica de previsin social;
e) producto terminado.
4.
Se requiere informacin para el lanzamiento de un nuevo producto y se cuenta, apenas, con los siguientes
datos:
a) Demanda de productos similares por las amas de casa, en la ciudad.
b) Produccin nacional de este artculo, informacin tomada de las publicaciones del ministerio
c) Costo de la produccin, en la empresa.
d) Anlisis de los precios de la materia prima, obtenido de la Asociacin de Productores.
Determinar si los datos son internos o externos; adems, si las fuentes son primarias o secundarias.
5.
Qu es un marco muestral?
6.
7.
Una poblacin consta de 1.200 unidades numeradas desde 0001 hasta 1.200. Es necesario seleccionar una
muestra aleatoria simple sin reemplazamiento de tamao 25. Cmo lo hara usted si le pidieran que lo
hiciera aplicando la seleccin sistemtica?
8.
En un peridico o una revista reciente, donde usted pueda tomar ejemplos de la aplicacin de la
estadstica, seleccione un artculo que d respuesta a los siguientes interrogantes:
a) Cul es la poblacin investigada?
b) La investigacin fue total o parcial?
c) Qu tipo de datos se utiliz?
d) Qu fuente de datos considera para usted este informe?
e) Qu estadstica se aplic, descriptiva o de inferencias?
9.
Se debe responder "verdadero" si el enunciado lo es. Si, por el contrario, no es vlido, hay que sustituir la
palabra destacada por otra, con la cual el enunciado adquiere validez.
a) Un parmetro es la medida de alguna caracterstica estudiada en las unidades de una muestra.
b) El nmero de peces de una laguna corresponde a una poblacin finita.
c) El nmero de pacientes atendidos en una clnica de la ciudad, segn enfermedad diagnosticada, es un
ejemplo de variable.
f)
11. En un estudio de actitudes en un conjunto de empleados de, una empresa, se dispone de un listado de
empleados por departamentos, cargos y tiempo de servicio, para un total de 567 empleados. Sin embargo,
por uno u otro motivo el estudio se retarda 14 meses. Si continuara en las mismas condiciones anteriores
al retardo y con el mismo marco, qu problema se puede presentar?
Si hacemos una investigacin en una empresa sobre su personal, referente a cargos, profesin, sexo,
departamento en el que labora, se observa que todas esas caractersticas son cualitativas, que se
pueden clasificar cada una de ellas en un orden alfabtico.
Los accidentes de trnsito segn las causas que los originan, se pueden ordenar alfabtica y
geogrficamente. Pero si esta caracterstica es representada por das, meses o aos, se le denomina
clasificacin histrica o cronolgica.
Escalas numricas son las que utilizamos para clasificar las caractersticas cuantitativas o variables.
Algunos las dividen en escalas a intervalos regulares, las que son establecidas cuando no existen patrones
de medicin de uso comn, por ejemplo, cuando se requiere medir la inteligencia, hbitos, actitudes,
formas de comportamiento. Las escalas proporcionales, al contrario de las anteriores, estn dadas por
unidades de uso corriente, como cuando clasificamos 50 establecimientos por volumen de ventas, nmero
de empleados, etc.
TABULACIN Y PRESENTACIN DE LOS DATOS
Despus de haber determinado el criterio de clasificacin que se va a seguir, es necesario iniciar el
proceso de tabulacin, que consiste en un recuento de las veces que se repite la caracterstica observada,
por ejemplo, cuntos de los fumadores prefieren cigarrillos de marca Lider?, cuntos de la marca
Belmo? y as sucesivamente.
La tabulacin puede realizarse en forma manual o mecnica. La decisin sobre cul de ellas se debe
elegir, depende de muchos factores, entre otros: el nmero de formularios, la cantidad de preguntas que
tenga el instrumento de recoleccin y la disponibilidad de equipo. De todas formas, se requiere la
elaboracin de un plan de tabulacin, que debe referirse al diseo de una serie de cuadros o tablas, que
deben atender al objetivo de la encuesta, permitiendo la presentacin de los datos en forma clara y su
anlisis, mediante la aplicacin de algunas medidas, o su representacin grfica.
Los cuadros que constituyen el plan de tabulacin, sea esta manual o mecnica, no deben ser
necesariamente iguales a los finales o de publicacin de resultados; sin embargo, es preferible que sean
iguales por economa de tiempo y dinero. Los cuadros, de acuerdo con el nmero de caractersticas que se
van a presentar, se clasifican en simples, de doble entrada y mltiple entrada. Los cuadros simples
siempre representan una sola variable o un atributo; los cuadros de doble entrada se elaboran para
presentar dos variables, dos atributos o una variable y un atribulo; finalmente, una tabla mltiple permite
la presentacin de ms de dos caractersticas. Cuando en un cuadro se combinan variables con atributos,
algunos lo denominan tabla mixta.
En la elaboracin de cuadros finales o de publicacin, es necesario observar algunas recomendaciones:
a)
b) Todo cuadro debe tener un ttulo, lo ms completo posible, de manera que al leerlo tengamos una
visin general sobre su contenido.
c)
La mayora de los tcnicos recomienda que el ttulo debe situarse en la parte superior del cuadro; sin
embargo, otros consideran que debe ir debajo.
d) Las lneas que encierran el cuadro deben ser ms gruesas que las internas. Algunos aconsejan, por
presentacin, cerrar el cuadro por encima y por debajo, es decir, suprimir las lneas laterales.
e)
f)
Cualquier observacin que se haga, debe indicarse en el sitio correspondiente con una llamada, y al
final, debajo del cuadro, hacer la aclaracin. En ese mismo sitio se acostumbra colocar la fuente de la
cual se tom la informacin.
NMERO DE FUMADORES
12
PORCENTAJE
%
60
NO
Total...
8
20
40
100
Hay casos en que el total no puede corresponder al tamao de la encuesta, ni al ciento por ciento de su
distribucin porcentual.
Consideremos una encuesta a 80 fumadores sobre las marcas que prefieren, con el siguiente resultado:
MARCA DE CIGARRILLO
Lider
Kool
Luky Strike
Marlboro
Piel roja
Royal
NMERO DE FUMADORES
12
8
6
10
30
16
28
PORCENTAJE
%
15.0
10.0
7.5
12.5
37.5
20.0
35.0
Puede observarse que en vez de darnos un total de 80 fumadores encuestados, el resultado es 110; ello se
debe a que existen fumadores que tienen preferencias por ms de una marca; algo similar ocurre con el
porcentaje que sumado da 137,5, diferente al 100%; en este caso el porcentaje de cada marca tiene como
base el 100%, es decir, se considera como total los 80 fumadores que corresponden al tamao de la
encuesta.
Un cuadro de doble entrada podra ser la clasificacin de 150 empleados, segn estado civil y sexo.
ESTADO CIVIL
Soltero
Casado
Separado
Viudo
Unin libre
Total
SEXO
Masculino Femenino
28
22
52
10
17
5
3
1
10
2
110
40
TOTAL
50
62
22
4
12
150
VARIABLES
Se ha dicho que stas se clasifican en discretas y continuas. Las primeras son todas aquellas que admiten
nicamente valores enteros; las segundas las que admiten valores fraccionarios. As que el procedimiento
que se debe seguir en la elaboracin de una tabla de frecuencias se har atendiendo a la anterior
clasificacin.
Variable discreta
Para la elaboracin de una tabla de frecuencias, tanto para la variable discreta como para la continua,
utilizamos una serie de smbolos, con los cuales tenemos que familiarizarnos, ya que continuamente los
emplearemos, pues son una forma de entendernos, es decir, de hablar un mismo lenguaje. Estos trminos
son:
xi
es una manera de simbolizar el valor de cada observacin, esto es, el valor que toma la variable.
Donde i puede tomar valores desde uno, dos, tres... hasta n, cuando corresponde a datos
originales o no agrupados. En datos agrupados, cuando se ha elaborado una tabla de
frecuencias, i toma valores desde uno hasta m. Puede simbolizar tambin marcas de clase, siendo
el promedio entre el lmite inferior y el superior en un intervalo.
es el nmero de valores que toma la variable en una tabla de frecuencias. En la variable continua
recibe el nombre de nmero de marcas de clase o nmero de intervalos.
fi = ni
se denomina frecuencia absoluta y corresponde al nmero de veces que se repite cada valor de la
variable, dentro de los lmites determinados. Siempre son nmeros enteros y su suma debe ser
igual al total de las observaciones investigadas, es decir n.
fi/n=h
es la frecuencia relativa, entendida como los cuocientes obtenidos entre el valor de una
determinada frecuencia absoluta y el total de observaciones. Las frecuencias relativas sern
valores fraccionarios, es decir, comprendidos entre 0 y 1. Adems, la suma de todas estas
frecuencias debe ser igual a uno, o sea, el 100%.
Ni
Hi
Supongamos un ejemplo de variable discreta para construir una tabla de frecuencias: una empresa tiene
220 empleados, de los cuales selecciona una muestra al azar de 50 de ellos, con el fin de investigar qu
porcentaje y con qu frecuencia hay retardos en la llegada del personal en las horas de la maana; para
ello, se recogen las tarjetas de control de la ltima quincena, cuyos resultados fueron:
x1 = 2
x2 = 1
x3 = 3
x4 = 4
x5 = 0
x6 = 2
x7 = 3
x8 = 1
x9 = 3
x10 = 5
x11 = 6
x12 = 3
x13 = 3
x14 = 4
x15 = 1
x16 = 2
x17 = 2
x18 = 3
x19 = 5
x20 = 3
x21 = 4
x22 = 0
x23 = 2
x24 = 1
x25 = 3
x26 = 4
x27 = 2
x28 = 3
x29 = 1
x30 = 0
x31 = 2
x32 = 5
x33 = 3
x34 = 1
x35 = 2
x36 = 4
x37 = 5
x38 = 1
x39 = 4
x40 = 3
x41 = 0
x42 = 2
x43 = 3
x44 = 6
x45 = 3
x46 = 5
x47 = 4
x48 = 3
x49 = 2
x50 = 4
Cada elemento queda representado por un smbolo; as, si se nos pide cules son los valores para x 11, x26 y
x42, diremos que son 6, 4 y 2, respectivamente.
Ahora determinamos los valores que toma la variable y observamos que son: 0 1 2 3 4 5 6; en total 7, el
cual lo simbolizamos con m = 7.
A continuacin tabulamos, es decir, determinamos cuntas veces se presenta cada valor que toma la
variable.
Vamos a presentar dos tablas, una con los valores de las frecuencias y la otra con los smbolos
respectivos.
xi
0
1
2
3
4
5
6
fi
3
7
10
15
8
5
2
50
fi/n
0,06
0,14
0,20
0,30
0,16
0,10
0,04
1,00
Ni
3
10
20
35
43
48
50
-
Hi
0,060
0,20
0,40
0,70
0,86
0,96
1,00
-
xi
fi
fi/n
Ni
Hi
x1
f1
f1/n
N1
H1
x2
f2
f2/n
N2
H2
x3
f3
f3/n
N3
H3
x4
f4
f4/n
N4
H4
x5
f5
f5/n
N5
H5
x6
f6
f6/n
N6
H6
x7
f7
f7/n
N7
H7
n
1,00
Es necesario tener en cuenta las siguientes propiedades de las frecuencias:
a)
Las frecuencias relativas son nmeros fraccionarios as: 0 < fi/n <1
f)
Variable continua
Corresponde a aquella variable que admite fracciones siendo el resultado de la aplicacin de algn
mtodo de medicin. A los smbolos anteriores dados para una variable discreta, es necesario agregarles
algunos ms, que son propios de esta variable.
xmx
es el valor mximo que toma la variable, cuando los datos se encuentran sin agrupar.
xmn
Rango = Recorrido es la diferencia entre el valor mximo y mnimo que toma la variable. R = xmx
xmn.
m
nmero de intervalos o marcas de clase. Es un valor que en algunos casos se toma por
conveniencia o porque la informacin se ha venido presentando en esa misma forma. Se aconseja
que el valor de m no debe ser menor que cinco ni mayor que 16. Es preferible utilizar la frmula
m = l + 3,3 log n.
es la amplitud del intervalo y no necesariamente debe ser constante. Por facilidad, se utilizar
una amplitud constante: c = rango m, y siempre que su resultado sea fraccionario, por
pequea que ella sea, se aproximar al nmero inmediatamente superior.
x2 = 56
x3 = 39
x4 = 48
x5 = 54
x6 = 62
x7 = 45
x8 = 45
x9 = 51
x10 = 56
x11 = 37
x12 = 42
x13 = 56
x14 = 61
x15 = 56
x16 = 50
x17 = 42
x18 = 60
x19 = 61
x20 = 46
x21 = 51
x22 = 46
x23 = 54
x24 = 62
x25 = 50
x26 = 36
x27 = 56
x28 = 52
x29 = 63
x30 = 58
x31 = 62
x32 = 48
x33 = 55
x34 = 60
x35 = 54
x36 = 38
x37 = 61
x38 = 50
x39 = 58
x40 = 57
x41 = 65
x42 = 53
x43 = 56
x44 = 57
x45 = 53
x46 = 40
x47 = 65
x48 = 55
x49 = 50
x50 = 46
Pasos que deben seguirse para la confeccin de una tabla de frecuencias, cuando se tiene una variable
continua.
a)
b) Determinar el valor mximo y mnimo que toma la variable. x mx = 65, o sea la observacin x47 y xmn
= 36, que corresponde a la observacin X26.
c)
d) Se determina el valor de m o nmero de intervalos necesarios para agrupar los datos. Se puede tomar
un valor arbitrario. Recordemos que no se deben elegir muchos ni pocos intervalos o marcas de clase,
generalmente debe utilizarse un nmero no mayor que 16 ni menor que 5. Tambin se puede observar
si la empresa o entidad que realiza el estudio lo utiliz en publicaciones o estudios anteriores, tablas
similares, con el fin de continuarlas presentando en la misma forma, con fines comparativos.
Puede utilizarse la frmula m = 1 +3,3 log n para calcular el nmero de intervalos o marcas de clase.
m = 1 + 3,3 log 50 = 1 + 3,3 (1,698970)
m = 1 + 5,60660 = 6,6066 7 se aproxim al nmero inmediatamente superior.
A pesar de que muchas personas calculan el valor de m =
n , o sea, m =
50 = 7,07 8, el
Determinar el valor de la amplitud, es decir, la diferencia que hay en cada uno de los intervalos de
clase y que simbolizamos por C. Por comodidad y presentacin, se le considera como un nmero
entero; en la mayora de los casos, como constante para cada uno de los intervalos de clase.
C = rango /m = 29/7 = 4,14 5. De todas formas, por pequea que sea la fraccin, siempre se
aproxima al nmero inmediatamente superior.
Si mantenemos constantes los valores de m = 7 y C = 5, notamos que el valor del rango cambia.
5 = rango + 7; el nuevo rango ser 35, es decir, se increment en 6 unidades, y siempre que esto
suceda debe repartirse, sumndole una parte al lmite superior y restando la otra al lmite inferior. En
este caso, como el incremento es 6, le sumamos 3 a 65 y obtenemos 68 como nuevo x mx y le
restamos tambin 3 a 36 que nos da 33 como x mn. El nuevo rango ser igual a 68 - 33 = 35. Lo ms
indicado es repartir el incremento, hasta donde sea posible, en partes iguales, pero no necesariamente.
f)
Una vez establecido el nuevo rango, se coloca como lmite inferior del primer intervalo al valor
mnimo del rango, en este caso 33, y se le va sumando el valor de la amplitud.
Puede observarse que al lmite inferior se le ha agregado 0,1, pero slo se hace con el fin de clasificar los
datos. Es decir, si un valor de x es igual a 48, quedar dentro del tercer intervalo, ya que el cuarto
corresponde para valores superiores a 48.
fi
3
5
7
9
15
9
2
fi/n
0,06
0,10
0,14
0,18
0,30
0,18
0,04
Ni
3
8
15
24
39
48
50
Hi
0,06
0,16
0,30
0,48
0,78
0,96
1,00
Yi
35,5
40,5
45,5
50,5
55,5
60,5
65,5
50
1,00
fi
f1
f2
fi/n
f1/n
f2/n
Ni
N1
N2
Hi
H1
H2
Yi
y1
y2
Las marcas de clase, que aparecen en la ltima columna de la tabla, se pueden calcular de varias maneras:
a)
Promediando los valores en cada intervalo. Para ello se suma el lmite inferior con el lmite superior
del intervalo y se divide por dos. (33 + 38) + 2 = 35,5; (38 + 43) + 2 = 40,5, y as sucesivamente.
b) Si la amplitud es constante, basta con obtener la primera marca de clase por el mtodo anterior y se le
va sumando el valor de la constante, que en este caso es igual a 5.
c)
Se divide la constante por 2 y el resultado se le suma al lmite inferior, o se le resta al lmite superior
del intervalo.
CUESTIONARIO
1.
2.
Suponga que se realiza una investigacin sobre los precios de un artculo distribuido en la ciudad,
con los siguientes resultados:
$
250
265
250
290
238
260
248
270
232
275
262
262
240
270
272
236
263
258
248
254
280
263
246
236
288
254
270
263
265
240
270
280
260
250
246
260
284
290
272
268
230
300
284
240
254
258
296
278
280
278
Se pide:
a)
Elaborar una tabla de frecuencias, trabajando con una amplitud constante. Obtenga el nmero de
intervalos aplicando
m = 1 + 3,3 log n
3.
La seccin de cobro de una empresa comercial registra los das de mora en el cumplimiento de sus
obligaciones, en un mes, a 70 deudores. Los resultados son:
0
20
10
10
10
10
20
10
10
10
16
10
12
25
12
16
12
16
25
a)
Considere los das como variable discreta y elabore una tabla de frecuencias.
La empresa da tres das de gracia en los cuales no se cobra intereses por mora. Qu proporcin
de deudores tendrn que pagar intereses de mora?
4.
5.
Una empresa realiza una encuesta a sus 800 empleados, respecto al traslado de sus cesantas a los
fondos de reciente creacin. El objetivo era determinar cuntos empleados estaban dispuestos a
aceptar el traslado de sus cesantas. Los resultados son:
S
256
NO
474
INDECISOS
70
Una muestra realizada a 250 familias de un barrio, sobre el consumo de chocolate en el desayuno de
acuerdo con las marcas de su preferencia, arroj los siguientes datos:
MARCAS
A
NMERO DE
FAMILIAS
116
B
C
D
E
44
172
80
58
Construya la grfica que mejor reprsenle a este conjunto de observaciones. Explique el por que de
su decisin.
7.
8.
9.
Segn la regla de Sturges de m = 1 + 3,3 1og n, cuntas clases o marcas de clases se obtienen:
a) Si la muestra es 80 observaciones?; b) si la muestra es 1.500?
10. Una programadora de T.V. realiza una encuesta telefnica sobre la aceptacin de uno de sus
programas, de acuerdo con la edad del televidente. Los resultados obtenidos se presentan a
continuacin:
GRUPOS DE EDADES
18 a 30
30 a 50
ACEPTACIN
GUSTO
NO GUSTO
NO VIERON
Menos de 18
156
74
10
112
86
24
Ms de 50
86
50
18
26
20
18
C = Aceptable
B = Bueno
D = Regular
F = Deficiente
CARACTERSTICA
Con grado universitario
2 000
2 001
2 002
2 003
40
70
62
85
Mujeres
Hombres
Con bachillerato
Mujeres
Hombres
Total
12
28
120
36
84
160
16
54
130
38
92
200
14
48
118
35
83
180
18
67
165
42
123
250
Cmo elaborara un cuadro? Suponga que la informacin que debe presentar a la Gerencia es sobre la
proporcin de empleados vinculados a la empresa en los ltimos aos, por niveles de estudio y sexo.
13. Una encuesta de 30 trabajadores de una empresa sobre el nmero de accidentes de trabajo sufridos
durante su vida laboral, arroj los siguientes resultados:
3
0
a)
2
3
0
0
4
7
3
0
10 5
2
5
2
0
3
2
4
0
0
7
2
6
3
0
2
2
4
Se ha dicho que stas se clasifican en discretas y continuas. Las primeras son todas aquellas que admiten
nicamente valores enteros; las segundas las que admiten valores fraccionarios. As que el procedimiento
que se debe seguir en la elaboracin de una tabla de frecuencias se har atendiendo a la anterior
clasificacin.
Variable discreta
Para la elaboracin de una tabla de frecuencias, tanto para la variable discreta como para la continua,
utilizamos una serie de smbolos, con los cuales tenemos que familiarizarnos, ya que continuamente los
emplearemos, pues son una forma de entendernos, es decir, de hablar un mismo lenguaje. Estos trminos
son:
xi
es una manera de simbolizar el valor de cada observacin, esto es, el valor que toma la variable.
Donde i puede tomar valores desde uno, dos, tres... hasta n, cuando corresponde a datos
originales o no agrupados. En datos agrupados, cuando se ha elaborado una tabla de
frecuencias, i toma valores desde uno hasta m. Puede simbolizar tambin marcas de clase, siendo
el promedio entre el lmite inferior y el superior en un intervalo.
es el nmero de valores que toma la variable en una tabla de frecuencias. En la variable continua
recibe el nombre de nmero de marcas de clase o nmero de intervalos.
fi = ni
se denomina frecuencia absoluta y corresponde al nmero de veces que se repite cada valor de la
variable, dentro de los lmites determinados. Siempre son nmeros enteros y su suma debe ser
igual al total de las observaciones investigadas, es decir n.
fi/n=h
es la frecuencia relativa, entendida como los cuocientes obtenidos entre el valor de una
determinada frecuencia absoluta y el total de observaciones. Las frecuencias relativas sern
valores fraccionarios, es decir, comprendidos entre 0 y 1. Adems, la suma de todas estas
frecuencias debe ser igual a uno, o sea, el 100%.
Ni
Hi
Supongamos un ejemplo de variable discreta para construir una tabla de frecuencias: una empresa tiene
220 empleados, de los cuales selecciona una muestra al azar de 50 de ellos, con el fin de investigar qu
porcentaje y con qu frecuencia hay retardos en la llegada del personal en las horas de la maana; para
ello, se recogen las tarjetas de control de la ltima quincena, cuyos resultados fueron:
x1 = 2
x2 = 1
x3 = 3
x12 = 3
x21 = 4
x30 = 0
x39 = 4
x9 = 3
x10 = 5
x11 = 6
x20 = 3
x29 = 1
x38 = 1
x47 = 4
x17 = 2
x18 = 3
x19 = 5
x28 = 3
x37 = 5
x46 = 5
x8 = 1
x25 = 3
x26 = 4
x27 = 2
x36 = 4
x45 = 3
x7 = 3
x16 = 2
x33 = 3
x34 = 1
x35 = 2
x44 = 6
x6 = 2
x15 = 1
x24 = 1
x41 = 0
x42 = 2
x43 = 3
x5 = 0
x14 = 4
x23 = 2
x32 = 5
x49 = 2
x50 = 4
x4 = 4
x13 = 3
x22 = 0
x31 = 2
x40 = 3
x48 = 3
Cada elemento queda representado por un smbolo; as, si se nos pide cules son los valores para x 11, x26 y
x42, diremos que son 6, 4 y 2, respectivamente.
Ahora determinamos los valores que toma la variable y observamos que son: 0 1 2 3 4 5 6; en total 7, el
cual lo simbolizamos con m = 7.
A continuacin tabulamos, es decir, determinamos cuntas veces se presenta cada valor que toma la
variable.
Vamos a presentar dos tablas, una con los valores de las frecuencias y la otra con los smbolos
respectivos.
xi
0
1
2
3
4
5
6
fi
3
7
10
15
8
5
2
50
fi/n
0,06
0,14
0,20
0,30
0,16
0,10
0,04
1,00
Ni
3
10
20
35
43
48
50
-
Hi
0,060
0,20
0,40
0,70
0,86
0,96
1,00
-
xi
fi
fi/n
Ni
Hi
x1
f1
f1/n
N1
H1
x2
f2
f2/n
N2
H2
x3
f3
f3/n
N3
H3
x4
f4
f4/n
N4
H4
x5
f5
f5/n
N5
H5
x6
f6
f6/n
N6
H6
x7
f7
f7/n
N7
H7
n
1,00
Es necesario tener en cuenta las siguientes propiedades de las frecuencias:
g) Las frecuencias absolutas son nmeros enteros.
h) La suma de las frecuencias absolutas es igual al nmero de observaciones, en este caso n.
i)
Las frecuencias relativas son nmeros fraccionarios as: 0 < fi/n <1
j)
Variable continua
Corresponde a aquella variable que admite fracciones siendo el resultado de la aplicacin de algn
mtodo de medicin. A los smbolos anteriores dados para una variable discreta, es necesario agregarles
algunos ms, que son propios de esta variable.
xmx
es el valor mximo que toma la variable, cuando los datos se encuentran sin agrupar.
xmn
Rango = Recorrido es la diferencia entre el valor mximo y mnimo que toma la variable. R = xmx
xmn.
m
nmero de intervalos o marcas de clase. Es un valor que en algunos casos se toma por
conveniencia o porque la informacin se ha venido presentando en esa misma forma. Se aconseja
que el valor de m no debe ser menor que cinco ni mayor que 16. Es preferible utilizar la frmula
m = l + 3,3 log n.
es la amplitud del intervalo y no necesariamente debe ser constante. Por facilidad, se utilizar
una amplitud constante: c = rango m, y siempre que su resultado sea fraccionario, por
pequea que ella sea, se aproximar al nmero inmediatamente superior.
x39 = 58
x2 = 56
x40 = 57
x3 = 39
x4 = 48
x11 = 37
x5 = 54
x12 = 42
x6 = 62
x13 = 56
x7 = 45
x14 = 61
x21 = 51
x8 = 45
x15 = 56
x22 = 46
x9 = 51
x16 = 50
x23 = 54
x10 = 56
x17 = 42
x24 = 62
x31 = 62
x18 = 60
x25 = 50
x32 = 48
x19 = 61
x26 = 36
x33 = 55
x20 = 46
x27 = 56
x34 = 60
x41 = 65
x28 = 52
x35 = 54
x42 = 53
x29 = 63
x36 = 38
x43 = 56
x30 = 58
x37 = 61
x44 = 57
x38 = 50
x45 = 53
x46 = 40
x47 = 65
x48 = 55
x49 = 50
x50 = 46
Pasos que deben seguirse para la confeccin de una tabla de frecuencias, cuando se tiene una variable
continua.
j)
Se determina el valor de m o nmero de intervalos necesarios para agrupar los datos. Se puede tomar
un valor arbitrario. Recordemos que no se deben elegir muchos ni pocos intervalos o marcas de clase,
generalmente debe utilizarse un nmero no mayor que 16 ni menor que 5. Tambin se puede observar
si la empresa o entidad que realiza el estudio lo utiliz en publicaciones o estudios anteriores, tablas
similares, con el fin de continuarlas presentando en la misma forma, con fines comparativos.
Puede utilizarse la frmula m = 1 +3,3 log n para calcular el nmero de intervalos o marcas de clase.
m = 1 + 3,3 log 50 = 1 + 3,3 (1,698970)
m = 1 + 5,60660 = 6,6066 7 se aproxim al nmero inmediatamente superior.
A pesar de que muchas personas calculan el valor de m =
n , o sea, m =
50 = 7,07 8, el
Una vez establecido el nuevo rango, se coloca como lmite inferior del primer intervalo al valor
mnimo del rango, en este caso 33, y se le va sumando el valor de la amplitud.
Puede observarse que al lmite inferior se le ha agregado 0,1, pero slo se hace con el fin de clasificar los
datos. Es decir, si un valor de x es igual a 48, quedar dentro del tercer intervalo, ya que el cuarto
corresponde para valores superiores a 48.
Confeccionemos la tabla de frecuencias, calculando, a la vez, las marcas de clase.
Yi - 1 Yi
33,1 38
38,1 43
43,1 48
48,1 53
53,1 58
58,1 63
63,1 68
fi
3
5
7
9
15
9
2
fi/n
0,06
0,10
0,14
0,18
0,30
0,18
0,04
Ni
3
8
15
24
39
48
50
Hi
0,06
0,16
0,30
0,48
0,78
0,96
1,00
Yi
35,5
40,5
45,5
50,5
55,5
60,5
65,5
50
1,00
fi
f1
f2
fi/n
f1/n
f2/n
Ni
N1
N2
Hi
H1
H2
Yi
y1
y2
Las marcas de clase, que aparecen en la ltima columna de la tabla, se pueden calcular de varias maneras:
d) Promediando los valores en cada intervalo. Para ello se suma el lmite inferior con el lmite superior
del intervalo y se divide por dos. (33 + 38) + 2 = 35,5; (38 + 43) + 2 = 40,5, y as sucesivamente.
e)
Si la amplitud es constante, basta con obtener la primera marca de clase por el mtodo anterior y se le
va sumando el valor de la constante, que en este caso es igual a 5.
f)
Se divide la constante por 2 y el resultado se le suma al lmite inferior, o se le resta al lmite superior
del intervalo.
CUESTIONARIO
1. Consultar todo lo referente a grficos estadsticos y sus aplicaciones
2.
Suponga que se realiza una investigacin sobre los precios de un artculo distribuido en la ciudad,
con los siguientes resultados:
$
250
265
250
290
238
260
248
270
232
275
262
262
240
270
272
236
263
258
248
254
280
263
246
236
288
254
270
263
265
240
270
280
260
250
246
260
284
290
272
268
230
300
284
240
254
258
296
278
280
278
Se pide:
a)
Elaborar una tabla de frecuencias, trabajando con una amplitud constante. Obtenga el nmero de
intervalos aplicando
m = 1 + 3,3 log n
3.
La seccin de cobro de una empresa comercial registra los das de mora en el cumplimiento de sus
obligaciones, en un mes, a 70 deudores. Los resultados son:
0
20
10
10
10
10
20
10
10
10
16
10
12
25
12
16
12
16
25
d) Considere los das como variable discreta y elabore una tabla de frecuencias.
e)
f)
La empresa da tres das de gracia en los cuales no se cobra intereses por mora. Qu proporcin
de deudores tendrn que pagar intereses de mora?
4.
5.
Una empresa realiza una encuesta a sus 800 empleados, respecto al traslado de sus cesantas a los
fondos de reciente creacin. El objetivo era determinar cuntos empleados estaban dispuestos a
aceptar el traslado de sus cesantas. Los resultados son:
S
256
NO
474
INDECISOS
70
Una muestra realizada a 250 familias de un barrio, sobre el consumo de chocolate en el desayuno de
acuerdo con las marcas de su preferencia, arroj los siguientes datos:
MARCAS
A
B
C
D
E
NMERO DE
FAMILIAS
116
44
172
80
58
Construya la grfica que mejor reprsenle a este conjunto de observaciones. Explique el por que de
su decisin.
7.
8.
9.
Segn la regla de Sturges de m = 1 + 3,3 1og n, cuntas clases o marcas de clases se obtienen:
a) Si la muestra es 80 observaciones?; b) si la muestra es 1.500?
10. Una programadora de T.V. realiza una encuesta telefnica sobre la aceptacin de uno de sus
programas, de acuerdo con la edad del televidente. Los resultados obtenidos se presentan a
continuacin:
GRUPOS DE EDADES
ACEPTACIN
GUSTO
NO GUSTO
NO VIERON
Menos de 18
156
74
10
18 a 30
30 a 50
Ms de 50
112
86
24
86
50
18
26
20
18
C = Aceptable
B = Bueno
D = Regular
F = Deficiente
2 000
2 001
2 002
2 003
40
12
28
120
36
84
160
70
16
54
130
38
92
200
62
14
48
118
35
83
180
85
18
67
165
42
123
250
Cmo elaborara un cuadro? Suponga que la informacin que debe presentar a la Gerencia es sobre la
proporcin de empleados vinculados a la empresa en los ltimos aos, por niveles de estudio y sexo.
13. Una encuesta de 30 trabajadores de una empresa sobre el nmero de accidentes de trabajo sufridos
durante su vida laboral, arroj los siguientes resultados:
3
0
c)
2
3
0
0
4
7
3
0
10 5
2
5
2
0
3
2
4
0
0
7
2
6
3
0
2
2
4
OBJETIVOS
Identificar y aplicar en cada caso particular el promedio ms indicado.
Desarrollar habilidades para el clculo y utilizacin de los diferentes promedios.
Utilizar, interpretar y analizar los resultados obtenidos.
GENERALIDADES
Las medidas de posicin, generalmente denominadas promedios, son consideradas como medidas
destinadas a reducir el conjunto de datos de una caracterstica observada o investigada a un slo nmero
representativo. Se puede decir tambin que el resultado de las medidas solo pretende explicar mediante
un valor tpico, un conjunto de datos.
Algunos establecen diferencias entre estos promedios y los clasifican en medidas de Posicin y de
Tendencia Central. A los primeros los definen como un valor tpico, dentro de la variable, que representa
al conjunto de observaciones; a los segundos, como un valor central. De todas formas es un valor que
calculamos para describir una caracterstica que suele agrupar muchas clases de datos, y que se
diferencian en la forma en que se definen tpicamente, y en la cantidad y tipo de informacin que pierden
al resumir la informacin.
Por otra parte, el promedio es un concepto ms familiar que puede considerarse como indeterminado. Por
lo general, un valor promedio intenta representar o resumir las caractersticas relevantes de un conjunto
de valores, siendo los ms conocidos: media aritmtica, mediana y moda; y otros de menor importancia,
tales como: la media geomtrica, media armnica, media cbica, media cuadrtica, los cuartiles, deciles,
percentiles. Por lo general, son medidas de posicin o promedio, por consiguiente, la expresin
promedios no slo hace referencia a la media, sino; tambin a las medidas mencionadas.
Es necesario recordar que si estos promedios son calculados con valores de una poblacin, se les
denomina parmetros; si se aplican a los valores que toma la caracterstica de las unidades de una
muestra, sern llamados estimadores.
Vale la pena preguntarnos si es posible calcular un promedio que sea capaz de representar, lo mejor
posible, un conjunto de datos. La respuesta es afirmativa, conociendo las ventajas y desventajas que
presentan las diferentes medidas.
Algunos autores establecen diferencias en cuanto a la forma de medicin. Una de ellas es el promedio
objetivo, que se utiliza para remediar la imperfeccin de los elementos de medida de que se dispone en un
momento dado. Por ejemplo, la distancia entre un punto y otro con posibilidades de obtener resultados
diferentes, ya sea por dificultad o por imperfeccin del instrumento de medicin utilizado; pero si
promediamos esos resultados, se obtiene una cifra que puede estimarse como representativa, siendo
considerada como promedio objetivo. Otro es el promedio subjetivo, el cual es diferente del anterior y se
obtiene al medir varios elementos o unidades, calculando una sola cifra que indicara el promedio del
conjunto; por ejemplo, el promedio de venta diaria en un establecimiento comercial.
Como puede observarse, la finalidad de estas unidades es presentar aquellas medidas ms utilizadas e
indicar cmo son calculadas y en que casos debe aplicarse.
MEDIA ARITMTICA ( X )
Frecuentemente se omite la calificacin aritmtica, de modo que solo se menciona la palabra media. Es la
medida ms utilizada, la ms conocida, la ms fcil de calcular. Sus frmulas admiten tratamiento
algebraico. Por tal razn es considerada como la ms importante dentro de los promedios, a pesar de ser
demasiado sensible a cambios en la variable o cuando el extremo es demasiado grande. Se simboliza
indistintamente, empleando una rayita sobre la letra que indica la variable x o y , con minscula para
indicar el estimador y con mayscula para el parmetro. Otra forma de simbolizar la media es
utilizando la letra M (mayscula) colocando como subndice y entre parntesis la letra que identifica la
variable: M(x); M(y); M(z); tambin algunos utilizan la a (minscula). En poblaciones, como parmetro, es
empleada con mucha frecuencia la letra griega miu o mu ().
x
n
x f
i i
Cuando slo se dispone de la frecuencia relativa, tambin puede calcularse la Media Aritmtica,
aplicando la siguiente frmula:
fi
n
x xi
Ahora aplicaremos las dos frmulas anteriores, en variables discretas y continuas; para ello, se
considerar la informacin dada por las tablas de la unidad anterior
xi
0
1
2
3
4
5
6
fi
3
7
10
15
8
5
2
xifi
0
7
20
45
32
25
12
fi/n
0,06
0,14
0,20
0,30
0,16
0,10
0,04
xi(fi/n)
0
0,14
0,40
0,90
0,64
0,50
0,24
x f
141
2,82
n
50
f
x x i i 2,82
n
i i
50
141
1,00
2,82
los dos resultaos anteriores son iguales
Tabla de variable discreta Clculo de la media aritmtica ponderada
xi 1 xi
fi
xi
xifi
fi/n
xi(fi/n)
33,1 38
3
35,5
106,5
0,06
2,13
38,1 43
5
40,5
202,5
0,10
4,05
43,1 48
7
45,5
318,5
0,14
6,37
48,1 53
9
50,5
454,5
0,18
9,09
53,1 58
15
55,5
832,5
0,30
16,95
58,1 63
9
60,5
544,5
0,18
10,89
63,1 68
2
65,5
131,0
0,04
2,62
50
2.590,0
1,00
51,80
Tabla de variable contina. Clculo de la media aritmtico ponderada
2.590
51,8
50
x 51,8
x
Si comparamos los anteriores resultados con los obtenidos para datos no agrupados, observamos que en la
variable discreta son iguales; en cambio en la variable continua, por lo general, difieren. Ello se debe a la
prdida de informacin, primero, al agrupar los datos en intervalos de clase; luego, al calcular la media
utilizando las marcas de clase.
DESVIACIONES
Son diferencias que se obtienen entre los valores de la variable y un punto fijo, que puede ser un
promedio, por lo general, la media, o un valor arbitrario, es decir, cualquier valor que caprichosamente se
quiera tomar, ya sea positivo o negativo, dentro o fuera del recorrido, denominado media supuesta u
origen de trabajo, y que lo simbolizaremos mediante A u Ot.
Se consideran tres clases de desviaciones: respecto a la media; a una media supuesta; y a la media
supuesta tomada en unidades de amplitud del intervalo.
Supongamos los valores 6, 8, 6, 10, 5, para los cuales se sabe que la media es igual a x = 7, y las
desviaciones, aplicando la frmula de di = xi - x sern: 6 - 7 = -1; 8 - 7 = 1; 6 - 7 = -1; 10 - 7 = 3; 5 - 7
= -2.
En datos agrupados, el procedimiento de clculo es como sigue:
di = xi - x
xi
fi
xi - x
(xi - x )fi
0
3
-2,82
-8,46
1
7
-1,82
-12,74
x
2
10
-0,82
-8,20
3
15
0,18
2,70
4
8
1,18
9,44
5
5
2,18
10,90
6
2
3,18
6,36
50
0
Tabla Variable discreta- Desviacin respecto a la media
xi 1 xi
fi
x f
i i
141
2,82
50
x fi 0
xi
(xi - x )
(xi - x )fi
33,1 38
3
35,5
-16,3
-48,9
38,1 43
5
40,5
-11,3
-56,5
43,1 48
7
45,5
-6,3
-44,1
48,1 53
9
50,5
-1,3
-11,7
53,1 58
15
55,5
3,7
55,5
58,1 63
9
60,5
8,7
78,3
63,1 68
2
65,5
13,7
27,4
50
0
Tabla Variable continua- Desviacin respecto a la media
x 51,8
Observe detenidamente que, en datos no agrupados, la suma de las desviaciones respecto a la media
aritmtica, debe ser siempre igual a cero; en cambio en datos agrupados o tablas de frecuencia debe estar
multiplicada cada desviacin por su respectiva frecuencia, para que la sumatoria sea igual a cero.
DESVIACIONES
xi
xi - A
35,5
-10
40,5
-5
45,5
0
A = 45,5
50,5
5
55,5
10
60,5
15
65,5
20
Tabla Variable continua - Desviaciones respecto a un origen de trabajo
La media supuesta se simboliza por A o por Ot; considerando el valor 4 para la variable discreta y 45,5
para la continua.
Una de las tantas utilizaciones que se le da a estas desviaciones, corresponde al clculo de la media
aritmtica, mediante el denominado primer mtodo abreviado. Veamos su frmula y su aplicacin con las
tablas anteriores.
xi
0
1
2
3
4
5
6
fi
3
7
10
15
8
5
2
50
xi - A
-4
-3
-2
-1
0
1
2
-
(xi - A)fi
-12
-21
-20
-15
0
5
4
-59
fi
3
5
7
9
15
9
2
50
xi - A
-10
-5
0
5
10
15
20
-
(xi - A)fi
-30
-25
0
45
150
135
40
315
La frmula que utilizaremos para calcular la media aritmtica en ambos casos ser:
xA
Af i
d f
i i
xi A di
c
c
di =
Tambin se aplica para calcular algunas medidas, entre ellas la media aritmtica, conocida como segundo
mtodo abreviado, cuya frmula es:
x Ac
d f
\
i i
Su aplicacin es la siguiente:
xi
fi
di
di/c
difi
35,5
3
-10
-2
-6
A = 45,5
40,5
5
-5
-1
-5
45,5
7
0
0
0
x 45,5 5 (63 50)
50,5
9
5
1
9
55,5
15
10
2
30
x 45,5 6,30 51,8
60,5
9
15
3
27
65,5
2
20
4
8
50
63
Tabla variable continua Clculo de la media aritmtica segn mtodo abreviado
a)
La suma de las desviaciones respecto a la media siempre debe ser igual a cero. En datos no
agrupados ser
x 0
x fi 0
. Ya estas
propiedades las habamos demostrado cuando se habl de las desviaciones respecto a la media.
b) La media aritmtica de una constante es igual a la constante. Propiedad fcil de entender y de
explicar mediante un ejemplo como el siguiente: si en un curso todos los estudiantes obtienen la
misma nota, esa ser el promedio.
M k k n nk n k
c)
La media aritmtica de una constante por una variable ser igual al producto de la constante por
la media aritmtica de la variable.
M kx kx n k x n k x
d) La media de una variable ms una constante es igual a la suma de la media ms la constante
M x k M x M k x k
e)
M x k x k
ponderadas, es decir, las medias deben estar multiplicadas por su respectivo nmero de elementos, y la
suma de estos productos dividida por el total de elementos.
x 1n 1 x 2 n 2 x 3 n 3
n
xi
35,5
40,5
45,5
50,5
55,5
60,5
65,5
xi
46
51
56
61
fi
3
5
7
9
15
9
2
50
fi
3
5
7
9
xi fi
168
255
392
549
66
71
76
15
9
2
50
990
639
152
3.115
xi
fi
xi fi
71
3
213
81
5
405
91
7
637
101
9
909
111
15
1.665
121
9
1.089
131
2
262
50
3.115
(1) Informacin correspondiente a la tabla inicial, de la cual sabemos que el promedio es igual a:
x = 51,8.
(2) Se le ha sumado 10,5 a cada uno de los valores de la variable de la tabla anterior y con ella se calcula
la nueva media aritmtica.
x 3.115 50 62,3
M x k 51,8 10,5 62,3
(3) Se ha multiplicado por dos cada uno de los valores de la variable tabla anterior y se ha calculado
nuevamente la media aritmtica.
x 5.180 50 103,6
M kx 51,8 2 103,6
(4) Dividamos la distribucin de la tabla anterior en dos submuestras, la primera de ellas con 15
elementos y la segunda con 35. Luego, calculamos la media para cada una de las submuestras.
xi
35,5
40,5
45,5
fi
3
5
7
xifi
106,5
202,5
318,5
15
627,5
x 1 627,5/15 41,83
Primera Submuestra
xi
50,5
55,5
60,5
65,5
fi
9
15
9
2
15
xifi
454,5
832,5
544,5
131,0
1.962,5
x 2 1.962,5 35 56,071
Segunda Submuestra
51,8
50
50
MEDIANA (Me)
Es aquel valor de la variable que divide la frecuencia total en dos partes iguales, es decir, aquel valor de la
variable que supera y a la vez es superado por ms de la mitad de las observaciones en un conjunto
ordenado. La mediana es el valor central.
Se le considera como una medida de tendencia central, ya que se localiza en el centro, superando la mitad
y siendo superada por la otra mitad de las observaciones. Este promedio es menos importante que la
media aritmtica y su clculo es un poco ms complicado, ya que en cada situacin en particular debe
aplicarse una determinada frmula, tan rgida que no admite tratamiento algebraico alguno, pero presenta
la ventaja de no ser afectada por cambios que se le hagan a la variable, manteniendo su ordenamiento, aun
cuando existan valores demasiado grandes.
Para la determinacin de la mediana no se requiere conocer el valor de todos los datos; solo es preciso
saber cul es la observacin central y que los valores restantes, mitad de ellos sean menores y la otra
mitad mayores que ste. Tambin se puede aplicar en datos incompletos, por ejemplo, en aquellas
distribuciones cuya variable tiene valores extremos no definidos con intervalos titulados "menos de" o
"ms de".
Veamos su aplicacin en cada caso en particular:
DATOS NO AGRUPADOS
Para el clculo de la mediana, cuando los datos no estn agrupados en una tabla de frecuencias, debe
tenerse en cuenta si el nmero de observaciones es impar o par. En cada caso se siguen los siguientes
pasos:
a)
b) Se determina el valor central, ya sea mediante la observacin directa de los datos o a travs de la
aplicacin de la frmula: (n + 1)/2. El resultado nos seala el nmero de la observacin en que se
localiza la Mediana
Nmero impar de observaciones
Si slo se dispone de un nmero impar de datos, la mediana estar localizada en el centro. Consideremos
nuevamente los datos 6, 8, 6,10 y 5. Se ha dicho que primero los ordenamos de menor a mayor o de
mayor a menor, de la siguiente manera: 5 6 6 8 10. Observemos que uno de los seis ocupa el centro; por
lo tanto, a ese valor le corresponde la mediana. Me = 6. Ahora disponemos de dos resultados: x = 7 y Me
= 6. Qu sucede si el ltimo valor en vez de 10 es 100? La mediana sigue siendo 6 y la media se altera,
pasa a ser 25 para el mismo conjunto de datos, debido a lo sensible que es la media, a cualquier cambio
que se haga en la variable.
En el mismo ejercicio podemos calcular la mediana aplicando la frmula (n + 1) 2 = (5 + 1) 2 = 3,
lo cual indica que la mediana est localizada en el tercer dato de la variable ordenada.
Nmero par de observaciones
Si disponemos de un conjunto par de datos, se toma convencionalmente la mediana, a la media de las dos
observaciones centrales. Si estos dos valores son iguales, se tomar uno de ellos. Con los datos: 6; 8; 6;
10; 5; 10, los ordenamos de mayor a menor; 10 10 8 6 6 5. La mediana ser el promedio entre la tercera y
la cuarta observacin obtenida de la siguiente manera: (6 + 1) 2 = 3,5, es decir, que promediamos
8 6
DATOS AGRUPADOS
Cuando trabajarnos con tablas de frecuencias, debe establecerse si la variable es discreta o continua;
luego, miraremos si al dividir por dos el total de observaciones, el valor se encuentra en la columna de las
frecuencias absolutas acumuladas. Se nos presentan dos situaciones al calcular la mediana. En cada caso
debe aplicarse una frmula diferente, con base en las siguientes recomendaciones:
a)
Se obtienen las frecuencias absolutas acumuladas, sumando las sucesivas frecuencias, ya sea de
arriba hacia abajo, o en sentido contrario, sin que este procedimiento afecte el resultado.
VARIABLE DISCRETA
Procedemos a calcular la mediana, de acuerdo con las dos situaciones descritas anteriormente:
xi
0
1
2
3
4
5
6
xj-1
xj
fi
3
7
15
10
8
5
2
50
Nj
3
10
25
35
43
48
50
-
Nj-1
Nj
xi
0
1
2
3
4
5
6
xj
(2)
fi
3
7
10
15
8
5
2
50
Nj
3
10
20
35
43
48
50
-
Nj-1
Nj
(1) Aparece en la columna de las frecuencias el valor obtenido al calcular n/2 = 25; por lo tanto, se dir
que Nj-1 = n/2. En este caso la frmula que debe emplearse es:
Me
x j1 x j
Me
23
2,5
2
(2) Como en la columna de las frecuencias absolutas acumuladas no aparece el valor 25, consideremos
como Nj-1 a 20, es decir, el valor inmediatamente inferior, y como Nj al inmediatamente superior a 25,
o sea, 35. Se dir en este caso Nj-1 < n/2, y la frmula a emplear ser:
Me = xj
Me = 3
VARIABLE CONTINUA
xj-1
xj 1 xj
33,1 38
38,1 43
43,1 48
48,1 53
53,1 58
58,1 63
63,1 68
fi
3
5
7
10
15
9
1
50
Nj
3
8
15
25
40
49
50
-
Nj-1
Nj
fi
Nj
xj-1
33,1 38
38,1 43
43,1 48
48,1 53
53,1 58
58,1 63
63,1 68
3
5
7
9
15nj
9
2
50
3
8
15
24
39
48
50
-
Nj-1
Nj
(1)
el valor deClculo
n/2 = 25
la columna de las frecuencias absolutas acumuladas, siendo Nj-1
(2) Localizamos
Variable continua
de en
la mediana
= n/2. La frmula que debe aplicarse ser:
Me = xj-1 = 53
Observe que el valor de x j-1 lo hemos localizado al frente de N j ya que 53 es el centro de la
distribucin, en cuanto al nmero de observaciones.
(2) En este caso, el valor 25 no se encuentra en la columna, por lo tanto, se dir que N j-1 < n/2. Para su
clculo se aplicar la siguiente frmula:
Me x j1
n
N j1
2
c
nj
Me 53 5
25 24
53,33
15
NOTA: Nj es el smbolo que utilizaremos para indicar la columna de las frecuencias absolutas acumuladas
por ser ms fcil de manejar.
MODA (Md)
Es una medida de posicin que sacrifica una mayor cantidad de informacin que la mediana. Su resultado
es ms general y en algunos casos poco til. Es definida como aquel valor de la variable que ms se
repite, es decir que tiene la mxima frecuencia de la distribucin. Se simboliza por Md, siendo igual a Xj.
DATOS AGRUPADOS
As corno se calcul la moda, en datos no agrupados, en una forma simple e inmediata, casi por simple
observacin y sin frmula alguna, podemos proceder igual en datos agrupados, tanto para la variable
discreta como para la continua. En esta ltima debe ser calculada utilizando las marcas de clase y slo
cuando la amplitud del intervalo sea constante; cuando no lo sea, es preferible aplicar otra medida
diferente.
En las tablas que se presentan a continuacin, se han calculado las modas en cada una de las
distribuciones, siendo Md = 3 en la variable discreta y Md =55,5 en la variable continua, utilizando para
ello las marcas de clase.
Md
xi
0
1
2
3
4
5
6
fi
3
7
10
15
8 nj
5
2 Md = xj = 3
50
xi
fi
35,5
3
40,5
5
45,5
7
50,5
9
Md
55,5 15 nj
60,5
9
65,5
2 Md = xj = 55,5
50
RELACIN ENTRE MEDIA, MEDIANA y MODA
Variable continua
Clculo de la en
moda
Hagamos
algunas comparaciones
cuanto a la aplicacin de estas medidas, que hemos considerado
como las ms importantes y de mayor utilidad.
a)
b) En una distribucin simtrica y adems unimodal, la media, la mediana y la moda son iguales. En
este caso, se prefiere el uso de la media.
c)
Los tres promedios dependen de la forma que tome la distribucin. Si es simtrica, o ligeramente
asimtrica, debe utilizarse la media; en cambio cuando esto no ocurre, la mediana es la ms indicada.
La media no se puede calcular en distribuciones con intervalos abiertos, por tanto, la mediana y la
moda son las ms indicadas.
f)
Dos medianas o dos modas no se pueden promediar para obtener el valor promedio de dos muestras
combinadas, pero s se puede realizar con la media aritmtica.
x Me Md
x Me Md
Cuando es simtrica
Cuando es asimtrica
Cuando es asimtrica
x Me Md
j)
La media aritmtica es sensible a cualquier cambio que se haga en los valores que toma la variable, y
en especial cuando uno de ellos es exageradamente grande. La mediana y la moda no se afectan
mientras el cambio no se realice en su propio valor.
k) Se considera que en gran parte de las distribuciones, la distancia entre la media y la moda es tres
veces la distancia entre la media y la mediana. Esta relacin fue establecida por K Pearson y sirve
para calcular una de ellas en funcin de las otras dos.
x M d 3( x M e )
M d 3M e - 2x
Una distribucin es Simtrica cuando las frecuencias absolutas y relativas, equidistantes a un valor
central, son guales, en caso contrario la distribucin es Asimtrica. Se ha dicho que en una distribucin
simtrica la mediana, media y moda tendrn el mismo valor, el cual se localiza en el centro de la variable.
Veamos como ejemplo una distribucin simtrica, cuya media, moda y mediana es igual a 6.
Xi
0
2
4
6
8
10
12
fi
2
8
15
20
15
8
2
70
fi/n
0,03
0,11
0,22
0,28
0,22
0,11
0,03
1,00
x6
Me 6
Md 6
La media geomtrica de n cantidades positivas es la raz positiva ensima del producto de dichas
cantidades. Se simboliza por Mg, Mo, G, y es aplicada en todos aquellos casos en los que la variable
muestra un crecimiento geomtrico, como en el de la poblacin de un pas o el de un capital colocado
a una tasa de inters compuesto, es decir, con tendencia exponencial. Siguiendo el procedimiento de
explicacin para los anteriores promedios, veamos cules son las frmulas que deben aplicarse en este
caso y cul el procedimiento que debe seguirse para su clculo:
DATOS NO AGRUPADOS
De acuerdo con la definicin, la frmula para aplicar, si se dan los dalos siguientes: 6; 8; 6; 10 y 5, es:
Mg
x i
Mg
6 8 6 10 5
x1 x 2 x 3 ...x n
5
14.400 6,79
La letra griega (pi) se lee como multiplicacin de, es decir, corresponde al producto de los elementos
o valores que tome la variable. La anterior frmula presenta varios inconvenientes en su clculo. Algunos
de ellos son:
(a) si un valor de la variable es 0, el producto ser igualmente cero.
(b) ninguna observacin puede ser negativa, pues nos dara una raz imaginaria. Como solucin, es
preferible trabajar con logaritmos:
(c)
log Mg
log x
n
Aplicando esta frmula a los datos originales, el resultado debo ser exactamente igual al obtenido con la
formula anterior.
5
5
log Mg 0,831672
log Mg
Millones de habitantes.
DATOS AGRUPADOS
Las frmulas de clculo anteriores se modifican un poco, pues deben estar ponderadas, es decir, la
variable debe estar multiplicada por las respectivas frecuencias absolutas.
Mg x
log Mg
f i /n
i
log x i
Por comodidad utilizaremos esta ltima frmula, tanto para la variable discreta como para la continua. El
procedimiento ser:
xi
0
1
2
3
4
5
6
fi
3
5
7
9
15
9
2
50
log xi
0
0
0,301030
0,477121
0,602060
0,698970
0,778151
-
fi log xi
0
0
3,01030
7,15682
4,81648
3,49485
1,55630
20,03475
log Mo
fi
xi
log xi
fi log xi
log x i
n
20,03475
log Mo
50
Mo antilog 0,400695
Mo 2,52
33,1 38
38,1 43
43,1 48
48,1 53
53,1 58
58,1 63
63,1 68
3
5
7
9
15
9
2
50
35,5
1,55023
4,65069
85,77854
40,5
1,60746
8,03728 log Mo
50
45,5
1,65801
11,60608
50,5
1,70329
15,32962 log Mo 1,715571
55,5
1,74429
26,16439
Mo antilog 1,715571
60,5
1,78175
16,03580
65,5
1,81624
3,63248 Mo 51,95
20,03475 85,77854
Variable continua Clculo de la media geomtrica
PROBLEMA DE APLICACIN
1.
El ingreso por habitante de un pas es 1.200 dlares al ao. El sector obrero est constituido por el
38% de la poblacin y percibe 1/7 del ingreso total. Cul ser el ingreso per cpita de este sector?
CUESTIONARIO
1.
Encontrar la media, mediana y moda, en cada uno de los siguientes conjuntos de observaciones:
A) 20 18 16 10 18 13 12 12 18 20
B) 11 13 13 15 15 15 17 17 19
C) 10 11 12 15 14 14 14 130
a)
b) En cada uno de los casos compruebe que la suma de las desviaciones respecto a la media
aritmtica es igual a cero.
c)
Con el ejercicio A) contestar qu pasara con los resultados obtenidos con la aplicacin de las
tres medidas: (1) si cada uno de los valores de la variable lo multiplicramos por 3?; (2) si a
cada valor se le suma 5?
2.
Con base en las siguientes medidas de posicin, indicar en cules de los siguientes puntos existe una
relacin:
a)
x = 78
mediana = 84
moda = 90
b)
x = 80
mediana = 84
moda = 78
3.
c)
x = 84
mediana = 84
moda = 84
d)
x = 84
mediana = 84
moda = 52
moda = 116
Si los resultados obtenidos al aplicar tres promedios son: media = 50; mediana = 46 y moda = 40,
qu pasar con los promedios si cada uno de los valores de la variable se multiplica por 10?
4.
Suponga que usted es el gerente de mercadeo de una empresa, donde se distribuye el mismo producto
con dos marcas diferentes, asegurando que ambas tienen la misma duracin media de 9 aos. Se
realiza una encuesta entre los compradores de estos productos, para determinar cul ha sido su
duracin. Los resultados obtenidos fueron: Producto A: 10; 7; 8; 9; 10; 8; 11; 7; 7; 11; 9; 8; 10; 10; 9;
11; 9; 8; 9. Producto B: 19; 4; 3; 4; 3; 9; 10; 3; 19; 5; 9: 4; 9; 5; 9: 4; 9; 5; 9; 4; 9; 10; 19; 4; 5; 9.
a)
Como vendedor, en qu marca se sentir ms seguro, al afirmar que la vida media de duracin
es 9 aos?
5.
Una muestra de 22 empresas, editoras de textos, revela los siguientes porcentajes del gasto en
promocin, respecto al total de ventas del producto.
21 18 25 20 16 18 16 10 18 20 16
14 20 26 12 14 12 14 12 12 12 18
Calcule: media, mediana y moda.
6.
Los siguientes dalos representan el nmero de interrupciones diarias, en un mes. Los factores son de
diversa ndole, tales como falta de fluido elctrico, dao en las mquinas, enfermedad o malestar del
operario, etc. Los resultados se presentan en la siguiente tabla de frecuencias:
Xi
0
1
2
4
5
7
10
7.
fi
10
8
4
2
3
2
1
30
En un almacn de repuestos para automotores se seleccion una muestra al azar de 80 cuentas de los
archivos de crdito y se construy la siguiente tabla.
VALOR DEUDA
(MILES $)
Hasta 20
20,1 40
40,1 60
NUMERO DE
DEUDORES
14
26
20
Se pide:
a) Calcular la mediana y la moda.
b) Cmo procedera usted si le pidieran
calcular la media aritmtica?
60,1 80
80,1 100
100,1 y ms
8.
10
6
4
80
Supongamos que se realiz una encuesta sobre la tasa de desempleo en 40 de las principales ciudades
del pas, con los siguientes resultados:
NUMERO DE
CIUDADES
6
10
16
5
3
40
9.
TASA DE
DESEMPLEO
2 - 5%
5,1 - 8%
8,1 - 11%
11,1 - 14%
14,1 - 18%
Se pide calcular:
a) Media, mediana y moda.
b) Media geomtrica y armnica.
c) Las desviaciones respecto a la media y
comprobar que su sumatoria es igual a
VENTAS
2
4
11
16
28
10. Consideremos que una empresa cuenta con tres departamentos con diferente nmero de empleados.
Se realiza una encuesta para determinar el nmero de unidades producidas por hora, con los
siguientes resultados:
DEPARTAMENTO I
UNIDADES
NUMERO DE
TRABAJADORES
3
2
5
3
7
6
8
12
10
4
11
2
12
1
30
DEPARTAMENTO II
UNIDADES
NUMERO DE
TRABAJADORES
2
3
4
7
5
14
7
9
8
10
3
4
40
DEPARTAMENTO III
UNIDADES
NUMERO DE
TRABAJADORES
4
6
5
2
7
12
8
10
9
14
10
2
12
3
13
1
50
a)
10
12
11
10
a)
b) Agrupar los datos en una tabla de frecuencia, calcular los promedios mencionados en la unidad y
comparar sus resultados.
OBJETIVOS:
Conocer e identificar las medidas de dispersin.
Desarrollar habilidades en el clculo y aplicacin prctica de estas medidas.
Comprender la utilidad e identificar los problemas que requieran su uso
GENERALIDADES
El comportamiento de un conjunto de datos se ha podido describir, en parte, mediante la elaboracin de
cuadros, grficas y el clculo de algunos promedios, tal como se present en unidades anteriores. Sin
embargo, estos ltimos quedan incompletos, ya que en algunos casos particulares nos estn dando
resultados que distorsionan el comportamiento de ese conjunto de datos o, en el mejor de los casos, no
nos mide nada. Esta es la razn que nos lleva hacia el conocimiento de otras medidas que complementan
e indican cmo se distribuyen o se dispersan los valores observados a ambos lados del promedio, es decir,
cmo se concentran alrededor del valor central o valor tpico.
El promedio calculado, por s mismo, tiene escaso valor significativo, si no se determina el grado de
variabilidad de los datos. No es extrao, pues, que las distribuciones tengan el mismo promedio pero con
diferente grado de dispersin la finalidad en esta unidad es calcular el grado de concentracin de las
observaciones alrededor de un promedio, mediante la aplicacin de ciertas medidas de dispersin,
determinando, al igual que en el promedio, cul de ellas es la ms indicada en determinado caso. Veamos
algunas de esas medidas.
RECORRIDO (R)
Esta medida se conoce tambin con el nombre de rango. Puede definirse como la diferencia entre el
mayor y el menor valor que toma la variable. Esta medida, tan sencilla de calcular y ms conocida como
oscilacin, slo brinda una ligera aproximacin del grado de variabilidad, pues presenta el inconveniente
que slo toma en cuenta los valores extremos, sin importar el conjunto de valores intermedios; por tanto,
en algunos casos puede arrojar un resultado totalmente distorsionado por su gran sensibilidad a valores
extremos, mostrndose engaador e inestable.
DATOS NO AGRUPADOS
S observamos los siguientes datos: 6; 8; 6; 10; 5, el RANGO ser igual a 10 - 5 = 5.
R = Xmx Xmn
DATOS AGRUPADOS
Apliquemos esta medida en datos agrupados, tanto en la variable discreta corno en la continua, con la
misma informacin que se ha utilizado en los promedios.
xi
R = x7 x1
R=60=6
fi
0
1
2
3
4
5
6
3
7
15
10
8
5
2
R = 68 33 =35
50
Variable discreta
xi 1 xi
33,1 38
38,1 43
43,1 48
48,1 53
53,1 58
58,1 63
63,1 68
fi
3
5
7
9
15
9
2
50
Variable contina
Se puede ver en los ejemplos anteriores que los valores intermedios de la variable, algunos de ellos con
peso o frecuencia de alguna importancia, no fueron tomados en cuenta para el clculo del rango.
VARIANZA (S2 2)
Es una de las medidas de dispersin ms til, con un significado fcil de captar. Es definida,
generalmente, como la media de los cuadrados de las diferencias entre los valores que toman la variable y
su media aritmtica. Se define tambin como el cuadrado de la desviacin tpica o estndar. Se simboliza
mediante S2 2.
La definicin anterior nos hace pensaren la existencia de una sola frmula para calcular la dispersin. Sin
embargo, existe ms de una expresin matemtica para la misma idea, algunas de ellas prcticas para
casos simples; otras, para datos agrupados o para el uso de la calculadora. Veamos algunas de ellas.
DATOS NO AGRUPADOS
Para los siguientes datos originales: 6; 8; 6; 10; 5, obtengamos la varianza por las siguientes frmulas, de
las cuales el alumno escoger la que considere ms fcil de manejar.
a)
S
b)
c)
35
7
5
(x
2
i
2
i
S2
x)
nx
16
3,2
5
261 5(7) 2
3,2
5
261
(7) 2 3,2
5
xi
6
8
6
10
5
35
xi - x
-1
1
-1
3
-2
0
(xi - x )2
1
1
1
9
4
16
xi2
36
64
36
100
25
261
DATOS AGRUPADOS
Aplicamos las frmulas anteriores, pero ponderadas para las variables discreta y continua. Para esta
ltima, debe trabajarse con las marcas de clase.
xi
fi
xi - x
(xi - x )2
(xi - x )2 fi
xi2 fi
0
1
2
3
4
5
6
3
7
10
15
8
5
2
50
S2
a)
b)
-2.82
7,9524
23,8572
-1,82
3,3124
23,1868
-0,82
0,6724
6,7240
0,18
0,0324
0,4860
1,18
1,3924
11,1392
2,18
4,7524
23,7620
3,18
10,1124
20,2248
109,3800
Variable discreta - Clculo de la varianza
S2
n
f nx
2
i i
fi
109,38
2,19
50
507 50(2,82) 2
2,19
50
n
2
i
c)
x fi
2
i
507
5
0
7
40
135
128
125
72
507
x =2,82
2,82 2 2,19
En datos agrupados, tanto en la variable discreta como en la continua, se puede trabajar con desviaciones
respecto a una media supuesta u origen de trabajo, y se denomina primer mtodo abreviado para el
clculo de la varianza.
xi
0
1
2
3
4
5
6
fi
3
7
10
15
8
5
2
50
di= (xi A)
-4
-3
-2
-1
0
1
2
-
(xi -A)2
16
9
4
1
0
1
4
-
difi
-12
-21
-20
-15
0
5
4
-59
di2 fi
48
63
40
15
0
5
8
179
A=4
2
i i
179 59
S2
50 50
S 2 3,58 (1,18) 2
2
i i
S 2 2,19
Variable discreta Clculo de la varianza Primer Mtodo abreviado
Calculemos la varianza por los diferentes mtodos ya vistos, pero aplicados a una variable continua.
xi
fi
35,5
40,5
45,5
50,5
55,5
60,5
65,5
3
5
7
9
15
9
2
50
x 51,80
xi2
xi - x
(xi - x )2
(xi - x )2 fi
-16,3
265,69
797,07
1.260,25
-11,3
127,69
638,45
1.640,25
-6,3
39,69
277,83
2.070,25
-1,3
1,69
15,21
2.550,25
3,7
13,69
205,35
3.080,25
8,7
75,69
681,21
3.660,25
13,7
187,69
375,38
4.290,25
2.990,50
Variable continua Clculo de la varianza
xi2 fi
3.780,75
8.201,25
14.491,75
22.952,25
46.203,75
32.942,25
8.580,50
137.152,50
137.152,50 - 50(51,8)
2.990,5
59,81
S2
59,81
50
50
a)
b)
137.152,5
S2
(51,8) 2 59,81
50
c)
S2
Trabajemos ahora con el segundo Mtodo abreviado para calcular la varianza, el que slo se aplica
cuando la amplitud del intervalo es constante. Tambin como en los casos anteriores, debe trabajarse con
las marcas de clase.
xi
35,5
40,5
45,5
50,5
55,5
60,5
65,5
fi
di
di/c
di fi
di 2 fi
3
-10
-2
-6
12
5
-5
-1
-5
5
A = 45,5
7
0
0
0
0
9
5
1
9
9
C=5
15
10
2
30
60
9
15
3
27
81
2
20
4
8
32
50
63
199
Variable continua - Clculo de la varianza - Segundo Mtodo abreviado
/ 2
i
fi
fi
5 (199/50) (63/50)
2
/
i
a)
V k 0
V x k V x V k S 2x
Esta propiedad es vlida para la diferencia.
V x k S2x
d) La varianza de una constante por una variable es igual al producto de la constante elevada al
cuadrado por la varianza de la variable.
V xk k 2 S 2x
Es una de las propiedades que ms se dificulta, no slo para su aplicacin, si no para entenderla.
Consideremos que se tiene un conjunto de datos cuya variable est dada en horas, siendo su
promedio 7 y la varianza igual a 3,2. Se desea convertir esos resultados en minutos, sin tener que
volver aplicar las frmulas, con los datos transformados en minutos slo utilizando las propiedades.
La nueva media ser:
M xk k x 60(7) 420
minutos.
S2
S12 n 1 S 22 n 2 ( x 1 x ) 2 n 1 ( x 2 x ) 2 n 2
n
n
x1n1 x 2 n 2
n
Supongamos que los datos para la variable discreta que tanto se ha utilizado corresponden a la primera
submuestra con media x1 2,82 y varianza
x 2 51,8 y S22 59,81 . Con la informacin anterior, va a calcularse la media y la varianza, para el
conjunto de las 100 observaciones. Siendo:
2,82(50) 51,8(50)
27,31
100
2,19(50) 59,81(50)
100
31 599,7601 630,7601
100
S S2
(x
(x
x)2
(datos no agrupados)
x)2fi
n
(datos agrupados)
Con las varianzas obtenidas para las diferentes variables, calculemos sus desviaciones tpicas:
S 59,81 7,73
La desviacin estndar tiene una interpretacin bien precisa, por ejemplo, en la Distribucin Normal,
puede visualizarse con el siguiente grfico:
X
68.3%
95.5%
99.7%
Distribucin normal
El total del rea bajo la curva es igual a uno, o sea, el 100%. El rea corresponde a la proporcin de
observaciones en la distribucin, es decir:
x + 1S se tendr el 68,26%
x + 2S se tendr el 95,50%
x + 3S se tendr el 99,70% de las observaciones
La media de una distribucin normal () divide en dos partes iguales la curva, correspondindole a cada
lado el 50%. Si nos alejamos del centro a la derecha, una desviacin estndar se incluir en esta rea,
aproximadamente del 34,13% de las observaciones. Como es simtrica, si se toma una vez la desviacin
tpica a lado y lado del promedio, el total ser 68,26%.
Dentro del dominio de la variable, la media aritmtica, en general, se dice que debe comprender
tres veces la desviacin estndar; por lo tanto, se concluye que en una distribucin normal, la
desviacin tpica debe aproximarse a la tercera parte de la media aritmtica.
La Distribucin Normal, o de Gauss, es la distribucin terica de variable continua ms utilizada.
Adems, se trata de una distribucin simtrica, unimodal y asinttica al eje horizontal o abscisa, que
permite analizar numerosas variables resultantes de investigaciones de carcter socio-econmico que
presentan un comportamiento aproximado a la distribucin normal.
Se podrn comparar las desviaciones tpicas o las varianzas de dos o ms distribuciones, si se quiere
determinar cul de ellas tiene una menor o mayor variabilidad absoluta, siempre y cuando que las
variables estn dadas en las mismas unidades de medida.
COEFICIENTE DE VARIACIN (CV)
Se dijo que puede calcularse la variabilidad absoluta siempre y cuando las distribuciones estn dadas en
las mismas unidades de medicin. Por lo tanto, se requiere de una medida de dispersin para cuando sean
diferentes, siendo el coeficiente de variacin el ms indicado, calculado como el cociente entre la
desviacin tpica y la media aritmtica. Se simboliza por CV, d V.
Desviacin tpica
Coeficiente de variacin = Media aritmtica
CV
S
x
CV (S x )100
El coeficiente permite comparar la variabilidad de dos o ms distribuciones dadas en unidades de medidas
diferentes, con el fin de determinar cul de ellas tiene una mayor o menor variabilidad relativa.
Si partimos de la consideracin hecha a partir de la Distribucin Normal, se dir que una distribucin,
cualquiera que tenga un Coeficiente de Variacin menor o igual al 33%, tiende a ser homognea, es decir,
la media obtenida ser lo bastante representativa del total de las observaciones y si, por el contrario, el
CV se hace mayor al 33%, nos indicar que cada vez ser ms heterognea. Por lo tanto, la media ir
perdiendo su representatividad; de ah que en el muestreo se procede, en estos casos, a dividir la
poblacin en grupos ms homogneos, denominados estratos, permitiendo la aplicacin del muestreo
aleatorio estratificado.
PUNTAJE TPICO "O" ESTANDARIZADO (Z t)
Algunos lo denominan como puntaje de la Z, y es expresado como desviaciones respecto a la media
muestral, en unidades de desviacin tpica. Es muy aplicado en la transformacin de valores de una
variable, expresado en cierta escala, en unidades de otra escala Z, proceso denominado como tipificacin
o estandarizacin. Igualmente se utiliza para comparar los resultados de ciertos experimentos expresados
en unidades de medida diferente; tambin sirve para indicar la posicin relativa de un elemento de la
distribucin con respecto a la media en unidades de desviacin estndar, como puede observarse en los
resultados de las pruebas que se realiza para indicar la posicin que ocupa el estudiante dentro del
conjunto. Esta medida se simboliza ya sea por Z o t, para la frmula:
xx
S
Si consideramos que un curso obtiene en promedio 6,8 en matemtica y. 7,8 en estadstica, y se quiere
saber en cul de ellas un alumno alcanza mejor posicin relativa,
es decir, en cul obtuvo un mejor rendimiento con relacin al grupo, si las calificaciones de ese alumno
fueron 7,0 y 7,6, respectivamente. Aparentemente se dira que en la segunda, pero dentro del curso
corresponde a la primera. Apliquemos la frmula, si se sabe que las desviaciones tpicas fueron 0,6 y 0,3,
respectivamente.
Zmatemtica = (7,0 - 6,8)/0,6 = 0,33
Zestadstica = (7,6 - 7,8)/0,3 = 0,66
Se dir que hay una mejor posicin relativa cuanto ms cerca a 3 se encuentre, ya que es el mximo valor
que supuestamente toma Z.
Da = 0,7979 S
Datos no agrupados
Continuamos til izando los mismos datos: 6; 8; 6; 10; 5, de tal manera que nos permitan comparar los
resultados obtenidos con la aplicacin de las diferentes medidas. La frmula a aplicar es:
Da
xi
xi - x
xi x
6
8
6
10
5
-1
1
-1
3
-2
1
1
1
3
2
x x i n 35 5 7
Da
n
Da S
8
1,6
5
DATOS AGRUPADOS
El procedimiento de clculo es parecido al desarrollado para obtener la varianza, con la modificacin de
trabajar con las diferencias entre la variable y la media, en valores absolutos.
xi
fi
xi - x
0
1
2
3
4
5
6
3
7
10
15
8
5
2
50
-2,82
-1,82
-0,82
0,18
1,18
2,18
3,18
-
xi x
xi x
fi
2,82
8,46
x 2,82
1,82
12,74
D a 58,8 50 1,176
0,82
8,20
0,18
2,70
Da S
1,18
9,44
1,18 < 1,48
2,18
10,90
3,18
6,36
58,80
Variable discreta - Desviacin media
fi
xi - x
35,5
40,5
45,5
50,5
55,5
60,5
65,5
3
5
7
9
15
9
2
50
-16,3
-11,3
-6,3
-1,3
3,7
8,7
13,7
-
xi x
xi x
fi
16,3
48,9
x 51,8
11,3
56,5
D a 322,4 50 6,448
6,3
44,1
1,3
11,7
Da S
3,7
55,5
6,45 < 7,33
8,7
78,3
13,7
27,4
322,4
Variable continua - Desviacin media
clculo se desarrolla exactamente igual al de la media, sustituyendo esta por la mediana. Las frmulas
para aplicar en este caso son:
De
De
Me
n
Me f i
n
GLOSARIO
Coeficiente de variacin Dispersin
Rango
Desviacin media
Distribucin normal
Recorrido
Desviacin mediana
Oscilacin
Variacin absoluta
Desviacin estndar
Desviacin tpica
Variacin relativa
Posicin relativa
EJERCICIOS DE APLICACIN
1.
El coeficiente de variacin de 200 empleados de una empresa es 62%. Despus de reajustar todos los
salarios en $1400, este coeficiente de variacin es del 52%. Sin embargo, la gerencia fija un sueldo
mnimo de $6100. Antes del reajuste 40 personas tenan un sueldo medio de $6000 y todos ellos
ganaban menos de $7000; con la nueva poltica de la gerencia, sus sueldos sern elevados a $7100.
Determinar la cantidad de dinero mensual que necesitar la empresa para pagar despus de efectuado
el reajuste.
Solucin
CV = S/ x = 0,62
CV = S/( x +1400) = 0,52;
40(6000) 160 x 2
7280
200
x2
14560000 240000
7600
160
Si el nuevo promedio de salario es $7100 para los 40 empleados, el resto de empleados, o sea los 160,
devengarn $7600 ms los $1400 de aumento, es decir $9000. El valor total de la nmina ser:
40 (7100) + 160 (9000) = $1 724 000.
2.
Tres empresas de la ciudad realizan concursos de admisin a fin de proveer las vacantes actuales y
entre los inscritos, en las tres empresas, aparece el Seor Pedreros. Gracias a sus influencias el Seor
Pedreros pudo conocer los resultados generales y los de l en particular.
EMPRESA
A
B
C
a)
58
72
68
CALIFICACIN
4,7
3,8
4,2
Seor Pedreros
69
77
64
En cul de las entrevistas, el Seor Pedreros obtuvo una mejor posicin? En cul estuvo mal?
b) Si se sabe que el nmero de aspirantes a la vacante en cada una de las empresas fue: 320; 472;
258, respectivamente, cul es el promedio de calificacin y el coeficiente de variacin para el
total?
Solucin
fue la peor
4,7 2 (320) 3,8 2 (472) 4,2 2 (258) (58 66,75) 2 320 (72 66,75) 2 472 (68 66,75) 2 258
S
1.050
1.050
2
CUESTIONARIO
1.
a) Coeficiente ce variacin.
b) Desviacin media y desviacin mediana.
c) Cual es el valor del rango u oscilacin?
2.
Para cinco artculos se tienen las variaciones en sus precios respecto al mes pasado. Estos valores
fueron: -$40; -$120; -$80; +$50; +$220.
Se pide calcular el
a) Coeficiente de variacin.
b) Desviacin media.
c) Desviacin mediana.
3.
En un curso de capacitacin ofrecido por la empresa a sus trabajadores, uno de ellos terico y el otro
prctico, se calific utilizando una escala de O a 10. Uno de los trabajadores obtuvo las calificaciones
de 8,2 y 6,8 en los cursos respectivos. El trabajador pudo averiguar cules haban sido los promedios
y la dispersin en las notas obtenidas en cada curso, con el siguiente resultado;
Curso terico:
Media = 8,7;
Varianza = 1,21
En cul de los cursos este trabajador obtuvo una mejor posicin relativa?
Cul es el coeficiente de variacin para el curso en general, si adems se sabe que al primero
asistieron 30 trabajadores y al segundo, solo asistieron 20?
4.
Los empleados de tres departamentos de una empresa fueron sometidos a una prueba sobre
conocimiento del rea en la cual trabajan, con los siguientes resultados:
DEPARTAMEN
TO
A
B
C
x
74
82
68
S
6,2
7,8
4,4
N
25
40
35
Una vez publicadas las notas se encontr que haba un error en los clculos, ya que faltaban 10
puntos que se haban ofrecido como compensacin a una pregunta calificada como mal pero que era
correcta. Se pide calcular el coeficiente de variacin para el total de empleados teniendo en cuenta
los 10 puntos que se deben aadir a las calificaciones de cada uno de los empleados.
5.
Un jefe de produccin encuclilla anotado en el libro de control que el peso promedio del artculo
fabricado es 270 gramos, con una desviacin tpica de 8 centmetros. Hay algo incorrecto?
6.
Si se tiene una media muestral x = 25 y varianza de 36, hallar la media muestral, la varianza y
desviacin tpica de y, en los siguientes casos:
a) y = 8 + 20 x
b) y = 5 x - 26
7.
Si en un problema cualquiera se obtiene una varianza de 2,4 horas, pero se nos solicita el resultado en
minutos, cul ser su valor?
8.
Si en una empresa el salario promedio es $210.000, con una desviacin tpica de $8.216, mientras
que en otra empresa de la competencia el salario promedio es $224.500, con una varianza de 92.544.
En cul de las empresas los salarios presentan
a) Una mayor variabilidad absoluta?
b) Una menor variabilidad relativa?
9.
Cuando se aplica el muestreo en un plan de auditora, uno de los aspectos ms importantes que se
deber considerar es la variabilidad de la poblacin objeto de estudio. Esta se mide por:
a) La media; b) desviacin estndar; c) la mediana; d) ninguna de las anteriores.
10. Una firma tiene 40 almacenes distribuidos en el territorio nacional y se cuenta con la siguiente
informacin sobre las ventas mensuales en millones de pesos.
VENTAS (millones
NMERO
$)
10,1 20
ALMACENES
2
20,1 30
30,1 40
13
b) la desviacin media
40,1 50
c) la desviacin mediana
50,1 60
60,1 70
4
40
Calcular:
a) el coeficiente de variacin
11. En una prueba realizada a 30 autos, de una nueva marca, se obtiene un rendimiento promedio de 32,4
millas por galn de gasolina, con varianza de 32,04 mpg. a) Exprese estos resultados en trminos de
kilmetros por galn (un km =0,622); b) Exprese los resultados anteriores en kilmetros por litro (un
litro = 1,056 cuartos de galn).
12. Para qu se utiliza el coeficiente de variacin?
13. A los trabajadores de una empresa el prximo ao les ser aumentado el salario mensual en un 20%
ms $12.000. La empresa tiene 850 trabajadores y actualmente devengan un salario medio mensual
de $230.000, con un coeficiente de variacin del 38%.
a) Cul ser la desviacin estndar el prximo ao?
b) En cunto se aumentar el valor de la nmina el prximo ao?
14. Una encuesta a 12 fbricas de helados revela los siguientes porcentajes de utilidad:
25% 20% 22% 20% 25% 30% 18% 16% 30% 16% 20% 16%
Se pide calcular:
a) Coeficiente de variacin
b) Desviacin media
d) Varianza
e) Desviacin mediana
c) Rango
15. En el lanzamiento do un producto se realiz una investigacin para determinar el grado de
aceptacin, utilizando una escala de 10 puntos. Se tom a 12 hombres y 12 mujeres con el siguiente
resultado:
HOMBRES: 7 5 6 9 10 8 7 4 5 7 3 10
MUJERES: 6 4 4 3
a)
6 8 6 5 5 4
Con los 24 datos, construya una tabla de frecuencia y calcule el coeficiente de variacin, la
desviacin media y la desviacin mediana.
cuando M1 = Me = Md;
Asimtrica positiva
Asimtrica negativa
Simtrica
Asimtrica Positiva
Asimtrica Negativa
M1
Md Me M1
Simtrica M1 = Me = Md
M1 Me Md
a)
As
x Md
s
b)
As
3( x Me)
s
x = 51,8;
s = 7,73;Md = 55,5;
Me = 53,33
As
m3
s3
m3
m2
m3
x fi
n
fi
xi - x
(xi - x )2
(xi - x )2 fi
(xi - x )3 fi
3
-16,3
265,69
797,07
-12.992,241
5
-11,3
127,69
638,05
7.214,485
7
-6,3
39,69
277,83
-1.750,329
x =51,8
9
-1,3
1,69
15,21
-19,773
15
3,7
13,69
205,35
759,795
9
8,7
75,69
681,21
5.296,527
2
13,7
187,69
375,38
5.142,706
50
2.990,50
-10.147,800
Variable continua - Clculo del momento de orden tres respecto a la media
m2 = S2 = 59,81
S=
59,81 =7,73
As
m3
S3
m3
As
x fi
10.147,800
202,956
50
202,956 202,956
0,44
461,89
7,73 3
MEDIDAS DE APUNTAMIENTO
Es conocida tambin como curtosis y permite establecer el grado de apuntamiento o achatamiento de la
curva de la distribucin respecto a la normal. Esta medida propuesta tambin por Pearson y basada en los
momentos unidimensionales, es dudosa si se considera que una simple razn mida adecuadamente el
apuntamiento de una distribucin. La frmula que se aplicar es:
Ap
m4
S4
m4
m4
2 2
x fi
n
fi
xi - x
(xi - x )2
(xi - x )2 fi
(xi - x )4 fi
35,5
3
-16,3
265,69
797,07
211.773,5283
40,5
5
-11,3
127,69
638,05
81.523,6805
45,5
7
-6,3
39,69
277,83
11.027,0727
x =51,8
50,5
9
-1,3
1,69
15,21
25,7049
55,5
15
3,7
13,69
205,35
2.811,2415
60,5
9
8,7
75,69
681,21
51.560,7849
65,5
2
13,7
187,69
375,38
70.455,0722
50
2.990,50
429.117,0722
Variable continua - Clculo del momento do orden cuatro, respecto la media
Apuntadaoomesocrtica
leptocrtica >=33
Normal
Achatada o platicrtica < 32.990,50
m 2 s 2 59,81
m4
Ap
m4
2 2
x fi
n
50
8.582,34
59,81
429.117,085
8.582,34
50
Ap
8.582,34
2,40
3.577,24
m4
m4
S S
4
2 2
Si Ap = 3, la distribucin es normal.
b) Si Ap > 3, la curva es apuntada, ms alta que la normal y nos indica una concentracin alrededor del
promedio.
c)
En el ejercicio que nos ocupa encontramos que 2,4 < 3, siendo la curva algo achatada.
A las tres formas anteriores se les denomina leptocrtica, platicrtica y mesocrtica.
MOMENTOS
Es necesario referirnos a ellos en forma rpida, ya que se ha mencionado en varias ocasiones. En trminos
generales, un momento es el valor medio de una potencia de una variable. Hay varias clases de
momentos, a saber:
a) Momentos respecto a la variable.
b) Momentos respecto a la media aritmtica.
c) Momentos respecto a un origen de trabajo o media supuesta.
d) Momentos respecto a la media supuesta, tomada en unidades de amplitud.
La media aritmtica es un momento de orden uno, respecto a la variable.
ar
x f
r
i i
a1
x f
1
i i
mr
m2
x fi
n
s2
/
r
A f i
r
d f
r
i i
En el caso de momentos respecto a un origen de trabajo, tomada en unidades de amplitud, estar dada por
la frmula
m r//
// r
i
i
Siendo
d i//
d i/ x i A
C
C
En todos los casos r significa el orden del momento y la potencia a la cual se eleva la variable. Se tendr
que r toma valores de 1, 2, 3, 4...
CUESTIONARIO
1.
Qu significa:
a) que una variable tenga un apuntamiento mayor a la normal?
b) que la distribucin de una variable sea asimtrica a la derecha?
2.
fi
38
22
14
6
3
2
85
Se pide:
a) Construir un histograma y un polgono de frecuencias.
b) Calcular la media, mediana y moda. Utilizar la
informacin anterior para determinar el grado de
asimetra y hacia que lado se presenta la deformacin.
c) Calcular el grado de apuntamiento y de asimetra,
3.
i-1
X x
120,1 136
136,1 142
142,1 148
148,1 154
154,1 160
160,1 168
4.
fi
2
6
14
26
38
54
140
Con los siguientes datos, responda las preguntas formuladas en los ejercicios anteriores.
Xi-1 xi
-0,5 0,5
0,5 ,15
1,5 2,5
2,5 3,5
3,5 4,5
4,5 5,5
5,5 6,5
6,5 7,5
fi
1
7
21
35
35
21
7
1
128
Xi-1 xi
-0,5 0,5
0,5 ,15
1,5 2,5
2,5 3,5
3,5 4,5
4,5 5,5
5,5 6,5
6,5 7,5
fi
35
21
7
1
1
7
21
35
128
Estas series, en parte, son analizadas a travs del uso de los nmeros ndices, se hallan dentro de las
distribuciones bidimensionales, es decir, estn constituidas por dos variables: una de ellas corresponde al
tiempo, identificada por X, que puede ser aos, semestres, meses, quincenas, semanas, das, horas; la otra
variable, simbolizada por Y, se refiere al fenmeno que se investiga, que puede ser: produccin, ventas,
costos, inversin, horas trabajadas, accidentes de trabajo, matrcula, precios, etc., informacin que nos
permite analizar aspectos de su comportamiento pasado, presente y futuro.
El anlisis que se hace a una serie no slo corresponde a aspectos econmicos, sino que encierra mltiples
aspectos de la vida diaria, social, poltica, educativa, etc., o sea, todos aquellos fenmenos que varan a
travs del tiempo y que requieren la aplicacin de mtodos que permitan conocer los efectos de los
cambios, como ayuda en el proceso de control y planeacin de esos aspectos, adems, predecir su
comportamiento futuro.
Si consideramos una variable, por ejemplo produccin, esta ser el resultado de varios aspectos, tales
como: la tendencia, las variaciones estacionales, las cclicas y las aleatorias. Veamos en qu consiste cada
una de ellas.
Tendencia o tendencia secular. Esta ltima es una expresin alternativa para la tendencia de una serie, la
cual corresponde a un movimiento suave y constante que se extiende durante perodos extensos.
Generalmente, se representa por una lnea recta, parablica, exponencial o cualquier otro tipo de lnea,
dependiendo del comportamiento de la variable.
Variacin estacional. Se considera, generalmente, como parte del movimiento que se atribuye al efecto
de las estaciones del ao, es decir, a circunstancias climticas o a simples costumbres sociales: las ventas
en navidad, la demanda de hotelera en temporada alta, etc.; sin embargo, puede corresponder a
variaciones que se presentan en perodos ms cortos; por ejemplo, el movimiento de pasajeros en
transporte urbano, en el cual se observan unos perodos denominados "picos", de alta demanda, que se
repiten todos los das laborables, en las mismas horas y en las mismas condiciones.
Variaciones cclicas. Ligadas a los ciclos econmicos, corresponden a movimientos peridicos, ms o
menos regulares, que se extienden por varios aos, sin que se pueda determinar cundo se inicia y termina
su ciclo. Estas variaciones corresponden a perodos de prosperidad, recesin, depresin y recuperacin.
Variaciones aleatorias. Denominadas tambin accidentales o irregulares, resultan de sucesos no
previsibles, generalmente ocasionados por situaciones excepcionales, pero que se pueden identificar.
Ejemplos: huelgas, inundaciones, terremotos, crisis poltica o situaciones generadas por factores externos.
Parte del anlisis de estas series consiste en la descomposicin de la serie en los factores antes
mencionados. Sin embargo, se dice que todas ellas contienen variaciones aleatorias, y que no
necesariamente abarcan la totalidad de los factores. En algunos casos, su clculo aislado se hace difcil, ya
que resultan inseparables. Se puede afirmar que es posible, la mayora de las veces, determinar la
cuantificacin de la tendencia y las variaciones estacionales, en un determinado perodo. En cambio las
variaciones cclicas y las aleatorias slo se podrn determinar por residuo. De todas formas, siempre va a
ver cierta dificultad para descomponer esos factores, ya que son movimientos poco uniformes en el
tiempo, y que en muchos casos no permiten su identificacin.
TENDENCIA
La tendencia es considerada como el principal componente de una serie de tiempo. En muchos casos, slo
existe preocupacin por su comportamiento, olvidando en forma desprevenida las incidencias que, en
algunas situaciones, pueden verse afectadas por los otros tres componentes. Para identificar la tendencia,
es recomendable, en primer lugar, hacer su representacin grfica. Para ello nos valemos de un plano
cartesiano. De esta manera, se podr observar el comportamiento de la serie, al mismo tiempo que nos
permite visualizar mejor la tendencia, es decir, la lnea ms adecuada para su representacin, la que puede
ser una recta, una parbola, una exponencial o cualquier otra lnea. Dentro de los mtodos utilizados
para describir la tendencia, se tienen:
MTODO LIBRE O DE MANO ALZADA
Es conocido tambin como mtodo grfico y, como su nombre lo indica, consiste en utilizar la serie,
partiendo de la elaboracin del respectivo grfico; luego, con base en la experiencia y un perfecto
conocimiento del desarrollo pasado y presente, prolongar la lnea, para de esta manera expresar el
comportamiento futuro. Este mtodo es muy subjetivo, ya que el resultado depende de quien trace o
prolongue la lnea. A pesar de lo anterior, es justificada con el argumento de estar basada en el pleno
conocimiento de su comportamiento y no de un sistema rgido, como son los mtodos matemticos.
Ahora, consideremos una informacin arbitraria, que presente variaciones, y que nos permita graficar no
slo los valores observados, sino la tendencia, mediante los diferentes mtodos que sern expuestos en
esta unidad.
Ejercicio: Supongamos que una empresa comercial desea proyectar sus ventas (miles de unidades); para
ello, organiza la informacin por aos de la siguiente forma:
AOS:
VENTAS:
1987
36
1988
1989
1990
1991
55
40
48
72
Tabla 1.Ventas (miles de unidades) 1987-1993
1992
50
1993
68
Se pide elaborar la grfica correspondiente a los datos originales y efectuar la estimacin para los dos
aos siguientes, mediante los diferentes mtodos que a continuacin se presentan:
Solucin:
Realunidades)
VENTAS (miles de
40
Estimado
20
0
1986 1988 1990 1992 1994
AOS
Grafico 1. Representacin grfica de las ventas (miles de unidades)
En la grfica 1. aparecen representados los datos originales de la tabla, y adems d los valores estimados
(tendencia) segn criterio del autor, quien consider necesario ajustar una recta, en tal forma que divida
la lnea poligonal en dos partes, es decir, que pase aproximadamente por el centro.
MTODO ANALTICO
Se realiza mediante la aplicacin de una funcin matemtica que exprese la tendencia.
Los mtodos ms conocidos y aplicados son los siguientes:
A) Recta o funcin lineal
Y = a + bX
Y = a + bX + cX2
Y = abx
El problema es saber elegir la funcin matemtica que mejor represente o describa la tendencia de esa
serie temporal y la seleccin de esa lnea, la cual, adems de la visualizacin grfica, depende de la
experiencia, sentido comn, habilidad y, sobre todo, del buen juicio del investigador. Por otra parte, en el
proceso de proyeccin debe suponerse que el comportamiento pasado y presente, continuar sindolo,
ms o menos, en la misma forma en el futuro. Por lo tanto, las proyecciones son vlidas para uno o dos
perodos, aceptndose para un perodo no mayor de cinco aos, pues en la mayora de estas series su
comportamiento tiende a cambiar, haciendo fracasar las proyecciones, en especial cuando los cambios son
fuertes.
TENDENCIA RECTILNEA
Como su nombre lo indica, la serie se describe mediante una recta, si el crecimiento, o decrecimiento, de
las cantidades, en cada uno de los perodos, es ms o menos constante. Veamos el procedimiento que debe
seguirse. Para ello, partimos de la informacin de tabla 1..
La ecuacin de la recta est dada por Y = a + bX
a: corresponde al coeficiente de posicin. Tambin se le considera como un punto localizado en el eje
de la ordenada; por tal razn, se le denomina como origen en la ordenada. Puede simbolizarse por a,
A o 0.
b: es la pendiente o coeficiente angular. Nos determina la tasa de crecimiento o el ngulo de inclinacin
de la recta. Puede ser positiva, si la recta es ascendente; o negativa, cuando es descendente. Tambin
puede simbolizarse por b, B o 1.
X: corresponde a la variable tiempo, simbolizada tambin por t.
Y: es la variable que se va a predecir o estimar y se simboliza por Y*.
El mtodo de los mnimos cuadrados facilita el clculo de los parmetros a y b, y mediante la utilizacin
de un sistema de ecuaciones normales, permite la aplicacin de cualquiera de los mtodos que el
estudiante conoce para dar solucin, como son el de sustitucin, igualacin y eliminacin.
Las ecuaciones son:
1) Y = na + bX
2) XY = aX + bX2
Calculemos estos coeficientes; para ello se tomar como origen de la serie el primer perodo, siendo X =
0 y su sumatoria diferente de cero (X 0), situacin que implica la necesidad de aplicar las ecuaciones
anteriores. Hagamos su clculo y proyeccin para 1997. Ver tabla 2.
AOS
1987
1988
1989
1990
1991
1992
1993
X
-3
-2
-1
0
1
2
3
0
X
0
1
2
3
4
5
6
X2
0
1
4
9
16
25
36
XY
0
55
80
144
288
250
408
40,08
44,29
48,50
52,71
56,93
61,14
65,35
369 21
X2
9
4
1
0
1
4
9
91
1.225
XY
-108
-110
-40
0
72
100
204
369,00
Y
36
55
40
48
72
50
68
28
118
origen
+ 28b;
Este resultado significa qu por cada unidad de tiempo, en este caso un ao, la variable crece en 4,21, o
sea, 4210 unidades.
= valor preeditor
El valor estimado para 1997, teniendo en cuenta que X = 1997 1987 = 10, ser:
= 40,08 + 4,21 (10) = 82,18 = 82180 unidades. Corresponde a las unidades que se estima se vendern
en 1997, de acuerdo al comportamiento de la serie. El origen se puede trasladar a cualquier punto o
perodo, y su resultado ser exactamente igual. Cuando la serie es impar y continua lo recomendable es
trasladar el origen al perodo central, de tal manera que la X = O, con lo cual se logra agilizar y
simplificar las operaciones de clculo. Con la informacin de la tabla 3., calculemos el valor de los
parmetros, obtengamos la ecuacin de la recta y estimemos el valor de Y para 1997, tomando como
origen a 1990.
b = XY X2 = 118 28 = 4,21
a = Y n = 369 7 = 52,71
= a + bX = 52,71 + 4,21X
Y
36
55
40
48
72
50
68
40,08
44,29
48,50
52,71
56,93
61,14
65,35
Y
-4,08
10/71
-8,50
-4,71
15,07
-11,14
2,65
(Y )2
16,6464
114,7041
72,2500
22,1841
227,1049
124,0996
7,0225
Y2
1.296
3.025
1.600
2.304
5.184
2.500
4.624
369
369,00
0,00
584,0116
20.533
Tabla 3. Clculo de la varianza residual y del coeficiente de correlacin
Primero calculamos los cuadrados de las diferencias entre los valores reales y estimados, los sumamos y
luego los dividimos por el nmero de perodos. Medida conocida como varianza residual, mide la
dispersin de los datos que no queda explicada por la recta de estimacin.
S 2y x
(Y Y) 2
n
584,0116 7 83,43
Tambin se puede calcular en forma ms sencilla, a pesar de que sus resultados presentan una ligera
diferencia, mediante la aplicacin de la frmula:
2
yx
S 2y x 83,75
a Y b YX
n
S 2y x
S 2y x
S 2y x
nY
r 2 1 (S 2y x S 2y )
r r 2 0,46 0,68
Valor bastante alejado de la unidad; por lo tanto, se puede decir que existe poca correlacin y que esa
recta es poco explicativa para los datos de esta.
Hay un procedimiento que nos permite determinar el coeficiente de correlacin lineal en forma directa:
n XY X Y
n X X n Y Y
2
7(1.225) 21 369
826
0,68
2
2
1
.
218
7(91) 21 7 20.533 (369)
TENDENCIA PARABLICA
Se emplea, en especial, cuando la serie presenta variaciones acentuadas y cuando asume la forma de una
parbola. La ecuacin correspondiente est dada por Y = a + bX + cX 2. La tarea consiste en determinar
los valores para los parmetros a, b y c. Para ello, nos valemos de un sistema de ecuaciones normales,
siendo:
1) Y = na + bX + cX2
2) XY = aX + bX2 + cX3
3) X2Y = aX2 + bX3 + cX4
a
Utilicemos la informacin de la tabla 1. y trabajemos, en primer lugar, tomando como origen el primer
perodo de la serie, es decir, 1987, donde X = 0 y la X 0.
AOS
1987
1988
1989
1990
1991
1992
1993
Y
36
55
40
48
72
50
68
369
X2Y
0
55
160
432
1152
1250
2448
39,61
44,30
48,79
53,09
57,21
61,13
64,87
21 91
441
2275
1225
5497
Tabla 4. Clculo de la tendencia parablica
369,00
X
0
1
2
3
4
5
6
X2
0
1
4
9
16
25
36
X3
0
1
8
27
64
125
216
X4
0
1
16
81
256
625
1296
XY
0
55
80
144
288
250
408
118 =
28b + 168c
La ecuacin resultante la hemos sealado como ecuacin 4); ahora trabajamos con las ecuaciones primera
y tercera. Para ello, multiplicamos a la primera ecuacin por -13 y se la restamos a la tercera.
3) 5.497 = 91a + 441b + 2.275c
1) -4797 = -91a 273b 1183c
5)
700 =
168b + 1092c
Tenemos dos ecuaciones: 4) y 5), cada una con dos incgnitas; por lo tanto, se podr eliminar el
parmetro b multiplicando la ecuacin 4) por -6 y la restamos de la 5):
5) 700 = 168b + 1092c
4) -708 = -168b 1.008c
-8 =
84c,
siendo c = -8 84 = -0,095
Y
36
55
40
48
72
50
68
369
Y
-3,61
10,07
-8,797
-5,09
14,79
-11,13
3,13
(Y )2
13,0321
114,4900
77,2641
25,9081
218,7441
123,8769
9,7969
0
28
0
196
118
1.468
369,00
0,00
Tabla 5. Clculo de la tendencia parablica con cambio de origen
583,1122
X
-3
-2
-1
0
1
2
3
X2
9
4
1
0
1
4
9
X3
-27
-8
-1
0
1
8
27
X4
81
16
1
0
1
16
81
XY
-108
-110
-40
0
72
100
204
X2Y
324
220
40
0
72
200
612
39,61
44,30
48,79
53,09
57,21
61,13
64,87
Vamos a utilizar el sistema de ecuaciones expuesto anteriormente, suprimiendo aquellos trminos donde
X = 0.
1) Y = na + cX2
1) 369 = 7a + 28c
2) XY = bX2
2) 118 = 28b
84c;
Siendo c = -8 84 = -0,095; este valor no vara, aun cuando cambiemos el origen. Una vez calculado el
parmetro c lo reemplazamos en la primera ecuacin, siendo:
1) 369 = 7a + 28 (-0,095)
a = [369 + 2,66] 7 = 53,09
La ecuacin general quedar as:
= 53,09 + 4,21X 0.095X2
El valor estimado de para 1997, sabiendo que X = 1997 1990 = 7, ser:
= 53,09 + 4,21(7) 0,095(49) =77,91
Existen otras frmulas que simplifican las anteriores operaciones cuando la X = 0:
b = XY n
X XY
c
n X X
a Y c X n
369
n X 2 Y
b = 118 7 = 4,21
2 2
7(l.468) (28)(369)
-0,095
7(l96) (28) 2
S 2y x (Y - Y) 2 n
S 2y x 583,1182 7 83,30
2
yx
S 2y x
a XY b YX c X 2 Y
n
20.533 23,09(369) 4,21(118) 0,095(1.468)
83,64
7
S 2y 154,49
. Conociendo
r 2 1 (S 2y x S 2y )
El valor de ser igual a
r 0,4608 0,68
Y
1987
1988
1989
1990
1991
1992
1993
36
55
40
48
72
50
68
39,61
44,30
48,79
53,09
57,21
61,13
64,87
369
369,00
13,10
-8,41
-3,92
0,38
4,50
8,42
12,16
( Y )2
Y 369 7 52,71
171,7223
70,8002
15,4000
0,1412
20,2114
70,8242
147,7614
S a2 y
(Y Y) 2 n
S a2 y 496,8607 7 70,98
R 2 S a2 y S 2y
R 2 70,98 154,49 0,459
r 0,459 0,68
0,00
496,8607
Tabla 6.Clculo de la varianza residual
Comprobado que el coeficiente de correlacin parablico se puede calcular de diferentes maneras con el
mismo resultado, procedamos a la representacin grfica.
TENDENCIA EXPONENCIAL
Describe la tendencia de una serie si los crecimientos y decrecimientos muestran un porcentaje casi constante
de un perodo a otro; por ejemplo, una serie que crece en un 5% mensual o del 28 % anual. La tasa de
crecimiento de la variable debe ser geomtrica.
La ecuacin general es Y = abx
Es ms fcil su aplicacin si empleamos los logaritmos:
log Y = log a + X log b
Para el clculo de los parmetros, cuando la X 0, se debe utilizar un sistema de ecuaciones normales.
AOS
1987
1988
1989
1990
1991
1992
1993
Y
36
55
40
48
72
50
68
369
X
0
1
2
3
4
5
6
X2
0
1
4
9
16
25
36
log Y
1,55631
1,74036
1,60206
1,68124
1,85733
1,69897
1,83251
X log Y
0
1,74036
3,20412
5,04372
7,42930
8,49485
10,99505
21
91
11,96878 36,90743
Tabla 7.Ajuste exponencial cuando X 0
log
1,60256
1,63832
1,67407
1,70983
1,74558
1,78133
1,81709
40,04
43,48
47,21
51,27
55,66
60,44
65,33
11,96878
363,73
28 log b
X2
36
55
40
48
72
50
68
369
-3
-2
-1
0
1
2
3
0
9
4
1
0
1
4
9
28
X logY
log
2
(log Yi log Y) (log
Y log Y) 2
-4,66891 1,60256
-3,48072 1,63832
-1,60206 1,67407
0
1,70983
1,85773 1,74558
1,69897 1,78139
1,83251 1,81709
1,00110 11,9687
0,0738597
6
8
Tabla 8. Ajuste exponencial cuando X = 0
0,035793
b =1,0858 ;
r = 8,58%
log a = log Y n = 11,96878 7 = 1,70983;
a = 51,27
La ecuacin general ser: log = 1,70983 + 0,0357537X ; el valor estimado para 1997, sabiendo que X =
7, ser: log = 1,70983 + 1,001106 (7) = 1,96010
Ahora se puede obtener el antilogaritmo de 1,96010, siendo igual a
= 91,22
Se observa en los dos cuadros anteriores que log = log Y, en cambio Y . Esto hace que el
clculo del coeficiente de correlacin se dificulte, ya que es necesario trabajar con logaritmos de los
valores reales y de los valores estimados. Lo mismo sucede con el clculo de la media aritmtica y la
varianza, que corresponde a los logaritmos de la variable.
Directamente puede calcularse el coeficiente de correlacin al cuadrado, de la siguiente manera:
r
2
log Y log Y
log Y
log Y
r2
0,035793
0,48
0,0738596
r 0,48 0,70
Tambin se puede calcular as:
2
Slog
log
Y
log
Y
yx
i
2
S log
n
y log Yi log Y
2
2
Slog
yx 0,109653 7 0,0156647
2
S log
y 0,07385967 7 0,0105513
r 0,48 0,70
La representacin grfica debe elaborarse en papel semilogartmico, colocando en el eje horizontal o
abscisa la variable tiempo, y en el eje vertical los logaritmos de la variable Y. En el ejemplo realizado no
se requiere, ya que la variable no muestra un crecimiento geomtrico y, por lo tanto, no es necesario el
clculo de la tendencia geomtrica; solo se desarroll el ejercicio con el fin de mantener la serie e indicar
el procedimiento que debe seguirse y poder comparar estos resultados con los otros dos ajustes.
Estimado
20
0
19861988199019921994
AOS
Grafico 4.Ventas reales y estimadas 1987 - 1933 Ajuste exponencial
EJERCICIOS DE APLICACIN
1.
2.
Y
?
?
220
240
30
220
254
Se pide:
a) Calcule los valores de Y1 y Y2.
b) Estime el valor de
c) Calcule el coeficiente de correlacin lineal
3.
Con base en una serie de tiempo se pudieron calcular, mediante un ajuste rectilneo, los salarios
iniciales de los egresados de una facultad, encontrndose que en 1986 eran, en promedio, $72.200 y
en 1993, de $ 380.500. Con base en estos estimativos:
a)
b) Prediga los salarios que tendr el egresado al iniciar su ejercicio profesional, en 1997.
(a b) n a n na n 1b
P C xn p x q n x
C xn
= combinaciones de n elementos
Ejemplo: En el lanzamiento de cuatro monedas, la probabilidad de que se tengan exactamente dos cara es
igual:
a)
nmero de exitos
numero de exitos
CCCC
CCCS
CCSS
CSSS
CCSC
CSSC
SCSS
CSCC
SCSC
SSCS
SCCC
SSCC
SSSC
SSSS
SCCS
CSCS
1/16
4/16
6/16
4/16
Nmero de xitos
6
0,375
Total de casos posibles 16
P 37,5%
P
n = 4 monedas
Sello = q = 1/2;
P C xn p x q n x P C 24 (1 / 2) 2 (1 / 2) 2
C xn
n!
4!
24
C 24
C 24
C 24 6
(n x)! x!
(4 2)!2!
4
1/16
1 1
P 6
2 2
P 37,5%
1
P 6
P 0,375
16
DISTRIBUCIN NORMAL
Cuando el valor de n, es demasiado grande, se presenta dificultad en el clculo de las probabilidades, y
por lo tanto se utiliza la distribucin normal.
La distribucin binomial es una distribucin de probabilidad discreta, en cambio la distribucin normal
corresponde a una variable continua, as que los problemas de distribucin binomial (denominado
mtodo exacto), se pueden resolver mediante la distribucin normal (denominado mtodo aproximado},
trasformando la variable discreta en continua. Por otra parte, se debe obtener la media y la desviacin
estndar de una distribucin binomial
npq
1
4 2
2
1 1
4 1
2 2
La distribucin normal grficamente se presenta mediante una curva en forma de campana denominada
indistintamente curva normal, curva de error, curva de probabilidad o campana de Gauss, siendo de gran
utilidad en la inferencia estadstica.
El rea bajo la curva normal es igual al 100/o. La media () se encuentra localizada en el centro,
dividiendo la curva en dos partes iguales, correspondindole a cada una de ellas el 50%.
Para hallar el rea bajo la curva utilizamos la variante estadstica Z, en otras palabras, la
variable X la tipificamos o estandarizamos, mediante la aplicacin de la siguiente frmula.
La adopcin de unidades de Z tiene como fin referir cualquier distribucin normal a un tipo nico cuyos
parmetros sern = 0 y 2 = 1. Si consideramos el lanzamiento de las 4 monedas del ejercicio anterior,
la probabilidad de obtener exactamente dos caras, mediante la aplicacin de la distribucin binomial se
vio que era igual a 0,375 o 37,5%; ahora, mediante la utilizacin de la distribucin normal se tendr:
En primer lugar, la forma de hacer la pregunta vara, ya que en la binomial era P (X = 2) y en la normal
ser P (1,5<X<2,5), trasformando la variable discreta en continua.
Siendo = 2 y = 1 se tendr:
2,5 2
Z
0,5
1
1,5 2
Z
0,5
1
Z
Para Z = 0,5 el rea (ver tabla II) ser igual a 0,1915; por ser simtrico, para Z = 0,5 se tendr el mismo
valor de 0,1915, el rea total de la regin sombreada ser igual a la suma: 0,1915 + 0,1915 = 0,3830 =
38,3%. Se observar que el resultado es bastante aproximado al obtenido mediante la binomial.
LIMITES DE CONFIANZA
El anlisis de una poblacin podra dificultarse dado su tamao, lo cual ocasionara altos costos,
requerira un gran nmero de personas para encuestar y un tiempo demasiado largo, para poder abarcar la
totalidad de las unidades que conforman la poblacin; en algunas investigaciones, el elemento o unidad se
destruye al ser analizado, tal como ocurre, por ejemplo en la vida o duracin de una bombilla, de una
batera para carro, de una pila, en la dureza de un vidrio, de un tornillo, de un alambre, etc., lo cual impide
que tomemos la totalidad de las unidades producidas, ya sea de una mquina o de un conjunto de
mquinas; en otros casos, la poblacin puede ser infinita, como ocurre al analizar las caractersticas de los
peces en un ro. En todos estos casos se hace necesario la realizacin de una muestra, generalmente
aleatoria, que conlleva a tomar tan solo una parte de los elementos que constituyen la poblacin que se va
investigar.
Supongamos que se desea estudiar alguna caracterstica o caractersticas de los empleados de un sector
industrial, por ejemplo: los sueldos.
Podramos recurrir a toda la poblacin (total de empleados en el sector) pero sera muy dispendioso la
recoleccin de esa informacin, debido al nmero tan elevado de empleados. As que se recurre a una
muestra aleatoria de 200 empleados, obtenindose un promedio mensual de $7.200 y desviacin estndar
de $800. El resultado del promedio se infiere, es decir se considera como si fuera el promedio que se
obtiene al tomar la totalidad de los empleados, sin embargo observemos que se podr obtener un nmero
M de muestras posibles de tamao 200 de una poblacin de N elementos, as:
M C nN
N!
( N n)! n! posibles combinaciones
Ejemplo. Supongamos una poblacin pequea de 13 elementos, de la que se van a seleccionar muestras
de 4 elementos. Calcular el nmero de muestras posibles
Resolucin:
N = 13
n=4
M C nN
M=?
M C413
M
N!
( N n)! n!
13! 6.227.020.000
6.227.020.000
8.709.120
n ); b) de la
desviacin tpica ( s). Si la desviacin tpica es grande, nos estar indicando que los datos se
encuentran muy dispersos en relacin a la media, caso contrario sucede, cuando la desviacin es pequea.
Con las dos caractersticas anteriores se obtiene el error estndar de la media, la que es igual a:
sx
s
n
s
800
565,7
n
200
sx
Si consideramos que el salario promedio obtenido es de $7.200, siendo uno de los tantos promedios que
se pueden obtener en una muestra al azar sin poder afirmar que sea igual a la media poblacional, lo que
requerir fijar unos lmites de confianza para la media muestral con una probabilidad (por ejemplo del
95%, aceptando que nos equivoquemos 5 veces de 100, o sea con un margen de error del 5/o) dentro de
la cual debe estar la media poblacional. En este caso, la tabla para calcular el rea bajo la curva de
probabilidad nos dice que Z = 1,96 Cmo se halla el valor de z = 1,96? Como el rea total bajo la
curva asumimos que es el 95% = 0.95 este valor de 0.95/2 = 0,475 por ser dos regiones este valor de
0,475 buscamos en la tabla II y vemos a que valor de Z corresponde Z = 1,96 y se tendr que los
lmites para la media poblacional estimada sern:
X xZ
s
n
X 7.200 1,96(56,57)
n
200
0,0571 5,71%
N 3.500
, por lo tanto los lmites de confianza para la media muestral se
calcularn as:
s
1 f
n
X sI x Z
ss
n
n 1 ;
25
25 1
s 800
sx
s
816
163,20
n
25
Siendo igual:
s
800
800
sx
163,20
n 1
25 1
24
b) La desviacin tpica se puede calcular directamente corregida
x x
n
ss
n 1
x x
n
n 1
n 1
X sI x t
s
n
(sin factor de correccin para poblacin finita dado que f < 0,05)
PRUEBA DE HIPTESIS
Como en la mayora de los casos no se conoce la media poblacional (verdadera), ya que nos tocara
trabajar con todos los elementos que constituyen la poblacin, pero s se puede tener un valor aproximado
como resultado de una larga experiencia debido a continuas evaluaciones que nos permitan tomarlo como
el comportamiento normal de esa distribucin.
As, por ejemplo, se tendr que un fabricante ofrece bateras (pilas) para transistor que tiene una duracin
promedio de 4.000 horas. Un comprador cualquiera adquiere 36 pilas y encuentra que la duracin
promedio es de 3.600 horas, resultado que lo obliga a pensar que est siendo engaado, comprando un
producto de menor calidad, pues la duracin promedio de las 36 pilas fue inferior a la ofrecida por el
fabricante. La desviacin tpica de la duracin de estas pilas fue de 985.
Al nivel del 5%, se quiere saber si el fabricante est ofreciendo un producto de menor calidad.
El proceso que se sigue para la prueba de la hiptesis es el siguiente:
a)
Se plantea la hiptesis nula (Ho) y la hiptesis alternativa (Ha). La prueba puede ser bilateral o
unilateral (derecha o izquierda).
Planteamiento de la hiptesis
Hiptesis nula Ho: = 4.000 horas
Hiptesis alternativa Ha: < 4.000 horas para prueba unilateral a la izquierda
b)
c)
Desviacin tpica conocida = 985 horas (con distribucin normal y la muestra es aleatoria)
s
n
3.600 4.000
2,43
985
36
Como la prueba es unilateral y la campana se divide en 50 % al un lado y 50% al otro lado. Tomamos
slo el 50% de la izquierda es decir el 0,5 y a este valor le restamos el margen de error con el que se
trabaja en este caso 0.05,
0,5000 0,05 = 0,45000 con este valor de rea buscamos el valor de Z en la tabla II Z = 1,64 y
representamos en la campana de Gauss
Planteamiento de la hiptesis
Hiptesis nula Ho: = 4.000 horas
Hiptesis alternativa Ha: 4.000 para prueba bilateral o doble cola
b)
c)
s
n
3.600 4.000
2,43
985
36
Como la prueba es bilateral al 50% de la campana le restamos /2 es decir 0,05/2 = 0,025 y con este
valor de rea hallamos el valor de Z en la tabla II
0,5 0,025 = 0,4750 con este valor de rea hallamos Z = 1,96; luego identificamos las regiones en la
campana.
Como el valor de Z calculado es -2,43 cae en la zona de rechazo o regin crtica, por esta razn
rechazamos la afirmacin del fabricante.
Si se plantea la hiptesis de que la duracin de las pilas es superior a lo afirmado por el fabricante, la
prueba ser unilateral a la derecha y se plantea de la siguiente manera:
a)
Planteamiento de Hiptesis
Hiptesis nula Ho: = 4000 horas
Hiptesis alternativa Ha: > 4.000 horas
b)
s
n
3.600 4.000
2,43
985
36
De igual forma que en el primer caso Z tabulado = 1.64 razn por lo que se rechaza la hiptesis nula.
Cuando n es menor o igual a 30 y el resto de datos se mantienen se procede de la siguiente manera:
S en el ejemplo anterior n = 25 tenemos
S
(c) Clculo de la desviacin S =
s 985
25
1.005,31
24
horas
t
d)
x 3.600 4.000
1,99
s
1.005,31
n
25
En este caso como -1,99 cae en la zona de aceptacin, se podr concluir, al nivel del 5% y con una
muestra menor que 30 el fabricante tiene razn.
Si se trata de una prueba unilateral, el punto crtico de "t" siendo = 0,05, se procede de la siguiente
forma:
= n 1; =25 1; = 24
= 2(0,05); = 0,10 (se toma el doble se unilateral a la izquierda o derecha),
Con = 24 y = 0,10 localizamos el valor de t en la tabla III t = 1,7109 y localizamos las regiones en
la campana.
DISTRIBUCIN JI CUADRADO
En la aplicacin de la prueba anterior se presentan dos posibilidades, pero en el caso en que se tengan ms
de dos posibilidades, ese procedimiento no es aplicable y se hace necesario la utilizacin de otro tipo de
distribucin, denominado como ji o chi cuadrado,
cuyo nombre se deriva del uso como smbolo de la letra griega , la que se lee ji o chi. La frmula que se
aplica, para el clculo de esta distribucin, es la siguiente:
ni ni *
n1 *
ni *
1
120
(120)
20
6
6
y as para todas las caras
ni
ni*
ni ni*
(ni ni*)2
(ni ni *) 2
ni *
1
2
3
4
5
6
26
23
19
14
18
20
120
20
20
20
20
20
20
120
6
3
-1
-6
-2
0
0
36
9
1
36
4
0
1,80
0,45
0,05
1,80
0,20
0
4,30
EXITOS
TOTAL
74
54
131
63
66
129
140
120
260
PROCEDIMIENTOS
A
B
Total
A qu conclusin se puede llegar? (nivel del 5%)
Solucin
La anterior tabla es de "2 X 2" ya que se tienen dos columnas (Fracasos y xitos) y dos
Lneas (A y B}. El procedimiento que se sigue es similar al anterior.
p1
140
0,54
200
, o sea que el 54/o corresponde al procedimiento A
p1
120
0,46
200
, o sea que el 46/o corresponde de al procedimiento B
De 260 enlatados 131 fueron fracasos, ahora si lo multiplicamos por 0,54, se obtendr el nmero de
enlatados esperados que fracasen en el procedimiento A; si se multiplica por 0,46, se obtendr el nmero
de fracasos esperados para el procedimiento B, esto mismo sucede con los 129 xitos, que al ser
multiplicados por 0,54 y 0,46, respectivamente, darn el nmero de xitos esperados para A y B,
respectivamente.
ni
ni*
ni ni*
(ni ni*)2
(ni ni *) 2
ni *
77
54
63
66
260
70,74
60,26
69,66
59,34
260,00
6,26
-6,26
-6,66
6,66
0
39,19
39,19
44,36
44,36
0,55
0,65
0,64
0,75
2,59
= (2 1) (2 1) = 1
Siendo 2,59 < 3,84, se acepta la hiptesis, o sea que ninguno de los procedimientos es superior al otro.
Siempre que se tenga una tabla de 2 X 2 es decir que = 1 se debe calcular el valor de n2 utilizando la
correccin de Yates y la frmula ser:
ni
ni*
n i * 0,5
n1 *
ni ni*
n i ni *
ni ni * 0,5
ni * 0,5
ni * 0,5
n1 *
77
54
63
66
260
70,74
60,26
69,66
59,34
260,00
6,26
-6,26
-6,66
6,66
0
6,26
6,26
6,66
6,66
5,76
5,76
6,16
6,16
33,18
33,76
37,95
37,95
0,47
0,55
0,54
0,64
2,20
BIBLIOGRAFA
ESTADSTICA APLICADA A LOS NEGOCIOS Y A LA ECONOMA DE
MARCHAL, WILLIANG edicin # 12
LIND, DOULAS A.