Escolar Documentos
Profissional Documentos
Cultura Documentos
+ =
1 2
Donde L
md
es el lmite inferior del intervalo mediano, n es el total de datos
en la muestra y corresponde a la suma de las frecuencias en la distribucin; F
md-1
es la frecuencia acumulada hasta el intervalo anterior al que contiene la mediana;
f
md
es la frecuencia particular que corresponde al intervalo que contiene a la
50% de los datos por debajo de la mediana
Criterios para la Presentacin del Proyecto de Investigacin y de Tesis 17
VAC. Academia de Investigacin
mediana y a es la amplitud o tamao del intervalo (distancia entre el lmite inferior
y el lmite superior de un intervalo)
MODA
Es el valor de la observacin que aparece con ms frecuencia. Lind-
Marchal-Mason. (2004), p.74
Ejemplo: A continuacin se muestran los sueldos anuales (en dlares) de
gerentes de control de calidad en algunos estados. Cul es el valor modal de los
sueldos?
Estado Sueldo Estado Sueldo Estado Sueldo
Arizona 35000 Illinois 58000 Ohio 50000
California 49100 Louisiana 60000 Tennessee 60000
Colorado 60000 Maryland 60000 Texas 71400
Florida 60000 Massachussets 40000 West
Virginia
60000
Idaho 40000 New jersey 65000 Wyoming 55000
Si analizamos todos los sueldos, el que repite mas es el de $60000, por lo
tanto esa es la moda.
El manejo anterior es sencillo si se tienen pocos datos, en caso contrario se
tiene que recurrir a ordenarlos en una distribucin de frecuencias y posteriormente
ver que clase es la que tiene mayor nmero de observaciones o mayor frecuencia.
Para calcular la moda, cuando los datos estn agrupados deber tomarse el
intervalo con mayor frecuencia como punto de partida de la interpolacin, de
acuerdo con la frmula:
Criterios para la Presentacin del Proyecto de Investigacin y de Tesis 18
VAC. Academia de Investigacin
|
2 1
1
a L Mo
mo (
+
+ =
Donde L
mo
es el lmite inferior del intervalo con mayor frecuencia;
1
es la
diferencia entre la frecuencia del intervalo con mayor frecuencia y la frecuencia del
intervalo antecedente;
2
es la diferencia entre la frecuencia modal y la frecuencia
del intervalo posterior (cuando los datos estn agrupados de menor a mayor) y a
es la amplitud del intervalo.
MEDIA GEOMTRICA
Es til para encontrar el promedio de porcentajes, razones, ndices o tasas
de crecimiento. Se utiliza principalmente en negocios y la economa. Lind-
Marchal-Mason. (2004, p.77).
MG=
Ejemplo: Suponga que reciba un aumento de sueldo de 5% este ao, y
reciba uno de 15% el prximo. Cul ser el aumento porcentual promedio?
MG= =1.09886%
MEDIDAS DE DISPERSIN
Anteriormente se estudiaron las medidas de tendencia central, en este
aparatado se expondrn las medidas de dispersin ya que sin estas, las primeras
seran unos indicadores engaosos.
Criterios para la Presentacin del Proyecto de Investigacin y de Tesis 19
VAC. Academia de Investigacin
Esto se debe a que las medidas de dispersin nos indican si los datos estn
lejos o cerca de la medida de tendencia central as como la manera en que estn
distribuidos debajo de la curva.
RANGO
El rango de un conjunto de datos es la diferencia entre el valor mximo y el
valor mnimo Triola F. Mario, (2008), p. 93.
Ejemplo: Calcule el rango de los tiempos de espera de la siguiente tabla:
Banco 1: filas variables 6 6 6
Banco 2: una sola fila 4 7 7
Banco 3: mltiples filas 1 3 14
Banco 1:
Rango=6-6=0
Banco2:
Rango=7-4=3
Banco 3:
Rango=14-1=13
Esto quiere decir que en el banco 3 los datos estn ms dispersos con
respecto a la medida de tendencia central. Triola (2008, p. 92, 93).
Criterios para la Presentacin del Proyecto de Investigacin y de Tesis 20
VAC. Academia de Investigacin
El Rango es relativamente sencillo de calcular, pero como depende de los
valores mximo y mnimo no es tan til como otras medidas de dispersin.
DESVIACIN MEDIA
2
D
m
=
De acuerdo a Lind-Marchal-Mason. (2004, p.102) Es el promedio aritmtico
de los valores absolutos de las desviaciones con respecto a la media aritmtica
n
Donde:
Xi: es cada uno de los datos
X: media aritmtica
n : nmero total de datos
Ejemplo: el nmero de pacientes atendidos en una sala de urgencias del
hospital St. Luke para una muestra de 5 das el ao pasado fue: 103, 97, 101, 106
y 103. Determine la desviacin media.
X-media Desviacin absoluta
103-102 1
2
La desviacin media Dx es poco utilizada porque es una desviacin sobreestimada y a la frmula hay que
agregarle la frecuencia de cada diferencia pues no necesariamente vas a tener datos nicos, siempre puede
haber repeticiones.
Criterios para la Presentacin del Proyecto de Investigacin y de Tesis 21
VAC. Academia de Investigacin
97-102 5
101-102 1
106-102 4
103-102 1
Total 12
DM=12/5=2.4
Lind-Marchal-Mason. (2004, p.103).
VARIANZA Y DESVIACIN ESTANDAR MUSTRALES
o Varianza: La media aritmtica de las desviaciones cuadrticas con
respecto a la media.
o Desviacin estndar: La desviacin estndar es la raz cuadrada
positiva de la varianza.
Clculo de la varianza muestral (S
2
) y de la desviacin estndar muestral
(S):
1
) (
1 1
2
2
=
=
n
x x
S
n
i
x
y
2
1 1
2
1
) (
=
=
n
x x
S
n
i
x
Se divide entre n-1 porque se pierde un grado de aleatoriedad por cada medida
estadstica que se utilice para definir otra, en este caso se usa la media aritmtica
para definir a la varianza y la desviacin.
Criterios para la Presentacin del Proyecto de Investigacin y de Tesis 22
VAC. Academia de Investigacin
Ejemplo: las edades de los pacientes del pabelln de aislados en el hospital
Yellowstone, son: 38, 26, 13, 41 y 22 aos. Cul es la varianza y la desviacin
estndar de estas personas?
Calculando la media:
X=140/5=28
Edad (X) X-media (X-media)
2
38 10 100
26 -2 4
13 -15 225
41 13 169
22 -6 36
Total=140 Total=0 Total=534
Desviacin estndar
Varianza y la desviacin
muestral sera la raz cuadrada de esta varianza muestral
En este ejemplo, todos los valores son nicos, por lo tanto no hay repeticin y la
frecuencia es 1, en el caso de haber repeticin cada diferencia (X-media)
2
se
multiplica por su frecuencia.
El manejo anterior es sencillo si se tienen pocos datos, en caso contrario se
tiene que recurrir a ordenarlos en una distribucin de frecuencias y posteriormente
utilizar la siguiente frmula:
Criterios para la Presentacin del Proyecto de Investigacin y de Tesis 23
VAC. Academia de Investigacin
2
2 2
1
1
=
=
n
x n x f
S
i
n
i
i
x
i
f es la frecuencia particular de cada valor que toma la variable;
En donde:
Xi: es cada uno de los datos
X: media aritmtica
N: nmero total de datos
COEFICIENTE DE VARIACIN
De acuerdo a Lind-Marchal-Mason. (2004, p.115) Es la razn (cociente) de
la desviacin estndar y la media aritmtica, expresada como un porcentaje.
100 . .
(
=
X
S
V C
Donde:
S: desviacin estndar
X: media
Esta medida es til para comparar la variacin relativa cuando los datos
estn en unidades diferentes. Ejemplo: Un estudio sobre el monto de bonos
pagados y los aos de servicio de varios empleados, dio como resultado los
Criterios para la Presentacin del Proyecto de Investigacin y de Tesis 24
VAC. Academia de Investigacin
siguientes datos estadsticos: la media de los bonos pagados fue de $200 y la
desviacin estndar fue de $40. Comprese las dispersiones relativas.
CV=(40/200)*100=20%
Lind-Marchal-Mason. (2004), p.115, 116.
Existen otras medidas de dispersin como son los Cuartiles, Deciles y
Centiles, estos expresan de igual manera a la dispersin que la desviacin
estndar, razn por la cual solo se mencionan en este prrafo sin profundizar en
los conceptos y frmulas.
Los cuarteles, percentiles, deciles etc., son medidas posicionales que se
utilizan para definir valores lmite para una fraccin determinada de elementos en
la distribucin ordenada, por ejemplo cul es el valor de la variable estudiada
cuando se separa el 68% de los datos ordenados?
a
f
F
L C
i
i
p
p
i n
p i
|
|
.
|
\
|
+ =
1 1
100
) (
CORRELACIN
Una correlacin existe entre 2 variables cuando una de ellas est
relacionada con la otra de alguna manera. Triola F. Mario, (2008), p. 517.
Criterios para la Presentacin del Proyecto de Investigacin y de Tesis 25
VAC. Academia de Investigacin
COEFICIENTE DE CORRELACIN
El coeficiente de correlacin lineal r mide la fuerza o grado de la relacin
lineal entre los valores cuantitativos apareados x y y en una muestra. El
coeficiente de correlacin lineal tambin se conoce como coeficiente de
correlacin producto momento de Pearson, en honor a Karl Pearson (1857-
1936), quien lo desarroll originalmente. Triola F. Mario, (2008), p. 518.
1
1
=
=
n s s
y x n y x
r
y x
n
i
i i
donde:
n: nmero de pares de observaciones x es la media de la variable x
X: suma de los valores de la variable x y es la media de la variable y
Y: suma de los valores de la variable y s
x
es la desviacin estndar de x
XY: suma de los productos de x y y s
y
es la desviacin estndar y
Ejemplo: En la siguiente tabla se muestran las llamadas a clientes
realizadas y copiadoras vendidas por lo 10 vendedores de una muestra de la
empresa Copier Sales of America.
representante de
ventas
llamadas a clientes
(X)
tom keller 20
jeff hall 40
brian virost 20
Criterios para la Presentacin del Proyecto de Investigacin y de Tesis 26
VAC. Academia de Investigacin
greg fish 30
susan welch 10
carlos ramirez 10
rich niles 20
mike kiel 20
mark reynolds 20
soni jones 30
Calcular el coeficiente de correlacin.
Como primer paso se tiene que graficar el diagrama de dispersin y ubicar
la media de ambas variables (lneas rojas) x=22 y y=45, antes de hacerlo es
pertinente aclarar que la variable dependiente es el nmero de computadoras
vendidas y la independiente es la cantidad de llamadas hechas. Para graficar se
posiciona a la variable dependiente en el eje Y y la variable independiente en el
eje X.
Fuente:Creacin propia (2012)
Criterios para la Presentacin del Proyecto de Investigacin y de Tesis 27
VAC. Academia de Investigacin
Si la relacin entre las 2 variables es positiva, entonces el nmero de
copiadoras vendidas es mayor a la media as como el nmero de llamadas
hechas.
Se calculan los productos que requiere la frmula de r:
representante de
ventas
llamadas a clientes
(X)
copiadoras vendidas
(Y)
XY
tom keller 20 30 400 900 600
jeff hall 40 60 1600 3600 2400
brian virost 20 40 400 1600 800
greg fish 30 60 900 3600 1800
susan welch 10 30 100 900 300
carlos ramirez 10 40 100 1600 400
rich niles 20 40 400 1600 800
mike kiel 20 50 400 2500 1000
mark reynolds 20 30 400 900 600
soni jones 30 70 900 4900 2100
TOTAL 220 450 5600 22100
1080
0
Sustituyendo en la frmula
r = =0.759
Para interpretar este nmero sera de la forma siguiente: en primera
instancia es un nmero positivo, esto quiere decir, que existe una relacin directa
entre variables, en segundo lugar es muy cercano a 1, y entre ms cercano a 1 la
relacin es ms fuerte.
Criterios para la Presentacin del Proyecto de Investigacin y de Tesis 28
VAC. Academia de Investigacin
Se dice que entre ms cercano a 1 (cuando la relacin es positiva) o a -1
(cuando la relacin es negativa) mayor es el grado de asociacin entre las
variables estudiadas.
REGRESIN LINEAL
3
3
El anlisis de regresin slo se utiliza cuando existe una relacin de dependencia entre las variables, esto
es Y depende o se modifica cuando el investigador modifica la variable independiente X. Y esto se mide
usando el coeficiente de determinacin r
2
. Se considera que el modelo de regresin es adecuado cuando r
2
es
al menos 0.8 pero entre ms cercano a 1 es mejor el ajuste al modelo matemtico propuesto.
Dado un conjunto de datos muestrales apareados, la ecuacin de
regresin
Y=a +bx
Describe algebraicamente la relacin entre 2 variables. La grfica de la
ecuacin de regresin se denomina recta de regresin (o recta del mejor ajuste o
recta de mnimos cuadrados). Triola (2008, p. 542).
Donde:
Y: es el valor pronosticado de la variable y para un valor seleccionado x.
a: es la ordenada de la interseccin con l, es decir, el valor estimado de y
cuando x=0.
b: es la pendiente de la recta, o el cambio promedio de y por unidad de
cambio en la variable independiente x.
Criterios para la Presentacin del Proyecto de Investigacin y de Tesis 29
VAC. Academia de Investigacin
b =
1
1
=
=
n s
y x n y x
b
x
n
i
i i
Donde y y x son las medias de ambas variables; s
x
es la desviacin
estndar de la variable x y n es el tamao de la muestra o nmero de pares
ordenados
a= x b y a =
donde:
X: valor de la variable independiente
Y: valor de la variable dependiente
N: nmero de elementos de la muestra
Ejemplo: Retomando el ejemplo utilizado en el apartado de correlacin
Cul es el nmero esperado de copiadoras vendidas por un representante que
realiza 20 llamadas a sus clientes?
Utilizando la tabla expuesta en el ejercicio anterior y sustituyendo en la
frmula tenemos:
b = =1.1842
a=
Criterios para la Presentacin del Proyecto de Investigacin y de Tesis 30
VAC. Academia de Investigacin
Por lo tanto la ecuacin de regresin es Y=18.9476+1.1842X. De modo
que si un vendedor hace 20 llamadas telefnicas, puede esperarse que venda
42.6316 copiadoras, esto es resultado de Y=18.9476+1.1842 (20). El valor
b=1.1842 (1.2 ya redondeado) significa que para cada llamada adicional que
realizan los representantes de ventas pueden esperar que aumente en casi 1.2 el
nmero de copiadoras vendidas. (Lind-Marchal-Mason. 2004), p.472, 473.
REFERENCIAS BIBLIOGRFICAS
Daniel WW, (2006) Bioestadstica- Base para el Anlisis de las Ciencias de
la Salud 4 Edicin: Limusa Wiley.
Devore J .L.(2001) Probabilidad y Estadistica para Ingeniera y Ciencias, 5
Edicin. Mxico: Thompson Learning.
Hines, W.W y Montgomery, D.C. (1993) Probabilidad y Estadstica para
Ingeniera y Administracin, 3 Edicin C.E.C.S.A. Mxico.
Lind-Marchal-Mason (2004) Estadstica para Administracin y Economa.
11 Ed: Alfa Omega.
Mendenhall. W.(1982) Introduccin a la probabilidad y la Estadstica 5
Edicin Wadsworth International/ Iberoamrica. USA: Thompson Learning.
Triola, Mario F. (2008). Estadstica. 10 Edicin: Ed. Pearson.