Você está na página 1de 133

ESTADISTICA PARA

ADMINISTRACIÓN Y
ECONOMÍA.
CURSO PROPEDÉUTICO
DESCRIPCIÓN DE LOS DATOS.

Distribuciones de Frecuencias y
Representaciones Gráficas.
Introducción:

Necesitamos organizar datos de varias


maneras e indicar los sitios donde los
valores de datos tienden a acumularse,
y ayudar a distinguir los valores
mayores y menores.
Los métodos que se utilizará para
describir un conjunto de datos son:
a.-) Distribución de Frecuencias:

Agrupamiento de datos en
categorías mutuamente
excluyentes, que indican el
número de observaciones en cada
categoría.
Para elaborarla el primer paso es
anotar los datos en una tabla que
muestre las clases (categorías) y
el número de observaciones en
cada categoría.

Ejemplo: Lectura 1
De acuerdo a la lectura Rob Whitner, esta
interesado en reunir información sobre los
precios de venta de los vehículos que vende
en su agencia.

¿Cuál es el precio de venta típico?, ¿Cuál es


el precio de venta más alto? ¿Cuál es el más
bajo? ¿Alrededor de qué valor tienden a
acumularse los precios de venta?

La tabla siguiente muestra los precios que


pagaron los clientes por cada vehículo.

Ver : Tabla 1
La tabla anterior muestra los
datos de una manera
desorganizada y es difícil sacar
los datos para contestar las
preguntas. Por lo tanto
aplicaremos una distribución de
frecuencias paso a paso.
La tabla anterior muestra los
datos de una manera
desorganizada y es difícil sacar
los datos para contestar las
preguntas. Por lo tanto
aplicaremos una distribución de
frecuencias paso a paso.
Paso 1

Determinar el Número de Clases:

El objetivo es usar suficientes


grupos o clases. Demasiadas
clases o muy pocas no darán
información.
Para determinar el número de clases
usaremos la siguiente fórmula:

k = 1 + 3.322*log(n)
En el ejemplo n = el número de observaciones
son 80.

Logaritmo de 80 = 1.903089987

Mult. 3.322*1.903089987 = 6.322064937

Completando la ecuación

K = 1 + 6.322064937
por lo tanto se recomienda utilizar
7 clases.
Paso 2

Determinar el Intervalo o Amplitud:

El intervalo o amplitud de las clases debe de


ser el mismo. Todas las clases deben de
cubrir la distancia que hay desde el menor
hasta el mayor valor de los datos sin
procesar. Usaremos la siguiente fórmula:
i >= H-L
K

Donde:

i= Intervalo de la clase.
H= Mayor valor observado.
L= Menor valor observado.
K= Numero de clases.
Para el ejemplo:

L=12,546 USD
H=32,925 USD
K=7

Entonces: (32,925-12,546)= 2,911 USD


7

Redondeando hacia arriba nos queda


de 3,000 USD.
Paso 3

Establecer los Límites de cada Clase:

Cada observación debe pertenecer a


una sola clase.
Para el ejemplo: 7 clases con una
amplitud de 3,000 USD nos da un total
de 21,000 USD.
Las clases que usaríamos para el
ejemplo serían:

$12,000 hasta 15,000


$15,000 hasta 18,000
$18,000 hasta 21,000
$21,000 hasta 24,000
$24,000 hasta 27,000
$27,000 hasta 30,000
$30,000 hasta 33,000
Paso 4

Distribuir los Precios de Venta de los


Vehículos en las Distintas Clases:
CLASE PRECIOS EN ESTA
CLASE
$12,000 hasta 15,000 IIII III
$15,000 hasta 18,000 ETC, ETC.
$18,000 hasta 21,000
$21,000 hasta 24,000
$24,000 hasta 27,000
$27,000 hasta 30,000
$27,000 hasta 33,000
Paso 5

Contar el Numero de Elementos en Cada Clase:Al


numero de observaciones en cada clase se le llama
frecuencia.

Precios de venta Frecuencia


(Miles de Dólares)

$12 hasta 15 8
$15 hasta 18 23
$18 hasta 21 17
$21 hasta 24 18
$24 hasta 27 8
$27 hasta 30 4
$30 hasta 33 2

TOTAL 80
Distribución de Frecuencias Relativas.

Es el porcentaje del número total de


observaciones en cada clase.

Precios de venta Frecuencia Frecuencia Relativa


(Miles de Dólares)

$12 hasta 15 8 0.1000


$15 hasta 18 23 0.2875
$18 hasta 21 17 0.2125
$21 hasta 24 18 0.2250
$24 hasta 27 8 0.1000
$27 hasta 30 4 0.0500
$27 hasta 33 2 0.0250

TOTAL 80 1.000
Ya organizados los datos en una distribución de
frecuencias podemos rendir un informe.

1.- Los precios de venta van desde los 12,000 hasta los
33,000 USD.

2.- Los precios de venta se concentran entre 15,000 y


24,000 USD (72.5% se localizan en éste intervalo).

3.- La mayor concentración está en la clase de 15,000


a 18,000 USD. El valor central de la clase es 16,500
USD (éste es le precio típico de venta)

15,000+18,000 = 16,500 USD.


2
Con ésta información el señor
Whitner tendrá una imagen clara
de la distribución de los precios
de venta del mes anterior.
PRACTICA
Autoexamen 2.1, 2.2, y 2.3
Ejercicios 1 a 8
Representaciones Graficas de una
Distribución de Frecuencias.

Nos proporcionan una buena imagen,


visualización rápida, manejo de varios
datos, percepción rápida. Etc.
Los mas utilizados son el histograma,
el polígono de frecuencias y el polígono
de frecuencias acumuladas.
HISTOGRAMA:

Es una gráfica en la que las clases se


marcan en el eje horizontal y las
frecuencias de clase en el eje vertical.
Las frecuencias de clase están
representadas por las alturas de las
barras, y éstas se colocan juntas una
con otra.
POLÍGONO DE FRECUENCIAS:
Esta formado por segmentos de recta
que unen a los puntos medios de cada
clase (valor típico) y las frecuencias de
clase.
Polígono de Frecuencias en un
comparativo:
Podemos representar gráficamente los
datos usando tanto los histogramas
como los polígonos:
Polígono de Frecuencias Acumuladas:
Precios de venta Frecuencia
(Miles de Dólares)
Frecuencia ¿De donde
acumulada salió?
$12 hasta 15 8 8
$15 hasta 18 23 31 8+23
$18 hasta 21 17 48 8+23+17
$21 hasta 24 18 66 8+23+17+18
$24 hasta 27 8 74 8+23+17+18+8
$27 hasta 30 4 78 8+23+17+18+8+4
$27 hasta 33 2 80 8+23+17+18+8+4+2

TOTAL 80
Si en este caso se calcula la frecuencia
acumulada y se grafica ; la figura recibe el
nombre de curva ojiva o simplemente ojiva.

Para análisis estadísticos mas avanzados se


suele tomar el polígono de frecuencias; en este
caso solamente la curva; Lo que recibe el
nombre de curva normal o campana de gauss.
Otras Representaciones Gráficas.
Las gráficas de barras son útiles para mostrar
cualquiera de los niveles de medición: nominal,
ordinal de intervalo o de razón.
En los histogramas los datos pertenecen a una
escala de intervalo o de razón.
Las gráficas circulares son útiles para mostrar
los datos de nivel nominal.
Las graficas de líneas para mostrar tendencias
con series de tiempo
Las graficas de correlación o x,y son útiles para
graficar funciones lineales, cuadráticas y en
general polinomiales
ejercicios
 Elabora las siguientes graficas tomando como
base los ejercicios 7 y 8 del tema de distribución
de frecuencias.
 Histograma
 Polígono de frecuencias
 Polígono de frecuencias acumuladas ( La ojiva)
DESCRIPCIÓN DE LOS
DATOS.
En este capítulo se continuará con el
desarrollo de métodos para describir un
conjunto de datos, mediante un único
valor:

Medida de tendencia central.

Es un valor único que resume un conjunto


de datos. Señala el centro de los valores.
Ejemplo:

Durante el cuatrimestre enero-abril


las calificaciones promedio en
Matemáticas III fue de 8.7

El rendimiento promedio de un
automóvil de 4 cilindros es de 14.6
km/lt.
En estadística existen varias medidas
de tendencia central.
Trabajaremos con las más utilizadas.
Media Poblacional:

Se utilizan todos los valores de una


población.

Ejemplo: El promedio de
calificaciones del EGETSU en todas
las Universidades Tecnológicas de la
República fue de 9.2
Ejemplo 2:

Las comisiones obtenidas de todas las


tiendas Suburbia en el año 2006
fueron de $ 1,875 por empleado.
En resúmen:

La media poblacional se calcula con la siguiente fórmula:

µ=∑x/N
Donde:

µ = Media de la población.
∑x= Suma de todos los valores.
N= Número total de elementos en la población.
Media Muestral.

Solo seleccionamos una muestra de la


población.
Ejemplo: El departamento de calidad
necesita tener la seguridad de que la
longitud de sus láminas es aceptable.
Selecciona 5 láminas y las mide y saca la
longitud promedio, y con ello estima la
longitud de las láminas que se producen.
Para datos no agrupados usaremos la siguiente
fórmula:
_
x = ∑x/n
Donde:
_
x = Media muestral
∑x= Suma de todos los valores de la muestra.
n= Número total de valores en la muestra.
La media de una muestra, o cualquier
otra medida basada en datos
muéstrales se denomina dato
estadístico

La característica de una población tal


como la media aritmética se
denomina parámetro poblacional
Ejercicio:
Cierta empresa se especializa en los
intereses a largo plazo que ofrecen
los bancos de diferentes países.
Una muestra aleatoria de 6 bancos
reveló lo siguiente:
PAÍSES TASA DE
INTERÉS
Banco de Australia 9.50 %
Banco de Bélgica 7.25 %
Banco de Canadá 6.50 %
Banco de Francia 4.75 %
Banco de Italia 12.0 %
Banco de México 8.30 %
¿Cuál es la media de las tasas de
interés en ésta muestra de intereses a
largo plazo?
Propiedades de la Media
Aritmética.
Propiedades:

1.- Todo conjunto de datos de nivel de


intervalo tiene un valor medio.

2.- Para evaluar la media se consideran


todos los valores.
3.- Un conjunto de datos solo tiene una media.

4.- La media es útil para comparar dos o mas


poblaciones.

5.- La media aritmética es la única medida de


tendencia central, donde la suma de las
desviaciones de cada valor, respecto de la
media, siempre es igual a cero:
_
∑ (X-X)=0
Ejemplo:

La media de 3,8,4 es 5

Entonces:
_
∑ (X-X)= (3-5)+(8-5)+(4-5)=0
= -2+3-1=0
= 0=0
DESVENTAJAS DE LA
MEDIA:

Si valores de una población son muy


grandes o muy pequeños, al sacar la
media podría no ser un promedio
adecuado para representar datos.
Ejemplo:

Los ingresos mensuales de los 5


profesores de Matemáticas de la
carrera de comercialización de la
UTSJR son:
$5,000- $4550- $3920- $ 5125 y
$12,569.
El sueldo de $ 12,569 afecta
indebidamente a la media.

Otra desventaja es que si hay clases con


extremos abiertos, como salarios de $
6,000 ó más, y existan 11 profesores en
esta clase no sabes si se acerca a los
$6,000, a los $7,000 etc.
Por lo tanto no es posible determinar la
media aritmética para intervalos abiertos.
PRÁCTICA:

1.- AUTOEXÁMEN 3.1

2.- EJERCICIOS 1-10


MEDIA PONDERADA.

Se utiliza cuando hay varias


observaciones con un mismo valor.
Ejemplo:
Un restaurante vende refrescos chicos,
medianos y grandes; y sus precios son de
$2, $3, $4 respectivamente. Los últimos 10
refrescos que se vendieron 1 chicos, 4
medianos, y 5 grandes.
Para calcular el precio promedio de
los últimos 10 refrescos vendidos
podemos usar:

_
x = ∑x/n

(Media Muestral)
Lo más correcto es usar la fórmula de la
Media Ponderada:

_
Xw= w1X1+w2x2+w3x3+…+wnxn
w1+w2+w3+…+wn
_
Donde: X = Media Ponderada.
W= Cantidad de cada muestra.
x= Ponderaciones (precios).
Sustituyendo datos:
_
X= 1($2)+4($3)+5($4) =34 = $ 3.4
1+4+5 10

Éste es el precio de venta medio de los


últimos 10 refrescos vendidos.

Cada observación se multiplica por el


número de veces que se presenta.
Ejercicio:

Cierta constructora paga a sus empleados


$120, $ 140, $ 160 pesos a sus
empleados. En al empresa hay 26
empleados contratados por hora.
14 reciben la primer tarifa, 10 reciben la
segunda y 2 reciben la última tarifa.
¿Cuál es la media de la tarifa por hora que
se paga a los 26 trabajadores?
Autoexamen 3.2
Ejercicios 11-14
Mediana.

Valor que corresponde al punto medio de


los valores después de organizarlos de
mayor a menor o viceversa.
Ejemplo:

Precios en pesos de casas en cierta colonia son:


$ 80,000 $ 65,000 $ 70,000 $ 275,000 $ 60,000

$ 60,000
$ 65,000
$ 70,000
$ 80,000
$ 275,000

Después de ordenarlos podemos observar


cual es la mediana.
Ejemplo II:

Las tasa de interés bancario a 3 meses de


los principales bancos del país son:
Banamex 28.5%, Scotiabank 17.2%,
Santander Serfín 25.4%, Bancomer
28.6%, Banorte 22.6%, HSBC 21.0%
Solución:
Ordenarlos de mayor a menor o viceversa:

17.2% Como existen 2 valores


21.0% centrales, se calcula la
22.6% mediana de ambas:
25.4%
28.5% 22.6+25.4 = 24.0%
28.6% 2
MODA.

Es el valor de la observación que aparece


con mas frecuencia.
Autoexamen 3.3
Ejercicios 15-20
Media Geométrica.

Se utiliza ampliamente en negocios y la


economía, para sacar cambios
porcentuales de ventas, sueldos, cifras
económicas (PIB).
Su fórmula es :

n ____________
MG=√ (X1)(X2)…(Xn) <= Media Aritmética
Ejemplo:

Las ganancias obtenidas por una constructora, en


cuatro proyectos recientes fueron de 3%, 2%, 4%, y
6% ¿Cuál es la media geométrica de la ganancia?

4__________ 4___
MG=√ (3)(2)(4)(6) = √ 144 = 3.46 %

Calcule la media aritmética y compare. R = 3.75


Un segundo uso de la Media Geométrica
es encontrar aumentos porcentuales
promedio en un intervalo de tiempo.
Ejemplo:
Si se ganaron $30,000 pesos al año, en
1990, y $50,000 en el año 2000. ¿Cuàl es
la tasa de aumento anual en el periodo?
La tasa de aumento se determina
mediante:
Formula de Aumento Porcentual Promedio
en un Periodo Determinado:

n ___________________
MG=√ Valor al final del periodo __ 1
Valor al inicio del periodo

n= Número de periodos
Ejemplo:

La población en México en 2001 era de


315,020 personas, y en 2007 de 789,915.
¿Cuál fue la tasa del incremento
porcentual anual promedio para el
periodo?
Entre 2001 y 2007 hay una diferencia de 6
años por lo tanto n=6
6_______
MG=√ 789,915 _ 1
315,020
6_______
MG= √ 2.50750 __ 1

MG= 1.16557474 – 1

MG= 0.16557474

MG= 16.55% (Tasa de Aumento Anual por Año)


Autoexamen 3.4
Ejercicios 21-28
MEDIA, MEDIANA Y MODA DE
DATOS AGRUPADOS.

Se utiliza cuando se tienen datos de


edades, ingresos etc. y se presentan en
forma de distribución de frecuencias
Media Aritmética de Datos Agrupados:

Se utiliza la siguiente fórmula:


__

X=∑fX Donde: X= Media Aritmética

n X= Valor central o punto medio de


cada clase
f= Frecuencia en cada clase

fx= Frecuencia en cada clase multipli-


cada por el punto medio de la clase
∑fx= Suma de esos productos.
n= Número total de frecuencias
Ejemplo:

Utilizando el mismo ejemplo de la


agencia Whitner Pontiac.
Precios de venta Frecuencia Punto fX
(Miles de Dólares) Medio (X)

$12 hasta 15 8 $13.5 $108.0


$15 hasta 18 23 $16.5 $379.5
$18 hasta 21 17 $19.5 $331.5
$21 hasta 24 18 $22.5 $405.0
$24 hasta 27 8 $25.5 $204.0
$27 hasta 30 4 $28.5 $114.0
$30 hasta 33 2 $31.5 $63.0

TOTAL 80 $1,605.0
_
X=∑fX = $1,605 = $20.1 (miles)
n 80

Por lo tanto la media del precio de


venta de los vehículos es
aproximadamente $20,100
Autoexamen 3.5
Ejercicios 29-34
MEDIANA

n
Mediana= L+ 2 – FA (i)
f
Donde: L= Límite inferior de la clase que contiene a la mediana.
n= Numero total de frecuencias.
f= Frecuencia de la clase que contiene a la mediana.
FA= Número acumulado de frecuencias en todas las cla-
ses que preceden a la clase que contiene a la median
i= Amplitud de la clase en que se encuentra la mediana.
Ejemplo:

El mismo caso de los automóviles


Pontiac: ¿Cuál es la mediana del precio
de venta?
Precios de venta Frecuencia Frecuencia
(Miles de Dólares) Acumulada ( FA)

$12 hasta 15 8 8
$15 hasta 18 23 31
$18 hasta 21 17 48
$21 hasta 24 18 66
$24 hasta 27 8 74
$27 hasta 30 4 78
$27 hasta 33 2 80

TOTAL 80
Para calcular la mediana se localizará la
observación número 40. Aplicando la
fórmula:
80 - 31
Mediana=$18,000+ 2____ ($3,000)
17

Mediana= $ 19,588
MODA

Es el valor que ocurre con mayor


frecuencia. Para datos agrupados es
posible aproximar la moda usando el
punto medio de la clase que contiene el
mayor número de frecuencias de clase.
Pueden darse el caso de tener 2 modas.
Autoexamen 3.6
Ejercicios 35-38
OTRAS MEDIDAS DESCRIPTIVAS
Introducción:

En éste capítulo se continuará con el


desarrollo de medidas para describir un
conjunto de datos, concentrándose en
las medidas que describen la
dispersión o variabilidad de los datos
considerados.
Medidas de Dispersión.

Una medida de dispersión se puede utilizar para


evaluar la confiabilidad de dos o mas promedios.
Existen varias medidas de dispersión:

1.-) Amplitud o intervalo de variación:

Es la diferencia entre el valor mas grande y el mas


pequeño de un conjunto de datos. Su fórmula es:

Amplitud de Variación= Valor mas grande-Valor mas


pequeño
b.-) Desviación Media.- Es el promedio aritmético de
los valores absolutos de las desviaciones con
respecto a la media aritmética. Su fórmula es:

_
DM= ∑/x-x/
n
Donde: x= valor de cada observación.
_
x= Es la media aritmética de los valores.
n= Numero de observaciones de la muestra.
//= Valor absoluto.
Ejemplo: El número de pacientes atendidos en la sala de urgencias del
IMSS, en una muestra de cinco días el año pasado fue: 103,97,101,106,
y 103. Determine e interprete la desviación media.

Primero sacar la media aritmética= 102

_
Número de casos (x-x) Desviación absoluta

103 (103-102) 1
97 (97-102) 5
101 (101-102) 1
106 (106-102) 4
103 (103-102) 1

TOTAL 12
_
DM= ∑/x-x/ = 12 = 2.4 Pacientes por día
n 5
La media son 102 enfermos diarios y 2.4 es la
desviación media.

AUTOEXAMEN 4.1 Y EJERCICIOS 1 A 5


POBLACIONAL

VARIANZA

MUESTRAL
EJEMPLO:

La altura de los perros en milímetros:

LAS ALTURAS SON 600 mm, 470 mm, 170 mm, 430 mm y 300 mm
Calcula la media aritmética:

La línea verde marca la media de las alturas 394 mm


Calcula la diferencia de cada altura con
respecto a la media:
Calcula la varianza y la desviación
estándar 147 mm:
LA DESVIACIÓN ESTÁNDAR NOS
AYUDA A SABER QUE ES NORMAL,
EXTRA GRANDE Ó EXTRA PEQUEÑO:
Varianza Poblacional: σ2=Σ(x- µ)2
N

Donde:

σ2= Varianza Poblacional.


X= Valor de una observación en la población.
µ= Media aritmética en la población
N= Numero total de observaciones en la población.

NOTAS: La varianza y la desviación estándar se basan en las


desviaciones con respecto a la media.

La varianza solo es positiva o cero, lo último si todas las


observaciones son iguales.
Ejemplo:
Las edades de los alumnos del grupo CO-03-09 de la
UTSJR, son 38,26,13,41, y 22 años ¿Cuál es la
varianza de esa población?

Edad (X) X-µ (X-µ)2

38 10 100
26 -2 4
13 -15 225
41 13 169
22 -6 36

TOTAL 140 0 534


µ= Σx= 140= 28
N 5

σ2=Σ(x- µ)2= 534=106.8 (nota: son años al cuadrado)


N 5

Si le sacamos raiz cuadrada: 10.3 años


A lo anterior se le llama desviación estandar
poblacional.

AUTO EXAMEN 4.2 EJERCICIOS 7 A 12


_
Varianza Muestral: S2= Σ(x- x)2
n-1

Donde: S2= Varianza Muestral


X= Valor de cada observación en la muestra.
_
X= Media de la muestra.
n= Número total de observaciones muestrales

Ejemplo: Los salarios en pesos por hora en una


muestra de operarios de medio tiempo de Coca-Cola
son: 2,10,6,8,9. ¿Cuál es la desviación estándar?
_
X= Σx= 35/5= $7
n
_ _
Salario por hora (x-x) (x-x)2

2 -5 25
10 3 9
6 -1 1
8 1 1
9 2 4
TOTAL $ 35 0 40
Aplicando la formula: S2= 40= 10 pesos al cuadrado.
5-1

Pero si le sacamos raiz cuadrada= 3.1 pesos y esta será la


desviación estandar
AUTOEXAMEN 4.3 EJERCICIOS 13 A 18.
MEDIDAS DE DISPERSIÓN PARA DATOS
AGRUPADOS EN UNA DISTRIBUCIÓN DE
FRECUENCIAS.

Amplitud de la Variación= Límite superior de la clase mas alta menos


el límite inferior de la clase mas baja.

Ejemplo: Precios de venta Frecuencia


(Miles de Dólares)

$12 hasta 15 8
$15 hasta 18 23
$18 hasta 21 17
$21 hasta 24 18
$24 hasta 27 8
$27 hasta 30 4
$30 hasta 33 2

En éste caso la amplitud de la variación es: 33-12=21


Desviación Estándar Datos Agrupados

____________
S=√ Σfx2- (Σfx)2
n___
n-1

Donde: S= Desviación Estándar Muestral.


X= Punto medio de una clase
f=frecuencia de la clase.
n= Número total de observaciones en la muestra
Ejemplo:
Una muestra de las cantidades que los empleados
de Kimberly Clark de México invierten
quincenalmente en el plan de participación de
utilidades, se organizó en una distribución de
frecuencias para su estudio. ¿Cuál es la desviación
Estándar de los datos? ¿Cuál es la varianza
Muestral?
Cantidad Invertida Número de Empleados
$ 30 hasta $ 35 3
$ 35 hasta $ 40 7
$ 40 hasta $ 45 11
$ 45 hasta $ 50 22
$ 50 hasta $ 55 40
$ 55 hasta $ 60 24
$ 60 hasta $ 65 9
$ 65 hasta $ 70 4
Cantidad Número de Punto medio (x)
fX fX x X
Invertida Empleados (f)
$ 30 hasta $ 35 3 $ 32.50 $ 97.50 3168.75
$ 35 hasta $ 40 7 37.50
$ 40 hasta $ 45 11 42.50
$ 45 hasta $ 50 22 47.50
$ 50 hasta $ 55 40 52.50
$ 55 hasta $ 60 24 57.50
$ 60 hasta $ 65 9 62.50
$ 65 hasta $ 70 4 67.50
TOTAL 120 $6,185.00 325,500.00
Sustituyendo en la fórmula:

____________
S=√ Σfx2- (Σfx)2
n___= 325,500-318,785.2 = $ 7.51
n-1 120-1

La Desviación Estándar Muestral es $ 7.51

La Varianza Muestral es (7.51)2 ó aproximadamente 56.40 (en


dólares al cuadrado)
AUTOEXAMEN 4.4 Y EJERCICIOS 19 A 22
INTRODUCCIÓN

En éste tema realizaremos un análisis y cálculos


numéricos para expresar la relación entre 2
variables.

Determinaremos si la relación es fuerte, débil,


directa o inversa.

Por citar algunos ejemplos:

 La relación entre la publicidad y las ventas.


 Las horas que dedican los alumnos del
propedéutico de estadística y la calificación que
Análisis de Correlación.

Es el grupo de técnicas para medir la asociación


entre dos variables.

Lo primero que debemos hacer es trazar los datos


en un diagrama de dispersión.
EJEMPLO:

Cierta compañía que se dedica a la venta de


copiadoras desea saber si existe alguna relación
entre el número de llamadas que realiza el vendedor
y el número de ventas realizadas.

Para realizar el estudio se decide tomar una muestra


aleatoria de 10 vendedores

Observe el cuadro siguiente y emita su análisis:


El gerente sospecha que si existe una relación entre
llamadas de venta y ventas realizadas.

Visualiza que existen algunos vendedores que


hicieron pocas llamadas y por ende realizaron pocas
ventas.

En general, al aumentar el número de llamadas,


también aumenta el número de ventas.

De acuerdo a éste ejemplo, el número de llamadas


se le considera una variable dependiente, y al
número de copiadoras vendidas se le llama variable
independiente.
Definiendo:

a.-) Variable Dependiente:

Es la variable que se predice o estima, y se grafica


en el eje “X”.

b.-) Variable Independiente:

Es la variable que proporciona la base para la


estimación, es la variable de pronóstico, y se grafica
en el eje “Y”.

De acuerdo a lo anterior, realice la gráfica de


dispersión para el ejemplo.
En la gráfica se puede observar que entre más
llamadas se realizan más ventas, esto es, existe una
relación positiva entre las dos variables, pero no
todos los puntos se encuentran sobre una recta.

Para determinar la fuerza y la dirección de una


relación entre dos variables, debemos determinar el
coeficiente de correlación
COEFICIENTE DE CORRELACIÓN DE PEARSON.

Describe la fuerza de relación entre dos conjuntos


de variables, se designa con la letra “r ”, y su
intervalo de valores es de -1 a 1.
Un coeficiente de correlación de 1 o de -1, indica
una correlación perfecta.
De lo anterior tenemos que pueden existir 4 tipos
básicos de correlaciones:

Correlación positiva.
Correlación negativa.
Correlación exponencial.
Sin correlación.
PROPIEDADES

Cuando el valor de “r” es cercano a cero indica que


la relación lineal es muy débil.

Cuando el valor de “r” se acerca a -1 se tiene una


relación fuerte inversa.

Cuando el valor de “r” se acerca a +1 se tiene una


relación fuerte directa.
EJERCICIO: Calcular el coeficiente de correlación
de la empresa que vende copiadoras
Primero realizaremos un diagrama de dispersión,
después, trazaremos dos rectas en la media tanto de
las llamadas como en la media de las computadoras
vendidas.
Nuestro diagrama se dividió en cuatro cuadrantes, y
el origen de nuestro trazo es el punto (22,45).

Ahora llenaremos la tabla siguiente:


Para calcular el coeficiente de correlación
utilizaremos la siguiente fórmula:

Donde lo único que nos faltaría calcular es la


desviación estándar muestral que vimos con
anterioridad:

2 2
Varianza Muestral: S= Σ(x- x)
n-1

Donde sx = 9.189 y sy = 14.337


Sustituyendo los datos en la fórmula de correlación:

El valor obtenido es positivo, por lo que hay una


relación directa entre el número de llamadas y el
número de ventas, lo cuál confirma el razonamiento
basado en el diagrama de dispersión.
Así mismo el valor es cercano a 1, esto indica una
asociación fuerte.
Coeficiente de Determinación.

Los resultados de un coeficiente de correlación


(fuerte, moderado, débil), no tiene un significado
exacto.

Para saberlo utilizaremos el coeficiente de


determinación, que no es otro cálculo, mas que
elevar el coeficiente de correlación al cuadrado:

r
Para el ejercicio anterior donde r=0.759, el
coeficiente de determinación sería 0.576, lo cuál si
lo pasamos a porcentaje 57.6 %

Esto nos dice que es posible decir que 57.6 % de la


variación en el numero de copiadoras vendidas, se
contabiliza por la variación en el número de
llamadas de ventas.
AUTOEXAMEN 13.1
EJERCICIOS 1 A 6
FIN

Você também pode gostar