Você está na página 1de 22

4

ANLISIS
DESCRIPTIVO

ESTADSTICO

Clculo de datos usando funciones con criterios lgicos


Anlisis estadstico descriptivo de datos

GUA DIDCTICA

Descripcin
Esta sesin proporciona informacin sobre las principales funciones de Excel
que utilizan criterios lgicos en la obtencin de resultados, as como tambin
funciones estadsticas que requieren de un anlisis descriptivo para una muestra de
datos, logrando ahorrar pasos y tiempo en la realizacin de los clculos.
En esta sesin har uso de funciones de criterio lgico mltiple y de anlisis
de datos que le permitirn la obtencin de parmetros y grficos estadsticos.

Capacidad
El participante al final de esta sesin estar en capacidad de elaborar
resmenes y anlisis estadstico descriptivo de los datos utilizando funciones
estadsticas para la obtencin de los resultados.

Actividad
Las actividades a desarrollar en la sesin son:

Utiliza funciones matemticas y estadsticas con criterios lgicos simples y


mltiples.

Obtiene resultados estadsticos a partir del anlisis descriptivo de una


muestra de datos.

Evaluacin
En esta sesin Ud. ser evaluado en:

Usa funciones matemticas y estadsticas con uno o ms criterios lgicos.

Usa herramientas de anlisis descriptivo de datos estadsticos y de regresin


sobre variables independientes y dependientes.

Clculo de datos usando funciones con criterios


lgicos
Las funciones con criterios lgicos actan sobre una expresin para devolver
informacin acerca de los valores o conjuntos de una expresin, condicionada.

1. Funcin CONTAR.SI.CONJUNTO
Realiza el conteo de las celdas que cumplen los criterios especificados, dentro
del rango.
Sintaxis:
=CONTAR.SI.CONJUNTO (rango_criterio1, criterio1, rango_crieterio2,
criterio2)
Donde:

Rango1, rango2, .: rango de valores a contar.

Criterio1, criterio2, ..: condiciones a evaluar en cada rango.

Ejercicio: Determine el nmero de empleados segn los criterios


siguientes:

Empleados del Departamento de Contabilidad

Empleados afiliados a AFP Prima con ingreso superior a 1700.

Empleados del Departamento de Ventas con fecha de ingreso a partir


del ao 2000.

Tener esta tabla de datos en la Hoja1.

Recuerde, es muy
importante
identificar
los
criterios
y
los
rangos, donde se
validarn
dichos
criterios para ser
contados.

Solucin:
Para este ejercicio, el criterio es que sean de Contabilidad

Selecciona la celda G17 y escribe la siguiente funcin:


=CONTAR.SI.CONJUNTO(D5:D14,Contabilidad)

Para el este otro caso, el criterio es que sean de la AFP Prima y ganen
ms de 1700.

Seleccione la celda G18 y escriba la funcin:


=CONTAR.SI.CONJUNTO(E5:E14,Prima,G5:G14,>1700)

Para el siguiente caso, el criterio es que sean de la AFP Prima y ganen


ms de 1700.

Seleccione la celda G19 y escriba la funcin:


=CONTAR.SI.CONJUNTO(D5:D14,Ventas,C5:C14,>01/01/2005)

El resultado final ser:

IMPORTANTE! es muy sencillo usar criterios (condiciones) para el


conteo de datos, el xito est en identificar el criterio y el rango donde
dicho criterio ser evaluado. Similar proceso debes seguir para las
funciones Sumar.Si.Conjunto y Promedio.Si.Conjunto, que veremos a
continuacin.
..

2. Funcin SUMAR.SI.CONJUNTO
Esta funcin suma las celdas de un rango de valores, pero slo a aquellos que
cumplen con varios criterios que se especifiquen.
Sintaxis:
=SUMAR.SI.CONJUNTO(rango_suma,

rango_criterio1,

criterio1,

rango_criterio2, criterio2)
Donde:

Rango1, rango2, .: rango de valores que sern usados en la suma.

Criterio1, criterio2, ..: condiciones a evaluar en cada rango.

Ejercicio:

Calcular el total ingreso de los empleados del Dpto. de Contabilidad

Calcular el total ingreso de los empleados del Dpto. Ventas, afiliados a


Hbitat.

Tener esta tabla de datos en la Hoja2

Recuerde, es muy
importante
identificar
los
criterios
y
los
rangos donde se
validarn
dichos
criterios para ser
sumados.

Solucin:
Calculando el total ingresos de los empleados del Dpto. Contabilidad:

Selecciona la celda G17 y escribe la siguiente funcin:


=SUMAR.SI.CONJUNTO(G5:G14,D5:D14,"Contabilidad")

Ahora, calcularemos el total ingresos de los empleados del Dpto. Ventas,


afiliados a Hbitat:

Seleccione la celda G18 y escriba la funcin:


=SUMAR.SI.CONJUNTO(G5:G14,D5:D14,"Ventas",E5:E14,"Hbitat")

El resultado final ser:


5

3. Funcin PROMEDIO.SI.CONJUNTO
Devuelve el promedio (media aritmtica) de todas las celdas que cumplen
mltiples criterios que predeterminaste.
Sintaxis:
=PROMEDIO.SI.CONJUNTO(rango_promedio,rango_criterio1,criterio1,rango_
criterio2, criterio2)
Donde:

Rango1, rango2, .: rango de valores que sern usados en la promedio.

Criterio1, criterio2, ..: condiciones a evaluar en cada rango.

Ejercicio: Calcular el ingreso promedio de los empleados, con los siguientes


criterios:

Ingreso promedio de los empleados del Dpto. de Contabilidad.

Ingreso promedio de los empleados del Dpto. de Ventas, afiliados en la


AFP Hbitat.

Tener esta tabla de datos en la Hoja3

Solucin:

Calculando el ingreso promedio de los empleados del Dpto.


Contabilidad:

Selecciona la celda G17 y escribe la siguiente funcin:


=PROMEDIO.SI.CONJUNTO(G5:G14,D5:D14,"Contabilidad")

Ahora, calcularemos el ingreso promedio de los empleados del Dpto.


Ventas, afiliados a Hbitat:

Seleccione la celda G18 y escriba la funcin:


=PROMEDIO.SI.CONJUNTO(G5:G14,D5:D14,"Ventas",E5:E14,"Hbitat")

El resultado final ser:

Anlisis estadstico descriptivo de datos


El anlisis estadstico en Excel le ayudar en el establecimiento de relaciones entre
los mltiples conjuntos de datos, la previsin de crecimiento y las tendencias,
predecir las ventas futuras; lo cual es de gran utilidad para los profesionales de
negocios. Es importante utilizar clculos y predicciones de una forma organizada
para hacer un negocio rentable, en vez de confiar en los instintos y las conjeturas
en los negocios.

1. Funcin FRECUENCIA
Calcula la frecuencia con que se repiten los valores dentro de un rango,
devolviendo una matriz vertical de nmeros.
Sintaxis
=FRECUENCIA (datos, grupos)

Donde:

Datos: rango de datos a analizar.


7

Grupos: rango de intervalos en los que se analizar la muestra.

Ejercicio:
Se hizo una encuesta para conocer las edades de los pacientes atendidos en el
Hospital de Neoplsicas, la muestra poblacional fue de 120 encuestados. Se pide
clasificar dicha muestra con una de amplitud de 10, considerando un lmite
mnimo de 29 y un lmite mximo de 79, obteniendo la frecuencia absoluta y
relativa.

Para desarrollar esta aplicacin se necesita tener la siguiente tabla de datos,


donde clasificars la muestra y obtendrs la frecuencia Absoluta y Relativa:

Creando los grupos de datos:


Estos grupos o rangos servirn para clasificar las edades de los encuestados.
Se sabe que existe un lmite mnimo de 29 para el primer rango y un mximo de
79 para el ltimo rango, con una amplitud de 10.
Solucin:

Digite en la celda K10, el dato 29 como lmite del primer grupo.

Ahora, en la celda K11, ingresa el dato 39 como lmite de este grupo, este
valor se obtiene sumando al lmite anterior, la amplitud que es de 10; y as
sucesivamente sobre el resto de grupos. Quedar el cuadro con se
muestra:

Calculando las frecuencias absolutas:


1.

Seleccione el rango de celdas donde se obtendrn todas las frecuencias.


Por ejemplo: L10:L1.

2.

Activa la ficha Frmulas y haz clic en el botn Insertar funcin

3.

Siga la secuencia mostrada en la figura:

a)

b)
c)
d)

4.

Seleccione la
categora:
ESTADSTICA
Elija la funcin
FRECUENCIA
Aceptar.
Ingrese
argumentos
solicitados:
DATOS
GRUPOS.

Ahora, ingresar los argumentos solicitados, para obtener el resultado:

IMPORTANTE! En el cuadro Datos (B5:I19) contiene el rango de la


muestra, y Grupos (K10:K15), son los datos que ingreso a partir de los
lmites y la amplitud, llamados tambin intervalos de clase.

5.

Por ser la Frecuencia, una funcin de tipo matricial, los resultados se


mostrarn presionando las teclas: CRTL+SHIFT+INTRO:

10

los

y.

Calculando las frecuencias relativas:


Estas frecuencias se obtienen con la frmula: =frecuencia Absoluta/Total
muestra.
6. Por ello debe calcular el total de la muestra con la funcin SUMA:

Haga clic en la celda L16

Escriba la funcin: =SUMA(L10:L15) y pulsa la tecla Enter

7. Ahora ya puede calcular la frecuencia relativa:

8.

Haga clic en la celda M10

Escriba la frmula: =L10/$L$16 y pulsa la tecla Enter.

Copie la frmula hacia abajo y veras la informacin completa.

IMPORTANTE! Debes tener muy en cuenta que la frecuencia absoluta


es cuantitativa y la frecuencia relativa es porcentual.

2. Funcin DESVEST.P
Calcula la desviacin estndar de la poblacin total determinada por los
argumentos. La desviacin estndar es la medida de la dispersin de los valores
respecto a la media (valor promedio).
Sintaxis
=DESVEST.P(nmero1; nmero2; ...)
Donde:

Nmero1,

nmero2,...:

son

de

30

argumentos

numricos

correspondientes a una poblacin. Tambin puede utilizar una matriz nica


o una referencia matricial en lugar de argumentos separados con punto y
coma.

11

Se pasan por alto los valores lgicos, como VERDADERO y FALSO, y de


texto. Si los valores lgicos y el texto no se deben pasar por alto, utilice la
funcin de hoja de clculo DESVESTA.
Observaciones
1.

DESVESTP parte de la hiptesis de que los argumentos representan


la poblacin total. Si sus datos representan una muestra de la
poblacin, utilice DESVESTP para calcular la desviacin estndar.

2.

Cuando el tamao de las muestras es importante, las funciones


DESVEST y DESVESTP devuelven aproximadamente el mismo valor.

3.

La desviacin estndar se calcula utilizando los mtodos "sesgado" o


"n".

4.

DESVESTP utiliza la frmula siguiente:

Donde:
X: es la media de muestra PROMEDIO(nmero1,nmero2,)
n: es el tamao de la muestra.

3. Funcin DESVEST.M
Calcula la desviacin estndar, segn una muestra (se omiten los valores
lgicos y de texto en la muestra).
La desviacin estndar es la medida de la dispersin de los valores respecto a
la media (valor promedio).
Sintaxis
=DESVEST.M(nmero1;[nmero2];...])
Donde:

Nmero1: Obligatorio. El primer argumento numrico correspondiente a


una muestra de una poblacin. Tambin puede usar una matriz nica o una
referencia matricial en lugar de argumentos separados con punto y coma.

Nmero2; Opcional. De 2 a 254 argumentos numricos correspondientes a


una muestra de una poblacin. Tambin puede usar una matriz nica o una
referencia matricial en lugar de argumentos separados por comas.

12

Observaciones

DESVEST.M parte de la hiptesis de que los argumentos representan la


muestra de una poblacin. Si sus datos representan la poblacin total, use
DESVEST.P para calcular la desviacin estndar.

La desviacin estndar se calcula utilizando el mtodo "n-1".

Los argumentos pueden ser nmeros, o nombres, matrices o referencias


que contengan nmeros.

Se tienen en cuenta los valores lgicos y las representaciones textuales de


nmeros escritos directamente en la lista de argumentos.

Si un argumento es una matriz o una referencia, slo se considerarn los


nmeros de esa matriz o referencia. Se pasan por alto las celdas vacas,
valores lgicos, texto o valores de error de la matriz o de la referencia.

Los argumentos que sean valores de error o texto que no se pueda traducir
a nmeros provocan errores.

Si desea incluir valores lgicos y representaciones textuales de nmeros en


una referencia como parte del clculo, utilice la funcin DESVESTA.

DESVEST.M usa la frmula siguiente:

Donde:
X: es la media de muestra PROMEDIO(nmero1;nmero2;)
N: es el tamao de la muestra.

4. Funcin CUARTIL.INC
Devuelve el cuartil de un conjunto de datos, segn los valores de porcentil de
0 a 1, ambos incluidos.
Los cuartiles se usan con frecuencia en los datos de ventas y encuestas para
dividir las poblaciones en grupos. Por ejemplo, puede usar la funcin
CUARTIL.INC para determinar el 25 por ciento de ingresos ms altos en una
poblacin.
Sintaxis
=CUARTIL.INC(matriz; cuartil)

Donde:

Matriz

Obligatorio. La matriz o el rango de celdas de valores numricos

cuyo cuartil desea obtener.

Cuartil

Obligatorio. Indica el valor que se devolver.

13

Parmetros
SI CUARTIL ES IGUAL A

LA FUNCIN CUARTIL.INC DEVUELVE

Valor mnimo

El primer cuartil (percentil 25)

El valor de la mediana (percentil 50)

El tercer cuartil (percentil 75)

Valor mximo

Observaciones

Si el argumento matriz est vaco, CUARTIL.INC devuelve el valor de


error #NUM!

Si el argumento cuartil no es un nmero entero, se trunca.

Si cuartil < 0 o si cuartil > 4, CUARTIL.INC devuelve el valor de error


#NUM!

Las funciones MIN, MEDIANA y MAX devuelven el mismo valor que


CUARTIL.INC cuando el argumento cuartil es igual a 0 (cero), 2 y 4
respectivamente.

5. Funcin MEDIANA
Devuelve la mediana de los nmeros. La mediana es el nmero que se
encuentra en medio de un conjunto de nmeros, es decir, la mitad de los
nmeros es mayor que la mediana y la otra mitad es menor.
Sintaxis
=MEDIANA(nmero1;nmero2; ...)
Donde:

Nmero1, nmero2, ...: son entre 1 y 30 nmeros cuya mediana desea


obtener.

Observaciones

Los argumentos deben ser nmeros o nombres, matrices o referencias que


contengan nmeros. Microsoft Excel examina todos los nmeros en cada
argumento matricial o de referencia.

Si el argumento matricial o de referencia contiene texto, valores lgicos o


celdas vacas, estos valores se pasan por alto; sin embargo, se incluirn las
celdas con el valor cero.

Si la cantidad de nmeros en el conjunto es par, MEDIANA calcula el


promedio de los nmeros centrales. Vea la segunda frmula del ejemplo.

14

Ejercicio:
Supongamos que tenemos una lista de datos, que representan los sueldos
mensuales de 40 trabajadores.

Solucin:
Ahora obtendremos los parmetros estadsticos solicitados, haciendo uso de
funciones en Excel.

Seleccionamos la celda H3 y digitamos los siguiente: =CONTAR(A4:D13).

En la celda H4 digitamos lo siguiente: =PROMEDIO(A4:D13)

En la celda H5 digitamos lo siguiente: =DESVEST.P(A4:D13)

En la celda H6 digitamos lo siguiente: =DESVEST.M(A4:D13)

En la celda H7 digitamos lo siguiente: =SUMA(A4:D13)

En la celda H8 digitamos lo siguiente: =SUMA.CUADRADOS(A4:D13)

En la celda H9 digitamos lo siguiente: =MIN(A4:D13)

En la celda H10 digitamos lo siguiente: =CUARTIL.INC(A4:D13,1)

En la celda H11 digitamos lo siguiente: =MEDIANA(A4:D13)

En la celda H12 digitamos lo siguiente: =CUARTIL.INC(A4:D13,3)

En la celda H13 digitamos lo siguiente: =MAX(A4:D13)

Podemos observar que Excel posee una gran variedad de funciones que nos
permiten aplicar un Anlisis Estadstico.

15

Pero existe una forma ms rpida de obtener y analizar datos, Excel cuenta con un
complemento llamado Herramienta para anlisis la cual proporciona herramientas
de anlisis de datos para anlisis estadstico y de ingeniera.
Activar Herramientas de Anlisis de Datos
Para activar el complemento, realizar los siguientes pasos:
1.

Seleccionamos la ficha Archivo, elegimos Opciones.

2.

En la ventana de Opciones de Excel, elegimos Complementos y luego clic


en el botn Ir

3.

En la ventana Complementos, seleccionamos la opcin Herramienta para


anlisis y damos clic en Aceptar.

16

4.

En la ficha Datos, grupo Anlisis podemos observar la opcin


Anlisis de datos.

Componente
Varianza
Correlacin
Covarianza
Estadstica
descriptiva
Suavizacin
exponencial
Prueba F para
varianzas de dos
muestras
Anlisis de Fourier

Histograma

Media mvil

Generacin de
nmeros aleatorios
Jerarqua y percentil

Regresin
Muestreo
Prueba t
Prueba z

Descripcin
Medida de variabilidad que da cuenta del grado
de homogeneidad de un grupo de observaciones
Determina la relacin o dependencia que existe
entre dos o ms variables.
Es un valor que indica el grado de variacin
conjunta de dos variables aleatorias.
Genera un informe estadstico de una sola
variable para los datos del rango de entrada, y
proporciona informacin acerca de la tendencia
central y dispersin de los datos.
Predice un valor que est basado en el pronstico
del perodo anterior, ajustado al error en ese
pronstico anterior.
Ejecuta una Prueba F de dos muestras para
comparar dos varianzas de poblacin.
Resuelve problemas de sistemas lineales y
analiza datos peridicos, transformndolos
mediante el mtodo de transformacin rpida de
Fourier (FFT, Fast Fourier Transform).
Calcula
las
frecuencias
individuales
y
acumulativas de rangos de celdas de datos y de
clases de datos.
Proyecta valores en el perodo de pronsticos,
basndose en el valor promedio de la variable
calculada durante un nmero especfico de
perodos anteriores.
Rellena un rango con nmeros aleatorios
independientes extrados de una de varias
distribuciones.
Crea una tabla que contiene los rangos ordinales
y porcentuales de cada valor de un conjunto de
datos.
Efecta el anlisis de regresin lineal utilizando el
mtodo de "mnimos cuadrados" para ajustar una
lnea a un conjunto de observaciones.
Crea una muestra de poblacin tratando el rango
de entrada como una poblacin.
Comprobar la igualdad de las medias de
poblacin que subyacen a cada muestra.
Realiza una Prueba z en las medias de dos
muestras con varianzas conocidas.

Debemos de tener siempre presente que los anlisis estadsticos se hacen para
conocer las caractersticas de una poblacin a estudiar.

Horas trabajadas al mes al cabo del trmino de un periodo.

Cantidad de libros que extrae cada alumno de la biblioteca por semestre.

Presin atmosfrica de una ciudad.

17

Notas obtenidas en exmenes de un alumno durante un semestre.

Distribucin por edad y sexo de pacientes de un hospital.

Ejercicio: Anlisis de datos de ventas haciendo uso de la Estadstica


Descriptiva
Como analista de ventas de una importante cadena de retail, es necesario analizar
las ventas trimestrales en Arequipa, Piura, Tacna, Trujillo, Chiclayo y Lima. El
departamento de inventarios utilizar los resultados para gestionar de manera
ptima el stock del producto en cada uno de las ciudades.

Solucin:
1.

En la ficha Datos, grupo Anlisis elegimos Anlisis de datos.

2.

Luego elegimos la opcin Estadstica descriptiva y damos clic en Aceptar.

3.

En la ventana Estadstica descriptiva, en Rango de entrada especifica el


rango $B$2:$G$26, Rtulos en la primera fila, rango de salida $J$2 y
seleccionas la opcin Resumen de estadsticas y das clic en el botn
Aceptar.

18

4.

En el resultado, mejoraremos el aspecto visual en el anlisis de ventas


trimestrales de las ciudades usando estadstica descriptiva.

Con la herramienta Estadstica Descriptiva, puede identificar los distintos


componentes de tendencia y la variabilidad central de un conjunto de datos.
Componente
Media

Error tpico

Mediana

Descripcin
La media es la suma de las observaciones dividido por el
nmero de observaciones.
Una estimacin no sesgada de la desviacin estndar de un
conjunto de datos. Debido a la desviacin estndar se calcula
a partir de una muestra de una gran poblacin de datos, que
no logra captar la verdadera dispersin de los datos.
El valor central de datos. Es el nmero de la separacin de la
mitad superior de una muestra de la mitad inferior.

19

Moda
Desviacin
estndar
Varianza de la
muestra

Curtosis

Coeficiente de
asimetra

Rango
Mnimo
Mximo
Suma
Cuenta

El valor que ocurre con mayor frecuencia en un conjunto de


datos. Si no hay datos se produce ms de una vez, entonces
el resultado es #N/A.
Una medida de la variabilidad o dispersin de un conjunto de
datos. La desviacin estndar aqu es la desviacin estndar
de la muestra.
Otra medida de la variabilidad o dispersin de un conjunto de
datos. Esto se calcula mediante la frmula de la varianza =
(desviacin estndar)2.
Mide el apuntamiento de un conjunto de datos. Curtosis alta
significa ms de la varianza es debido a las desviaciones
extremas infrecuentes, en lugar de las desviaciones
modestos frecuentes.
Una medida de la asimetra de un conjunto en torno a su
media de datos. Si es negativo, entonces la mayora de los
datos se concentra en el lado derecho de la media. Si es
positivo, entonces la mayora de los datos se concentra en el
lado izquierdo de la media.
Una medida de la dispersin de los datos, que se calcula por
la diferencia entre los valores mximo y mnimo en un
conjunto de datos.
El valor mnimo de un conjunto de datos.
El valor mximo de un conjunto de datos.
La suma de todos los valores de un conjunto de datos.
El nmero de observaciones en un conjunto de datos.

Regresin Lineal
El anlisis de regresin es una tcnica estadstica para analizar la relacin entre un
conjunto de variables dependientes y un conjunto de una o ms variables
independientes. Anlisis de regresin lineal se realiza mediante el mtodo de
mnimos cuadrados para ajustar una lnea a travs de un conjunto de observaciones
mediante el uso de la ecuacin:

= + 1 1 + 2 2 +
La variable dependiente, denotado como Y en la ecuacin de regresin, se modela
como una funcin de las variables independientes, indicada como X1, X2, y as
sucesivamente. La y en la ecuacin de regresin estimada por el modelo son
los coeficientes.
Ejercicio: Anlisis de datos de Tarjetas de Crdito utilizando la Regresin
Como gerente de riesgo de crdito, desea analizar los datos de la encuesta principal
para entender la dependencia de la cantidad de tarjetas de crdito en poder de una
familia del tamao de la familia y el ingreso total de la familia.
El resultado del anlisis ser utilizado por el equipo de desarrollo de negocios para
identificar y seleccionar las familias que pueden aceptar ms tarjetas de crdito.

20

Solucin:
1.

En la ficha Datos, grupo Anlisis elegimos Anlisis de datos.

2.

Luego elegimos la opcin Estadstica descriptiva y damos clic en Aceptar.

3.

En la ventana Regresin, seleccione en Rango Y de entrada $A$2:$A$14, en


Rango X de entrada $B$2:$C$14, selecciona Rtulos, Constante igual a
cero, Nivel de confianza. Opciones de salida en una hoja nueva y damos clic
en Aceptar.

21

Una familia puede tener X cantidad de tarjetas de crdito. Utilizando el mtodo de


anlisis de regresin, se puede analizar la dependencia de este nmero (X) en el
tamao de la familia y el ingreso total de la familia. En este contexto, el nmero de
tarjetas de crdito es la variable dependiente y el tamao de la familia y los ingresos
son las variables independientes.
Usando la ecuacin

= + 1 1 + 2 2 + , los valores de regresin se

pueden calcular.

El resultado del anlisis se puede utilizar para identificar y seleccionar las familias
que pueden aceptar ms tarjetas de crdito.

22

Você também pode gostar