Você está na página 1de 11

ANALISIS DE DATOS AGRUPADO Y NO AGRUPADOS

ESTADISTICA I

INTEGRANTES
NOMBRE
1

BRANDONW MARTINEZ

ALFREDO ALVAREZ

GRUPO: A1D
DOCENTE :
FERNANDO GONZLEZ

UNIVERSIDAD AUTONOMA DEL CARIBE


FACULTAD DE INGENIERIA
ESTADISTICA I
BARRANQUILLA
2014-02

1. DATOS NO AGRUPADOS
1.1. MEDIDAS DE TENDENCIA CENTRAL
1.1.1. MODA:
La moda, como su nombre lo indica, es el valor ms comn (de mayor
frecuencia dentro de una distribucin. Una informacin puede tener una
moda y se llama unimodal, dos modas y se llama bimodal, o varias
modas y llamarse multimodal. Sin embargo puede ocurrir que la
informacin no posea moda.
1.1.2. MEDIANA:
Otra medida de tendencia central, utilizada principalmente en
estadstica no paramtrica, es la mediana, la cual no se basa en la
magnitud de los datos, como la media aritmtica, sino en la posicin
central que ocupa en el orden de su magnitud, dividiendo la informacin
en dos partes iguales, dejando igual nmero de datos por encima y por
debajo de ella.
La Mediana Cuando los datos no estn Agrupados en Intervalos.
Partiendo de la informacin bruta, ordenamos los datos ascendente o
descendentemente:
x1 , x2 , x3 , . xi , . xn

Se define:

Me=x

n+1
(
)
2

x n +x
Si n es impar o

Me=

n
( +1)
2

( )
2

si n es par.

1.1.3. MEDIA:
Cotidiana e inconscientemente estamos utilizando la media aritmtica.
Cuando por ejemplo, decimos que un determinado fumador consume
una cajetilla de cigarrillos diaria, no aseguramos que diariamente deba
consumir exactamente los 20 cigarrillos que contiene un paquete sino
que es el resultado de la observacin, es decir, dicho sujeto puede
consumir 18, un da; 19 otro; 20, 21, 22; pero segn nuestro criterio, el
nmero de unidades estar alrededor de 20.

Matemticamente, la media aritmtica se define como la suma de los


valores observados dividida entre el nmero de observaciones.
N

xi

X = i=1
N

1.2

MEDIDAS DE POSICIN

1.2.1 DECILES:
Los cuantiles son aquellos valores de la variable, que ordenados de
menor a mayor, dividen a la distribucin en partes, de tal manera que
cada una de ellas contiene el mismo nmero de frecuencias. Los
Deciles (Di) Son los valores de la variable que dividen a la distribucin
en las partes iguales, cada una de las cuales engloba el 10 % de los
datos. En total habr 9 deciles. (Q2 = D5 = Me).
Si se tienen una serie de valores X1, X2, X3... Xn, se localiza mediante
las siguientes frmulas:

Cuando n es par

Cuando n es impar.
Siendo A l nmero del decil.
1.2.2. CUARTILES:
Las cuartillas o cuartiles son valores posicionales que dividen la
informacin en cuatro partes iguales, el primer cuartil deja el 25% de la
informacin por debajo de l, y el 75% por encima, el segundo cuartil, al
igual que la mediana, divide la informacin en dos partes iguales, y por
ltimo el tercer cuartil deja el 75% por debajo de s, y el 25% por
encima.
Si se tienen una serie de valores X1, X2, X3... Xn, se localiza mediante
las siguientes frmulas:
- El primer cuartil:

Cuando n es par,

Cuando n es impar.

Para el tercer cuartil

Cuando n es par,

Cuando n es impar.

2. DATOS AGRUPADOS
2.1. MEDIDAS DE TENDENCIA CENTRAL
2.1.1. MEDIANA:
Cuando se trabaja con tablas de frecuencia, se debe establecer si la
variable es discreta o continua; luego, se mira si al dividir por dos (2) el
total de las observaciones, el valor obtenido se encuentra o no en la
columna de las frecuencias absolutas acumuladas; como consecuencia,
se presentan dos situaciones al calcular la mediana. En cada caso,
deber aplicarse una frmula diferente, tanto para la variable discreta
como la continua.
n+1
( F+1)
2
w ) + Lm
fm

m=
Dnde:
m
: es la mediana de la muestra.

n: nmero de total de elementos de la distribucin.


F = suma de todas las frecuencias de clase hasta, pero sin incluir, la
clase de la mediana.
fm= frecuencia de la clase de la mediana.
W= ancho de intervalo de clase.
Lm= lmite inferior del intervalo de clase de la media.

2.1.2 MEDIA:
Cuando los datos son presentados en una distribucin de frecuencia,
todos los valores
que pertenece un intervalo son considerados
coincidentes con la clase o punto medio del intervalo La frmula con la
cual se halla la media aritmtica en los datos agrupados es

fX
X =
n
Siendo n, el total de frecuencias; f, frecuencia; X, punto medio.
El punto medio es la mitad del intervalo que se vaya a tomar luego este
se multiplica por la frecuencia con la que este, se suman y luego se
aplica la formula antes dicha.

2.2. MEDIDAS DE POSICION


2.2.1 DECILES:
Los Deciles (Di) Son los valores de la variable que dividen a la
distribucin en las partes iguales, cada una de las cuales engloba el 10
% de los datos. En total habr 9 deciles.
Para datos agrupados los deciles se calculan mediante la frmula.

Dnde:
Lk = Lmite real inferior de la clase del decil k
n = Nmero de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del
decil k.
fk = Frecuencia de la clase del decil k

c = Longitud del intervalo de la clase del decil k.


2.2.2 CUARTILES:
Las cuartillas o cuartiles son valores posicionales que dividen la informacin en
cuatro partes iguales, el primer cuartil deja el 25% de la informacin por debajo
de l, y el 75% por encima, el segundo cuartil, al igual que la mediana, divide
la informacin en dos partes iguales, y por ltimo el tercer cuartil deja el 75%
por debajo de s, y el 25% por encima.

La frmula para el clculo de los cuartiles cuando se trata de datos


agrupados es la siguiente:

Dnde:
Lk = Lmite real inferior de la clase del cuartil k
n = Nmero de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del
cuartil k.
fk = Frecuencia de la clase del cuartil k
c = Longitud del intervalo de la clase del cuartil k
2.2.3. PERCENTILES:
Centiles o Percentiles (Pi) Son los valores que dividen a la distribucin en 100
partes iguales, cada una de las cuales engloba el 1 % de las observaciones. En
total habr 99 percentiles. (Q2 = D5 = Me = P50). La frmula para determinar
los percentiles es la siguiente:

Dnde:
Lk = Lmite real inferior de la clase del decil k
n = Nmero de datos

Fk = Frecuencia acumulada de la clase que antecede a la clase del


decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k

2.3. MEDIDAS DE DISPERSIN


2.3.1 DESVIACIN ESTNDAR:
La desviacin estndar ser siempre un valor positivo o cero, en el caso
de que las frecuencias sean iguales.
Si a todos los valores de la variable se les suma un numero la desviacin
estndar no vara.
Si todos los valores de la variable se multiplican por un nmero la
desviacin estndar queda multiplicada por dicho nmero.

3. REPRESENTACIN GRFICA
3.1. OJIVA:
Una ojiva es un grfica lineal que representa frecuencias acumulativas,
de la misma forma que la distribucin de frecuencias acumulativas en
una lista de estas. La ojiva utiliza fronteras de clase a lo largo de la
escala horizontal, y que la grfica empieza con la frontera inferior de la
primera clase, en tanto que finaliza con la frontera superior de la ltima
clase. Las ojivas son tiles para determinar el nmero de valores que se
encuentran por debajo de un valor. Ejemplo de ojiva:

3.2. POLIGONO:
Utiliza segmentos lineales conectados directamente a puntos que se
localizan directamente directamente por encima de los valores de las
marcas de clase. Las alturas de los puntos corresponden a las
frecuencias de clase, en tanto que los segmentos lineales se extienden
hacia la derecha y la izquierda de manera que la grfica inicia y termina
sobre el eje horizontal. Ejemplo de un polgono:

3.3. TORTA:
Se utilizan para visualizar datos cualitativos en forma de rebanadas de
pastel. Para construir una grfica circular o de forma de torta, se separa
el circulo en las proporciones que se adecuan mejor.

3.4. CAJA Y BIGOTES:


El grafico de la caja fue descrito por Tukey denominndolo box and
whiskers. Para su construccin se utilizan 5 datos estadsticos de
distribucin de frecuencia: el mnimo, el primer cuartil, la mediana, el
tercer cuartil y el mximo; tambin se indica la posicin de la media. El
grafico de la caja nos proporciona la posicin relativa de la mediana, los
cuartiles y extremos de la distribucin, informacin sobre los datos
apartados, nos informa de la simetra o asimetra de la distribucin y
tambin se utiliza para comparar la misma variable en dos tipos de
muestras. Ejemplo de grafico caja-bigote:

3.5. SERIE DE TIEMPO:


Son aquellos que se renen en diferentes momentos. Este tipo de
grafico es sumamente importante para las compaas ya que permite
conocer los cambios en los valores de una poblacin a travs del tiempo.
Por esto muchas compaas cayeron en bancarrota porque no

verificaban la calidad de sus bienes o servicios, adems crean estn


tratando con datos estables. No se dieron cuenta que sus productos o
servicio se volva defectuoso e incompetente conforme iba cambiando
las caractersticas de la poblacin.

BIBLIOGRAFIA
-Manual de estadstica, David Ruiz Muoz
-Estadstica 9na edicin, Mario f. Triola
-Manual de Estadistica
Hernandez Arroyo

(Handbook

of

statistics),

Emil

-Estadstica Aplicada, Nstor Guarn Salazar, Universidad


Nacional de Colombia
-Estadstica Descriptiva;
Crdoba y Jos M. Cordero.

Santiago

Fernndez,

Alejando

Você também pode gostar