Você está na página 1de 6

Unidad 2.

: ESTADISTICA BASICA
ACTIVIDAD 1. DATOS AGRUPADOS Y NO AGRUPADOS PRESENTACIN.
Con este tema se inicia el estudio de la parte de la estadstica que se ocupa de la recoleccin, organizacin, resumen y presentacin de la informacin; cuestin esencial para cualquier investigacin. El buen uso de los mtodos descriptivos ahorra tiempo y esfuerzo, facilita la interpretacin de resultados y sirve de base incuestionable para el desarrollo de mtodos de inferencia y prediccin: La informacin recogida durante el proceso de observacin, medicin, entrevista, etc., suele ser dispersa, y no es hasta que la misma se organiza, procesa y presenta adecuadamente que cobra real dimensin la misma y puede considerarse, ms all de un conjunto de datos, verdadera informacin. Una de las ramas de la Estadstica ms accesible a la mayora de la poblacin es la Descriptiva. Esta parte se dedica nica y exclusivamente al ordenamiento y tratamiento mecnico de la informacin para su presentacin por medio de tablas y de representaciones grficas, as como de la obtencin de algunos parmetros tiles para la explicacin de la informacin. La Estadstica Descriptiva es la parte que conocemos desde los cursos de educacin primaria, que se ensea en los siguientes niveles y que, por lo general, no pasa a ser un anlisis ms profundo de la informacin. Es un primer acercamiento a la informacin y, por esa misma razn, es la manera de presentar la informacin ante cualquier lector, ya sea especialista o no. Sin embargo, lo anterior no quiere decir que carezca de metodologa o algo similar, sino que, al contrario, por ser un medio accesible a la mayora de la poblacin humana, resulta de suma importancia considerar para as evitar malentendidos, tergiversaciones o errores. Las caractersticas de los elementos de una poblacin pueden ser de tipo cualitativo o de tipo cuantitativo. En el primero caso se trata de cualidades que distinguen un elemento de otro y lo ubican en clases independientes y separadas. Las propiedades de tipo cuantitativo son aquellas que pueden medirse o contarse. Una caracterstica cuantitativa que toma datos aislados de modo que no acepta valores intermedios entre dos consecutivos, se llama Cuantitativa Discreta. Si se trata de una caracterstica que puede tomar valores consecutivos, se dice que es una variable Cuantitativa Continua. Las diferentes caractersticas de los elementos de una poblacin pueden representarse de diversas maneras: tablas, diagramas de barras o diagramas circulares.

Descripcin de Datos:
Los datos agrupados y no agrupados se refieren al hecho de que estn ordenados, clasificados y contados.

DATOS NO AGRUPADOS
Recoleccin simple o no organizada (datos no organizados): Es el listado de los datos presentados en su forma primaria, es decir, tal como fueron obtenidos durante el proceso observacin o medicin en la muestra o poblacin. Se dice que los datos estn organizados, pero no agrupados, cuando en las tablas de frecuencias se ponen, organizados, todos y cada uno de los valores que toma la variable; esto es,

Unidad 2. : ESTADISTICA BASICA


se colocan los datos en columnas que recogen los distintos valores de la variable y las frecuencias (las veces) con que han aparecido tales valores.

DATOS AGRUPADOS
Recoleccin organizada o tabulacin (datos organizados): Es el ordenamiento de la informacin en tablas, denominadas tablas de frecuencias o distribuciones de frecuencias, a partir de los datos primarios. Cuando los datos se tabulan, o se organizan en las tablas de frecuencias, pueden estar no agrupados, es decir, de manera que se leen directamente los valores observados, o agrupados, esto es, se construyen intervalos para resumir la informacin observada. Por su parte, se dice que los datos estn organizados y agrupados cuando en la tabla se presentan stos no con sus valores individuales, sino en agrupaciones parciales del recorrido de la variable, denominadas clases o intervalos de clases. Una clase se caracteriza por un valor que es su lmite inferior y otro que es su lmite superior. El promedio de los dos lmites, que muchas veces se toma como el valor representativo de la clase, es llamado marca de clase. Y a la diferencia o distancia entre los lmites de la clase se le llama ancho de clase: aunque no es obligatorio, es usual utilizar clases del mismo ancho siempre que es posible. (Si las clases no tienen el mismo ancho, no es la altura de las barras o rectngulos la que debe ser proporcional a las frecuencias representadas, sino su rea.)(1) La forma general de una tabla de frecuencias es la siguiente:
Li-1 - Li L0 - L1 L1 - L2 Xi X1 X2 ni n1 n2 fi f1 f2
(1)

Ni N1 N2

Fi F1 F2 Fk

Lk-1 - Lk slo si hay clases (datos agrupados)

Xk

nk

fk frecuencias complementarias

Nk

Los smbolos y definiciones correspondientes son: Xi : representa los valores individuales de la variable (en datos no agrupados) o las marcas de clase (en datos agrupados en clases) Li-1 - Li : representan las clases (si los datos se agruparon), delimitadas por los lmites de clase, el inferior (Li-1) y el superior (Li) ni ( frecuencia absoluta ): nmero de veces que se repite el i-simo valor de la variable; donde ni = n n ( tamao de la muestra ): cantidad de observaciones efectuadas, es decir, nmero de elementos contenidos en la muestra k: representa el nmero de valores diferentes observados (datos no agrupados) o la cantidad de clases creadas (datos agrupados) Tambin pueden incorporarse a la tabla otras frecuencias, como: fi ( frecuencia relativa ): proporcin de veces que se repite el i-simo valor de la variable (si se multiplica por cien constituye un porciento); se cumple que: fi = ni/n y donde fi = 1 Ni ( frecuencia absoluta acumulada ): Es el nmero de observaciones menores o iguales al isimo valor de la variable, donde N1 = n1, N2 = n1 + n2, N3 = n1 + n2 + n3, y as sucesivamente hasta Nk = n. As, se interpreta como el nmero de observaciones menores o iguales al i-simo valor de la variable.

Unidad 2. : ESTADISTICA BASICA


Fi ( frecuencia relativa acumulada ): es la proporcin (o porciento) de observaciones menores o iguales al i-simo valor de la variable, siendo F1 = f1, F2 = f1 + f2, F3 = f1 + f2 + f3, y as sucesivamente hasta Fk = 1.

DIFERENCIAS ENTRE DATOS NO AGRUPADOS Y AGRUPADOS


DATOS NO AGRUPADOS.
1.- los datos son en brutos (es decir, no se presentan clasificados) 2.- no es necesario clasificar ni generar una tabla de frecuentas, ya que no tiene mucho sentido. 3.- elementos que menor tamao (generalmente menor a 20 elementos).Esto no sucede as siempre. Les comento que al momento de buscar informacin encuentro solo datos referentes a media, mediana , moda de datos agrupados y no agrupados, me parece que solo debemos tratar sobre el concepto de datos agrupados y no agrupados, que son?, y no adentrarnos en cuestiones que aun no vemos en la asignatura, les dejo mi aportacin, para que la lean y me den su opinin. DATOS AGRUPADOS 1.- su fin es resumir la informacin. 2.- generalmente, los elementos son de mayor tamao, por lo cual requieren ser agrupados, esto implica: ordenar, clasificar y expresar los en una tabla de frecuencias. 3.- se agrupa a los datos, si se cuenta con 20 o ms elementos. Aunque contemos con ms de 20 elementos, debe de verificarse que los datos n sean significativos, Esto es: que la informacin sea repetitiva, tambin debemos de verificar que los datos puedan clasificarse. Y que dicha clasificacin tiene coherencia y lgica (de acuerdo a lo que se nos esta pidiendo) .Una vez que ya hemos ordenado y clasificado, presentaremos la informacin obtenida mediante una tabla de frecuencias 4.- la agrupacin de los datos puede ser simple o mediante intervalos de clase. La frmula de la variancia para datos agrupados usada como estimador de la variancia poblacional es:

Donde f es la frecuencia de clase y X es el punto medio de la clase. EJEMPLOS DE DATOS NO AGRUPADOS Y AGRUPADOS Datos no agrupados Cuando la muestra que se ha tomado de la poblacin o proceso que se desea analizar, es decir, tenemos menos de 20 elementos en la muestra, entonces estos datos son analizados sin necesidad de formar clases con ellos y a esto es a lo que se le llama tratamiento de datos no agrupados. Son el conjunto de observaciones que se presentan en su forma original tal y como fueron recolectados, para obtener informacin directamente de ellos.

EJEMPLO 1 (Datos no agrupados):

Unidad 2. : ESTADISTICA BASICA


Se tiene los datos recopilados acerca de la variable X: nmero de ausencias a clase que tienen los estudiantes de un grupo. 01221 32142 43200 22303

Datos en su forma primaria (sin organizar)


Qu tipo de variable es esta?: Variable cuantitativa discreta. Construccin de la tabla o distribucin de frecuencias: Al tratarse de una variable discreta (un conteo siempre tomar valores enteros) y con pocos valores diferentes, no parece necesario crear clases para agrupar los datos. En este caso k = 5 (son cinco los valores distintos de X: 0, 1, 2, 3 y 4). Para facilitar el conteo de las observaciones se suele hacer algn tipo de marcas, a lo cual se le llama tarjado.
nmero ausencias
Xi 0 1 2 3 4 //// /// /////// //// //

de

tarjado

cantidad estudiantes
ni 4 3 7 4 2
n= 20

de

proporcin estudiantes
fi 0.20 0.15 0.35 0.20 0.10

de
Ni 4 7 14 18 20 Fi 0.20 0.35 0.70 0.90 1.0

Interpretacin de las distintas frecuencias: ni indica las veces que se repite el valor de la variable, as: n1 = 4 indica que hay 4 alumnos del grupo que no tienen ausencias. n3 = 7 indica que hay 7 estudiantes del grupo que tienen 2 ausencias. fi indica el porciento de veces que se repite el valor de la variable, as: f4 = 0.20 indica que el 20% de los estudiantes tienen 3 ausencias f5= 0.10 indica que el 10% de los estudiantes tienen 4 ausencias Ni indica el nmero de observaciones menores o iguales al valor de la variable, as: N2 = 7 indica que hay 7 estudiantes que tienen hasta (o como mximo) 1 ausencia N3 = 18 indica que hay 18 estudiantes que tienen hasta 3 ausencias Fi indica el porciento de observaciones menores o iguales al valor de la variable, as: F2 = 0.35 indica que el 35% de los estudiantes tienen hasta 1 ausencia. F3 = 0.70 indica que el 70% de los estudiantes tienen hasta 2 ausencias.

EJEMPLO 2
Se pretende saber cuntas sillas de una oficina se encuentran en mal estado para sustituirlas de inmediato. La oficina tiene 8 escritorios y cada escritorio cuenta con 3 sillas. La poblacin es de 24 sillas en total y se procede a anotar los resultados en una lista como la siguiente: No. de silla | Estado | 1 | Bueno | 2 | Malo | 3 | Malo | 4 | Malo | 5 | Bueno | 6 | Bueno | 7 | Bueno | 8 | Bueno |

Unidad 2. : ESTADISTICA BASICA


9 | Malo | 10 | Malo | 11 | Malo | 12 | Malo | 13 | Bueno | 14 | Bueno | 15 | Malo | 16 | Bueno | 17 | Bueno | 18 | Bueno | 19 | Bueno | 20 | Bueno | 21 | Bueno | 22 | Bueno | 23 | Malo | 24 | Bueno |

EJEMPLO 1 (Datos agrupados):


Los siguientes valores corresponden al registro del consumo de gasolina de una flota de 50 taxis, en litros, un da dado: 46 39 34 33 32 36 41 26 32 36 43 28 30 27 32 42 30 31 34 41 28 30 26 21 37 39 25 33 47 28 26 23 30 43 40 36 21 38 31 38 29 30 48 47 23 31 24 38 35 36 Qu tipo de variable es sta? Aunque los datos observados son todos enteros la variable es continua, por su propia naturaleza (de hecho, un taxi podra haber consumido 24,75 litros de gasolina). Se tiene n = 50 taxis (tamao de la muestra). Determinacin del recorrido: R = Xmax - Xmin = 48 - 21 = 27 Definicin del nmero de clases a usar: Para 50 observaciones podran usarse 5, 6, 7 u 8 clases, segn decisin de quien va a organizar los datos. Sea en este caso k = 6.

Determinacin del ancho de clases:


c R/k R/k = 27/6 = 4,5 5 c=5 (El valor R/k = 4,5 se redondea a 5 porque no tendra sentido en este caso hacer los intervalos de amplitud decimal, ya que complicara, en vez de facilitar, la interpretacin y el trabajo con la informacin; ntese que esta aproximacin fue a un valor superior al verdadero cociente, es decir, por exceso.)

Creacin de las clases:


Se podra partir del valor Xmin = 21, pero resulta ms cmodo comenzar ligeramente por debajo de l, en 20, de manera que la primera clase sea desde 20 a 20 + c (ya se tiene c = 5), o sea, de 20 a 25; la segunda de 25 a 30, sin incluir el 25 (lmite inferior y extremo abierto) e incluyendo el 30 (lmite superior y extremo cerrado), y as sucesivamente hasta la sexta clase (k = 6), que sera desde 45 (extremo abierto) a 50 (extremo cerrado).

Determinacin de las marcas de clases (Xi):


Siendo el promedio de los lmites de clase se tiene que: Xi = (Li Li-1)/2

Unidad 2. : ESTADISTICA BASICA


As: X1 = (20 + 25)/2 = 45/2 = 22,5 X2 = (25 +30)/2 = 55/2 = 25,5 X2 = X1 + c Y as sucesivamente Clasificacin de la variable y clculo de las distintas frecuencias: Para ello se puede hacer previamente un tarjado Se debe tener en cuenta, adems, el convenio de que si una observacin coincide con un lmite de clase, se incluye en la clase donde dicho lmite est como lmite superior; as, 13 todos los taxis que consumieron 30 litros de gasolina se incluyen en la clase de 25 a 30, no en la que va de 30 a 35. Tarjado

clases
(Li-1; Li] 20-25 25-30 30-35 35-40 40-45 45-50 22.5 27.5 32.5 37.5 42.5 47.5

tarjado
ni ///// / ///// ///// /// ///// ///// / ///// ///// / ///// //// 6 13 11 11 5. 4. n= 50 fi 0.12 0.26 0.22 0.22 0.10 0.08 1.00 Ni 6 19 30 41 46 50 Fi 0.12 0.38 0.60 0.82 0.92 1.00

Interpretacin de las distintas frecuencias: n2 = 13: indica que hay 13 taxis que consumieron entre 25 y 30 litros de gasolina, o que consumieron como promedio 27,5 litros (utilizando la marca de clases) f3 = 0,22: indica que el 22% de los taxis consumieron entre 30 y 35 litros de gasolina, o que consumieron 32,5 litros como promedio. N4 = 41: indica que 41 taxis consumieron HASTA 40 litros de gasolina, o un mximo de 40 litros. (Las frecuencias acumuladas se interpretan utilizando el lmite superior del intervalo, nunca con la marca de clases.) F5 = 0,92: indica que el 92% de los taxis consumi HASTA 45 litros de gasolina

BIBLIOGRAFIA:
Estadstica para Administracin y economa. Thomson 519.5 A5462 Ej. 5 Biblioteca UNITEC campus Ecatepec.

INTERNET.
http://www.fec.uh.cu/CUGIO/1%20acciones/Contenidos/Asignaturas %20Maestria/Estadistica/Curso%20breve%20de%20Estad%C3%ADstica.pdf http://analisisydecision.es/monografico-datos-agrupados-en-sas/ http://www.foros.net/viewtopic.php?p=10&mforum=esadestadistica

Você também pode gostar