Escolar Documentos
Profissional Documentos
Cultura Documentos
i i
n F
i
n
clase. Las frecuencias relativas representan el porciento de veces en que ocurre
un dato. Como veremos en teora de probabilidades, el concepto de frecuencia
relativa nos conduce a un concepto de probabilidad.
La frecuencia relativa acumulada H
i
: es la suma de los valores acumulados de
la frecuencia relativa
la suma de las frecuencias relativas que se han acumulado, incluyendo la clase
sobre la que se esta calculando la frecuencia relativa.
Un diagrama de barras, tambin conocido como diagrama de columnas, este
esta conformado por barras rectangulares de longitudes proporcional al de los
valores que representan. Los grficos de barras son usados para comparar dos o
ms valores. Las barras pueden estar orientadas horizontal o verticalmente y
sirven para lo mismo.
Ejemplo
Este diagrama de ejemplo est basado en los resultados de la Eleccin del
Parlamento Europeo en el 2004 y en el de 1999. La tabla siguiente lista el nmero
de asientos asignadas a cada partido. Los resultados de 1999 han sido
multiplicados por 1.16933, para compensar el cambio en el nmero de asientos
entre estos aos.
Grupo Asientos (2004) Asientos (1999) a escala EURO 66 49 200 210
EFA 42 56
EDD 15 19
ELDR 67 60
EPP 276 272
UEN 27 36
Otros 66 29
Un grfico de barras visualizando los resultados anteriores de la eleccin del 2004
se vera as:
(Si todos los datos fuesen ordenados en orden descendiente este tipo de grfico
de barras sera llamado un Diagrama de Pareto.)
n
i
i
i i
N
f
h H acumulada relativa Frecuencia
1
Este grfico de barras muestra ambos resultados (2004 y 1999)
BARRAS Consiste en dos ejes perpendiculares y una barra o rectngulo para
cada valor de la variable. Normalmente, se suele colocar en el eje horizontal los
valores de la variable (aunque tambin se puede hacer en el vertical). El otro eje
se grada segn los valores de las frecuencias. La representacin grfica consiste
en dibujar una barra o un rectngulo para cada uno de los valores de la variable
de altura igual a su frecuencia
Diagrama de sectores (pastel): Consiste en dividir un crculo en tantos sectores
como valores de la variable. La amplitud de cada sector debe ser proporcional a la
frecuencia del valor correspondiente.
HISTOGRAMA : Es un caso particular del diagrama anterior en el caso de
variables continuas. Si los intervalos son correlativos, los rectngulos aparecen
pegados en la representacin grfica. En caso de que la amplitud de los intervalos
no se igual para todos, hay que hacer coincidir el rea del rectngulo con la
frecuencia del intervalo. Un ejemplo muy utilizado de histograma es una pirmide
de poblacin..
POLIGONO DE FRECUENCIAS: Representamos dos ejes perpendiculares y
representamos en el horizontal los valores de la variable y en el vertical las
frecuencias. Representamos los puntos que tiene por primera coordenada el valor
de la variable y por segunda el valor de la frecuencia. Uniendo todos los puntos
obtenemos una lnea poligonal que es la representacin que buscamos.
Tipos de grficos estadsticos
Barras, Lneas, Circulares, ,reas, Cartogramas, Mixtos, Histogramas
Otros
Dispersograma
Pictogramas
Grficos de barras verticales
Representan valores usando trazos verticales, aislados o no unos de otros, segn
la variable a graficar sea discreta o continua. Pueden usarse para representar:
una serie
dos o ms series (tambin llamado de barras comparativas)
Grficos de barras horizontales
Representan valores discretos a base de trazos horizontales, aislados unos de
otros. Se utilizan cuando los textos correspondientes a cada categora son muy
extensos.
para una serie
para dos o ms series
Grficos de barras proporcionales
Se usan cuando lo que se busca es resaltar la representacin de los porcentajes
de los datos que componen un total.
Las barras pueden ser:
Verticales
Horizontales
Grficos de barras comparativas
Se utilizan para comparar dos o ms series, para comparar valores entre
categoras.
Las barras pueden ser:
Verticales
horizontales
Grficos de barras apiladas
Se usan para mostrar las relaciones entre dos o ms series con el total.
Las barras pueden ser:
verticales
horizontales
Grficos de lneas
En este tipo de grfico se representan los valores de los datos en dos ejes
cartesianos ortogonales entre s.
Se pueden usar para representar:
una serie
dos o ms series
Estos grficos se utilizan para representar valores con grandes incrementos entre
s.
Grficos circulares
Estos grficos nos permiten ver la distribucin interna de los datos que
representan un hecho, en forma de porcentajes sobre un total. Se suele separar el
sector correspondiente al mayor o menor valor, segn lo que se desee destacar.
Se pueden ser:
En dos dimensiones
en tres dimensiones
Grficos de reas
En estos tipos de grficos se busca mostrar la tendencia de la informacin
generalmente en un perodo de tiempo.
Pueden ser:
Para representar una serie
para representar dos o ms series
en dos dimensiones
en tres dimensiones.
Cartogramas
Estos tipos de grficos se utilizan para mostrar datos sobre una base geogrfica.
La densidad de datos se puede marcar por crculos, sombreado, rayado o color.
Grficos Mixtos
En estos tipos de grficos se representan dos o ms series de datos, cada una
con un tipo diferente de grfico. Son grficos ms vistosos y se usan para resaltar
las diferencias entre las series.
Pueden ser:
en dos dimensiones
en tres dimensiones.
Histogramas
Estos tipos de grficos se utilizan para representa distribuciones de frecuencias.
Algn software especfico para estadstica grafican la curva de gauss superpuesta
con el histograma.
OTROS Grficos
En esta categora se encuentran la mayora de los grficos utilizados en
publicidad. Se los complementa con un dibujo que est relacionado con el origen
de la informacin a mostrar. Son grficos llamativos, atraen la atencin del lector.
Dispersograma
Los dispersogramas
Son grficos que se construyen sobre dos ejes ortogonales de coordenadas,
llamados cartesianos, cada punto corresponde a un par de valores de datos x e y
de un mismo elemento suceso.
Pictogramas
Los pictogramas son grficos similares a los grficos de barras, pero empleando
un dibujo en una determinada escala para expresar la unidad de medida de los
datos. Generalmente este dibujo debe cortarse para representar los datos.
Es comn ver grficos de barras donde las barras se reemplazan por dibujos a
diferentes escalas con el nico fin de hacer ms vistoso el grfico, estos tipos de
grficos no constituyen un pictograma.
Pueden ser:
En dos dimensiones
En tres dimensiones.
Conclusin
embargo, hoy da Excel dispone de muchos ms tipos de grficos.
Cada tipo de grfico se diferencia de los dems por la clase de marcas de datos
que utiliza. Por ejemplo, el grfico de columnas utiliza columnas como marcas de
datos; el de crculos, utiliza crculos; etc.
El motivo de que haya tantos tipos de grficos diferentes no es solamente esttico.
Cada uno de los tipos de grficos est especialmente indicado para representar
los datos de una manera distinta. Por lo tanto, si quieres obtener la mxima
eficacia al crear tus grficos y presentar tus datos de la mejor manera posible
debes tener esto muy en cuenta; que cada tipo de grafico esta destinado para una
labor especifica.
la media aritmtica (tambin llamada promedio o simplemente media) de un
conjunto finito de nmeros es el valor caracterstico de una serie de datos
cuantitativos objeto de estudio que parte del principio de la esperanza matemtica
o valor esperado, se obtiene a partir de la suma de todos sus valores dividida
entre el nmero de sumandos.
la media aritmetica es como el promediO, primero se suman todos los numeros y
luego se divide entre lo que son,,, ejemplo:
5,4,6,3,8,4
si los suman te dan 30 y ya nomas divides 30 entre los que son, los cuales son 6,
osea que la media aritmetica de 5,4,6,3,8,4 es 5
Defi ni ci n de medi ana: Es el val or que ocupa el l ugar cent ral de
todos l os dat os cuando stos estn ordenados de menor a mayor .
La medi ana se represent a por M
e.
La medi ana se puede hal l ar sl o para vari abl es
cuanti tati vas.
Cl cul o de l a medi ana
1 Ordenamos l os datos de menor a mayor.
2 Si l a seri e t i ene un nmero i mpar de medi das l a
medi ana es l a puntuaci n central de l a mi sma.
2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5
3 Si l a seri e t i ene un nmero par de punt uaci ones l a
medi ana es l a medi a ent re l as dos puntuaci ones central es.
7, 8, 9, 10, 11, 12Me= 9. 5
Cl cul o de l a medi ana para datos agrupados
La medi ana se encuent ra en el i nterval o donde l a
frecuenci a acumul ada l l ega hast a l a mi tad de l a suma de l as
frecuenci as absol utas.
Es deci r t enemos que buscar el i nt erval o en el que se
encuent re .
L
i
es el l mi t e i nf eri or de l a cl ase donde se encuent ra l a
medi ana.
es l a semi suma de l as f recuenci as absol ut as.
F
i - 1
es l a frecuenci a acumul ada ant eri or a l a cl ase
medi ana.
a
i
es l a ampl i t ud de l a cl ase.
La medi ana es i ndependi ente de l as ampl i tudes de l os
i nterval os.
Ej empl o
Cal cul ar l a medi ana de una di st ri buci n est ad st i ca que
vi ene dada por l a si gui ent e t abl a:
f
i
F
i
[60, 63) 5 5
[63, 66) 18 23
[66, 69) 42 65
[69, 72) 27 92
[72, 75) 8 100
100
100/ 2 = 50
Cl ase de l a medi ana: [ 66, 69)
Defi ni ci n de moda: La moda es el val or que ti ene mayor
f recuenci a absol ut a.
Se represent a por M
o.
Se puede hal l ar l a moda para vari abl es cual i tati vas y
cuanti tati vas.
Hal l ar l a moda de l a di st ri buci n:
2, 3, 3, 4, 4, 4, 5, 5 M
o
= 4
Si en un grupo hay dos o vari as puntuaci ones con l a
mi sma frecuenci a y esa f recuenci a es l a mxi ma, l a
di stri buci n es bi modal o mul ti modal , es deci r, t i ene vari as
modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9M
o
= 1, 5, 9
Cuando t odas l as puntuaci ones de un grupo t i enen l a
mi sma frecuenci a, no hay moda.
2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaci ones adyacentes t i enen l a frecuenci a
mxi ma, l a moda es el promedi o de l as dos punt uaci ones
adyacent es.
0, 1, 3, 3, 5, 5, 7, 8Mo = 4
Cl cul o de l a moda para datos agrupados
1 Todos l os i nterval os ti enen l a mi sma ampl i tud.
L
i
es el l mi t e i nf eri or de l a cl ase modal .
f
i
es l a f recuenci a absol ut a de l a cl ase modal .
f
i - - 1
es l a f recuenci a absol ut a i nmedi at ament e i nf eri or a l a
cl ase modal .
f
i - +1
es l a f recuenci a absol ut a i nmedi at ament e post eri or a l a
cl ase modal .
a
i
es l a ampl i t ud de l a cl ase.
Tambi n se ut i l i za ot ra frmul a de l a moda que da un val or
aproxi mado de st a:
Ej empl o
Cal cul ar l a moda de una di st ri buci n est ad st i ca que vi ene
dada por l a si gui ent e t abl a:
f
i
[60, 63) 5
[63, 66) 18
[66, 69) 42
[69, 72) 27
[72, 75) 8
100
2 Los i nterval os ti enen ampl i tudes di sti ntas.
En pri mer l ugar t enemos que hal l ar l as al t uras.
La cl ase modal es l a que t i ene mayor al t ura.
La frmul a de l a moda aproxi mada cuando exi st en
di st i nt as ampl i t udes es:
Ej empl o
En l a si gui ent e t abl a se muest ra l as cal i f i caci ones
(suspenso, aprobado, not abl e y sobresal i ent e) obt eni das por un
grupo de 50 al umnos. Cal cul ar l a moda.
f
i
h
i
[0, 5) 15 3
[5, 7) 20 10
[7, 9) 12 6
[9, 10) 3 3
50
Desvi aci n medi a: La desvi aci n medi a es l a medi a ari t mt i ca de
l os val ores absol ut os de l as desvi aci ones respect o a l a medi a.
La desvi aci n medi a se represent a por
Ej empl o
Cal cul ar l a desvi aci n medi a de l a di st ri buci n:
9, 3, 8, 8, 9, 8, 9, 18
Desvi aci n medi a para datos agrupados: Si l os datos vi enen
agrupados en una t abl a de f recuenci as, l a expresi n de l a
desvi aci n medi a es:
Ej empl o: Cal cul ar l a desvi aci n medi a de l a di stri buci n:
x
i
f
i
x
i
f
i
| x - x| | x - x| f
i
[10, 15) 12. 5 3 37. 5 9. 286 27. 858
[15, 20) 17. 5 5 87. 5 4. 286 21. 43
[20, 25) 22. 5 7 157. 5 0. 714 4. 998
[25, 30) 27. 5 4 110 5. 714 22. 856
[30, 35) 32. 5 2 65 10. 174 21. 428
21 457. 5
98. 57
La desviacin estndar tambin se basa en la desviacin respecto al
promedio. Pero en lugar de usar valores absolutos, elevamos al
cuadrado las desviaciones. Elevar al cuadrado las desviaciones
elimina nmeros negativos, porque al multiplicar dos nmeros
negativos resultarun nmero positivo.
La desviacin estndar es, probablemente, la medida de
dispersin ms usada.
Cuanto mayor es la desviacin tpica, mayor es la dispersin de los datos
alrededor de la media
LA formula de calculo es:
Esto es, la desviacin de cada puntuacin respecto a la media es elevada al
cuadrado, luego se suman todas las desviaciones cuadradas y se divide entre el
nmero total de puntuaciones y a esta divisin se 2()XXsN=
extrae la raz cuadrada.
Se interpreta en relacin a la media
La amplitud total se define como la diferencia entre el valor mximo y el
valor mnimo de un conjunto de datos. Cuando la variable sea continua,
para el clculo deben utilizarse los lmites exactos.
Cuanto ms grande sea el rango, mayor serla dispersin de los
datos de una distribucin.
La gran ventaja que presenta es su facilidad de clculo.
El inconveniente que presenta esta medida, es que no considera todos los datos,
es muy inestable e insensible al tamao de la muestra.
Ej.2:Dado el siguiente conjunto de
datos: 3, 5, 8, 10, 12, 15 y 16.
La amplitud total es igual a 15
Dnde:EjemploEj.1:Dado el siguiente conjunto de datos: 2, 2, 5, 7, 9, 9, 9, 10, 10,
12 y 18 .La amplitud total es igual a 16.Dnde:18216At=16313
E S T A D I S T I C A S
QU ES LA ESTADSTICA?
Estadstica es una disciplina que sistematizado las tcnicas de recoleccin y
anlisis de datos; nos permite inferir consecuencias a partir de estos.
Una poblacin es el conjunto total de todos los individuos u objetos que poseen
una caracterstica comn observable, que sean de inters en un estudio. Son
ejemplos de una poblacin:
Los alumnos de un curso.
Los pacientes de un hospital.
Los votantes de una comuna.
Es un subconjunto de la poblacin. Es de un tamao menor al total de la poblacin
y la estadstica pretende obtener conclusiones vlidas que pueden aplicarse al
total a partir de los resultados observados en la muestra. Son ejemplos de
muestra:
1.820 televidentes escogidos al azar.
Los automovilistas que acceden a contestar una encuesta de opinin.
Uno de cada diez sacos de maz de un cargamento.
Se le llama marca de clase a los valores representativos de todos los valores
incluidos en el intervalo respectivo; equivale a la semisuma de los lmites inferior y
superior de un intervalo.
Los lmites inferiores y superiores son los valores mnimo y mximo de una
distribucin. V.g: En un curso de 50 alumnos, se le pidi a un profesor que pesar
a todos, los datos obtenidos son los siguientes:
LIMITE SUPERIOR: 98
LIMITE INFERIOR: 38
La amplitud es el tamao numrico que existe entre los intervalos. Considerando
el siguiente ejemplo, la amplitud es igual a 5.
intervalo Frecuencia
11 - 15 5
16 - 20 8
El recorrido o campo de variacin de la variable, es la diferencia entre el mayor
valor que toma la variable y el menor. Por ejemplo, si el mayor valor es 85 y el
menor es 17, entonces el recorrido es:
FRECUENCIAS.
Situacin: En un curso de 50 alumnos, se le pidi a un profesor que pesar a
todos los alumnos, los datos obtenidos son los siguientes:
Intervalos (peso
en kg.)
n de alumnos Porcentaje (%)
35 - 39 2 4
40 - 44 0 0
45 - 49 1 2
50 - 54 1 2
55 - 59 2 4
60 - 64 3 6
65 - 69 8 16
70 - 74 6 12
75 - 79 11 22
80 - 84 6 12
85 - 89 4 8
90 - 94 4 8
95 - 99 2 4
tabla construir un histograma y un polgono de
frecuencia.
DESVIACIN MEDIA Y LA DESVIACIN ESTANDR?
Son valores que tipifican una muestra y en torno de los cuales se agrupan la
mayora de los datos, estos se denominan estadgrafos. A continuacin
definiremos cada uno de estos.
MEDIA ARITMETICA: Corresponde a la suma de todos los datos dividido por el
numero total de ellos. Es lo que se conoce como "promedio". La media aritmtica
es uno de los estadgrafos ms usados, por el hecho de ser de muy fcil clculo.
MODA: Corresponde al valor que mas se repite, sta sirve para describir una
distribucin si slo se desea tener una idea aproximada y rpida de donde est la
mayor concentracin de observaciones. Tambin se la utiliza para describir la
forma de algunas distribuciones. Puede ocurrir que en un conjunto de datos no
haya moda, como en: 3; 4; 7; 9; 10; 11; 13. O tambin que haya varios valores
con la mayor frecuencia, en estos casos la moda queda indeterminada.
MEDIANA: La mediana es aquel valor que ocupa el lugar central, de modo que la
mitad de los casos queda por debajo de ese valor y la otra mitad por encima. Por
ejemplo si consideramos: 2; 3; 5; 7; 11; 13; 16; 18; 25. La mediana es M = 11. Si
el conjunto de valores es un nmero par, entonces se calcula la media aritmtica
a los dos valores del centro.
DESVIACION MEDIA: Corresponde a la diferencia numrica entre una medida
individual o nmero y la media aritmtica de una serie completa de tales medidas
o nmeros. Por ejemplo, si la media de alturas de todos los alumnos de un curso
es 1,51 m y uno de ellos mide 1,63m, la desviacin media de su altura con
respecto a la media es de +0.12 metros.
DESVIACIN ESTANDAR: Es un dato que representa la variabilidad existente en
un conjunto de datos, ya que por ejemplo dos conjuntos de datos pueden
presentar la misma media aritmtica, pero poseer distinta variabilidad, por eso
este estadgrafo nos permite saber acerca de la variabilidad o dispersin de los
datos. Matemticamente se define como "la raz cuadrada del promedio de los
cuadrados de las desviaciones medias de cada valor de la variable con respecto
de la media aritmtica"
ESTADIGRAFOS ANTERIORES.
Intervalos frecuencia
1 5 9
6 10 13
11 - 15 3
16 - 20 2
88 - 77 - 74 - 64 - 67 - 69 - 49 - 82 - 69 - 71 -
38 - 65 - 86 - 68 - 77 - 84 - 66 - 73 - 75 - 58 -
94 - 78 - 67 - 75 - 78 - 89 - 69 - 91 - 84 - 62 -
50 - 72 - 39 - 62 - 58 - 74 - 79 - 81 - 70 - 79 -
90 - 81 - 79 - 86 - 97 - 78 - 75 - 90 - 98 - 81.
88 - 77 - 74 - 64 - 67 - 69 - 49 - 82 - 69 - 71 -
38 - 65 - 86 - 68 - 77 - 84 - 66 - 73 - 75 - 58 -
94 - 78 - 67 - 75 - 78 - z9 - 69 - 91 - 84 - 62 -
50 - 72 - 39 - 62 - 58 - 74 - 79 - 81 - 70 - 79 -
90 - 81 - 79 - 86 - 97 - 78 - 75 - 90 - 98 - 81.
Al organizar los datos en una tabla de frecuencia, se obtiene:
1 - 2 - 2 - 2 - 3 - 3 - 4 - 4 - 5 - 6 - 7 - 7 - 8 - 8 - 8 - 8- 8- 8 - 8 - 9 - 9 - 10 - 12 - 13 -
15 - 16 - 19
Media Aritmtica:
= 7.5
27
" 7.5 es el valor de la media aritmtica para los datos dados."
Moda: De los datos anteriores, la moda corresponde a "8".
Mediana: En los datos anteriores, la mediana es el valor "8" ennegrecido.
DESVIACIN ESTANDAR:
las desviaciones medias de cada valor, calculadas anteriormente se elevan al
cuadrado =
42.25 , 30.25 , 30.25 , 30.25 , 20.25 , 20.25 , 12.25 , 12.25 , 6.25 , 2.25 , 0.25 ,
0.25 , 0.25 , 0.25 , 0.25 , 0.25 , 0.25 , 0.25 , 0.25 , 2.25 , 2.25 , 6.25 , 20.25 , 30.25
, 56.25 , 72.25 , 132.25.-
la suma de los cuadrados se divide por el promedio menos 1 =
- 1 = 81.65
calculamos la raz cuadrada de 81.65 =
" 81.65 = 9.04
el valor de la desviacin estndar es de 9.04 en el ejemplo sealado.
DESVIACIN MEDIA:
Datos = 1 - 2 - 2 - 2 - 3 - 3 - 4 - 4 - 5 - 6 - 7 - 7 - 8 - 8 - 8 -
D. media = -6.5 , -5.5, -5.5 , -5.5 , -4.5 , -4.5 , -3.5 , -3.5 , -2.5 , -1.5 , -0.5 , -0.5 ,
0.5 , 0.5 , 0.5
Datos = 8 - 8 - 8 - 8 - 9 - 9 - 10 - 12 - 13 - 15 - 16 - 19
D. media = 0.5 , 0.5 , 0.5 , 0.5 , 1.5 , 1.5 , 2.5 , 4.5 , 5.5 , 7.5 , 8.5 , 11.5.-