Escolar Documentos
Profissional Documentos
Cultura Documentos
+
+ =
Donde: Lm: lmite inferior de la clase mediana.
F(x
m-1
): frecuencia acumulada de la clase
anterior a la clase mediana.
f(x
m
): frecuencia absoluta de la clase mediana.
Cm: amplitud de la clase mediana.
Observacin o clase que tiene la mayor
frecuencia en un conjunto de observaciones.
Un conjunto de datos puede ser unimodal,
bimodal o multimodal.
Es la nica medida de tendencia central que
se puede determinar para datos de tipo
cualitativo.
Para datos no agrupados: es simplemente
la observacin que ms se repite.
Para datos agrupados:
Cm Lim Mo
2 1
1
A + A
A
+ =
Donde: Lim: lmite inferior de la clase modal.
A
1
: diferencia entre f
i
de la clase modal y la
anterior.
A
2
: diferencia entre f
i
de la clase modal y la
posterior.
Cm: amplitud de la clase modal (clase de mayor
frecuencia).
Cuando los datos son sesgados es mejor emplear la Md
Propiedades:
La suma de las diferencias entre las media
muestral y el valor de cada observacin es cero.
La media de una constante es la constante.
Si todas las observaciones x
i
se multiplican por
una constante a, la X tambin se debe multiplicar
por ese mismo valor constante.
Si se somete a una variable estadstica X a un
cambio de origen y escala, Y = a + bX, la
media aritmtica de dicha variable X vara en
la misma proporcin.
La media de la suma de dos variables es igual
a la suma de sus medias.
Ventajas:
Emplea en su clculo toda la informacin
disponible.
Se expresa en las mismas unidades que la
variable en estudio.
Es el centro de gravedad de toda la
distribucin, representando a todos los
valores observados.
Es una valor nico.
Se trata de un concepto familiar
para la mayora de las personas.
Es til para llevar a cabo
procedimientos estadsticos como
la comparacin de medias de
varios conjuntos de datos.
Desventajas:
Se ve adversamente afectada por valores
extremos, perdiendo representatividad.
Si el conjunto de datos es muy grande puede ser
tedioso su clculo manual.
No se puede calcular para datos cualitativos.
No se puede calcular para datos que tengan
clases de extremo abierto, tanto superior como
inferior.
Ventajas:
Fcil de calcular si el nmero de
observaciones no es muy grande.
No se ve influenciada por valores
extremos, ya que solo influyen los
valores centrales.
Fcil de entender.
Se puede calcular para cualquier tipos de
datos cuantitativos, incluso los datos con
clase de extremo abierto.
Es la medida de tendencia central ms
representativa en el caso de variables que
solo admiten la escala ordinal.
Desventajas:
No utiliza en su clculo toda la informacin
disponible.
No pondera cada valor por el nmero de
veces que se ha repetido.
Hay que ordenar los datos antes de
determinarla.
Ventajas:
No requiere clculos.
Puede usarse para datos tanto cuantitativos
como cualitativos.
Fcil de interpretar.
No se ve influenciada por valores extremos.
Se puede calcular en clases de extremo
abierto.
Desventajas:
Para conjuntos pequeos de datos su
valor no tiene casi utilidad, si es que de
hecho existe. Solo tiene significado en el
caso de una gran cantidad de datos.
No utiliza toda la informacin disponible.
No siempre existe, si los datos no se
repiten.
En ocasiones, el azar hace que una
sola observacin se no representativa
se el valor ms frecuente del conjunto
de datos.
Difcil de interpretar si los datos tiene
3 o ms modas.
Son valores numricos que
indican o describen la forma en
que las observaciones estn
dispersas o diseminadas, con
respecto al valor central.
Son importantes debido a que dos muestras
de observaciones con el mismo valor central
pueden tener una variabilidad muy distinta.
Rango.
Varianza.
Desviacin Tpica.
Coeficiente de variacin.
Rango (amplitud o recorrido):
Est determinado por los dos valores
extremos de los datos muestrales, es
simplemente la diferencia entre la
mayor y menor observacin.
Es una medida de dispersin absoluta,
ya que depende solamente de los datos
y permite conocer la mxima
dispersin.
Casi no se emplea debido a que depende
nicamente de dos valores.
No proporciona una medida de variabilidad
de las observaciones con respecto al centro
de la distribucin.
Notacin: R
Es un valor numrico que mide el grado de
dispersin relativa porque depende de la
posicin de los datos x
1
,x
2
,,x
n
con respecto
a la media.
Es el promedio al cuadrado de las
desviaciones de cada observacin con
respecto a la media.
Notacin: s
2
, o
2
, var(X)
Si la varianza de un conjunto de
observaciones es grande se dice que los
datos tiene una mayor variabilidad que un
conjunto de datos que tenga un varianza
menor.
( )
2
1
2
2
1
2
2
x
n
x
s
n
x x
s
n
i
i
n
i
i
=
=
=
Para datos NO
agrupados:
Para datos agrupados en una distribucin
de frecuencias:
( )
( )
2
1
2
2
1
2
2
x
n
f m
s
n
f x m
s
k
i
i i
k
i
i i
=
=
=
=
Es la raz cuadrada de la varianza.
Notacin: s, o.
2
s s =
Es una medida de dispersin relativa que
permite comparar el nivel de dispersin de
dos muestras de variables estadsticas
diferentes.
No tiene dimensiones.
Notacin: CV
% 100 =
x
s
CV
Ventajas:
til cuando se quiere conocer la extensin de
las variaciones extremas (valor mximo de la
dispersin).
Fcil de calcular.
Desventajas:
No es una MD con respecto al centro de la
distribucin.
Solo emplea dos valores en su clculo.
No se puede calcular en distribuciones de
lmite de clase abierto.
Propiedades:
1. Siempre es mayor o igual a cero y menor
que infinito.
2. La varianza de una constante es cero.
3. Si a una variable X la sometemos a Y=a+bX,
la varianza de Y ser Var(Y) = b
2
Var(X)
Ventajas:
Es til cuando se compara la variabilidad de dos
o ms conjuntos de datos.
Utiliza toda la informacin disponible.
Desventajas:
No proporciona ayuda inmediata cuando se
estudia la dispersin de un solo conjunto de
datos.
Difcil de interpretar por tener sus unidades
elevadas al cuadrado.
Ventajas:
Esta expresada en las mismas unidades que
la variable en estudio.
Utiliza todas las observaciones en su clculo.
Fcil de interpretar.
Desventajas:
No tiene.
Ventajas:
Es la nica MD que permite comparar el nivel
de dispersin de dos muestras de variables
diferentes.
Emplea toda la informacin disponible en su
clculo.
Fcil de calcular.
Desventaja:
No es una MD con respecto al centro de la
distribucin de los datos.
Son medidas numricas que permiten
determinar la forma que tiene la curva de los
datos, por lo tanto, sirven para corroborar lo
que los grficos muestran.
Medidas
de forma
-Asimetra
-Kurtosis o apuntamiento
Coeficiente de Pearson
Coeficiente de Fisher
Permiten estudiar la forma de la curva,
dependiendo de cmo se agrupan los datos.
Coeficiente de Asimetra de Pearson:
Fcil de calcular e interpretar.
Clculo:
( )
s
Md X
ASP
=
3
o Interpretacin:
ASP
= 0, X=Md Simtrica
> 0, X>Md Asimtrica Positiva
< 0, X<Md Asimtrica Negativa
Coeficiente de Asimetra de Fisher:
No es de fcil clculo, pero si su
interpretacin.
( )
( )
3
1
3
3
1
3
ns
f x M
ASF
ns
X x
ASF
k
i
i i
n
i
i
=
=
=
=
Datos NO agrupados
Datos Agrupados
o Interpretacin:
ASF
= 0, Simtrica
> 0, Asimtrica Positiva
< 0, Asimtrica Negativa
Miden si los valores de la distribucin estn
ms o menos concentrados alrededor de los
valores medios de la muestra (zona central de
la distribucin).
Se definen tres tipos de distribucin segn su
grado de Kurtosis:
Mesocrtica: grado de concentracin
medio alrededor de los valores centrales
de la variable.
Leptocrtica: grado de concentracin
elevado.
Platicrtica: grado de concentracin
reducido.
( )
( )
3
3
4
1
4
4
1
4
=
=
ns
f X M
CK
ns
X x
CK
k
i
i i
n
i
i
Datos No Agrupados
Datos Agrupados
Interpretacin:
CK
=0 Mesocrtica
>0 Leptocrtica
<0 Platicrtica
Wikipedia(http://es.wikipedia.org/wiki/Wikip
edia:Portada)
Walpole y Myers. Probabilidad y Estadstica.
Mc Graw-Hill.
Triola, Mario F. Estadstica. Pearson.
Considero que la probabilidad representa el estado de
la mente con respecto a una afirmacin, evento u otra
cosa para las que no existe conocimiento absoluto
[August De Morgan, 1838]
Interpretaciones
Definicin y axiomas
Probabilidad condicional
Teorema de Bayes
Independencia e independencia condicional
Variables aleatorias y distribuciones bsicas
Teora de informacin
Es la posibilidad de que ocurra un
evento en Particular, de entre
conjunto de eventos, dentro de un
espacio muestral
Dos principales enfoques:
Objetiva (clsica, frecuencia, propensin) las
probabilidades existen y se pueden medir en el mundo
real.
Subjetiva (lgica, epistemolgica) las
probabilidades tienen que ver con el conocimiento
humano, medida de creencia.
Espacio Muestral: es el conjunto formado por
todos los posibles resultados de un
experimento aleatorio. En adelante lo
designaremos por S.
Evento: es un acontecimiento que ocurrir
o no, dependiendo del azar.
Dado un experimento E y el espacio de muestreo S, a
cada evento A le asociamos un nmero real P(A), el
cual es la probabilidad de A y satisface los siguientes
axiomas
S
A
Leyes o axiomas que debe cumplir una funcin de
probabilidad:
La probabilidad slo puede tomar valores
comprendidos entre 0 y 1.
(no puede haber sucesos cuya probabilidad de ocurrir
sea del 200% ni del 5%)
La probabilidad del suceso seguro es 1, es decir, el
100%, y la probabilidad del suceso imposible debe
ser 0.
Axiomas
Evento: es un resultado sencillo o un conjunto de resultados.
1. La probabilidad de cada resultado es mayor o igual a 0.
2. La suma de las probabilidades de los diversos resultados
es igual a 1.
3. Evento Complementario: la probabilidad de que un
evento no ocurrir.
4. Evento Mutuamente Excluyentes Y Reglas De Adicin:
dos eventos no pueden ocurrir simultneamente. La
ocurrencia de un evento impide la de los dems. Ocurre
uno u otro evento. Esta probabilidad se encuentra
sumando las probabilidades de los dos o ms eventos.
Propiedades de la Probabilidad
Unin
es el suceso formado por todos los elementos
de A y todos los elementos de B.
Interseccin
es el suceso formado por todos los elementos
que son, a la vez, de A y de B.
Diferencia
es el suceso formado por todos los elementos
de A que no son de B.
Suceso contrario
o
Complementario
=E - A se llama suceso contrario de A.
Dados dos sucesos, A y B, se llaman:
Dos sucesos A y B, se llaman incompatibles mutuamente excluyentes
cuando no tienen ningn elemento comn. Es decir, cuando
= (A y B son disjuntos)
Determinar la probabilidad de que al lanzar una
moneda, el resultado de esta sea cara.
Cual es la probabilidad de sacar un As de una baraja
estndar.
Cual es la probabilidad de sacar una carta de color
negro de una baraja estndar.
Leyes o axiomas que debe cumplir una
funcin de probabilidad:
La probabilidad de la interseccin de dos
sucesos debe ser menor o igual que la
probabilidad de cada uno de los sucesos por
separado, es decir:
| | | | A P B A P s
| | | | B P B A P s
Axiomas
En un supermercado el 70% de las compras las
realizan las mujeres; de las compras realizadas por
estas, el 80% supera los $ 200, mientras que de las
compras realizadas por hombres slo el 30% supera
esa cantidad.
a)Elegido un ticket de compra al azar, cul es la
probabilidad de que supere los $ 200?
b)Si se sabe que el ticket de compra no supera los
$200 cul es la probabilidad de que la compra haya
sido hecha por una mujer? .
En una ciudad el 55% de los habitantes consume pan
integral, el 30% consume pan de multicereales y el
20% consume ambos. Se pide:
1) Sabiendo que un habitante consume pan integral,
cul es la probabilidad de que coma pan de
multicereales?
2) Sabiendo que un habitante consume pan de
multicereales, cul es la probabilidad de que no
consume pan integral?
3) Cul es la probabilidad de que una persona de esa
ciudad no consuma ninguno de los dos tipos de pan?
Leyes o axiomas que debe cumplir una
funcin de probabilidad:
La probabilidad de la unin de sucesos
debe ser mayor que la de cada uno de los
sucesos por separado, es decir:
| | | | A P B A P >
| | | | B P B A P >
Axiomas
| | | | ] [ ] [ B A P B P A P B A P + =
Leyes o axiomas que debe cumplir una
funcin de probabilidad:
La probabilidad del suceso contrario
(complemento) de A, debe valer:
| | | | A P A P =1
Axiomas
Enunciado
Si A y B son dos sucesos tales que:
Dos personas piensan cada una de ellas
un nmero del 0 al 9. Calcula la
probabilidad de que las dos personas no
piensen el mismo nmero:
En una poblacin de 1000
personas, 500 son
fumadores (F) y 200
hipertensos (HTA). Se sabe
adems , que de los 200
hipertensos, 150 son
fumadores.
Cual es la probabilidad de
que no sea hipertenso
Representacin:
diagrama
150 50
Hipertensos
450
No Fumadores
350
Fumadores
Probabilidad: Diagramas
El equipo directivo de cierta empresa del sector de
hostelera est constituido por 25 personas de las que un
60% son mujeres. El gerente tiene que seleccionar a una
persona de dicho equipo para que represente a la empresa
en un certamen internacional. Decide lanzar una moneda:
si sale cara, selecciona a una mujer y si sale cruz, a un
hombre.
Sabiendo que 5 mujeres y 3 hombres del equipo directivo
no hablan ingls, determina, justificando la respuesta, la
probabilidad de que la persona seleccionada hable ingls..
Una caja contiene 10 bolas blancas, 5 negras y 5 rojas.
Se extraen dos bolas consecutivamente de la caja.
Calcula la probabilidad de que las dos sean blancas si:
Antes de extraer la segunda bola se vuelve a meter
la primera en la caja.
La segunda bola se extrae sin haber metido la
primera en la caja.
De la definicin de probabilidad condicional se puede
deducir:
P(B | A) = P(B) P(A | B) / P(A), dado P(A) > 0
Esto permite invertir las probabilidades, por ejemplo
obtener la P de una enfermedad dado un sntoma, con
conocimiento de la P de los sntomas dado que alguien
tiene cierta enfermedad
Con la definicin de probabilidad total, el teorema de
Bayes se puede escribir como:
P(B | A) = P(B) P(A | B) / S
i
P(A | B
i
) P(B
i
)
Dos eventos son independientes si la ocurrencia de uno no altera la
probabilidad de ocurrencia del otro:
P(A | B) = P(A)
P(B | A) = P(B)
Lo que es equivalente a:
P(A B) = P(A) P(B)
Independientes mutuamente exclusivos
A es condicionalmente independiente de B
dado C, si el conocer C hace que A y B sean
independientes:
P(A | B,C) = P(A | C)
Ejemplo:
A regar el jardn
B prediccin del clima
C lluvia
De la definicin de probabilidad condicional, se
puede evaluar la probabilidad de A
1
A
2
A
3
... A
N
(probabilidad conjunta) como:
P(A
1
, A
2
, ..., A
N
) =
P(A
1
| A
2
, ..., A
N
) P(A
2
| A
3
, ..., A
N
) ... P(A
N
)
A cada evento A se le asigna un valor numrico
X(A) = k, de forma que a cada valor le
corresponde una probabilidad P(X = k)
X es una variable aleatoria
Ejemplos:
X = Nmero de guilas en N lanzamientos
Y = Nmero del dado al lanzarlo
Z = Nmero de fallas antes de darle a un blanco
Discretas: el nmero de valores de X (rango) es finito o
contablemente finito
Continua: puede asumir todos los posibles valores en
cierto intervalo a b , ejemplos:
X = temperatura ambiente
Y = tiempo en el que falle cierto dispositivo
Z = distancia del robot a la pared