Você está na página 1de 11

Probabilidad y Estadstica

Estadstica
Rama de las matemticas que tiene por objeto la recopilacin, el
anlisis, la interpretacin, y la presentacin de una gran cantidad de
datos numricos.

E sta distica

D e sc riptiva

Infe re ncia l

Estadstica Descriptiva
Es el proceso de recolectar, agrupar y presentar datos de una manera tal
que describa fcil y rpidamente dichos datos.
Estadstica Inferencial
Es el proceso que involucra la utilizacin de una muestra para sacar
alguna inferencia o conclusin sobre la poblacin de la cual hace parte la
muestra.
Poblacin
Conjunto total de datos que es objeto de nuestro inters. Coleccin bien
definida de objetos. Es la recoleccin completa de todas las
observaciones de inters para el investigacin.
Muestra
Grupo de datos seleccionado sobre el que realmente hacemos las
observaciones (mediciones). Subconjunto de la poblacin. Es una parte
representativa de la poblacin que se selecciona para ser estudiada ya
que la poblacin es demasiado grande como para analizarla en su
totalidad.
Parmetro
Es una medida descriptiva de la poblacin total de todas las
observaciones.
Variable
Es cualquier caracterstica cuyo valor pueda cambiar de un objeto al
siguiente en la poblacin. Es una caracterstica de la poblacin que se
esta analizando en un estudio estadstico. Puede ser cuantitativa o
cualitativa.
Variable cuantitativa
Cuando las observaciones pueden expresarse numricamente.

Continua: Es aquella que puede tomar cualquier valor dentro de


un
rango dado. (Mediciones)
Discreta: Est limitada a ciertos valores, generalmente numeros
enteros. (Conteos)
Variable cualitativa
Cuando se mide de forma no numrica.
Niveles de medicin o Escalas de medicin
Las variables pueden clasificarse con base en su escala de medida. La
forma en que se clasifican las variables afecta en gran parte la forma
como se utilizan en el anlisis
Nominales Sexo, colores, sabores
Ordinales Alto, medio, bajo; bueno, regular, malo
De Intervalo
Temperaturas
De Razn Sistema numrico; costos, rentabilidad, inventarios
Importancias del muestreo
Gran parte del trabajo de un estadstico se realiza con muestras. Las
muestras son necesarias debido a que con frecuencia las poblaciones
son demasiado grandes para ser estudiadas en su totalidad. Es muy
costoso y demanda mucho tiempo examinar la poblacin total, por
tanto, debe seleccionarse una muestra de la poblacin, calcular el
estadstico de la muestra, y utilizarlo para estimar el parmetro
correspondiente de la poblacin.
Error de muestreo
La exactitud de toda estimacin es de enorme importancia. Esta
exactitud depende en gran parte de la forma como se tom la muestra,
y del cuidado que se tenga para garantizar que la muestra proporcione
una imagen confiable de la poblacin. Sin embargo, con mucha
frecuencia se comprueba que la muestra no es del todo representativa
de la poblacin y resultar un error de muestreo.
Muestreo Aleatorio o Probabilstico
En este tipo de muestreo, todos los elementos de la poblacin tienen la
misma chance de figurar en la muestra generalmente aceptado.
Muestreo no Aleatorio o de Juicio
En este tipo de muestreo, se usa el conocimiento y la opinin personal
para identificar los elementos de la poblacin que van a incluirse en la
muestra.
En ocasiones, el muestreo no aleatorio sirve de muestra piloto para
decidir como
seleccionar despus una muestra aleatoria.
Como nuestro trabajo lo debemos realizar con muestras obtenidas de
alguna poblacin, de modo que al realizar un muestreo lo podemos
hacer aplicando uno ms de los siguiente mtodos de muestreo:
a) Muestreo Aleatorio

Los elementos incluidos en esta muestra han sido seleccionados


mediante algun procedimiento de sorteo o azar que signa alguna
chance no nula a cada elemento de la poblacin, hablamos de
Muestreo Aleatorio Simple.
b) Muestreo por Estratos
En muchas situaciones, existe un factor que divide naturalmente a
la poblacin de inters en sub-poblaciones o Estratos ms o menos
homogneos. Este procedimiento de muestreo puede darnos
mayor precisin que el muestreo aleatorio simple, pero a un costo
mayor
c) Muestreo Sistemtico
Los elementos se seleccionan de la poblacin con un intervalo
uniforma que se mide en el tiempo, en el orden o en el espacio,
por ejemplo si se quiere entrevistar a todo vigsimo estudiante de
una escuela. Deberamos asignar a cada estudiante un numero
entre 00 y 99 y luego se comienza a escoger una muestra; cada
decimo numero, es decir, 1, 11, 21, 31 y as sucesivamente. Los
estudiantes asignados con los numeros 2, 3,4 y 5 no tendrn
oportunidad alguna de ser seleccionado.
d) Muestreo por Conglomerados
En este caso se divide la poblacin en grupos o conglomerados y
luego se selecciona una muestra aleatoria de ellos. Este muestreo
se usa cuando se advierte considerable variacin dentro de cada
grupo pero esencialmente semejantes entre s, por ejemplo s un
equipo de investigacin de mercados esta tratando de determinar
por muestreo el numero promedio de TV. por familia en una
ciudad, podra utilizar un mapa de la ciudad para dividir el
territorio en manzanas y luego seleccionar cierto numero de
manzanas (Conglomerados) para realizar la entrevista.
Presentacin de Datos
La presentacin de datos es importante ya que una vez que se han
reunido los valores, deben presentarse de forma tal que pueda
observarse cualquier patrn significativo
Esto se hace mediante el uso de tcnicas que presenten la informacin
de los conjuntos de datos en forma resumida.
Herramientas estadsticas
Tablas de frecuencia Que colocan todos los datos en clases
especificas.
Tablas de contingencia y diagramas de tallo y hoja los cuales
tambin permiten la presentacin de un conjunto grande de datos de
manera concisa y discernible.
Grficos Estadsticos Un grfico estadstico es la representacin de
datos en el plano con el propsito de obtener una impresin visual del
conjunto de datos, que facilite su rpida comprensin. Todo grfico debe
ser sencillo y auto explicativo.El tipo de grfico para los propsitos
anteriores depender del tamao del recorrido de las variables as como
del nivel de medicin de estas. En estadstica existen los siguientes tipos
de grficos
- Grficos de barras:

Simples o separadasCada valor de la variables se representa por


una barra cuyo largo corresponde a la frecuencia con que se
observa ese valor.
- Histogramas y polgonos de frecuencias
Estn constituidos por un conjunto de rectngulos contiguos,
levantados en el eje horizontal sobre cada uno de los intervalos de
clase.Los polgonos de frecuencias son adecuados para
representar la distribucin de frecuencias de una variable contnua
cuando todos los intervalos de clase tienen la misma amplitud
- Grficos lineales
Son grficos adecuados para analizar la existencia de asociacin
entre dos variables continuas, con nivel de medicin en escala de
intervalos o razn
- Grfico de correlacin o diagramas de dispersin
Son grficos adecuados para analizar la existencia de asociacin
entre dos variables continuas (X,Y), con nivel de medicin en
escala de intervalos razn
- Grficos circulares
Se utilizan para representar distribuciones de frecuencias para el
caso de variables discretas y cualquier nivel de medicin, con
pocos valores.
-Pictogramas
Se utilizan para presentaciones en publico o para fines
publicitarios Todos estos tipos de grficos se pueden resumir en el
siguiente cuadro
Medidas de Centralizacin
Al calcular valores descriptivos que resumen un conjunto de datos, la
primera consideracin es encontrar un valor central o representativo de
los datos. Las medidas ms importantes de tendencia central son:
1.
2.
3.
4.
5.
6.
7.

Media Aritmtica, MA
Media Ponderada, MP
Media Armnica, MH comparacin de precios
Media Geomtrica, MG crecimientos en % ventas
Media Cuadrtica, MC,RMS Clculos en fsica
Mediana
Moda.

Medidas de dispersin
Una descripcin mas completa del conjunto de datos puede obtenerse si
se mide que tan dispersos estn los datos alrededor de dicho punto
central. Las medias de dispersin indican cuanto se desvan las
observaciones alrededor de su media.
1.
2.
3.
4.

Rango
Varianza, s2 2
Desviacin estndar, s
Coeficiente de variacin, CV

Medidas de posicin
Se les considera tambin como medidas de dispersin. Asi como la
mediana divide los datos en dos partes iguales , los tres cuartiles
denotados por Q1, Q2 y Q3 dividen los puntajes clasificados en cuatro
partes iguales.
1.
2.
3.
4.

Cuartiles, Qx

1-4

Deciles, Dx 1-9
Percentiles, Pz 1-99
Rango intercuartilico

MEDIDAS DE ASIMETRIA Y CURTOSIS


Las medidas de tendencia central en una distribucin normal son
coincidentes, cuando esto no es as, se dice que la distribucin est
sesgada, el sesgo puede ser positivo o negativo. La posicin de las
medidas de tendencia central nos aproximan al tipo de sesgo de la
distribucin.
1. Asimetria, As
2. Curtosis, b

Probabilidades
El termino probabilidad se refiere al estudio de la aleatoriedad y la
incertidumbre. En cualquier situacin donde se produzca alguno de
varios resultados posibles, la teora de la probabilidad proporciona
mtodos para cuantificar las oportunidades, o probabilidades, asociadas
con varios resultados.

Pro babilid ad

O bjetiva

Subjetiva

priori o
lo gica

em pirica

Personalista

Probabilidad a priori
Se basa en espacios mustrales probables, se asume que todos los
resultados tienen las mismas probabilidades de ocurrir.
Probabilidad emprica
Este enfoque se basa en la frecuencia relativa de ocurrencia de un
evento con respecto a un gran numero de ensayos repetidos.
Probabilidad subjetiva
Es el grado de creencia por parte de
un individuo de que un evento ocurra, basado en toda la evidencia a su
disposicin.
Fenmenos Determinsticos: Se llaman as a aquellos cuando se
puede predecir
sus resultados: cada libre de un cuerpo.
Fenmenos Aleatorios: Se llaman as si sus resultados finales son
impredecibles: la conducta humana, juegos de azar.
Experimento
Es cualquier accin o proceso que genera observaciones o datos.
Espacio muestral
De un experimento, denotado por S, es el conjunto de todos los posibles
resultados de ese experimento.
Evento
Es cualquier coleccin (subconjunto) de resultados contenida en el
espacio muestral S.
Evento mutuamente excluyente ocurre cuando un evento
impide que ocurra cualquier otro.
Eventos independientes cuando el hecho de que ocurra o no un
evento, no se afecta en nada porque ocurra o no el otro evento.
Distribucin de probabilidades
Una distribucin de probabilidades indica toda la gama de valores que
pueden representarse como resultado de un experimento si este se
llevase a cabo.
Es decir, describe la probabilidad de que un evento se realice en el
futuro, constituye una herramienta fundamental para la planificacin,
puesto que se puede disear un escenario de acontecimientos futuros
considerando las tendencias actuales de diversos fenmenos naturales.
Probabilidades discretas
UNIFORME
BERNOULLI
HIPERGEOMETRICA
BINOMIAL NEGATIVA
GEOMETRICA
BINOMIAL
MULTINOMIAL
POISSON
APROXIMACION DE POISSON A LA BINOMIAL
Probabilidades Continuas

UNIFORME
NORMAL

EXPONENCIAL
APROXIMACION NORMAL A LA BINOMIAL

De todas las distribuciones de probabilidad que se mencionaron, la


distribucin normal es la ms importante. Sus caractersticas principales
son la simetra en forma de campana y la forma como se relaciona con
la regla emprica.
Puede existir un numero infinito de distribuciones normales posibles,
cada una con su propia media y su desviacin estndar. Ya que
obviamente no se puede analizar un numero tan grande de
posibilidades, es necesario convertir todas estas distribuciones normales
a una forma estndar. Esta conversin a la distribucin normal estndar
se efectua con la formula de conversin (o formula Z)
Valor de Z
Es el numero de desviaciones estndar a las que una observacin est
por encima o por debajo de la media. Nos sirve para calcular las
probabilidades que ocurra determinado evento.

Formularios
DATOS SIN AGRUPAR

DATOS AGRUPADOS
Nmero de clases = 1 + 3.32
log n
Rango = Dato mayor Dato
Rango = Dato mayor Dato
menor
menor
Amplitud = Rango / nmero
de clase
MEDIDAS DE TENDENCIA CENTRAL
n
x

fi M i

N
i 1
xw n
fM fM
x
fi X g

x
n
f Me
i 1
n Media aritmtica:
dia aritmtica:

xw

w x
i 1
n

w
i 1

Media ponderada:

Media ponderada:

M .H .

n
f

Media armnica, MH:

Media armnica, MH:

Media Geomtrica, MG:


MG n X 1 X 2 X 3 ... X n

Media Geomtrica, MG:

RMS

x
n

f1

Media Cuadrtica,

RMS:

Mediana, Med:
Posicin MedianCuara = (n+1) / 2
Valor Med = Valor en Posicin Med (impar)
Valor Med = Promedio Valores en Posicin
Med (par)

Moda:
Dato que ms se repite

f2

f3

MG n M 1 M 2 M 3 ...M n

RMS

fM

fn

n
Media
Cuadrtica, RMS:

Mediana, Med:
n / 2 f a _ ant
Mediana Lmd
(I )
f md

Posici

n Mediana = (n+1) / 2

Da
(I )
D

D
b
a

Moda:

Moda Lmo

Da = frecuencia clase modal


frecuencia anterior

Db =

frecuencia clase modal frecuencia

siguiente

MEDIDAS DE DISPERSIN
( Xi X )
fM 2 nX 2

2
2
s
s
n 1
n 1
Varianza, s:
Varianza, s:
2

s s 2 Desviacin estndar, s:
s
CV (100)
X

s s 2 Desviacin estndar, s:

Coeficiente de variacin, CV:

s
(100)
X
Coeficiente de
variacin, CV:
CV

MEDIDAS DE POSICIN
Rango Intercuartlico, RI: Q3Rango Intercuartlico, RI: Q3Q1
Q1
Percentiles:
Percentiles:
Percentil del puntaje x
( j * n)

100 f a ant _ Pj
No. _ puntajes x

*100
Pj Lri
*i
No. _ Total _ Puntajes
f _P
j

Puntaje del percentil x


Ubicacin del percentil = Lp = (n +
1) P/100

Cuartiles:
Qi = (n+1)i/4
i = 1, 2, 3

Cuartiles:
( j * n)

4 f a ant _ Pj
Q j Lri
*i
f _ Pj

Deciles:

Deciles:

Di = (n+1)i/10
i = 1, 2, 3, 4, 5, 6, 7, 8, 9

( j * n)

10 f a ant _ Pj
D j Lri
*i
f _ Pj

Intervalo semiintercuartiles
= (Q3 Q1)/2
Cuartil medio = (Q1 + Q3)/2
Intervalo de percentiles 10-90

Intervalo semiintercuartiles
= (Q3 Q1)/2
Cuartil medio = (Q1 + Q3)/2
Intervalo de percentiles 10-90

= P90 P10

= P90 P10

MEDIDAS DE ASIMETRIA Y CURTOSIS


Coeficiente de Asimetra de
Coeficiente de Asimetra de
Pearson:
Pearson:
As1 = (Media Moda)
Desv. Estndar
As2 = 3(Media Mediana)
Desv. Estndar
Si Coef = 0 normal
Coef < 0 sesgo negativo
Coef > 0 sesgo positivo

As1 = (Media Moda)


Desv. Estndar
As2 = 3(Media Mediana)
Desv. Estndar
Si Coef = 0 normal
Coef < 0 sesgo negativo
Coef > 0 sesgo positivo

Coeficiente de Asimetra de
Sesgo:
M
b1 33
s
Momento de orden r, Mr:
(x x)r

Mr
n

Coeficiente de Asimetra de
Sesgo:
M
b1 33
s
Momento de orden r, Mr:
f (M X )r
Mr
n

Curtosis:
M
b2 44
s

Curtosis:
M
b2 44
s

Coeficiente de Curtosis
Percentlico
1 = (Q3-Q1)
P90 P10

Coeficiente de Curtosis
Percentlico
1 = (Q3-Q1)
P90 P10

Si Coef = 3 mesocurtica
Coef < 3 platicurtica
Coef > 3 leptocurtica

Si Coef = 3 mesocurtica
Coef < 3 platicurtica
Coef > 3 leptocurtica

Você também pode gostar