Escolar Documentos
Profissional Documentos
Cultura Documentos
ESTADSTICA
Definicin. Nos proporciona un conjunto de mtodos, procedimientos o tcnicas para recopilar, clasificar,
analizar y presentar datos con el fin de describirlos o de realizar generalizaciones vlidas.
El estudio de la estadstica puede dividirse en dos reas principales:
a) Estadstica Descriptiva. Comprende las tcnicas que se emplean para la recopilacin, organizacin,
resumen y presentacin de los datos (o informacin).
b) Estadstica Inferencial. Comprende tcnicas que permiten tomar decisiones acerca de una poblacin
a partir del estudio de una muestra (subconjunto de dicha poblacin, sometida a observacin o
experimentacin).
La inferencia (de muestra a poblacin) no tiene por qu ser cierta en forma absoluta, motivo por el cual es
necesario que ella sea dada con una medida de confiabilidad a la cual se denomina probabilidad.
Poblacin y muestra. Todo estudio estadstico esta siempre referido a un conjunto o coleccin de
personas o cosas; al cual se le denomina poblacin, la cual puede ser finita o no.
Las personas o cosas que forman la poblacin se denominan unidad elemental o unidad estadstica.
Normalmente un estudio estadstico se realiza sobre un subconjunto de la poblacin, al que se le llama
muestra. La muestra debe ser seleccionada adecuadamente de manera que ella sea representativa de la
poblacin, para poder realizar de este modo posibles inferencias..
Variables estadsticas. Al estudiar una poblacin o muestra nos concentramos en una caracterstica
de los individuos u objetos que le conforman; si esta caracterstica tiene variabilidad o variacin se
denomina variable estadstica y el resultado de las observaciones o mediciones de la caracterstica se
llama dato estadstico.
Cuando la caracterstica o variable en estudio es no numrica o numrica no operable se le denomina
variable cualitativa o atributo. As por ejemplo: el estado civil de una persona, su nacionalidad, tipo de
automvil que posee, ciclo en el que se encuentra un alumno, etc. son variables cualitativas.
Cuando la variable de estudio se puede expresar numricamente y se puede hacer operaciones con
ella, entonces se denomina variable cuantitativa. As por ejemplo: el saldo de una cuenta bancaria; la
estatura de una persona, el nmero de hijos en una familia, son variables cuantitativas.
Estas variables cuantitativas pueden ser:
a) Discretas: Cuando se les puede asociar un nmero entero. Por ejemplo, el nmero de hijos, nmero de
empleados de una empresa, nmero de ruedas de un vehculo, etc; son variables cuantitativas discretas
b) Continuas, Aquellas que por su naturaleza admiten que entre dos valores cualesquiera la variable
pueda tomar cualquier valor intermedio, por ejemplo pesos, tiempo de duracin de en proceso y estaturas
de personas, etc.)
Organizacin y presentacin de datos
I. Para datos no agrupados. La informacin que se ha recopilado pero que an no se organiza se debe
ordenar. Si los datos incluyen valores repetidos se puede organizar una distribucin de frecuencias que
es una tabla o lista de los distintos valores de la variable (x).
A continuacin damos las siguientes definiciones:
Sean x1,x2, x3,., xk los distintos valores que puede tomar la variable x.
Frecuencia absoluta (fi): Designa el nmero de veces que el valor correspondiente aparece en el
conjunto de datos. Por ejemplo, fi indica el nmero de veces (frecuencia absoluta) que aparece el valor xi
Frecuencia relativa (hi): Indica la fraccin o porcentaje del total, con que aparece el valor xi, dentro del
fi
total de datos. Se calcula como: hi , i =1,2,....,n
N
Frecuencia Absoluta Acumulada (Fi) es la suma de todas las frecuencias absolutas hasta k = 1 hasta
k = i, obtenindose Fi f1 f2 ... fi
Frecuencia Relativa Acumulada (Hi) Es el cociente entre la frecuencia acumulada absoluta
Fi
correspondiente al dato xi y el nmero total de datos N. Luego Hi o tambin Hi h1 +h2 +...+hi
N
Ejemplo 1: Se realiz una encuesta entre los 50 empleados de una empresa, consultando sobre el
nmero de hijos en edad escolar que tena cada empleado, a fin de estimar el pago de una bonificacin
por gastos escolares que proyecta hacer la empresa.
0 2 1 0 3 2 0 1 1 0 0 1 1 2 4 1 0 1 1 0
2 1 0 0 3 0 0 1 2 1 0 0 2 4 1 1 0 1 2 0
1 1 0 3 5 1 2 1 3 2
Organizar los datos en una distribucin de frecuencias, enlistando cada valor diferente (x) en una columna,
luego empleamos marcas para contar el nmero de veces que aparece cada valor de x y al acabar,
anotamos la frecuencia absoluta (f) y luego calculamos la frecuencia relativa (h).
Tabla 1. No de hijos por empleados de una empresa
No de Conteo fi hi Fi Hi
hijos
0 \\\\ \\\\ \\\\ \ 16 16/50 = 0.32 = 32% 16 32%
1 \\\\ \\\\ \\\\ \\\ 18 18/50 = 0.36 = 36% 34 68%
2 \\\\ \\\\ 9 9/50 = 0.18 = 18% 43 86%
3 \\\\ 4 4/50 = 0.08 = 8% 47 94%
4 \\ 2 2/50 = 0.04 = 4% 49 98%
5 \ 1 1/50 = 0.02 = 2% 50 100%
n = 50 Total = 1 = 100%
Se deduce que: El total de frecuencias absolutas debe ser el total de datos y el total de frecuencias
relativas debe ser el 100%.
n n
Propiedad fundamental: f = N = total de datos ; h = 100%
i=1
i
i=1
i
II. Para datos agrupados. Cuando los datos consisten en muchos valores en su mayora no repetidos es
conveniente agrupar los datos y determinar las frecuencias absolutas y relativas de cada grupo que
llamaremos clase.
Necesitamos las definiciones:
a) Rango Recorrido (R). Es la diferencia entre el mayor xmx y el menor de los datos xmin: R = xmax xmin
b) Intervalo de Clase a i , b i . Son cada una de las categoras excluyentes (o clases) en los que se
pueden clasificar los datos. Los extremos de un intervalo [ai, bi son ai y bi, donde:
ai = lmite inferior del intervalo de clase; bi = lmite superior del intervalo de clase
c) Marca de Clase (xi). Son los puntos medios de cada clase, as en el intervalo a i , b i la marca de
clase xi ser: ai bi
xi
2
d) Nmero de Intervalos (k). No existen reglas fijas para establecer el valor de k. Una regla sugiere que
sea un nmero prximo a N y otra dice que el nmero ideal es 1 + 3,3 logN (Regla de Sturges), siendo
N el total de datos. En muchos casos, desde 5 hasta 20 intervalos puede ser el nmero adecuado.
e) Amplitud del Intervalo (A). Es la diferencia entre sus extremos. Por lo general todos los intervalos
tienen la misma longitud A por lo que se cumplir para estos casos que: R
A
k
Es preferible redondear el valor de A por exceso para no perder datos.
f) Frecuencia absoluta (fi). Es el nmero de datos que corresponden al i-simo intervalo de clase.
g) Frecuencia absoluta Acumulada (Fi) Se define para cada i-simo intervalo de clase, como la suma de
todas las frecuencias absolutas fi desde el primero hasta el i-simo intervalo: Fi f1 f2 ... fi
h) Frecuencia relativa (hi). Es el cociente entre la frecuencia absoluta del i-simo intervalo y el nmero
fi
total de datos: hi
N
b) Nmero de intervalos: k = 40 6
c) Ancho de clase 48 / 6 = 8
c) Ojivas. Son grficos de frecuencias acumuladas. En el eje vertical se anotan la frecuencias acumuladas
asociadas a cada lmite superior de clase (acumula frecuencias menores que un valor dado).
En algunos casos se grafican las frecuencias acumuladas de todos los valores mayores o iguales al lmite
inferior de cada intervalo (ojivas mayor que). Siempre que se mencione una ojiva sin especificar su tipo,
se entender que es de tipo menor que.
Histograma de la frecuencia absoluta acumulada y la OJIVA (Menor que)
Fi
50
40
30
20
10
0 x
42 50 58 66 74 82 90
Observaciones. Si f es la frecuencia en el intervalo de clase [a, b> y se considera que los datos se
distribuyen de manera uniforme en ese intervalo, entonces podemos considerar por ejemplo que en el
/ c -a
intervalo [a, c] contenido en [a, b> existen aproximadamente: f = ( ).f . Igualmente para una
b-a
/ c -a
frecuencia relativa h: h = ( ).h . Por semejanza:
b-a
f f f'
Esta se rige por una simple regla de tres:
ba c a
f
a b
c
Ejemplo: En el intervalo [50; 58> la frecuencia es 6, luego en el intervalo [52; 55] habr
55 - 52 2,25
f = . 6 = 2,25 100% = 5,625%
58 - 50 40
Medidas de centralizacin.
Los nmeros que describen de manera concisa el comportamiento y las caractersticas generales de un
conjunto de datos son los parmetros estadsticos.
Los parmetros que miden la tendencia central de los datos se llaman medidas de centralizacin y son
datos que representan de forma global a toda la poblacin y los ms representativos son la media, la
mediana y la moda.
a) Media aritmtica. Se calcula dividiendo la suma de los valores de todos los datos entre el nmero de
datos. As tenemos:
n n
En la ltima frmula fi es la frecuencia de cada intervalo y xi es la marca de clase.
Media aritmtica ponderada. Se aplica cuando no todos los datos tienen la misma importancia o peso.
Su frmula es similar a la de los datos agrupados, cambiando f i por los pesos pi y el denominador N por la
suma de todos los pesos; en este caso xi sera el valor de cada dato.
xp
x pi i
x 1p1 x 2p 2 ... x k p k
p i p1 p 2 ... p k
b) Mediana (Me). Es el valor del dato que ocupa la posicin central cuando stos se ordenan de menor a
mayor (o viceversa); dividiendo a la lista de datos en dos grupos de igual nmero de elementos.
Veamos cmo se calcula su valor:
b1) Para datos no agrupados: La mediana est dada por aquel valor que ocupa la posicin central,
cuando los datos se ordenan de menor a mayor (o viceversa)
Si el nmero de datos es par la mediana es la media de los dos que ocupan las posiciones centrales.
Si el nmero de datos es impar la mediana es el dato central.
Ejemplo. Sean los datos: 9, 7, 8, 10, 8, 11; al ordenar se tiene: 7, 8, 8, 9, 10, 11 Me = (8 + 9)/2 = 8,5
b2) Para datos agrupados. Debe encontrarse primero el intervalo mediano, (que es el intervalo donde se
sobrepasa por primera vez la mitad de los datos) y luego ubicar en dicho intervalo la mediana (Me) con la
N
Fi1
frmula : , donde se tiene:
Me ai ( 2 ).A
fi
ai = lmite inferior del intervalo mediano N = nmero de datos
N
i = el menor intervalo que cumple Fi Fi-1 = frecuencia acumulada del intervalo i-1
2
fi = frecuencia absoluta del intervalo mediano A = amplitud del intervalo
CEPRE-UNI ARITMTICA Pgina 5
Ciclo Preuniversitario Admisin 2013-2
d2) Para datos agrupados: MG n x1f1 x 2 f2 ...... x k fk (fi es la frecuencia del dato xi )
n 1
MH
e1) Para datos no agrupados: 1 1 1 1
x1 x 2
...
xn
x
i
n
e2) Para datos agrupados: MH
1
f xi
i
Propiedad: MH MG MA
Medidas de dispersin
Las medidas de tendencia central determinan el centro de los datos estadsticos, pero no nos indican nada
acerca de la posicin respecto al centro. Por lo tanto se necesita una medida que nos indique el grado de
dispersin o variacin respecto a un valor central que por lo general es la media aritmtica, con la finalidad
de tener una comparacin y ampliar la descripcin de los datos.
n
(x x)
2 2
i x i
i1
s
2
Lo cual es equivalente a s2 i1
x2 x2 x2
N N
Propiedades fundamentales.
a1) Sea M(X) la media de una variable X, entonces: M(a X + b) = a M(X) + b (a y b constantes)
2
a2) Sea V(X) la varianza de la variable X, entonces: V(aX + b) = a V(x) (a y b constantes)
s2 i1 s2 x
N N
Anlisis Combinatorio
Principios fundamentales
1. Principio de la multiplicacin. Si un evento A tiene p formas diferentes de realizarse y para cada una
de estas formas existe un segundo evento B que se puede realizar de q formas diferentes, entonces la
realizacin del evento A y B se podr hacer de : p . q formas.
2. Principio de la adicin. Si el evento A se puede realizar de p formas diferentes y un segundo evento B
se puede realizar de q formas diferentes y no es posible realizar los dos eventos a la vez, A B = ,
entonces la realizacin del evento A B se podr hacer de:p + q formas.
Factorial de un nmero. Sea n un nmero entero positivo, se define el factorial de n, como:
n! = 1 x 2 x 3 x ...............x n
Permutacin. Se entiende por permutacin de n elementos diferentes, a toda agrupacin lineal de estos
n elementos, sin que ninguno falte o se repita.
Estas agrupaciones se diferencian entre s, slo por el orden de sus elementos (el orden interesa)
El nmero de permutaciones de n elementos es: P(n) = n!
Ejemplo. Calcule el nmero de permutaciones que pueden formarse con 3 elementos.
Sean a, b, c los 3 elementos, entonces las permutaciones son: abc; acb; bac; bca; cab y cba
Luego hay 6 permutaciones y usando la frmula: P(3) = 3! = 6
Nota: Cuando en un arreglo solo entra parte de los elementos del conjunto, el arreglo es llamado
variacin.
3! 3!
Luego hay 6 permutaciones. Usando la frmula, obtenemos: V23 = = =6
(3 - 2)! 1!
Permutaciones con repeticin (Pr). Se tiene n1 elementos repetidos de un primer tipo, n2 elementos
repetidos de un segundo tipo,., nk elementos repetidos de un k-simo tipo y sea n = n1 + n2 + .+ nk ,
entonces la cantidad de permutaciones diferentes que se pueden obtener al disponer en forma lineal los n
n n!
elementos es: PRnn1,n2 ,....nk = = , llamado coeficiente multinomial.
n1,n2 ,....nk n1!n2!nk!
Ejemplo
Cuntas palabras diferentes (con sentido o sin sentido) se pueden escribir con las letras de la palabra
MATEMATICA?
Solucin
Las letras M, A, T ,E, I, C se repiten 2,3,2,1,1,1 veces respectivamente, tal que 2 + 3 + 2 + 1 + 1 + 1 = 10
10 10!
La cantidad de palabras distintas es = = 151200
2,3,2,1,1,1 2! 3! 2! 1! 1! 1!
Permutaciones circulares (PC). Se tiene una cantidad de elementos diferentes, se entiende por
permutacin circular de dichos elementos a cualquier disposicin circular de estos.
Dos permutaciones circulares son diferentes cuando uno de ellos no resulta de una rotacin del otro.
El nmero de permutaciones circulares diferentes de n elementos es PC(n) =(n-1)!.
Nmeros Combinatorios
Combinacin. Una combinacin de un conjunto de elementos es una disposicin lineal de ellos de
algunos de ellos en donde no interesa el orden de estos.
Ejemplo.
Para el conjunto 1, 2, 3, 4, 5, 6 tenemos que 1,2,3 y 3,2,1 son dos permutaciones distintas pero una
misma combinacin. Pero 1,2,3 y 2,4,6 son dos permutaciones distintas y dos combinaciones distintas.
Combinacin de un conjunto de n elementos tomados de r en r
Supongamos que tenemos una coleccin de n elementos. Una combinacin de r elementos
(r 0) es una disposicin lineal de r elementos donde el orden no interesa.
Ejemplo.
Las combinaciones de las letras a, b,c,d tomadas 3 a la vez son:
Disposiciones Combinaciones Permutaciones
abc abc, acb, bac, bca, cab, cba 1 3!
abd abd, adb, bad, bda, dab, dba 1 3!
acd acd, adc, cad, cda, dac, dca 1 3!
bcd bcd, bdc, cbd, cdb, dbc, dcb 1 3!
Luego hay 4 combinaciones porque el orden de cada tro seleccionado, no se tiene en cuenta.
Se observa, que el nmero de combinaciones multiplicado por 3! , es igual al nmero de permutaciones
P34
totales: C34 .3! = P34 C34 = =4
3!
En general: Cada combinacin de n elementos tomados de r en r, determina r! permutaciones
n n!
de los objetos, luego se deduce que: Cnr .r! = Prn , de donde Cnr = =
r r!.(n - r)!
n n
1.- Combinatorios Complementarios: = .
k n - k
n n n -1 n -1 k n
2. Se deduce que =
k k k -1 k -1 n k
Consecuencias:
n k +1 n n n - k n
a) = (n +1) - k
n n +1 n +1 n +1 n
b) =
k n +1 k k (n +1) - k k k n - k k +1 k +1 k +1 k
n n n +1 n +1 n n
3. Suma de combinatorios: + = = +
k k +1 k +1 k +1 k k +1
4.Igualdad de nmeros combinatorios:
n m
Si = , entonces se verifica que: (i) m = n x = y (ii) m = n = x + y
x y
Resultados notables:
n n n n n n n(n -1)
5. = = 1 6. = =n 7. = =
0 n 1 n -1 2 n - 2 2
n
n n
n
Binomio de Newton: (a + b)n = ak bn-k = an-k bk n , k 0 y n k
k=0 k k=0 k
n
n n n n n n
8. k = 0 + 1 + 2 + 3 +......+ n = 2n
k=0
n
n n n n n
9. k k = + 2 + 3 +......+ n = n 2n-1
k=1 1 2 3 n
n
n n n n n n n
10. (-1) k
= - + - +......+ (-1) = 0
k=0 k 0 1 2 3 n
11. Si n 2k, entonces C(n, k) >C(n, k-1), y si n2k, entonces C(n, k)>C(n, k+1).
PROBABILIDADES
Definiciones:
1. Experimento aleatorio (): Es todo proceso que consiste en la realizacin de una prueba o ms, cuyo
resultado (en cada una) depende del azar, por tanto, no se puede anticipar.
2. Espacio Muestral ( ) : Conjunto de todos los posibles resultados de un experimento aleatorio.
3. Evento Suceso (A): Conjunto de uno o ms resultados de un experimento. (es un subconjunto del
espacio muestral). El vaco tambin se considera un evento.
4. Probabilidad: Medida de la posibilidad de que ocurra un evento (o suceso) en el futuro.
5. Sean A, B,.,C dos eventos del espacio muestral , entonces
A B : Es el evento que ocurre si y slo si ocurre A o ocurre B ocurre A y B a la vez.
A B: Es el evento que ocurre si y slo si ocurre A y B a la vez.
Ac : Es el evento que ocurre si y slo si no ocurre A.
ABC: Ocurre si y slo si ocurre al menos uno de los eventos A, B,.,C.
A B C: Ocurre si y slo si todos los eventos A, B,.,C ocurren a la vez
Asignacin de probabilidad a un evento:
(i) En forma terica. La definicin clsica se basa en el supuesto de que todos los resultados posibles de
un experimento aleatorio son igualmente probables; es decir, cada uno de los elementos del espacio
muestral tiene la misma probabilidad de ocurrencia.
Empleando el punto de vista clsico, la probabilidad de que suceda un evento A se calcula as:
Nmero de resultados favorables n(A) Cardinal de A
P(A) = = =
Nemro total de resultados posibles n() Cardinal de
1 Una sola vez funcion el motor: P(X = 1) = C14 0,8 0,2 = 0,0256 = 2,56%
1 3
2 Dos veces funcion bien el motor: P(X = 2) = C24 0,8 0,2 = 0,1536 = 15,36%
2 2
3 Tres veces funcion bien el motor: P(X = 3) = C34 0,8 0,2 = 0,4096 = 40,96%
3 1
4 En todas las pruebas funcion bien el motor: P(X = 4) = C44 0,8 0,2 = 0,4096 = 40,96%
4 0
45 40.96 40.96
40
35
30
25
20 15.36
15
10
5 2.56
0.16
0
0 1 2 3 4
Nota: Si se considera la probabilidad de Xi como una frecuencia relativa se tiene que E(X) es el valor
promedio de X.
Ejemplo. En el problema anterior:
E(X) = (0).0,16% +(1).2,56% + (2).15,36% +(3).40,96% + (4).40,96% = 3,2
Observacin: Tenemos que 3,2 es el 80% de 4
Propiedad: E(a X + b) = a E(X) + b