Você está na página 1de 48

ESTADSTICA Y PROBABILIDADES

UNHEVAL- 2011 Mg. VARGAS RONCAL, Rosario

CAPTULO I. INTRODUCCIN A LA ESTADSTICA

1.1 DEFINICIN DE ESTADSTICA


La Estadstica es la ciencia que recopila, clasifica, presenta, describe e interpreta conjuntos de datos. Generalmente se ocupa de estudiar fenmenos aleatorios. La estadstica puede dividirse en dos ramas: descriptiva e inferencial

Estadstica descriptiva
es el conjunto de mtodos estadsticos que se relacionan con el resumen y descripcin de los datos, como tablas, grficos, y el anlisis mediante algunos clculos.

Estadstica inferencial
Es una tcnica mediante la cual se obtienen generalizaciones o se toman decisiones en base a una informacin parcial o completa obtenida mediante tcnicas descriptivas.

1.2DEFINICIN DE TRMINOS ESTADSTICOS BSICOS


Poblacin o Universo Unidad de anlisis Muestra Muestra aleatoria Variable Dato Parmetro Estadstico Censo Encuesta Escalas de medicin

1.3 TIPOS DE VARIABLES


A.Variables cualitativas Variables Nominales Variables Ordinales B. Variables cuantitativas Variable Cuantitativa Discreta Variable Cuantitativa Contina

1.4 TCNICAS DE MUESTREO


a) Muestreo Aleatorio b) Muestreo Estratificado c) Muestreo por conglomerados (Clusters) d) Muestreo Sistemtico

1.5 MANERAS DE RECOLECTAR DATOS


a) Haciendo entrevistas personales. b) Haciendo entrevistas por telfono. c) Mediante cuestionarios emitidos por correo. d) Por observacin directa. e) A travs de Internet. f) Usando simulacin por computadoras

1.6 EJERCICIOS PROPUESTOS


Cual es la definicin de la Estadstica? Tipos o ramas de la estadstica En que se diferencian los conceptos de Poblacin y Muestra? Ejemplos de variables (cuantitativa o cualitativa) Inferencia estadstica, ejemplos Tipos de muestreo Ventajas de los muestreos estratificado y por conglomerados

CAPTULO II: ORGANIZACIN Y REPRESENTACIN DE DATOS

2.1 DISTRIBUCIN DE FRECUENCIAS


2.1.1 TIPOS DE DISTRIBUCIONES. Distribucin categrica; es aquella que se aplica a la variable cualitativa, en donde sus valores son cualidades o categoras. Distribucin numrica; es aquella que se aplica a la variable cuantitativa, en donde sus valores son nmeros.

DISTRIBUCIN DE FRECUENCIAS: Variable cualitativa Categora de Frecuencias Frecuencias relativas la variable Xi absolutas Ci ni
C1 C2 Ck total n1 n2 n2 n f1 f2 fk 1

Ejemplo: En una encuesta de opinin acerca de las preferencias de una tipo de platos de comida en un pueblito de Per dieron las siguientes respuestas: P: Pachamanca; L: lomo saltado; C: cebiche P, P, P, P, P, P, P, P, L, L, L, L, L, L, L, L, L, C, C, C; construir la distribucin de frecuencias

Plato de comida N de personas Xi

% de personas

Pachamanca(P)
Lomo saltado(L)

8
9

40
45

Cebiche (c)
total

3
20

15
100

DISTRIBUCIN DE FRECUENCIAS: Variable cuantitativa discreta Valores Frecuencias Frecuencia de Xi absolutas s relativas Xi X1 X2 xk ni n1 n2 nk f1 f2 fk N1 N2 n F1 F2 100 Frec Frec relativas absolutas acumuladas acumuladas

total

Ejemplo Ante la pregunta del nmero de hijos por familia (variable x) una muestra de 20 hogares, marco las siguientes respuestas: 2 ,0, 3, 1, 1, 1, 2, 2, 2, 2, 3, 3, 1, 3, , 2, 3, 3, 4, 4, 2 Construir la distribucin de la variable X.

Nmero de hijos Xi
0

Nmero de familias ni
1

%Familias fi 5

Nmero % familias familias acumulada acumuladas s


1 5

1
2 3 4 total

4
7 6 2 20

20
35 30 10 100

5
12 18 20

25
60 90 100

DISTRIBUCIN DE FRECUENCIAS: Variable cuantitativa continua Interval Frecuencias Frecuencia Frec Frec os relativas absolutas s relativas absolutas Li-1-Li acumuladas acumuladas Lo-L1 ni L1-L2 L2-L3 Lk-1-Lk n1 n2 nk f1 f2 fk N1 N2 n F1 F2 100

total

Ejemplo 3. Los ingresos semanales en dlares (variable X) de 50 empleados son: 46 47 52 54 56 57 57 58 58 59 60 61 63 63 64 65 66 67 67 67 67 67 68 68 69 69 70 70 70 70 72 72 73 73 73 74 76 76 77 77 77 79 80 82 84 85 86 88 93 94 Construir una distribucin de frecuencias.
1. Decidir cuantos intervalos usar, para eso usaremos la regla de Sturges; K=1+ 3,322 Log(n) = 1+ 3,322 Log (50) = 1+ 3,322 (1,69897) = 6.6447 Por lo tanto el nmero de intervalos es K =7 NOTA: la aproximacin es al entero inmediatamente superior; se recomienda que el nmero de intervalos deba ser entero y entre 5 y 20. 2. Calcular el rango o recorrido de los datos R = Valor mximo Valor mnimo = 94-46+1 = 49 3. Calcular la amplitud comn del intervalo, usaremos un indicador: A=R/K=49/7=7 ; Luego la amplitud es: A= 7 Determinamos el exceso: E = AK-R = 7x7-49=0

Tabla 01: Ingresos semanales de Empleados ($) . Li-1-Li ni Ni fi Fi

]45-53] ]53-60] ]60-67] ]67-74] ]74-81] ]81-88] ]88-95] total


Interpretacin.

3 8 11 14 7 5 2 50

3 11 22 36 43 48 50

6 16 22 28 14 10 4 100

6 22 44 72 86 96 100

n3= 11; 11 empleados que ganan entre 60 y 67 $ sem N4= 36 empleados que ganan semanalmente entre 45 y 74 $ F6 = 96, el 96% de los empelados ganan entre 45 y 88 $ por semana.

PROPIEDADES DE LAS FRECUENCIAS.


Sea n el nmero total de observaciones realizadas de la variable X que toma los valores distintos X1,..., entonces, tenemos las siguientes propiedades: 1. n1+n2+n3+nk=n 2. f1+f2+f3++fk=1 3. Nk=n 4. Fk=1 5. 0 ni n ; i = 1, 2, 3,..., k 6. 0 fi 1; i= 1,2, 3, ...,k 7. Ni=Ni-1+ni = Ni-Ni-1 8. El porcentaje correspondiente a un valor de la variable X se obtiene multiplicado la frecuencia relativa por 100 esto es (%)Xi = 100

2.2 REPRESENTACIONES GRAFICAS


La representacin grfica de una distribucin de frecuencias depende del tipo de variable.
2.2.1 VARIABLES CUALITATIVAS Veremos dos tipos de representaciones:

Diagrama de sectores (tarta):


Est representacin grfica consiste en dividir un crculo en tantos sectores circulares como modalidades presente el carcter cualitativo, asignando un ngulo central a cada sector circular proporcional a la frecuencia absoluta ni, consiguiendo de esta manera un sector con rea proporcional tambin a ni. El ngulo central se determina as:angulo=360ni/n

Ejemplo 4 Hacer el diagrama de sectores para tabla siguiente.


Causas Mala atencin Nmero de casos 26

Productos inconformes
Reclamos Otras causas Total

3
10 1 40

360x26/40=234 360x3/4=27 360x10/40=90 360x1/40=9 Tabla 01. Nmero de Casos segn causa

Causas
Mala atencin Productos inconformes Reclamos Otras causas Total

Nmero de casos
26 3 10 1 40

ngulo(grados)
234 37 90 9 360

Grafico 01: Nmero de casos segn Causas

Reclamos, Otros 1 10 Productos Inconformes 3

Mala atencin 26

DIAGRAMA DE RECTNGULOS:

Esta representacin grfica consiste en construir tantos rectngulos como categoras presente la variable cualitativa en estudio, todo ellos con base de igual amplitud. La altura se toma igual a la frecuencia absoluta o relativa (segn la distribucin de frecuencias que estemos representando), consiguiendo de esta manera rectngulos con reas proporcionales a las frecuencias que se quieren representar.

Ejemplo. Hacer el diagrama de rectngulos para tabla siguiente.


Causas Mala atencin Productos inconformes Reclamos Otras causas Nmero de casos 20 6 3 10 1

Total

40

Grafico 01: Nmero de casos segn Causas


Diagrama de rectngulos
25

20

Casos

15

10

Mala atencin

Productos inconformes Reclamos Causas

Otras causas

2.2.2 VARIABLES CUANTITATIVAS: DATOS SIN AGRUPAR

Estudiaremos dos tipos de representaciones grficas, correspondientes a distribuciones de frecuencias (absolutas o relativas) no acumuladas y acumuladas.
Diagrama de barras: Consiste en levantar, para cada valor de la variable, una barra cuya altura sea su frecuencia absoluta o relativa, dependiendo de la distribucin de frecuencias que estemos representando.

Ejemplo. La tabla expresa el nmero de hijos de 25 familias, construya el diagrama de barras de las frecuencias relativas simples (fi) N de hijos(Xi) 0 1 2 3 4 Total N de familias(ni) 5 6 8 4 2 25 Grafico 02. Nmero de hijos por familia fi Xi ni fi 0 5 0.20 1 2 3 6 8 4 0.24 0.32 0.16

2 25

0.08 1.00 Numero de hijos

Diagrama de frecuencias acumuladas: Esta representacin grfica se corresponde con la de una funcin constante entre cada dos valores de la variable a representar, e igual en cada tramo a la frecuencia relativa acumulada (o absoluta acumulada si se trata de representar una distribucin de frecuencias absolutas) hasta el menor de los dos valores de la variable que construyen el tramo en el que es constante.
Ejemplo . Graficar el diagrama de frecuencias relativas acumuladas del ejemplo anterior

Xi 0 5

ni 0.20

fi

1 2 3 4

6 8 4 2 25

0.24 0.32 0.16 0.08 1.00

Grafico 03. Nmero de hijos por familia Fi

Nmero de Hijos

2.2.3 VARIABLES CUANTITATIVAS: DATOS AGRUPADOS EN INTERVALOS

Existen dos tipos de representaciones grficas dependiendo de si la distribucin de frecuencias en estudio es de datos acumulados o de datos sin acumular. Histograma. Al ser esta representacin una representacin por reas, hay que distinguir si los intervalos en los que aparecen agrupados los datos son de igual amplitud o no. Si la amplitud de los intervalos es constante, dicha amplitud puede tomarse como unidad y al ser Frecuencia (rea) = amplitud del intervalo altura, la altura correspondiente a cada intervalo puede tomarse igual a la frecuencia. Si los intervalos tienen diferente amplitud, se toma alguna de ellas como unidad (generalmente la menor) y se levantan alturas para cada intervalo de forma que la ecuacin anterior se cumpla.

Ejemplo. Grafique los datos de la tabla

Ii 7.65 9.15 9.15 10.65 10.65 12.15 12.15 13.65 13.65 15.15 15.15-17.0

ni 4 8 10 9 2 1 34

fi

Polgono de frecuencias acumuladas: Se utiliza para representar distribuciones de frecuencias (relativas o absolutas) acumuladas. Consiste en representar la grfica de una funcin que una por segmentos las alturas correspondientes a los extremos superiores de cada intervalo, tengan o no todos igual amplitud, siendo dicha altura igual a la frecuencia acumulada, dando una altura cero al extremo inferior del primer intervalo y siendo constante a partir del extremo superior del ltimo. Ii ni fi Ni Fi 07.65 - 09.15 09.15 - 10.65 4 8 0.118 0.235

4
12 22 31 33 34

0.118
0.353 0.647 0.912 0.971 1

10.65 - 12.15
12.15 - 13.65 13.65 - 15.15 15.15 - 16.65

10
9 2 1 34

0.294
0.265 0.059 0.029 1

Polgono de frecuencia

7.65 9.15 10.65 12.15 13.65 15.15 16.65

2.3 OTRAS REPRESENTACIONES GRAFICAS 2.3.1 DIAGRAMA TALLO- HOJA (STEM & LEAF) De manera similar al histograma permite ver el lote como un todo y advertir aspectos como: Cuan aproximadamente simtricos son los datos. Cuan diversos estn los valores. La aparicin de los valores inesperadamente mas frecuentes, Si algunos valores estn alejados del resto. Si hay concentraciones de valores. Si hay grupos separados. Caractersticas No se pierde informacin. Divide el dato (nmero) en dos partes; tallo y hoja Puede haber 1, 2 o 5 lneas por tallo (el tallo se puede dividir en dos partes iguales o en 5 partes iguales)

Ejemplo 11. Suponga que los siguientes datos representan el salario anual de los obreros de la compaa X 20 14 21 29 43 17 15 26 08 14 39 23 16 46 28 11 26 35 26 28 30 22 23 07 32 19 22 18 27 09 Construya el diagrama tallo-hoja Ordenamos los datos 07 08 09 11 14 14 15 16 17 18 19 20 21 22 23 23 26 26 26 27 28 28 29 30 32 35 39 43 46 Y separamos los datos en dos fracciones (dgitos), ejemplo el 07 se separa (0 y 7 ), el 08 (0 y 8) el 21(2 y 1) el 39(3 y 9) En este caso el tallo es el primer digito (decenas) y la hoja el ultimo (unidades)

Diagrama tallo - hoja

0 1 2 3 4

789 14456789 0122336667889 0259 36

2.3.2 DIAGRAMA DE CAJA (BOXPLOT)


A diferencia de los otros grficos ya vistos, los diagramas de caja hacen nfasis en las medidas de posicin. Es muy til para hacer comparaciones entre muestras de distintas poblaciones. Un diagrama de caja consiste en un rectngulo cuya longitud es el rango intercuartlico (IQR), dividido por un segmento a la altura de la mediana y complementado por dos lneas (llamadas bigotes) que parten de los extremos del rectngulo, cuya longitud no supera 1,5 veces el rango intercuartlico y que intentan alcanzar los valores mnimo y mximo observados. En un simple grfico se suministra informacin sobre la mediana (o media), sobre el 50% y 90% de los datos, sobre la existencia de situaciones con datos atpicos, as como de la simetra de la distribucin.

Diagrama Box-Plot
30
30

25

20
C1

Ls=Q3+1.5IQR
Q3=14

15

10

IQR=9
Q2=8

Q1=5 Li=Q1-1.5IQR

Ejemplo. Con base en una muestra de 20 entregas, Marcos Pizza determin la siguiente informacin: Valor mnimo = 13 minutos, Q1 = 15 minutos, mediana = 18 minutos, Q3 = 22 minutos, Valor mximo = 30 minutos Desarrolle un diagrama de caja para los tiempos de entrega.

Li = q1 - 1.5 IQR = 15 - 1.5 (22-15) = 15- 1.5(7) = 4.5, como min=13, el Li=13 y no 4.5 Ls = q3 + 1.5 IQR = 22 + 1.5 (22-15) = 22 + 1.5(7) = 32.5, como el mximo es 30 entonces Ls=30 y no 32.5

Diagrama Box-Plot
30

25

C3

20

15

2.3.3 DIAGRAMA DE PUNTOS (DOT-PLOT)

Un Dotplot es una alternativa informal al Histograma para mostrar datos continuos. En el dotplot cada valor de los datos mostrado como un punto en el eje horizontal. Cuando dos valores se separan por menos de un cierto espacio se apilan en una columna. Si el incremento es muy pequeo es imposible ver la forma de la distribucin. Sin embargo, si el incremento es muy grande entonces slo se obtiene una columna de puntos.

Ejemplo. Los siguiente datos presenta los resultados observados del nmero de plntulas de malezas por m2 en una muestra de tamao n=20. 5 3 4 7 5 9 8 4 7 4 5 1 4 5 8 4 7 5 3 5 Grafique el diagrama de punto o dot plot

2.3.4 DIAGRAMA DE PARETO

Se ordenan las categoras de mayor a menor frecuencia y se dibujan los rectngulos correspondientes. Es muy utilizado en controles de la calidad, donde cada clase representa un tipo de disconformidad o problema de produccin.

Ejemplo 16. Durante una jornada laboral el equipo de control de calidad decidi hacer un conteo de los defectos que se presentaban en los elementos estructurales para puertas que se manufacturaban dentro de la empresa recabando los siguientes datos. Construir el diagrama de Pareto de los defectos en elementos estructurales en puertas. Defecto Fuera de perfil Piezas desordenadas Cantidad 30 21 Porcentaje del total 37 26

Agujeros/ranuras perdidos Fuera de secuencia


Partes no lubricadas Piezas con rebabas Abolladuras/Picaduras Otros

6 6
5 5 4 4

7 7
6 6 5 5

Digama de pareto
Pareto Chart of Defecto
90 80 70

100
Percent

Cantidad

60 50 40 30 20 10 0

80 60 40 20
il rf pe

Defecto

s s s s ia er os ra da da ba id nc th u a a a d e O e ad en r ic eb er cu d r d b ic p e r s n a lu s /P so er o co ra e de as n u r d s Fu s ra an du es za r e t e la za s/ ar Fu Pi ol ie o P P r Ab je u Ag Cantidad 30 21 6 6 5 5 4 4 Percent 37.0 25.9 7.4 7.4 6.2 6.2 4.9 4.9 Cum % 37.0 63.0 70.4 77.8 84.0 90.1 95.1 100.0

Tabla de frecuencia ejercicios

Você também pode gostar