Você está na página 1de 82

1

INTRODUCCIN A LA ESTADSTICA
DESCRIPTIVA

Ing. Leonardo Snchez/ Ing. Carlos Burgos

INDICE
CAPTULO 1: ESTADSTICA

INTRODUCCIN

FUNCIONES

REPRESENTAIN GRFICA EN ESTADSTICA

GRAFICAS TIPO PASTEL O CIRCULARES

CLCULO PARA LA OBTENCIN DE PORCENTAJES

CLCULO PARA LA OBTENCIN DE PORCENTAJES DENTRO DE UNA GRFICA


TIPO PASTEL

GRFICO DE BARRAS

CAPTULO 2: FRECUENCIAS Y DISTRIBUCIONES

18

CAPITULO 3: MEDIDAS DE TENDENCIA CENTRAL

33

CAPTULO 4: MEDIDAS DE DISPERSIN

47

CAPTULO 5: MOMENTOS ESTADSTICOS

54

CAPTULO 6: PROBABILIDADES

59

CAPITULO 7: DISTRIBUCIONES DE PROBABILIDAD

71

CAPITULO 8: MUESTREO

78

CAPITULO 9: ESTADISTICA INFERENCIAL

82

Ing. Leonardo Snchez/ Ing. Carlos Burgos

CAPTULO 1: ESTADSTICA
INTRODUCCIN
Los inicios de la estadstica se remontan desde siglos pasados, tal es el caso del censo que
realizo Moiss despus de la salida de Egipto, esto segn la biblia, tambin existieron otros
censo como los realizados por el emperador TAO hacia el ao 2200 AC. En la edad media
realizado por Carlomagno en el ao 762.
La estadstica es bien aplicada desde los aos
La estadstica es una rama de las matemticas que se encarga de la recoleccin y estudio
de datos de una poblacin, objetos, animales, etc.
La estadstica es muy necesaria dentro de todos los campos, ya que permite a travs de sus
|datos darnos valores para interpretar nuestros datos recogidos, pudiendo estos ser de
estudio o no.
Cuando se habla de estadstica surge muchas preguntas:
Porque es importante la estadstica?
Se vuelve importante en nuestra vida diaria, como por ejemplo en lo ms simple cuando se
necesita saber cul ser el pronstico de un equipo de futbol durante un partido, la suerte
que se tendr a jugar a la ruleta dentro de un casino o tan simple como jugar a los volados,
y en otras mucho ms complejas como saber la necesidad de evaluar la tasa de
crecimiento de una poblacin, las notas de un grupo de estudiantes, el nmero de botellas
plsticas defectuosas, predecir el estado del clima en base a su comportamiento climtico,
predecir el comportamiento de una banda de aves, se puede calcular el comportamiento
de un delincuente, en fin un montn de usos prcticos.

Cules son las ventajas de usar estadstica?


Ofrece muchas ventajas como por ejemplo:

Pronosticar si un equipo ganara o no un campeonato


Realizar un estudio de una muestra, cualquiera que esta sea y que nos arroje sus
pronsticos
En los juegos de azar pronosticar si un evento tendr o no una probabilidad que este
ocurra
Si se desea saber la probabilidad de fallo de un foco dentro de unos cien producidos

Ing. Leonardo Snchez/ Ing. Carlos Burgos

Por qu es necesario la estadstica?


La estadstica se vuelve necesaria ya que es lo que nos permite obtener una conclusin en
base a sus resultados, a esto se lo conoce como estadstica inferencial.
Qu es la estadstica descriptiva?
La estadstica descriptiva se encarga de tomar la informacin, datos recogidos y
presentarla como un valor
Qu es la estadstica inferencial?
La estadstica inferencial es aquella que nos ayuda a dar una conclusin a los datos
obtenidos como resultados obtenidos en la estadstica descriptiva

FUNCIONES
Si a cada valor posible de una variable x le corresponden uno o ms valores de otra variable
y, entonces decimos que y es funcin de x, y escribimos:
y = f (x)
A la variable x se le llama variable independiente y a la variable y se le llama variable
dependiente.
Ejemplo 1. La poblacin total P de Ambato est en funcin del tiempo t, y lo expresamos:
P (Ambato) = f (t)
Ejemplo 2. La longitud L de un eje de trasmisin est en funcin de su peso, expresndose:
L = f (P)
Ejemplo 3. Los profesores de la UTI (C), estn en funcin del Rector (D) en cada una de las
Facultades.
C = f (D)

Ing. Leonardo Snchez/ Ing. Carlos Burgos

5
La dependencia funcional o correspondencia entre variables se anota en algunas
ocasiones en una tabla. Sin embargo, puede tambin indicarse con una ecuacin que
conecta ambas variables, por ejemplo:
y = 6x + 12
Si x = 2, y la funcin de x puede escribirse como:
Entonces:

y = f (x)

f(x) = 6x + 12

Sustituyendo el valor de x tenemos: f (2) = 6(2) + 12


f (2)= 12 + 12
f (2) = 24
El concepto de funcin admite extensin a varias variables.
Ejemplo 14. Si z = 5x - 3y +11, hallar el valor de z correspondiente a:
a) x = 1, y = 4
Sustituyendo tenemos:
z = 5(1)- 3(4) +11
z = 5 -12 +11
z=4
b) x = -2, y = -5
Sustituyendo tenemos:
z = 5(- 2)-3(- 5) +11
z = -10 +15 +11
z = 16

REPRESENTAIN GRFICA EN ESTADSTICA


Un grfico es una representacin de la relacin entre variables. Muchos tipos de grficos
aparecen en Estadstica; segn la naturaleza de los datos involucrados y el propsito del
grfico. Entre los ms comunes tenemos:

1.-Los grficos de pastel tambin conocidos como circulares.


2.-Los grficos de barras.
3.-Los grficos a base de pictogramas.
Ing. Leonardo Snchez/ Ing. Carlos Burgos

6
Para realizar cualquier tipo de grafica primero se debe tener los datos representados y
debidamente ordenado en una tabla

GRAFICAS TIPO PASTEL O CIRCULARES


Las grficas tipo pastel o circulares nos permiten visualizar de una mejor manera la relacin
entre una variable cualitativa (o discreta) y su porcentaje, su ventaja se encuentra en que
para pocas variables de estudio es ms notoria visualmente que al aplicarse otro mtodo
grafico
Los siguientes datos representan las reas de las provincias del Ecuador en kilmetros
cuadrados.
PROVINCIAS

AREAS (Km2)

AZUAY

8639

BOLIVAR

3254

CAAR

3908

CARCHI

3699

CHIMBORAZO

5287

ESMERALDAS

6569

GUAYAS

17139

PICHINCHA

9612

TUNGURAHUA

3334

Tabla 1 reas de las provincias de Ecuador en Km2

Paso 1 Con los datos e informacin de la tabla 1 Calcular los porcentajes para cada
provincia.
a) Para calcular el porcentaje de cada rea primero se debe sumar todos los valores
correspondientes a cada provincia.
PROVINCIAS

AREAS (Km2)

AZUAY

8639

BOLIVAR

3254

CAAR

3908

CARCHI

3699

CHIMBORAZO

5287

ESMERALDAS

6569

GUAYAS

17139

PICHINCHA

9612

TUNGURAHUA
=

3334

61441

Tabla 2 Suma de las reas de cada provincia

Ing. Leonardo Snchez/ Ing. Carlos Burgos

7
b) Luego de sumadas se debe realizar la regla de tres simple para calcular el rea
correspondiente. El porcentaje total ser igual a 100 una vez sumado cada uno de
sus valores.

CLCULO PARA LA OBTENCIN DE PORCENTAJES


=

8639
100 = 14.061
61441

3254
100 = 5.3
61441

3908
100 = 6.36
61441

3699
100 = 6.02
61441
8639
=
100 = 8.61
61441
6569
=
100 = 10.69
61441
17139
=
100 = 27.9
61441
9612
=
100 = 15.64
61441
3334
=
100 = 5.43
61441
=

PROVINCIAS

AREAS (Km2)

PORCENTAJE

AZUAY

8639

14,06

BOLIVAR

3254

5,30

CAAR

3908

6,36

CARCHI

3699

6,02

CHIMBORAZO

5287

8,61

ESMERALDAS

6569

10,69

GUAYAS

17139

27,90

PICHINCHA

9612

15,64

TUNGURAHUA

3334

61441

5,43
100,00

Tabla 3 Porcentajes correspondientes a cada rea de provincia

Ing. Leonardo Snchez/ Ing. Carlos Burgos

CLCULO PARA LA OBTENCIN DE PORCENTAJES DENTRO DE UNA


GRFICA TIPO PASTEL
c) Se calcula los grados a los que les corresponder cada rea calculada dentro de la
circunferencia (Grafica de pastel)

14.06
360 = 50.62
100
5.3
=
360 = 19.07
100
6.36
=
360 = 22.9
100
6.02
=
360 = 21.67
100
8.61
=
360 = 30.98
100
10.69
=
360 = 38.49
100
27.9
=
360 = 100.42
100
15.64
=
360 = 56.32
100
5.43
=
360 = 149.53
100
=

Para graficar cada uno de los ngulos calculados se deber utilizar un graduador
y representarlo sobre su grfica.

Ing. Leonardo Snchez/ Ing. Carlos Burgos

9
TUNGURAHU
A
5%

REAS (Km2)

PICHINCHA
16%

AZUAY
14%

GUAYAS
28%

ESMERALDAS
11%

BOLIVAR
5%
CAAR
6%
CARCHI
6%
CHIMBORAZ
O
9%

GRFICO DE BARRAS
Dentro de la representacin grafica de barras se tiene:
Segn a orientacin.- Vertical u Horizontal
Segn su tipo.- Pueden ser Sencillo, agrupados y apilados
HISTOGRAMA
Un histograma permite comparar valores con respecto a una variable cualitativa y
una cuantitativa. Esta no se ve limitada por el nmero de variables, ya que su
comparacin la una de la otra no depende del espacio utilizada por otra variable
en comparacin al grafico de pastel. La orientacin de estos grficos se puede
mostrar de manera vertical u horizontal segn convenga ver figura 1 y 2
respectivamente.
Grfico de barras Sencillos.- Para este tipo de grfico el orden de la distribucin de
variables se muestra como la figura 1 con una nica serie de datos.

Ing. Leonardo Snchez/ Ing. Carlos Burgos

10

AREAS (Km2)
18000
16000
14000
12000
10000
8000
6000
4000
2000
0

AREAS (Km2)

Figura. 1 Grfico de barras sencillo con una nica serie de datos con la variable cuantitativa en
sentido vertical

AREAS (Km2)
TUNGURAHUA
PICHINCHA
GUAYAS

ESMERALDAS
CHIMBORAZO
CARCHI
CAAR
BOLIVAR
AZUAY
0

2000

4000

6000

8000 10000 12000 14000 16000 18000

Figura. 2 Grafico de barras sencillo con una nica serie de datos con a variable cuantitativa en
sentido vertical

Grfico de barras agrupado.- Este tipo de grfico es utilizado para comparar los
valores de ciertas variables conforme al tiempo y las dems variables.
En la tabla 4 se tiene los datos de poblacin de la provincia de Tungurahua segn
el censo del 2010 y se la compara con la del censo del 2001

Ing. Leonardo Snchez/ Ing. Carlos Burgos

11
Rango de
edad
95 a mas
90 a 94
85 a 89
80 a 84
75 a 79
70 a 74
65 a 69
60 a 64
55 a 59
50 a 54
45 a 49
40 a 44
35 a 39
30 a 34
25 a 29
20 a 24
15 a 19
10 a 14
5a9
0a4

Ao
2001
1098
1275
2764
4550
6850
8606
10372
12470
13602
17837
19456
23705
27678
30367
33298
41475
45287
47913
48158
44273

Ao 2010

0,2
0,3
0,6
1,0
1,6
2,0
2,4
2,8
3,1
4,0
4,4
5,4
6,3
6,9
7,5
9,4
10,3
10,9
10,9
10,0

398
1207
3163
5612
7867
10581
13675
15761
18951
21629
26371
28966
32874
37189
42233
45622
49701
49194
48391
45198

0,1
0,2
0,6
1,1
1,6
2,1
2,7
3,1
3,8
4,3
5,2
5,7
6,5
7,4
8,4
9,0
9,8
9,7
9,6
9,0

441034

100,0

504583

100,0

Tabla 4 Tabla de poblacin segn el INEC 2010 vs 2001

Poblacin de la pronvincia de
Tungurahua
50000

40000
30000
20000
10000

Ao 2001

0a4

5a9

10 a 14

15 a 19

20 a 24

25 a 29

30 a 34

35 a 39

40 a 44

45 a 49

50 a 54

55 a 59

60 a 64

65 a 69

70 a 74

75 a 79

80 a 84

85 a 89

90 a 94

95 a mas

Ao 2010

Figura. 3 Grafico de barras vertical agrupado de poblacin de Tungurahua

Ing. Leonardo Snchez/ Ing. Carlos Burgos

12

Poblacin de la pronvincia de
Tungurahua
5a9
15 a 19
25 a 29
35 a 39
45 a 49
55 a 59
65 a 69
75 a 79
85 a 89
95 a mas
0

10000

20000
Ao 2010

30000

40000

50000

60000

Ao 2001

Figura. 4 Grafico de barras horizontal agrupado de poblacin de Tungurahua

Como se pude apreciar en la figura 3 y 4, el grafico de barras agrupado, muestra


la asociacin de la misma variable, en este caso el rango de la edad en aos
diferentes, los cuales muestran valores de rango de edad en periodos diferentes,
este grafico permite comparar los valores de la misma variable en diferentes
periodos, lo que nos permite apreciar de manera visual el aumento de la poblacin
con respecto al ao anterior.
POLIGONOS DE FRECUENCIA
El polgono de frecuencia nace de un histograma y de la unin de sus puntos
medios, tal y como se muestra en la siguiente figura.
Poner grafico aqui
EJERCICIOS
1. La siguiente tabla muestra un promedio del rendimiento en consumo de disel
en 50 viajes de la ruta Quito Guayaquil de Transportes Baos. Construir un
Histograma y un polgono de frecuencia.
KILOMETROS

NMERO

POR LITRO

DE VIAJES

4.50

Ing. Leonardo Snchez/ Ing. Carlos Burgos

13
5.50

6.50

7.50

11

8.50

9.50

10.50

4
Tabla 5

2. En las elecciones de 2014 para Alcaldes, se obtuvieron los siguientes resultados en el cantn
Ambato, correspondiente a la provincia de Tungurahua. Elaborar un grfico de pastel.
PARTIDO

PORCENTAJE (%)

PRIAN

33.59%

PAIS

53.31%

MPD

7.15%

SUMA

0.62%

PACHACUTIK 1.01%
PSC

0.00%

PRE

0.01%

PPBC

1.26%

OTROS

0.00%

NULOS

2.85%
Tabla 6

3. La elecciones 2014 para alcaldes, en Ecuador, arrojaron las siguientes cifras:


CANDIDATO

PARTIDO

VOTOS

PORCENTAJE

Luis Amoroso

Avanza

151,739

36.66%

Alexis Snchez

Alianza Pas 100,951

24.38%

Javier Altamirano

CCJM

153,949

37.18%

7,314

1.78%

VOTOS

Otros
Tabla 7

Votos Totales = 413,953


Padrn Electoral= 817,466
Elaborar un grfico de pastel, para representar la informacin de la tabla mostrada.
Ing. Leonardo Snchez/ Ing. Carlos Burgos

14

4. En la Unidad Educativa Bolvar, la distribucin de grupos y su correspondiente cantidad de


alumnos, era la siguiente en los turnos matutino y vespertino, en el ciclo escolar septiembre 2005 a
junio 2006.
TURNO MATUTINO

TURNO VESPERTINO

GRUPO

GRUPO

ALUMNOS

ALUMNOS

1 AP

44

1 CP

42

1 BP

44

1 DP

43

1 AM

44

1 EP

42

1 BM

44

1 FP

44

1 AT

44

1 CM

41

3 AP

38

1 DM

37

3 BP

40

1 BT

40

3 CP

38

1 SFT

52

3 AM

39

3 DP

40

3 BM

38

3 EP

40

5 AP

36

3 CM

35

5 BP

31

3 SFT

18

5 CP

32

5 DP

26

5 AM

52

5 CM

47

Tabla 8

Representar grficamente, tanto en Histograma y polgono de frecuencias como en grficos de pastel.


5. La tabla mostrada, representa las temperaturas de algunas ciudades del Ecuador. Se dan a conocer
las mximas y las mnimas en centgrados (C). La informacin corresponde al da domingo 21 de
abril de 2006.
CIUDAD

MAXIMA(C)

MINIMA(C)

Ambato

20

10

Quito

19

12

Atacames

19

13

Salinas

19

Puyo

26

10
Ing. Leonardo Snchez/ Ing. Carlos Burgos

15
Cuenca

23

12

Huaquillas

27

13

Esmeraldas

34

15

Babahoyo

33

15

Manta

32

14

Guayaquil

35

16

Portoviejo

29

15

Tabla 9

Construir un Histograma y un polgono de frecuencias, tanto para las temperaturas mximas como
para las mnimas.
6.- La nmina de los estudiantes de un curso de dibujo de la tabla 10 arroja las siguientes
calificaciones.
NOMBRES
LEONEL FERNANDO
DANNY ISRAEL
FRANCIS ANDRES
ADRIANA ELIZABETH
CYNTHIA ALEJANDRA
JHONATAN LUIGGY
PABLO MARCELO
WILSON ALEXANDER
MARLON ALEXIS
JORGE FERNANDO
DARWIN ISRAEL
JAIME OMAR
CHRISTIAN FERNANDO
FERNANDO ISRAEL
FERNANDA ELIZABETH
OLVER FELIPE
MERCEDES ELIZABETH
EDISON LENIN
HENRY VINICIO
FRANKLIN JAVIER
FERNANDO JOEL
DARWIN ALCIDES
JUANA GABRIELA

DEBERES TRABAJOS
8.3
9.3
7.7
7.7
5.4
8.2
9.4
9.5
8.7
9.4
9.0
7.7
2.0
6.5
8.4
8.5
9.5
4.7
9.8
9.2
7.6
8.0
2.5
6.0
3.0
5.7
8.4
8.7
7.5
8.3
6.0
8.0
8.9
8.7
7.9
7.8
9.4
8.8
9.0
8.8
8.5
8.0
2.8
4.0
9.6
9.8
Tabla 10

Ing. Leonardo Snchez/ Ing. Carlos Burgos

16
Realice un histograma de frecuencias acumuladas con cada una de los alumnos.
7.- La tabla 11 muestra un historial de repeticiones con su Throughput TH (Cantidad promedio de
productos no defectuosos producidos por unidad de tiempo)

Repeticiones

TH Sistema
Actual

18

32

26

15

33

27

17

27

35

10

24

11

31

12

34

13

22

14

27

15

22
Tabla 11

Realice un histograma con los datos de la tabla 11


8.- El tiempo requerido por 50 diferentes empleados para realizar un mismo trabajo fue medido con

Tiempo
(min)

Empleado

Tiempo
(min)

Empleado

Tiempo
(min)

Empleado

Tiempo
(min)

Empleado

Empleado

el siguiente resultado:
Tiempo
(min)

0.01

11

0.26

21

0.53

31

1.03

41

2.03

0.02

12

0.34

22

0.54

32

1.1

42

2.03

0.04

13

0.35

23

0.63

33

1.28

43

2.16

0.05

14

0.36

24

0.66

34

1.42

44

2.62

0.1

15

0.36

25

0.79

35

1.49

45

2.67

Ing. Leonardo Snchez/ Ing. Carlos Burgos

17
6

0.15

16

0.38

26

0.8

36

1.5

46

2.81

0.17

17

0.39

27

0.8

37

1.73

47

3.53

0.21

18

0.45

28

0.82

38

1.8

48

4.29

0.24

19

0.48

29

0.9

39

1.88

49

4.91

10

0.26

20

0.53

30

40

1.9

50

5.5

Realice un histograma con los datos de la tabla


9.-Se desarroll un modelo de cuerda con siete fibras de Nylon de diferente dimetro, el mismo que
soporto una carga en Newton de 18.9; 22.0; 19.4; 22.1; 19.8; 21.9; 20.2, respectivamente. Elabore
una grfica tipo pastel para cada una de las fibras y seale cual es la que soporto mayor carga en
Newton.
10.-En una fbrica de produccin de cocinas se tiene tres lneas de produccin, la primera produce
cocinas del tipo A elctricas con 50 Unidades por mes, la segunda lnea produce cocinas a gas del
tipo A cantidad 35 Unidades por mes y la tercera produce calefones del tipo A con 45 Unidades por
mes, el dueo de la empresa necesita leer los datos en un diagrama tipo pastel.

Ing. Leonardo Snchez/ Ing. Carlos Burgos

18

CAPTULO 2: FRECUENCIAS Y DISTRIBUCIONES


Al obtener datos producto de un levantamiento de informacin, es recomendable resumirlos o
agruparlos de manera que si existen valores con la misma cantidad o pertenecientes a un rango, estos
sean representados por su frecuencia, a esta recoleccin de datos tambin se la conoce como fila de
datos.
Frecuencia.-Es la cantidad asignada a un valor sea este un nombre o un nmero. Ejemplo. Existen 4
chaquetas de color caf, 5 chaquetas de color blanco y 10 chaquetas de color azul.
CHAQUETAS
Color caf
Color blanco
Color azul

Frecuencia
4
5
10

Lmite Inferior (Li)


Lmite superior
(Ls)

Orden.- Al recoger informacin de una cierta muestra es recomendable ordenarla de manera


ascendente o descendente segn convenga.
Rango.-Es la diferencia entre el mayor y el menor valor de un conjunto de nmero ordenados.
Tomando como modelo el ejemplo anterior, el rango entre las chaquetas de color es: 10-4=6
Datos no agrupados.-Estos datos son los obtenidos por el levantamiento o recoleccin de
informacin los cuales pueden estar o no ordenados (variable aleatoria).
Ejemplo. Las edades de 30 personas estn representadas en la siguiente tabla
10
10
16
17
8

8
14
26
20
17

15
21
30
24
21

22
21
25
35
10

12
16
8
16
25

22
18
30
27
30

Tabla 12

Datos agrupados.-Estos datos se obtienen producto de un orden establecido por la persona que
someter a estudio dichos datos. Ejemplo. Las edades de 30 personas del ejemplo anterior estn
representadas en la siguiente tabla.
Edades (aos) Frecuencia (f)
8
3
10
3
12
1
14
1
Ing. Leonardo Snchez/ Ing. Carlos Burgos

19
1
3
2
1
1
3
2
1
2
1
1
3
1

15
16
17
18
20
21
22
24
25
26
27
30
35
Tabla 13

Distribucin de Frecuencias.- Una distribucin de frecuencias es una tabla en la cual se agrupa en


clases los valores posibles para una variable y se registra el nmero de valores observados que
corresponde a cada clase.
En la tabla se agrupa en clase los valores posibles de una variable y se registra el nmero de valores
observados que corresponde a una clase
Nmero de clase.- El nmero de clase, es la divisin en la cual podemos ordenar la toma de datos
obtenidos en campo. Una frmula de aproximacin para calcular el nmero de clases es la llamada
Regla de Sturges, la cual matemticamente se define como:
no = 1 + 3.32log (n)
Dnde:
no = total de nmero de clases
n = total de datos obtenidos en campo.
log = logaritmo de Briggs.
Amplitud de clase.- Es el valor que se le aumenta a la cantidad menor de los datos o valores
Obtenidos, para as elaborar las distribuciones de frecuencia, matemticamente se expresa:
=

Ing. Leonardo Snchez/ Ing. Carlos Burgos

20
Dnde:
Vmax = valor mximo de los datos obtenidos en campo.
Vmin = valor mnimo.
no = nmero de clases.
El resultado final de la amplitud de clase debe estrictamente obtenerse en nmero entero; en caso
contrario deber redondearse, si el decimal es mayor a 0.5 se aumentara una unidad al resultado
obtenido.
Intervalos de clase Indica el rango de los valores incluidos dentro de una clase y puede ser
determinado restando el lmite exacto inferior de clase de su lmite exacto superior.
Marca de dase.-La marca de clase es un punto medio del intervalo de clase y se obtiene promediando
los lmites inferior y superior de clase. La marca de clase se denomina tambin punto medio de la
base. Generalmente se representa por x. ver tabla 15
Frecuencia.- Se define como el nmero de veces en que se repite un suceso y se representa por la
letra f.
Histograma.-Un Histograma o Histograma de frecuencias, consiste en un conjunto de rectngulos,
que pueden ser:
(a) Con bases en el eje x horizontal, centros en las marcas de clase y longitudes iguales a los tamaos
de los intervalos de clase.
(b) reas proporcionales a las frecuencias de clase.
Polgono de Frecuencias. Es un grfico de trozos de la frecuencia de clase con relacin a la marca de
clase. Puede obtenerse conectando los puntos medios de las partes superiores de los rectngulos del
Comentado [WU1]: Este prrafo de cambiar de orden

Histograma.
Distribuciones de Frecuencias Relativas.- La frecuencia relativa de una clase es su frecuencia
dividida por la frecuencia total de todas las clases y se expresa generalmente como un porcentaje, por
lo tanto la suma de las frecuencias relativas de todas las clases es 100%. Si se acumulan las frecuencias
relativas de varias clases, a la tabla obtenida, se le llama "tabla de frecuencia relativas".

Ing. Leonardo Snchez/ Ing. Carlos Burgos

21

Donde:
Fr.-frecuencia relativa
.-Sumatoria total de frecuencias relativas

Distribuciones de Frecuencias Acumuladas.- La frecuencia total de todos los valores menores que
la frontera de clase superior de un intervalo de clase dado se llama frecuencia acumulada hasta ese
intervalo de clase. Una tabla que presenta varias frecuencias acumuladas se llama "tabla de
frecuencias acumuladas". A las distribuciones de frecuencias acumuladas tambin se les conoce como
"ojivas". Esta tabla nos sirve para ver el comportamiento que tiene una variable respecto de otra,
debido a que su valor es la suma de acumulada de las variables anteriores.
Curvas de Frecuencia.- Los datos obtenidos pueden considerarse usualmente como pertenecientes
a una muestra de una poblacin grande. Ya que son posibles muchas observaciones sobre esa
poblacin, siendo posible escoger intervalos de clase muy pequeas y tener todava nmeros
Comentado [WU2]: CAMBIAR DE ORDEN

razonables en cada clase.


Ejemplo 1. Los datos siguientes representan el tiempo que tarda un autobs de la cooperativa Unin
en la lnea 8, en recorrer del punto A al punto B. El tiempo se mide en minutos y en promedio se
realiza 60 recorridos por da. Elaborar una tabla de registro de datos, adems construir el Histograma
y polgonos de frecuencias respectivos. El tiempo corresponde al recorrido de dicha ruta.
75

71

68

67

72

70

69

78

64

71

74

72

66

69

73

76

68

70

70

73

62

67

65

72

74

75

65

77

66

71

67

82

79

78

78

64

64

63

68

69

64

80

80

81

82

66

65

69

67

62

71

70

77

74

71

74

75

75

76

77

Tabla 14

Solucin.
Ing. Leonardo Snchez/ Ing. Carlos Burgos

22
Primeramente se localizan los nmeros mayor y menor.
Valor mximo=82

Valor mnimo=62

Calculando el nmero de clases: no = 1 + 3.32log n


n = nmero de datos; n = 60 Sustituyendo:
no = 1 + 3.32log60
no = 1 + 5.9035
no = 6.9035
La Amplitud de clase:
=

82 62
6.9035

A = 2.90
Hay que recordar que por definicin el valor de la amplitud de clase debe representarse en nmeros
enteros, por lo tanto:
A = 3.0
Tabla de Registro de Datos: Distribucin de Frecuencias Relativas y Acumuladas
Marca de
Intervalos

clase

de clase

Frecuencia Frecuencia
Relativa

Acumulada

fr

Fa

62 - 65

63.5

10

10

66 - 69

67.5

14

24

70 - 73

71.5

14

38

74 - 77

75.5

13

51

78 - 81

79.5

58

82 - 85

83.5

60

Tabla 15

Ejemplo 2.Segun las estadsticas del INEC (instituto ecuatoriano de estadsticas y censos) del ao
2010, los porcentajes de analfabetismo por provincia fueron:

Ing. Leonardo Snchez/ Ing. Carlos Burgos

23

#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

Provincia

Tasa de
Analfabetismo
por Provincias

Galpagos
Pichicha
El oro
Guayas
Santa Elena
Zamora Chinchipe
Loja
Carchi
Napo
Santo Domingo
Orellana
Morona Santiago
Azuay
Sucumbos
Pastaza
Tungurahua
Los Ros
Esmeraldas
Manab
Imbabura
Zonas no
delimitadas
Caar
Chimborazo
Cotopaxi
Bolvar

1,3%
3,5%
4,1%
5,0%
5,2%
5,5%
5,8%
6,2%
6,3%
6,3%
6,5%
6,6%
6,7%
6,8%
6,9%
7,5%
9,3%
9,8%
10,2%
10,6%
12,0%
12,2%
13,5%
13,6%
13,9%

Tabla 16

(a) Construir una tabla de frecuencias relativas y acumuladas.


(b) Construir un Histograma y polgono de frecuencias.
Solucin:
Valor mximo=13.9

Valor mnimo=1.3

Nmero de clases:

no = 1 + 3.32log n donde n =25


no = 1 + 3.32log25
no = 1 + 4.64

Ing. Leonardo Snchez/ Ing. Carlos Burgos

24
no = 5.64=6
La Amplitud de clase: A
=

13.9 1.3
6

A = 2.196

INTERVALOS
#
Clases
1
2
3
4
5
6

Li
1.3
3.4
5.5
7.6
9.7
11.8

frecuencia
Relativa Fr
3.4
1
5.5
5
7.6
14
9.7
14
11.8
16
13.9
19

Ls

Tabla de Registro de Datos: Distribucin de Frecuencias Relativas y Acumuladas

2. TIPOS DE CURVAS DE FRECUENCIA


Las curvas de frecuencia que aparecen, en la prctica adoptan ciertas formas caractersticas, como
se ilustra en las siguientes figuras.
Simetra en forma de campana

Ing. Leonardo Snchez/ Ing. Carlos Burgos

25

a) Las curvas de frecuencias simtricas o en forma de campana (1), se caracterizan porque las
observaciones equidistantes del mximo central tienen la misma frecuencia. Un ejemplo importante
es la curva normal.
b) En las curvas de frecuencias poco asimtricas o sesgadas (2 y 3), la cola de

la curva a un lado

del mximo central es ms larga que al otro lado. El sesgo de la cola puede

ser a la derecha o

hacia la izquierda.
c) En una curva en forma de 'J' o de 'J invertida' (4 y 5), hay un mximo en un

extremo.

d) Una curva de frecuencia en forma de 'U' tiene mximos en ambos extremos.


e) Una curva de frecuencia bimodal (6) tiene dos mximos.
f) Una curva de frecuencia multimodal (7) tiene ms de dos

mximos.

Ing. Leonardo Snchez/ Ing. Carlos Burgos

26
GRFICOS DE PASTEL
Los grficos de pastel son especialmente apropiados para ilustrar las divisiones de una cantidad total,
tal como la distribucin de los egresos o los ingresos de una empresa. Un grfico de pastel en
porcentajes es aquella en la que los valores se convierten en porcentajes para que resulte ms fcil
compararlos.

Ejemplo 3. De acuerdo a un sondeo a egresados de la Facultad de Administracin y Negocios de la


Universidad del Sur de California (USC) de Los ngeles, los siguientes datos representan el nmero
de egresados por especialidad. Construir un grfico de pastel.
ESPECIALIDAD

GRADUADOS

Contador Fiscal

73

PORCETAJE
EGRESADOS
(%)
28.85

Finanzas

52

20.55

74

Gerencia
Mercadotecnia
Otros

36
64
28

14.23
25.30
11.07

51
91
40

253

100 %

360

TOTAL

ANGULO
Grados ()
104

CALCULO PAREA LA OBTENCIN DE LOS NGULOS


=

28.85
360 = 103.86
100

20.55
360 = 73.98
100

14.23
360 = 51.23
100

25.03
360 = 91.08
100

11.07
360 = 39.85
100

Ing. Leonardo Snchez/ Ing. Carlos Burgos

27

GRADUADOS
Otros
11%
Mercadotec
nia
25%

Contador
Fiscal
29%

Finanzas
21%
Gerencia
14%

Ejemplo 4. De acuerdo a un estudio de Mercado sobre preferencias en los medios masivos de


comunicacin, haciendo referencia a la televisin pagada de los ecuatorianos. Los porcentajes de cada
televisora corresponden al horario DRTV PLUSde 9:00 a 11:00 de la noche. Elaborar un grfico
de pastel con datos del estudio realizado entre septiembre de 2011 y abril de 2012
TELEVISORAS

PORCETAJE
AUDIENCIA
(%)

ANGULO
Grados ()

CBS

23.00

83

ABC
NBC

20.00
18.00

72
65

FOX
Otros

11.00
28.00

40
100

100.00

360

TOTAL

CLCULO PAREA LA OBTENCIN DE LOS NGULOS


=

23.00
360 = 103.86
100

20.00
360 = 73.98
100

18.00
360 = 51.23
100

Ing. Leonardo Snchez/ Ing. Carlos Burgos

28

11.00
360 = 91.08
100

28.00
360 = 39.85
100

PORCETAJE AUDIENCIA (%)


CBS
23%

Otros
28%

ABC
20%

FOX
11%
NBC
18%

PROBLEMAS PROPUESTOS
1. Con el siguiente grupo de nmeros 13, 57,43, 22, 6, 19, 11, 9, 62, 35, 66, 24:
(a) Ordenar de menor a mayor.
(b) Hallar el intervalo de clase.
2. Los siguientes datos representan el nmero de clientes en el Restaurante "El lince" en los dos
primeros meses de 2006
140

130

125

90

60

140

160

125

180

140

125

90

130

75

62

70

80

45

62

72

95

64

80

92

115

80

30

84

40

75

110

115

130

90

70

125

95

64

72

130

70

95

50

115

120

60

180

130

70

60

130

60

30

140

40

80

110

115

120

130

Ing. Leonardo Snchez/ Ing. Carlos Burgos

29

Encontrar:
(a) El valor mximo
(b) El valor mnimo
(c) El rango
(d) Los siete mayores
(e) Los siete menores
(f) El treceavo en forma ascendente (de menor a mayor)
(g) Los das en que el nmero de clientes supera los tres dgitos
(h) Los das en que el nmero de clientes solo llego a los dos dgitos
(i) Construir una tabla de registros de datos (Distribucin de Frecuencias)
(j) Construir un Histograma y el polgono de frecuencias
(k) Construir un polgono de frecuencias acumuladas
3. De acuerdo a la Secretara de Turismo de Ecuador los siguientes son los principales hoteles con
mayor nmero de cuartos, en la "Ciudad de Baos". Construir un grfico de pastel con el porcentaje
de cuartos que cobre cada uno de los hoteles de la ciudad de Baos

HOTEL
Samari Spa Resort
Napolitano Apart & Hotel
Miramelindo Spa Hotel
La Floresta Hotel
Hotel Puerta del Sol
Hotel el Belen

# CUARTOS

HOTEL

# CUARTOS

1426
2700
1350
2891
5034
3003

Luna Runtun Adventure Spa


Hosteria Finca Chamanapamba
Hotel Sangay
Volcano Hotel
Hotel Alisamay
Hostal Familiar Las Granadillas

2024
3991
3479
2700
1720
1878

Ing. Leonardo Snchez/ Ing. Carlos Burgos

30
Casa Amarilla

4400

PROBLEMAS PARA RESOLVERSE EN EQUIPO


4. En equipos de 4 personas, realizar lo siguiente:
(a) Lanzar 4 monedas 50 veces y anotar el nmero de "sellos" obtenidos en cada ocasin.
(b) Construir una distribucin de frecuencias que indique el nmero de veces que se han obtenido
0,1, 2, 3 y 4 "sellos".
(c) Construir una distribucin de porcentajes correspondientes a la parte del inciso anterior.
(d) Comparar el porcentaje obtenido en (c) con los tericos 6.25%, 25%, 37.5%, 25% y 6.25%,
deducidos por las leyes de las probabilidades.
5. Los siguientes datos representan el nmero de horas ante grupo de un total de 40 Maestros
(Catedrticos) del CONALEP Mexicali II, son horas durante una semana.
20

12

14

18

20

17

13

17

15

16

11

12

13

16

12

13

13

12

14

17

17

13

11

18

20

15

12

14

20

(a) Construir una tabla de Registro de Datos.


(b) Construir un Histograma de polgonos de frecuencia.
(c) Construir un polgono de frecuencias acumuladas.
6. Hasta el da 12 de Mayo de 2006, as se encontraban las estadsticas del campeonato nacional de
futbol Profesional:

Ing. Leonardo Snchez/ Ing. Carlos Burgos

31

EQUIPO

GANADOS

PERDIDOS

21
19
19
15
14
23
21
17
15
10
18
17

13
13
15
20
21
10
13
18
19
22
17
17

Liga de quito
Nacional
Bacerlona
Emelec
Deportivo Quito
Independiente
Macara
Tcino
Cuenca
Manta
Espoli
Liga de loja

(a) Construir un Histograma de los juegos ganados


(b) Construir un Histograma de los juegos perdidos
(c) Construir un Histograma de los juegos ganados y perdidos
7. Los trasatlnticos ms grandes que han existido se enlistan en la siguiente tabla:
(a) Construya un grfico de pastel con respecto al tonelaje de los barcos.
BARCO

EMPRESA

Titanic
Queen Elizabeth 2
Queen Mary 2
Freedom of the seas

TONELADAS MODELO

White Star
Cunard
Cunard
Royal Caribbean

46,329
70,327
151,400
160,000

1912
1969
2004
2006

8. Los siguientes datos indican el nmero de trabajadores que faltan a una fbrica en 50 das de
trabajo:
13

13

37

10

16

11

12

21

12

11

16

49

18

Ing. Leonardo Snchez/ Ing. Carlos Burgos

32
3

11

19

15

10

14

10

24

11

10

32

12

29

12

19

20

15

17

10

(a) Hallar los cinco valores mayores.


(b) Hallar los cinco valores menores.
(c) Construir una tabla de Registro de Datos (Distribucin de Frecuencias).
(d) Construir un Histograma y Polgono de frecuencias.
(e) Construir un Polgono de frecuencias acumuladas.
9. Las mediciones de la temperatura de licuacin de un gas varan de 1161 a 1319F (grados
Fahrenheit). Construir una tabla con ocho clases iguales en las cuales estos datos podran ser
Agrupados. Calcular:
(a) Los lmites de clase
(b) Las fronteras de clase
(c) Las marcas de clase
(d) El intervalo de clase
10. La siguiente tabla se basa en datos publicados en los Indicadores Econmicos del Banco de
Central del Ecuador, y son datos preliminares correspondientes a diciembre de 1988. Construir una
grfica de pastel porcentual de las exportaciones de Ecuador
CATEGORIA DE
EXPORTACION
Petroleras
Agropecuarias
Extractivas
Manufactureras

CANTIDAD
(millones de dlares)
560.10
143.00
49.90
951.10

Ing. Leonardo Snchez/ Ing. Carlos Burgos

33

CAPITULO 3: MEDIDAS DE TENDENCIA CENTRAL


Un promedio es un valor tpico o representativo de un conjunto de datos, como tales valores suelen
situarse hacia el centro del conjunto de datos ordenados por magnitud, los promedios se conocen
como medidas de tendencia central.
Se definen varios tipos, siendo los ms comunes la media aritmtica, la mediana, la moda y la media
geomtrica. Cada uno tiene ventajas y desventajas, segn los datos y el objetivo perseguido.
)
MEDIA ARITMETICA (
La media aritmtica o promedio aritmtico, se define como la divisin de la suma de todos los valores
entre el nmero de valores.
En Estadstica es normal representar una medida descriptiva de una poblacin, o parmetro
poblacional, generalmente mediante letras griegas, en tanto que se utilizan letras romanas para las
medidas descriptivas de muestras, conocidas tambin como "Estadsticas Muestrales".
La media aritmtica, matemticamente se expresa:
=

=1

1 + 2 + 3 + +

Dnde:
) = media aritmtica.
(
xi= suma total de datos que componen la poblacin o muestra.
n = nmero de datos de la poblacin o tamao de la muestra.
Ejemplo1. Calcular la media aritmtica de los nmeros: 9, 4, 6, 13 y 11
Ing. Leonardo Snchez/ Ing. Carlos Burgos

34
1 + 2 + 3 + 4 + 5 + 6

9 + 4 + 6 + 13 + 11
=
5
=

)=8.6
(
Notacin de Suma.
El smbolo =1 representar la suma de todos los xi desde i= 1 a i= n, por definicin:

= 1 + 2 + 3 + +
=1

Ejemplo 2. Escribir explcitamente los trminos de la sumatoria:


8

= 1 + 2 + 3 + 4 + 5 + 6 + 7 + 8
=1

Clculo de la media aritmtica para datos agrupados


=

=1
=1

Donde:
= media aritmtica

fi = frecuencia
xi = marca de clase
n = nmero de datos de la poblacin o tamao de la muestra

Ejemplo 3. Calcular la media aritmtica de los valores 6, 9, 7 y 3 si suceden con frecuencias de 4, 3,


5 y 2 respectivamente.
Marca de clase
x

Frecuencia
Relativa

9
7
3

3
5
2

Ing. Leonardo Snchez/ Ing. Carlos Burgos

35

Ejemplo 4. Calcular la media aritmtica de los valores mostrados en la tabla de distribucin


Intervalos Marca de clase
de clase
x

Frecuencia
Relativa

Frecuencia
Acumulada

fa

62 - 65

63.50

10

10

66 - 69
70 - 73
74-77
78 - 81
82 - 85

67.50
71.50
75.50
79.50
83.50

14
14
13
7
2

24
38
51
58
60

63.5(10) + 67.5(14) + 71.5(14) + 75.5(13) + 79.5(7) + 83.5(2)


10 + 14 + 14 + 13 + 7 + 2

= 71.43

LA MEDIA ARITMETICA PONDERADA


La media aritmtica ponderada a veces se asocia con los nmeros x1, x2, x3, xk ciertos factores peso
o "de peso" w1,w2,w3.wk, dependientes de la relevancia asignada a cada nmero, entonces:
=

. 1 1 + 2 2 + 3 3 + +
=

1 + 2 + 3 + +

Ejemplo 5. Si el examen final de Tpicos de Actualizacin cuenta tres veces ms que una evaluacin
parcial y un estudiante tienen calificacin 85 en el examen final y, 70 y 90 en los dos parciales, la
calificacin media es:
=

. 70(1) + 90(1) + 85(3) 415


=
=
= 83

1+1+3
5

LA MEDIANA ()
La mediana de un grupo de datos es el valor central o la media de los dos valores centrales que ocupa
un lugar de cuando se les agrupa a todos en ascendente o descendente. La mediana puede presentarse
de dos formas:

Ing. Leonardo Snchez/ Ing. Carlos Burgos

36
a) Cuando el total de datos son un nmero impar.- En este caso, la mediana ser el dato que
queda exactamente en el centro, una vez ordenados los datos de menor a mayor.
Ejemplo 6. Hallar la mediana de: 6, 4, 8, 8, 3, 4, 8
Ordenando se tiene: 3, 4, 4, 6, 8, 8, 8
=6
Luego entonces ()
Cuando el total de datos son un nmero par. Aqu debemos aplicar la siguiente frmula:

() +(+1)
2

Dnde:
N=nmero total de datos
Hallar la mediana del conjunto de nmeros:
3, 6, 10, 11, 10, 11, 3, 13, 19, 10, 12, 8,
n = 12 , luego se acomodan de forma que se encuentren ordenados de menor a mayor
3, 3, 6, 8, 10, 10, 10, 11, 11, 12, 13, 19

12 + 12
(2)
( 2 +1)

6 +7
2

10 + 10
2

= 10
)
LA MODA (
La Moda de un conjunto de nmeros es el valor que sucede con mayor frecuencia, es decir, el valor
ms frecuente. La moda puede no existir, o incluso no ser nica en caso de existir; si existe dos veces,
se llama bimodal.

Ing. Leonardo Snchez/ Ing. Carlos Burgos

37
Ejemplo 8. Hallar la moda del siguiente grupo de datos:
2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18
Una vez ordenados de menor a mayor, el nmero que ms veces se repite es el 9. La moda es 9.
En el caso de datos agrupados donde se haya construido una curva de frecuencias para ajustar los
datos, la moda ser el valor o valores de x correspondiente al mximo o mximos de la curva.
La moda puede deducirse de una distribucin de frecuencias o de un histograma a partir de la frmula:

= + (

)
+
L1 = Frontera inferior de la clase modal (clase que contiene la moda)
1 = Exceso de frecuencia modal sobre la de la clase inferior inmediata
2 = Exceso de la frecuencia modal sobre la clase superior inmediata
c = Ancho de intervalo de clase modal
CUARTILES DECILES Y PERCENTILES
CUARTILES.-Los cuartiles dividen un conjunto de datos (n) ordenados en cuatro partes iguales,
cada uno de los cuales toman un valor, Q1 para el primer cuartil toma el 25% de la muestra por debajo
de este y el 75% por encima de la muestra, Q2 para el segundo cuartil toma el 50% de la muestra por
debajo este y el 50% por encima de la muestra, el cuartil Q2 es igual a la mediana, Q3 para el segundo
cuartil toma el 75% de la muestra por debajo de la misma y el 25% por encima de la muestra; el
clculo del cuarto cuartil no se lleva a cabo debido a que este toma el valor total de la muestra es decir
el 100%.

CLCULO DE CUARTILES PARA DATOS NO AGRUPADOS


Cuartiles cuando (n) es par.-Cuando se tiene un conjunto de datos en la cual su nmero de datos es
par, la frmula a aplicarse para encontrarse la posicin es:
=

.
4
Ing. Leonardo Snchez/ Ing. Carlos Burgos

38
Dnde:
= Es la posicin para el cuartil i=1,2, 3 4
n= es el nmero total de datos
Li=Lmite Inferior
Ls.-Lmite superior
Las posiciones relativas que se tomaran para dicho conjunto cuando n es par sern:

Ejemplo:
De un termmetro se registraron las siguientes temperaturas 240 260 280 300 320 340 sus unidades
estn en Grados celcius
Solucin:
n= 6 par
1ro.- Se calcula la posicin o ubicacin para cada cuartil
1 =

1. (6)
= 1.5
4

2 =

3 =

2. (6)
=3
4

3. (6)
= 4.5
4

Ing. Leonardo Snchez/ Ing. Carlos Burgos

39
Para calcular el valor de dicho cuartil cuando n es par o impar se debe utilizar la frmula de la
interpolacin lineal
= +

( )
4

Donde:
Li=Lmite inferior de la clase del cuartil
Ls.- Lmite superior de la clase del cuartil
i-Toma los valores de 1,2,3 o 4 dependiendo de la ubicacin del cuartil que se requiera hallar
1 = 240 + 1

(260 240)
= 245
4

2 = 280 + 2

(300 280)
= 290
4

Como el cuartil 2 es igual a la mediana se puede comprobar dicho valor de cuartil calculando el valor
de la mediana, bajo el concepto de que le media es el valor central o la media de los dos valores
centrales
=

(300 + 280)
= 290
2

3 = 300 + 3

(320 300)
= 315
4

4 = 240 + 4

(340 0)
= 245
4

Cuartiles cuando (n) es impar.-Cuando se tiene un conjunto de datos en la cual su nmero de datos
es impar, la frmula a aplicarse para encontrarse la posicin es:
=

. ( + 1)
4

Dnde:
= Es la posicin para el cuartil i=1,2, 3 4
n= es el nmero total de datos
Ing. Leonardo Snchez/ Ing. Carlos Burgos

40
Las posiciones relativas que se tomaran para dicho conjunto cuando n es impar sern:

Para calcular el valor de dicho cuartil cuando n es par o impar se debe utilizar la frmula de la
interpolacin lineal
= +

( )
4

Ejemplo:
De la muestra anterior de temperaturas 240 260 280 300 320 340 se ha recogido una muestra adicional
ms la cual marco 360, sus unidades estn en Grados Celsius.
1ro calculamos la posicin
=

1. (7 + 1)
=2
4

2 =

2. (7 + 1)
=4
4

3 =

3. (7 + 1)
=6
4

Para obtener el valor de cada cuartil basta con ubicar la posicin y tomar el valor asignado a la
posicin, por ejemplo
Para la posicin P1=2 tenemos el valor de Q1= 260
Para la posicin P2=4 tenemos el valor de Q2= 260
Para la posicin P3=6 tenemos el valor de Q3= 260
CUARTILES PARA DATOS AGRUPADOS
Para calcular los valores de cuartiles en datos agrupados se utiliza la siguiente formula
Ing. Leonardo Snchez/ Ing. Carlos Burgos

41


= + (
)

Donde:
Qi=Valor del cuartil para i=1,2 3
Li=Lmite inferior de la clase que contiene al cuartil
=Indica la posicin de la medida
Fc=Frecuencia de clase que contiene a la medida solicitada
c=anchura de la clase
fai=Frecuencia acumulada anterior que contiene a la medida solicitada.
n=Nmero de datos
DIAGRAMA DE CAJA PARA CUARTILES
Para hacer ms representativo la lectura e interpretacin de los cuartiles se suele utilizar los diagramas
de caja conocidos tambin como boxplots o box and whiskers y describe varias caractersticas
importantes, al mismo tiempo, tales como la dispersin y simetra, consta de dos cajas y dos bigotes,
adems de los siguientes elementos:

Ing. Leonardo Snchez/ Ing. Carlos Burgos

42

Donde:
Ls.-Lmite superior
Li.-Lmite inferior
Lmin.-Lmite mnimo
Lmax.-lmite mximo
RIC.-Rango Inter Cuartlico (RECORRIDO INTERCURTILICO)
Para su realizacin se representan los tres cuartiles y los valores mnimo y mximo de los datos, sobre
un rectngulo, alineado horizontal o verticalmente.
Un Diagrama de caja es un grfico, basado en cuartiles, mediante el cual se visualiza un conjunto de
datos. Est compuesto por un rectngulo, la "caja", y dos brazos, los "bigotes".
Ejemplo
Es un grfico que suministra informacin sobre los valores mnimo y mximo, los cuartiles Q1, Q2
o mediana y Q3, y sobre la existencia de valores atpicos y la simetra de la distribucin. Primero es
necesario encontrar la mediana para luego encontrar los 2 cuartiles restantes
Ing. Leonardo Snchez/ Ing. Carlos Burgos

43
DECILES (Di)
Los decles dividen un conjunto de datos ordenados n en diez partes iguales. Los decles
generalmente son utilizados para efectos de ingresos de un pas ya que dividen a una poblacin en
diez partes iguales y se analiza cada decl para la toma de decisiones del estado, esta muestra puede
ser el ingreso anual de la canasta bsica, la cantidad de emigrantes por ao, la tasa de natalidad del
pas, o fijar el aprovechamiento acadmico etc.

DECILES PARA DATOS NO AGRUPADOS


Cuando n es par:
Para calcular o hallar el valor de cada decl para un conjunto de datos no agrupado siempre que este
ordenado, se utiliza la siguiente forma.
1ro.-Hallar la posicin de cada decl
=

10

Donde:
n=Nmero total de datos
i=Tomara los valores de 1,2, 3, 4, 5, 6, 7, 8 y 9 correspondiente para cada decl.
2do.-Para determinar el valor de cada decl se emplea la frmula de la interpolacin lineal.
= +

( )
10

Cuando n es impar:
1ro.-Determinamos la posicin de cada decl mediante la frmula
=

. ( + 1)
10

2do.-Si es un nmero entero tomamos el valor directamente indicado por la posicin, en caso de ser
un nmero decimal calculamos el valor de decl mediante la frmula de la interpolacin lineal.

Ing. Leonardo Snchez/ Ing. Carlos Burgos

44

= +

( )
10

DECILES PARA DATOS AGRUPADOS


Cuando se presenta una tabla de datos agrupados de la cual se quiere hallar los decles respectivos es
conveniente utilizar la siguiente formula:


= + (
)

10

Donde:
Di=Valor del decil 1,2, 3, 4, 5, 6, 7, 8 9
Li=Lmite inferior de la clase que contiene al Decl solicitado.
=Indica la posicin de la medida del Decl.
Fc=Frecuencia de clase que contiene a la medida solicitada.
c=anchura de la clase.
fai=Frecuencia acumulada anterior que contiene a la medida solicitada.
n=Nmero de datos
PERCENTILES Pi
Los percentiles dividen un conjunto de datos ordenados n en 100 partes iguales, es una medida muy
til para describir a una poblacin. Es una medida de posicin no central que nos dice cmo est
posicionado un valor respecto al total de una muestra.

Ing. Leonardo Snchez/ Ing. Carlos Burgos

45
Para entender el concepto de percentil tomamos una muestra con muchos valores y la dividimos en
100 partes, cada una de ellas es un percentil. Y cada valor de la muestra estar en alguna de esas
cajitas percentiles. El percentil est referenciado de 0 a 100. El Percentil 0 es el menor valor de la
muestra y el Percentil 100 el mayor valor. Tcnicamente P K es el percentil i-simo, donde la i toma
valores del 1 al 100. El i% de los valores de muestra son menores que ese Pi y el (100-i)% restante
son mayores.
Los percentiles sirven para relacionar un valor concreto de la variable (el peso de un nio, un salario,
una calificacin, el tamao de una empresa) con los restantes valores de esa variable en la misma
poblacin. Se calculan en general se estiman- con las frecuencias obtenidas de una muestra
suficientemente grande, representativa de la poblacin de inters.

El percentil 50 es la mediana (la mitad de la poblacin est por encima de la mediana, y la otra mitad
no). Los percentiles 25 y 75 son los cuartiles 1 y 3, que junto con la mediana dividen a la poblacin
en cuatro partes con igual nmero o igual proporcin de elementos.

A menudo se utiliza el percentil 1, 2 o 3 como lmite de lo que se puede considerar excesivamente


bajo, y los opuestos, percentiles 97, 98 y 99 como lmite de lo que se puede considerar muy alto.

RELACIN ENTRE LA MEDIA, LA MEDIANA Y LA MODA


Las diferencias entre los valores de la media, la mediana y la moda permiten saber la forma de la
curva de frecuencias en trminos de asimetra.
a) Para una distribucin unimodal simtrica, el valor de la media, la mediana y la moda es igual.
b) Para una distribucin asimtrica positiva, la media es el mayor valor de los tres y la mediana es
mayor que la moda, pero menor que la media.
Ing. Leonardo Snchez/ Ing. Carlos Burgos

46
c) Para una distribucin asimtrica negativa, la media es el menor valor de los tres y la mediana es
inferior a la moda, pero mayor que la media
d) El coeficiente de asimetra de Pearson, es una medida conocida de asimetra que utiliza la
diferencia observada entre la media y la mediana de un grupo de valores.

Los cuartiles, decles y percentiles se parecen mucho a la media porque tambin subdividen una
distribucin de mediciones de acuerdo con la proporcin de frecuencias observadas. Mientras que la
mediana divide a la distribucin en dos mitades, los cuartiles la dividen en cuatro cuartos, los decles
en diez dcimos y los puntos percentiles la dividen en cien partes. Matemticamente, a manera de
ejemplo, se pueden expresar:

Ing. Leonardo Snchez/ Ing. Carlos Burgos

47

CAPTULO 4: MEDIDAS DE DISPERSIN


La dispersin a variacin de los datos intenta dar una idea de lo esparcido que se encuentra estos. Hay
varias medidas de tal dispersin, siendo las ms comunes el rango, la desviacin media, y la
desviacin tpica.
a) RANGO ( R )
El rango o recorrido de un conjunto de nmeros es la diferencia entre el mayor y el menor de todos
ellos; es una medida de dispersin que no se utiliza mucho. Rango = R = xmax xmin
Ejemplo 9. Encontrar el rango entre los siguientes valores:
a. R = 9.5 1.5 = 8
b. R = 6 1 = 5
Como 8>5, se dice que la variable en el primer histograma est ms dispersa que en el segundo.
DESVIACION MEDIA (MD)
La desviacin media o desviacin promedio, de un conjunto de N nmeros, x1, x2 , x3 ...xn es abreviada
por MD y se define como:

Donde:
x =media aritmtica de los nmeros
| xi x |=valor absoluto de la desviacin de xi respecto de x

n = nmero de datos de la poblacin o tamao de la muestra

Ejemplo ilustrativo 10. Hallar el rango del siguiente conjunto de datos.


2, 3, 3, 5, 5, 5, 8, 10, 12
xmax =12

xmin =2

R = xmax xmin = 12 2 = 10
Ing. Leonardo Snchez/ Ing. Carlos Burgos

48
Ejemplo11. Hallar la desviacin media del siguiente conjunto de nmeros. 2, 3, 6, 8, 11
2 + 3 + 6 + 8 + 11
=6
5
|2 6| + |3 6| + |6 6| + |8 6| + |11 6|
=
= 2.8
5
=

VARIANZA ( 2 S 2)
La varianza es similar a la desviacin media porque se basa en la diferencia entre cada uno de los
valores del conjunto de datos y la media del grupo. La diferencia consiste en que antes de sumarlas,
se eleva al cuadrado cada una de las diferencias. Matemticamente se expresa:

2= Varianza Poblacional
S2= Varianza Muestral
x = media aritmtica.
i x = suma total de datos que componen la poblacin
n = nmero de datos de la poblacin o tamao de la muestra
Ejemplo 12. En el mes de mayo, 8 vendedores de artculos electrnicos, vendieron los siguientes
nmeros de aparatos: 8, 11, 5, 14, 8, 11, 16, 11, las cuales se realizaron en INTELCOMP en
Ambato. Encontrar la varianza.
=

8 + 11 + 5 + 14 + 8 + 11 + 16 + 11
= 10.5
8

Ing. Leonardo Snchez/ Ing. Carlos Burgos

49

DESVIACIN ESTANDAR ( S )
En Estadstica frecuentemente se aplica ms la raz cuadrada de la varianza a la cual se le llama
Desviacin Estndar, representndose por para la poblacin y S para una muestra. Las formulas
son:

Dnde:

= Desviacin Estndar Poblacional


S = Desviacin Estndar muestral
x = media aritmtica.
i x = suma total de datos que componen la poblacin
n = nmero de datos de la poblacin o tamao de la muestra
La desviacin estndar es especialmente til cuando se le utiliza junto con la denominada Distribucin
Normal.
COMPROBACIN DE CHARLIER
La comprobacin de Charlier en clculos de la media y de la desviacin tpica por el mtodo de
compilacin hace uso de las identidades.

Ing. Leonardo Snchez/ Ing. Carlos Burgos

50

( + 1) = . + = . +
( + 1)2 = . (2 + 2 + 1) = 2 + 2 . + = . 2 + 2 . +

EJERCICIOS DE APLICACIN
1.-Anotar el trmino de la suma indicada
7

2
=1

2.- Escribir los trminos de la suma indicada.


4

( + 6)
=1

3.-Explicar en notacin abreviada la suma.


(a)

(X1 + 5)4 + (X2 + 5)4 + (X3 + 5)4 + (X4 + 5)4 + (X5 + 5)4

(b)

g1 (X1 - a)2 + g2 (X2 - a)2 + g3 (X3 - a)2 ++ g7 (X7 - a)2

4.- Expresar en notacin abreviada de suma


(a) (4X1 - 6y1) + (4X2 - 6y2) + (4X3 - 6y3)+ (4X4 - 6y4) + (4X5 - 6y5) + (4X6 - 6y6) + (4X7 - 6y7) +
(4X8 - 6y8) + (4X9 - 6y9)
5.-Las calificaciones finales de los estudiantes del 2do semestre de la UTI en las asignaturas de
geometra y trigonometra fueron: 7, 5, 8 y 10. Hallar la media aritmtica
6.- Los siguientes datos representan las 10 calificaciones de una muestra de un grupo

de

cuarto

semestre de Psicologa de la UTI de Ensenada: 65, 66, 67, 68, 71,73,74,77, 77, 77.Hallar la media,
mediana, y moda (M).
7. En la siguiente tabla se muestra las edades de las motociclistas que han cometido faltas al
reglamento de trnsito del estado de Ecuador en el 2013:

Ing. Leonardo Snchez/ Ing. Carlos Burgos

51

17,38, 27, 14, 18, 34, 16, 42,28, 24, 40, 20,23, 31,37, 21, 30, 25, 17, 28, 33, 25,23,19, 51,18,29
(a) construir una tabla de registro de datos
(b) construir un histograma y polgono de frecuencia
(c) calcular la media, mediana, y moda.
(d) Calcular la varianza y la desviacin tpica
8. En la tabla se muestran 30 resultados del examen SES para estudiantes de bachillerato, los cuales
mostraron:
500, 510, 514, 514, 516, 519, 521, 522, 522, 527
528, 535, 540, 542, 545, 553, 555, 558, 561, 571
572, 574, 577, 578, 580, 583,

584, 588, 589, 592

(a) Anotar las cinco calificaciones menores.


(b) Anotar las cinco calificaciones mayores.
(c) Construir un histograma y polgono de frecuencia.
(d) Calcular la media, mediana, y moda
(e) Calcular la varianza y la desviacin estndar.
9. La siguiente tabla representan las temperaturas de 106 habitantes de la provincia de " Manta" ,
llevadas a cabo por una brigada de estudiantes de la UTA. Las temperaturas Estn medidas en grados
Celsius.
35.8

36.3

36.4

36.6

36.7

36.8

36.9

37.0

37.0

37

.1

37.3

36.0

36.3

36.4

36.6

36.7

36.8

36.9

37.0

37.0

37

37.3

36.1

36.3

36.4

36.7

36.7

36.9

36.9

37.0

37.0

37

37.4

36.1

36.3

36.5

36.7

36.7

36.9

36.9

37.0

37.0

37

37.4

Ing. Leonardo Snchez/ Ing. Carlos Burgos

52
36.1

36.3

36.6

36.7

36.7

36.9

36.9

37.0

37.0

37.1

37.5

36.2

36.4

36.6

36.7

36.8

36.9

36.9

37.0

37.0

37.1

37.5

36.2

36.4

36.6

36.7

36.8

36.9

36.9

37.0

37.0

37.2

36.2

36.4

36.6

36.7

36.8

36.9

36.9

37.0

37.0

37.2

36.2

36.4

36.6

36.7

36.8

36.9

37.0

37.0

37.0

37.2

36.3

36.4

36.6

36.7

36.8

36.9

37.0

37.0

37.1

37.2

(a) Anotar las siete temperaturas menores


(b) Anotar las siete temperaturas mayores
(c) Construir una tabla de registro de datos
(d) Construir un histograma y un polgono de frecuencia
(e) Calcular la media, mediana, y moda.
(f) Calcular la varianza y desviacin estndar
10. Hallar la media y la mediana de: 6, 5, 9, 4, 8, 3, 10.
11. Hallar la media, mediana y moda de: 9, 12, 5, 4, 3, 6, 11, 7, 5, 2, 11, 9, 13, 7, 6, 8.
12. La siguiente tabla muestra los cocientes de inteligencia (IQ) de 480 nios De una escuela primaria
de la colonia "valle dorado" de Ensenada.

Hallar:
(a) la media aritmtica
(b) la varianza (2)

Ing. Leonardo Snchez/ Ing. Carlos Burgos

53
(c) la desviacin estndar()
13. para el conjunto de nmeros 8, 10, 9, 12, 4, 8, 2. Hallar la desviacin media respecto de:
(a) La media aritmtica (X)
(b) La mediana (X)
(c) Verificar que la desviacin media de la mediana no es mayor que la media
14.

El nmero de automviles que vendi cada uno de los 10 ejecutivos de cuenta de "auto

productos del pacifico" en el mes de diciembre es: 2, 4, 7, 10, 10, 10, 12, 12, 14, y 15; determinar:
(a)

La media, mediana, y moda.

(b)

El primer cuartil

(c)

El segundo decil

(d) El punto percentil 30 para los importes de ventas.


15. El servicio postal (SERVIENTREGA) determin que los pesos de una muestra de cartas
procesadas en una oficina postal, pesada hasta el gramo ms prximo son: 21, 18, 30, 12, 14, 17, 18,
27, 31, y 35; determinar
(a) La media mediana y moda de los pesos de las cartas en gramos
(b) El tercer cuartil
(c) El tercer decil
(d) El punto percentil 70

Ing. Leonardo Snchez/ Ing. Carlos Burgos

54

CAPTULO 5: MOMENTOS ESTADSTICOS


Dentro del concepto de momentos estadsticos existe la palabra Parmetro que se define como un
nmero que resume la ingente cantidad de datos que pueden derivarse de cualquier variable estadstica
en estudio.
Al estudiar grandes cantidades de datos de una poblacin, cualquiera que fuese esta, resulta intil o
inoperativo estudiarlos debido a su cantidad por eso es necesario resumirlos para que nos permita
tener una idea global de la poblacin, comprarlas con otros datos, comprobar su ajuste a un modelo
ideal, realizar estimaciones sobre datos desconocidos de la misma y en definitiva tomar decisiones
Momentos.-Los momentos estadsticos son formulaciones matemticas, que se definen como
parmetros estadsticos, algunos de los cuales tienen amplia connotacin dentro del campo de estudio
de curvas de distribucin de frecuencias y ms especficamente respecto de sesgo y curtosis.
Los momentos son una forma de generalizar toda la teora relativa a los parmetros estadsticos y
guardan relacin con una buena parte de ellos.
Dada una distribucin de datos estadsticos X1, X2, ..., Xn, se define el momento central o momento
centrado de orden r como.

= 1 +2 ++ =

=1

(ec 1)

Dnde:
n= Nmero total de datos.
A la ecuacin anterior se la conoce como el r-simo momento.
El primero momento, con r=1, es la media aritmtica .
El r-simo momento respecto de la media se define como:
=

=1( )

()

(ec 2)

Ing. Leonardo Snchez/ Ing. Carlos Burgos

55
Dnde:
n= Nmero total de datos
-Para la ecuacin anterior, cuando r=1 para el clculo del primer momento obtendremos que 1 = 0
, esto se refiere a que las desviaciones de un conjunto de nmeros respecto de su media aritmtica es
cero (esta es la primera regla de las propiedades de la media aritmtica).
-Para la misma ecuacin cuando r=2, para el clculo del segundo momento, se obtendr que 2 = 2
, el cual es la varianza.
-Para el clculo del r-simo momento respecto de cualquier origen A, se define como:
=

=1( )

()

(ec 3)

Dnde:
d=X-A.- son las desviaciones de X respecto de A. si A=0, la ecuacin anterior se reduce a la (ec 1),
es por esta razn que a la ecuacin (ec 1) se suele llamar el r-simo momento respecto de cero
MOMENTOS PARA DATOS AGRUPADOS
Para una distribucin de datos X1,X2,Xn que ocurren con una frecuencia f1,f2,fn, respectivamente,
las frmula para este tipo de caso se define como:

= 1 1 +2 2 ++ =

1 +2 ++

=1

=1

Para el clculo del r-simo momento respecto de la media se define como:

=1 ( )

( )

Para el clculo del momento respecto de cualquier origen A


=

=1 ( )

( )

Ing. Leonardo Snchez/ Ing. Carlos Burgos

56
Dnde:

= =
=1

SESGO:
Al grado de asimetra que presenta una distribucin de datos se la conoce como Sesgo. Si la curva
de un polgono de frecuencias suavizado presenta una cola ms larga a la izquierda, se dice que es
sesgada a la izquierda o sesgo negativo, si esta sesgada a la derecha se dice sesgada a la derecha o de
sesgo positivo tal y como se muestra en las siguientes figuras.

Ubicaciones relativas de la Media Mediana y Moda en curvas de frecuencias sesgadas a la izquierda

Ubicaciones relativas de la Media Mediana y Moda en curvas de frecuencias sesgadas a la derecha

Ing. Leonardo Snchez/ Ing. Carlos Burgos

57

Para distribuciones sesgadas, la media suele situarse del mismo lado de la moda
CURTOSIS
El clculo de Curtosis nos permite saber que tan puntiaguda es una distribucin de datos. Una
distribucin Leptocrtica presenta un pico muy alto, si presenta una punta un poco ms suavizada se
dice que es mesocrtica y si la curva presenta una distribucin normal ms achatada se dice que es
Platicrtica

Para considerar si una curva es Leptocrtica, mesocrtica y Platicrtica se debe saber que:
Si Curtosis = 3.- Esta curva es normal o mesocrtica
Si Curtosis > 3. La curva es apuntada o Leptocrtica
Si Curtosis < 3.- La distribucin es achatada o Platicrtica.
Una de las maneras para el clculo de Curtosis es utilizando el cuarto momento respecto de la media
() = 4 =

4 4
=
4 22

EJERCICIOS
1.-Hallar los cuatro primeros momentos del siguiente conjunto de nmeros: 1, 4, 7, 10,15
Solucin:
a) El primer momento, o media aritmtica es:

Ing. Leonardo Snchez/ Ing. Carlos Burgos

58

1
1
1
1
1
1 = = 1 + 4 + 7 + 10 + 15 = 7.4

5
b) El segundo momento es:

2 =

12 + 42 + 72 + 102 + 152
=
= 78.2

c) El tercer momento es:

3 =

13 + 43 + 73 + 103 + 153
=
= 956.6

d) El cuarto momento es:

4 =

14 + 44 + 74 + 104 + 154
=
= 12656.6

2.-hallar los cuatro primeros momentos respecto de la media para el conjunto de nmeros del
problema anterior: 1, 4, 7, 10,15.
Solucin
a) El primer momento respecto de la media es:
1 =

( ) (1 7.4)1 + (4 7.4)1 + (7 7.4)1 + (10 7.4)1 + (15 7.4)1 0


=
= =0

5
5

b) El segundo momento respecto de la media es:


2 =

( ) (1 7.4)2 + (4 7.4)2 + (7 7.4)2 + (10 7.4)2 + (15 7.4)2 117.2


=
=
= 23.44

5
5

c) El tercer momento respecto de la media es:


3 =

( ) (1 7.4)3 + (4 7.4)3 + (7 7.4)3 + (10 7.4)3 + (15 7.4)3 155.04


=
=
= 31

5
5

d) El cuarto momento respecto de la media es:


4 =

( ) (1 7.4)4 + (4 7.4)4 + (7 7.4)4 + (10 7.4)4 + (15 7.4)4 5193.296


=
=
= 1038.65

5
5

Ing. Leonardo Snchez/ Ing. Carlos Burgos

59

CAPTULO 6: PROBABILIDADES

La teora de las probabilidades es la menos


intuitiva

de

todas

las

ramas

de

las

matemticas
Amir Aczel

El estudio de las probabilidades abarca casi todas los sucesos de nuestras vidas, tales como la Ciencia,
la Filosofa, las matemticas, los juegos de azar, etc., ya que nos permite estudiar los sucesos o eventos
que de cada una de ellas se deriven.
Mediante el uso de las probabilidades se puede obtener la frecuencia con la que un acontecimiento u
evento puede darse como resultado de haber realizado un experimento o prueba del que se conocern
todos los resultados posibles, bajo condiciones suficientemente estables.
Evento (E).- Hecho o suceso que ocurre, especialmente si es de cierta importancia
Posibilidad (n).- Circunstancia u ocasin de que una cosa ocurra o suceda.
PROBABILIDAD DE OCURRENCIA (p).
Supongamos que un suceso (E) tiene (h) posibilidades de salir de un total de (n) posibilidades.
= {}
=

Dnde:
h.- Son todas las formas en las que se pueda o se requiera obtener un resultado.
n.- Total de formas en las que se da el resultado.
Si la probabilidad de que un evento ocurra es decir un xito ser igual a 1
Si la probabilidad de que un evento no ocurra es decir sea un fracaso ser igual a 0
Ing. Leonardo Snchez/ Ing. Carlos Burgos

60
PROBABILIDAD DE NO OCURRENCIA (q)
La probabilidad de que un evento no ocurra { } y definido por (q) viene determinado por:
=1
Esto quiere decir que:
1 = Pr{} + { }

Ejemplo. Ahora supongamos un ejemplo clsico, que al lazar un dado una sola vez nos salga 2.
Solucin:
Datos
h=1 (Forma de salir nmero de veces que saldr el 2)
n=6 (Todas las opciones posibles de un dado)
=

1
= 0.167
6

Anlisis.
La probabilidad de que al lanzar un dado nos salga 2 en un solo lanzamiento es de 0.167 es decir un
16.7%. Esto es muy importante ya que no importa las veces que lancemos un dado, la probabilidad
de que nos salga el 2 en un lanzamiento siempre ser de 16.7%.
La paradoja del cumpleaos
Para explicar la paradoja formulamos la pregunta Cmo explicar la probabilidad de que en un grupo
de 23 personas dos de ellas cumpla aos el mismo da? Coincide tu intuicin con lo que dicen las
matemticas?
El enunciado de la paradoja cita lo siguiente:
La paradoja del cumpleaos establece que si hay 23 personas reunidas hay una probabilidad del
50,7% de que al menos dos personas de ellas cumplan aos el mismo da. Para 60 o ms personas la

Ing. Leonardo Snchez/ Ing. Carlos Burgos

61
probabilidad es mayor del 99%. Obviamente es casi del 100% para 366 personas (teniendo en cuenta
los aos bisiestos).
En sentido estricto esto no es una paradoja ya que no es una contradiccin lgica; es una paradoja en
el sentido que es una verdad matemtica que contradice la comn intuicin. Cuando se propone este
problema por primera vez y se pide una estimacin sobre el tamao mnimo que debera tener un
grupo para que sea ms probable que improbable que dos personas compartan el da del cumpleaos,
la mayora de las personas se equivoca por completo.
La respuesta intuitiva que se da a menudo es 183, es decir 365 dividido entre dos. La cantidad correcta
no es algo a lo que la gente pueda llegar fcilmente y, ciertamente, no por intuicin. Es bastante
extrao que las primeras estimaciones sean inferiores a 40. Y sin embargo la respuesta es 23.
La clave para entender estas "sorprendentes" recurrencias es pensar que hay muchas posibilidades de
encontrar parejas que cumplan aos el mismo da.
Un anlisis superficial asume que 23 das (cumpleaos de las 23 personas) es una fraccin demasiado
pequea del posible nmero de das distintos (365) para esperar repeticiones. Y as sera si
esperramos la repeticin de un da dado. Pero las repeticiones, en el caso supuesto, pueden darse
entre dos das cualesquiera, con lo que stas pueden combinarse entre s de un nmero de formas que
aumenta rpidamente con el nmero de elementos a considerar. As:
Entre dos personas P1 y P2 slo cabe una posibilidad de repeticin de cumpleaos: Pl=P2.
Con tres ya hay tres posibilidades (Pl=P2; Pl=P3; P2=P3)
Con cuatro ya habra seis, (4x3)/2=6 .
Con un grupo de 10 personas, (10x9)/2=45 posibilidades
Con 23 personas, hay (2322)/2 = 253 parejas distintas, cada uno de ellas es una candidata
potencial para cumplir la paradoja
Y as sucesivamente, en uno de 40, ya son 780 las parejas, y 1770 si juntamos 60 personas.

No hay que malinterpretar lo que nos dice esta paradoja: Si entramos en una habitacin con 22
personas, la probabilidad de que cualquiera cumpla aos el mismo da que usted, no es del 50%, es
mucho ms baja, slo hay un 6% de probabilidades. Esto es debido a que ahora slo hay 22 parejas
Ing. Leonardo Snchez/ Ing. Carlos Burgos

62
posible y se necesitan 253 personas para que haya ms de un 50% de probabilidades de que esto
ocurra.
El problema real de la paradoja del cumpleaos consiste en preguntar si el cumpleaos de cualquiera
de las 23 personas coincide con el cumpleaos de alguna de las otras personas.

Ejemplo.
Determinar la probabilidad de que en 10 lanzamientos de una moneda 7 de ellas salga caras, por tanto:
=

7
= 0.7
10

Si en otros 10 lanzamientos salen 6 caras, su frecuencia relativa aumenta a 20 lanzamientos, por


tanto:{
=

(7 + 6)
= 0.625
(10 + 10)

Para obtener una cifra significativa dentro de la cual se pueda tomar una decisin basta con realizar
ms lanzamientos.
PROBABILIDAD CONDICIONAL
Se conoce como probabilidad condicional aquel en la que dos eventos E1 y E2 y que el evento E2
ocurra dado que ya haya sucedido el evento E1 y se denota por: {2|1} Pr {2 1}
Sucesos Independientes
Son sucesos independientes cuando dos eventos E2 y E1 ocurren de manera independiente es decir
el evento E1 ocurra sin que afecte la probabilidad que suceda el evento E2. Ejm El lanzamiento de
una moneda tres veces es un evento independiente, ya que el resultado de un lanzamiento no afecta
el otro.
{1 2} = {1}. {Pr 2}
Para tres sucesos E1, E2 y E3 se tiene:

Ing. Leonardo Snchez/ Ing. Carlos Burgos

63
{1 2 3} = {1}. {2}. {3}.
Para los tres eventos citados la probabilidad de ocurrencia es la misma
Ejemplo
Al lanzar una moneda en su 7mo lanzamiento sale cara y en el 8vo lanzamiento sale cara, entonces
el evento E1 Cara en el 7mo lanzamiento y el evento E2 Cara en el 8vo lanzamiento, son sucesos
independientes ya que cada lanzamiento no depende que salga cara en el siguiente lanzamiento.
Sucesos Dependientes
Son sucesos dependientes cuando en dos eventos E1 y E2 ocurren de manera tal que el evento E1
afecta la probabilidad que suceda el evento E2.
{1 2 3} = {1}. Pr{2|1} . Pr{3|1. 2}.

Suceso compuesto
Se conoce como suceso compuestos cuando dos eventos E1 y E2 tienen la misma probabilidad de
ocurrencia.
{1 2} = {1} Pr{2|1}

SUCESOS MUTUAMENTE EXCLUYENTES.


Se conoce como sucesos mutuamente excluyentes cuando se presentan dos eventos E1 y E2, y uno
de estos eventos sea E1 E2 excluye la del otro evento sea este E1 E2.
La siguiente ecuacin se utiliza para calcular la ocurrencia del evento E1 o bien E2 ambos a la vez
{1 + 2} = {1} +{2} Pr{1. 2}
Para sucesos mutuamente excluyentes se utiliza la siguiente ecuacin.
{1 + 2} = {1} + {2}

Ing. Leonardo Snchez/ Ing. Carlos Burgos

64

DISTRIBUCIONES DE PROBABILIDAD
Variables discretas
Una variable discreta es una variable cuantitativa que toma valores aislados, es decir no admite
valores intermedios entre dos valores especficos.
Si una variable X toma un conjunto discreto de valores X1, X2, . . . , XK con probabilidades respectivas
p1, p2, . . . , pK, donde p1 + p2 +. . .+ pK = 1, esto se define como una distribucin de probabilidad
discreta de X. La funcin p(X ), que tiene los valores p1, p2, . . . , pK para X = X1, X2, . . . , XK ,
respectivamente, se llama funcin de probabilidad o funcin de frecuencia de X. Como X puede tomar
ciertos valores con determinadas probabilidades, suele llamrsele variable aleatoria discreta. A las
variables aleatorias tambin se les conoce como variables estocsticas.
Ejm
Si al lanzar un par de dados nos de la suma 8, la probabilidad es de 5/36 y se marca en la siguiente
tabla. As que de 500 veces se lancen los dados se espera que en 100 la suma en sea 8
Suma de los
dados
Probabilidad
(p)

10

11

12

1/36

2/36

3/36

4/36

5/36

6/36

5/36

4/36

3/36

2/36

1/36

La manera adecuada de agrupar o parear los dados se presenta a continuacin y se aprecia las 3
maneras posibles de combinar.

Ing. Leonardo Snchez/ Ing. Carlos Burgos

65

Mas ejemplo de variables discreta tenemos:


1.-Nmero de acciones vendidas cada da en la Bolsa.
2.-Nmero de hijos de 50 familias.
3.-Censo anual de los espaoles.
Variable Continua
Una variable continua es una variable cuantitativa que puede tomar valores comprendidos entre dos
nmeros. Por ejemplo:
1.-La altura de las 5 personas: 1.60, 1.72, 1.76, 1.79, 1.75.
2.-Temperaturas registradas cada hora en un observatorio
3.-Perodo de duracin de un automvil.
4.-El dimetro de las ruedas de varios coches.
Valor esperado o Esperanza matemtica
El Valor esperado o Esperanza matemtica de una variable aleatoria discreta es la suma del producto
de la probabilidad de cada suceso por el valor de dicho suceso. Tambin se puede entender como la
relacin entre el premio obtenido y probabilidad de acertar.
Si la esperanza matemtica es 1, el juego es justo. Por ejemplo, apostar 1 dlar a que una moneda
sale cara o cruz, si el premio por acertar son 2 dlares, y si se pierde, 0 dlares. La esperanza del
Ing. Leonardo Snchez/ Ing. Carlos Burgos

66
juego es 2 (1/2) = 1. Entonces, consecuentemente con la teora de juegos, podra pagar el dolar para
jugar o para rechazar jugar, porque de cualquier manera su expectativa total sera 0.
Si la esperanza matemtica es menor que 1, el juego es desfavorable para el jugador. Un sorteo
que pague 500 a 1 pero en el que la probabilidad de acertar sea de 1 entre 1.000, la esperanza
matemtica es 500 (1/1.000) = 0,5.
Si la esperanza matemtica es mayor que 1, el juego es favorable para el jugador, todo una
Fortuna para el jugador. Un ejemplo sera un juego en el que se paga 10 a 1 por acertar el nmero
que va a salir en un dado, en donde hay una probabilidad de acertar es de 1 entre 6. En este ejemplo
el valor de la esperanza matemtica es 10 (1/6)=1,67 y por tanto en esas condiciones es juego
beneficioso para el jugador.
ANALISIS COMBINATORIO
El origen del anlisis combinatorio se le atribuye a los trabajos de Pascal (1596 1650) y Fermat
(1601 - 1665) que fundamentan el clculo de probabilidades.
Leibiniz (1646 1716) public en 1666 Disertatio de Arte Combinatoria. El mayor impulsor de
esta rama fue Bernoulli quien en sus trabajos incluye una teora general de permutaciones y
combinaciones.
El anlisis combinatorio estudia las distintas formas de agrupar y ordenar los elementos de un
conjunto, sin tener en cuenta la naturaleza de estos elementos.
Los problemas de arreglos y combinaciones pueden parecer aburridos y quiz se piense que no tienen
utilidad pero los teoremas del anlisis combinatorio son la base del clculo de la probabilidad.
La probabilidad se encarga de los arreglos y las combinaciones que determinan el nmero de formas
diferentes en que un acontecimiento puede suceder.
El anlisis combinatorio tiene aplicaciones en el diseo y funcionamiento de la tecnologa
computacional as como tambin en las ciencias. La teora combinatoria se aplica en las reas en
donde tengan relevancia las distintas formas de agrupar elementos.
Principio

Ing. Leonardo Snchez/ Ing. Carlos Burgos

67
Dado que un evento puede ocurrir en su primera salida n1, y dado que el primer evento a ocurrido,
luego se produce un siguiente evento n2, entonces el nmero de combinaciones que se pueda dar ser
n1*n2
Ejemplo:
Una persona tiene 2 formas de ir de una ciudad A una ciudad B; y una vez llegada a la ciudad B, tiene
3 formas de llegar a una ciudad C, De cuantas maneras podr realizar el viaje de A a C Pasando por
B?

Solucin
De manera general si aplicamos la formula
Combinacin= n1*n2
Combinacin= 2(3)
Combinacin= 6
Factorial de un nmero
El Factorial de un nmero est definido por:
! = ( 1)( 2) 1
Ejemplo
Hallar el factorial de 6!
! = ( 1)( 2) 1
6! = 6(6 1)(6 2)(6 3)(6 4)(6 5)
6! = 6(5)(4)(3)(2)(1)
6! = 720
Ing. Leonardo Snchez/ Ing. Carlos Burgos

68
Permutaciones:
Una permutacin de objetos es un arreglo de stos en el que orden s importa. Para encontrar el
nmero de permutaciones de n objetos diferentes en grupos de r, se usan las siguientes frmulas:
Cuando se permite Repeticin
=
Ejemplo
1.- Cuntas cantidades de cuatro cifras se pueden formar con los dgitos 0, 1, 2, 3 y 4 si se permite
la repeticin?
Solucin:
=
4
5P4=5

5P4=625

Cuando no se permite repeticin


=

!
( )!

Ejemplos:
1.- Cuntas cantidades de tres cifras se pueden formar con los dgitos 0, 1, 2, 3 y 4 si no se permite
la repeticin?
Solucin
5P3=

!
()!

5P3=

5!
(53)!

5P3=

5!
2!

Ing. Leonardo Snchez/ Ing. Carlos Burgos

69
Combinacin.- Una combinacin de objetos es un arreglo en el cual el orden no importa. Para
encontrar el nmero de combinaciones de n objetos en grupos de r, se usa la siguiente frmula:

!
( )=nCr !()!

Ejemplo
De entre 8 personas debemos formar un comit de cinco miembros. Cuntas diferentes posibilidades
existen para formar el comit? Solucin: Esta es una combinacin porque el orden no importa.
Solucin
8C5

8!
5!(85)!

8C5

8!
5!(3)!

8C5 =56

Ejercicios de resolucin
1) Cuntas cantidades de cuatro cifras se pueden formar con los dgitos 4, 5, 6, 7, 8 y 9 si no se
permite la repeticin?
resp[360]
2) Cuntas cantidades de tres cifras se pueden formar con los dgitos 3, 4, 5 y 6 si se permite la
repeticin?
resp[64]
3) Un entrenador de baloncesto dispone de 12 jugadores. Cuntos diferentes equipos de cinco
jugadores puede formar?
resp[792]
4) De una clase de 20 nias se escogern 6 para ir a un paseo. Cuntos posibles grupos de 6 se
pueden formar?
Resp [38760]

Ing. Leonardo Snchez/ Ing. Carlos Burgos

70
APROXIMACIN DE STIRLING
Al evaluar las funciones de distribucin en estadsticas, a menudo es necesario evaluar considerables
factoriales de nmeros, como en la distribucin binomial:
() =

! (1 )
! ( )!

Una relacin aproximada til y de uso comn en la evaluacin de factoriales de grandes nmeros es
la aproximacin de Stirling
! 2
Donde:
e=Es la base natural de logaritmos, con un valor 2.71828

Ing. Leonardo Snchez/ Ing. Carlos Burgos

71

CAPITULO 7: DISTRIBUCIONES DE PROBABILIDAD


Dentro de las distribuciones de probabilidad las ms importantes para objetos de estudio dentro de la
estadstica inferencial son:
1. La Distribucin Binomial o de Bernoulli
2. La Distribucin normal
3. La Distribucin de Poison
La Distribucin Binomial o de Bernoulli:
La distribucin Binomial o tambin conocida como de Bernoulli es una distribucin de probabilidad
discreta que cuenta el nmero de xitos en una secuencia de n ensayos entre s, con una probabilidad
fija p de ocurrencia del xito entre los ensayos. Un experimento de Bernoulli se caracteriza por ser
dicotmico, esto es, slo son posibles dos resultados. A uno de estos se denomina xito y tiene una
probabilidad de ocurrencia p y al otro, fracaso, con una probabilidad q = 1 - p. En la distribucin
binomial el anterior experimento se repite n veces, de forma independiente, y se trata de calcular la
probabilidad de un determinado nmero de xitos. Para n = 1, la binomial se convierte, de hecho, en
una distribucin de Bernoulli.
La distribucin Binomial viene definida por:
!

() = ( ) =

! ( )!
Donde:
X=0,1,2,N; N posibilidades de ocurrir
N!=N(N-1)(N-2)1; y 0!=1
q=1-p
CARACTERISTICAS DE LA DISTRIBUCIN BINOMIAL
Si al analizar un determinado experimento donde su variable sea aleatoria X y esta se repita n nmero
de veces de forma independiente, y que en ese experimento haya un suceso que denominamos xito,
que ocurre con una probabilidad p. Viene definido por:

Ing. Leonardo Snchez/ Ing. Carlos Burgos

72

Ejercicio
En un grupo de amigos se decide jugar a los volados, el jugador A necesita obtener la probabilidad
de que al lanzar una moneda no trucada 6 veces le d exactamente dos caras para ganar al jugador
B

Solucin
Datos
N=6: Posibilidades de ocurrir
X=2: Posibilidades que ofrece la moneda
p= : probabilidad de que ocurra el evento
q= : probabilidad de que no curra el evento
!

() = ( ) =

! ( )!
6!
1 2 1 62
() = (
)( ) ( )
2! (6 2)! 2
2
() = (

720 1 2 1 4
)( ) ( )
48 2
2

720
() = (
)
1536
15
() = ( )
48
() = 0.234

Ing. Leonardo Snchez/ Ing. Carlos Burgos

73

DISTRIBUCIN NORMAL
La distribucin normal, tambin conocida como a distribucin de gauss o gaussiana y es considerada
una distribucin de probabilidad individual.
Ejercicios resueltos
La compaa COLD fabricante de frigorficos, obtuvo, mediante mediciones valores promedios de
temperatura de -3.5C, con una desviacin Tpica o estndar de 1.12C con nivel de confiabiida del
95%
a) Adems desea saber cul es la probabilidad de que uno de sus frigorficos se fabrique con
una temperatura menor a 4.5C.
b) El dueo de la compaa necesita saber cul es la probabilidad de que uno de sus frigorficos
de una temperatura superior a 2.5C.
Solucin
Datos

=-4
=1.12
Pr(a<x<b)

a) La probabilidad de obtener un temperatura menor a 4.5 en un frigorfico se obtiene


=

mediante
Pr(X< 4.5)
X=-3.5
=

4.5 3.5
1.12

= 0.89
Pr=(1-0.5)-Pr(LA calculada por tablas Apndice)
Pr=0.5-0.3238
Pr=0.1762
Pr=17.62%
b) El dueo de la compaa necesita saber cul es la probabilidad de que uno de sus
frigorficos de una temperatura superior a -2.5C.
Ing. Leonardo Snchez/ Ing. Carlos Burgos

74
Pr(X> 2.5)
X=-3.5
=

3.5 2.5
1.12

= 0.89
Pr=(1-0.5)-Pr(LA calculada por tablas Apndice)
Pr=0.5-0.3212
Pr=0.1788
Pr=17.88%

DISTRIBUCIN DE POISSON
La distribucin de Poisson nos ayuda a obtener la probabilidad de ocurrencia de ciertos eventos que
ocurren con muy poca frecuencia es decir impredecibles y de forma aleatoria, en otras palabras
pertenece al grupo de las funciones de distribucin de variables aleatorias discretas , por tanto no se
conoce el total de resultados posibles. Esta distribucin es utilizada para terminar la probabilidad de
volumen, rea, distancia o tiempo establecido y viene definido por:

(; ) =

()
!

Donde:
Pr(X=y).-Probabilidad de ocurrencia cuando la variable discreta X toma un valor finito (y).
=Parametro de ocurrencias de un intervalo (>0, y=1, 2,3,)
e=Logaritmo natural o neperiano y es igual a 2.71828
y=Nmero de sucesos ocurridos.
Ejemplo
En una heladera se atienden cada 20 min a 6 personas. El dueo del local necesita saber cul es la
probabilidad de que:
a) En un da no soleado se atiendan 5 personas en 20min
Ing. Leonardo Snchez/ Ing. Carlos Burgos

75
b) En un da soleado se atiendan 10 personas en 20min
c) Y que en un feriado con da soleado se atiendan 5 personas o menos, en menos de 20min
Solucin
Parte a)

(; ) =

()
!

Datos
Pr(x=5)=(5,6)
(5,6) =

2.7186 (6)5
5!

(5,6) = 0.16
(5,6) = 16%
Parte b)

(; ) =

()
!

Datos
Pr(x=10)=(10,6)
(5,6) =

2.7186 (6)10
10!

(5,6) = 0.0413
(5,6) = 4.13%
Parte c)

(; ) =

()
!

Ing. Leonardo Snchez/ Ing. Carlos Burgos

76
Datos
Pr(x5)=Pr(x=0)+ Pr(x=1)+ Pr(x=2)+ Pr(x=3)+ Pr(x=4)+ Pr(x=5)
( 5) =

2.7186 (6)0 2.7186 (6)1 2.7186 (6)2 2.7186 (6)3 2.7186 (6)4
+
+
+
+
0!
1!
2!
3!
4!
+

2.7186 (6)5
5!
( 5) = 0.448
(5,6) = 44.83%

Interpretacin:
a) Indica que existe una probabilidad de que en un da no soleado se atiendan a 5 personas en
20 min
b) Sin embargo en este literal existe la probabilidad de que el 4.13% se atiendan a 10 personas
en 20min
c) Para este literal existe el 44.8% de probabilidad de que se atienda 5 personas o menos en 20
min.
Ejemplo
Lo alumnos en la cafetera de una universidad consumen en un determinado da como media 5 tazas
de caf, la misma tiene una distribucin de Poisson, Hallar la probabilidad de que cuando mucho
lleguen a consumirse 7 tazas de caf por da.
Datos:
=5
Pr (x7)
Solucin

(; ) =

()
!

Pr(x7)=Pr(x=0)+ Pr(x=1)+ Pr(x=2)+ Pr(x=3)+ Pr(x=4)+ Pr(x=5) + Pr(x=6) + Pr(x=7)


Ing. Leonardo Snchez/ Ing. Carlos Burgos

77

( 7) =

2.7185 (5)0 2.7185 (5)1 2.7185 (5)2 2.7185 (5)3 2.7185 (5)4
+
+
+
+
0!
1!
2!
3!
4!
+

2.7185 (5)5 2.7185 (5)6 2.7185 (5)7


+
+
5!
6!
7!

( 7) = 0.00674 + 0.0337 + 0.0842 + 0.14 + 0.1755 + 0.1463 + 0.1045


(7,5) = 0.6909
(7,5) = 69.09%
Anlisis:
La probabilidad de que a lo mucho llegue a consumirse 7 tazas de caf por da es del 69%, la cual nos
asegura en ms de un 50% que ese suceso de consumir al menos 7 tazas de caf ocurra.

Ing. Leonardo Snchez/ Ing. Carlos Burgos

78

CAPITULO 8: MUESTREO
Introduccin
Dentro de la estadstica existe la teora del muestreo, esta nos permite tomar de un
conjunto de datos una muestra que nos servir como objeto de estudio.
El muestreo nos ayuda a tomar de un conjunto universal de datos una muestra
especfica que nos servir como objeto de estudio.
Cuando se toma las caractersticas de una poblacin, es importante saber que
1.-La muestra debe ser seleccionada de acuerdo a su naturaleza.
2.-Resulta imposible verificar todos los elementos fsicos de una poblacin.
3.-El costo por estudiar toda l poblacin seria elevado y no es recomendable.
3.-Los resultados de la muestra son adecuados.
4.-Si se deseara estudiar todo el universo de la muestra, esto conllevara a tomar
ms tiempo de lo normal para el estudio
Muestra aleatoria simple.- Este tipo de muestra toma a cada elemento o individuo
de una poblacin y asigna las mismas posibilidades de que le incluya en la
seleccin.
Un ejemplo de muestra aleatoria simple es que si de un grupo de 145 botellas para
envasar agua, se debe elegir una muestra de 60 botellas. Para asegurarnos de que
todas las botellas tengan las mismas posibilidades de ser tomadas, estas deben ser
tomadas al azar mientras pasan el control de calidad hasta recoger la muestra de
60 botellas.
Muestra aleatoria sistemtica.-Para tomar una muestra sistemtica lo que se debe
hacer es primero tomar un punto de inicio aleatorio y luego cada k-simo objeto
de la muestra.
Muestra aleatoria estratificada.-Para realizar este tipo de pruebas se debe tener en
cuenta que esta se debe aplicar cuando una poblacin est dividida en grupos a
partir de ciertas condiciones propias de la muestra. Para esto se debe dividir una
poblacin en subgrupos conocido estos como estratos, como de los cuales se
seleccionar uno por cada estrato.
Muestra aleatoria por conglomerados.-Este tipo de muestreo cosiste dividir una
poblacin en conglomerados a partir de los lmites geogrficos o naturales o de
Ing. Leonardo Snchez/ Ing. Carlos Burgos

79
cualquier otro tipo de poblacin, y de este grupo de conglomerados se selecciona
al azar una muestra aleatoria .El muestreo por conglomerados es utilizado a
menudo para reducir costos de mostrar una poblacin dispersa en cierta rea.
EJERCICIOS DE DEMOSTRACIN CAPITULO 8

MUESTREO POR CONGLOMERADOS


Ejemplo.
Se desea saber el grado de aceptacin de una obra realizad por un Municipio de
en un grupo de personas de una localidad. Se pide seleccionar una muestra de la
localidad aplicando el mtodo de seleccin de una muestra por conglomerado y
subdividir la localidad en manzanas y a esta se las conocer como unidades
primarias.
La localidad X se dividi en 6 manzanas es decir en 6 unidades primarias y
selecciono al azar las manzanas 1, 2, 4, 5 y de cada una de ella se seleccionara 4
casas al azar

Ing. Leonardo Snchez/ Ing. Carlos Burgos

80
MUESTREO CON REPOSSIION Y SIN REPOSICIN
Muestreo con reposicin.-Se conoce as cuando de un grupo de muestras se toma
una al azar y luego es devuelta al mismo grupo. Por tanto se llama muestreo con
reposicin si cada objeto de una poblacin tiene la misma probabilidad de ser
elegido ms de una vez
Ejemplo:
En una bolsa donde existen 10 canicas, 4 de color azul, 3 de color rojo y 3 de color
amarillo, se desea tomar una muestra y devolverla a la bolsa.
Muestreo Sin reposicin.-Se le conoce al proceso de recoleccin en el cual se toma
una muestra y no se devuelve l grupo de muestras del cual fue tomado. Por tanto
se conoce como muestreo sin reposicin cuando el objeto extrado de una
poblacin ya no tiene ninguna probabilidad de que vuelva a salir.
Ejemplo:
Para el mismo caso de la bolsa donde existen 10 canicas, 4 de color azul, 3 de color
rojo y 3 de color amarillo, se desea tomar una muestra y sin devolverla a la bolsa.

DISTRIBUCIONES MUESTRALES
Se conoce como distribucin muestral a la seleccin de muestras de un tamao
desconocido N y que puedan ser estas con y sin reposicin se pueda hallar su
estadstico, tales como media o desviacin estndar.
Una distribucin muestral puede tomar diferentes formas segn las caractersticas
de la poblacin estudiada y es la que nos permite hacer inferencia adems posee
un patrn de compartimento predecible.
Ejemplo.
La ciudad de Ambato se ve en la necesidad de saber cul es la proporcin de
mujeres en funcin de la poblacin para poder determinar mediante un estudio
seguido la tasa de embarazos en mujeres menores de 18 aos.
Debido a que la poblacin de la ciudad es muy grande no se realizara un censo
ya que esto resultara costoso. Por tanto se decide estimar a partir de la muestra Pm
(Proporcin muestral).
=

#
()
Ing. Leonardo Snchez/ Ing. Carlos Burgos

81
DISTRIBUCIN MUESTRAL DE LA MEDIA
Una distribucin muestral poblacional considerando que no hay reposicin viene
definido por:
=
=

Si el muestreo se hace con reposicin y cuya poblacin es infinita, la ecuacin se


define por:
=
=

Para una poblacin en la que su tamao N 30 su distribucin normal de la media


es aproximadamente a la normal con media y desviacin estndar
Si N<30 la distribucin muestral de la medias es tambin normal, aun cuando el
tamao de la muestra N sea pequeo y la poblacin este distribuida normalmente.

ERROR DE MUESTREO
Dentro de la seleccin de datos o informacin recolectada por muestras
muestreo es de vital importancia saber que es poco probable que la desviacin
estndar de la muestra sea exactamente igual a la desviacin estndar de la
poblacin.
CARACTERISTICAS DEL ERROR ESTANDAR EN DISTRIBUCIONES MUESTRALES
ERROR ESTANDAR DE LA MEDIA
Para distribuciones donde las muestras son grandes o pequeas su ecuacin est
definida por:
=

Ing. Leonardo Snchez/ Ing. Carlos Burgos

82
Donde:
N30=Cuando la distribucin muestral se asemeja a una distribucin normal.
=Desviacin estndar
=Distribucin muestral de las medias estndar muestral
N=Poblacin

ERROR ESTANDAR DE LA DESVIACIN ESTANDAR


Para distribuciones donde la poblacin es N100
=Desviacin estndar muestral de s

CAPITULO 9: ESTADISTICA INFERENCIAL

La estadstica inferencial o estadstica matemtica se basa en la fusin de los conceptos y


conocimientos de estadstica descriptiva y la teora de probabilidad; Por tanto la estadstica inferencial
analiza los datos obtenidos pudiendo ser estos Cualitativos o cuantitativos de las muestras y en base
a esta informacin se toman decisiones
.
HIPOTESIS NULA

Ing. Leonardo Snchez/ Ing. Carlos Burgos

Você também pode gostar