Você está na página 1de 55

UNIDAD ACADEMICA Nº 01

Nombre de la Unidad: Estadística Descriptiva

Introducción.
La Estadística es la ciencia encargada de recolectar, organizar, resumir e
interpretar datos de un proyecto o estudio, en los últimos años ha cobrado gran
relevancia en todas las disciplinas ya que suministra los mejores instrumentos en
el propósito de toda investigación cuyo fin es el de probar mediante la observación
de los hechos empíricos la implicación teórica que establecemos entre los
mismos.

Objetivo General de la Unidad: Describir conceptos, definiciones, escalas de


medición, procesamiento de una encuesta, manejo y interpretación de variables
cualitativas y cuantitativas.

Objetivos Específicos de la unidad:


 Realizar una breve descripción del método científico y el papel de la
estadística en toda investigación.
 Establecer la secuencia en la elaboración de un instrumento de medición
“encuesta” su procesamiento resumen e interpretación de datos
cualitativos.
 Definir, calcular e interpretar medidas: De tendencia central, dispersión,
sesgo y curtosis.

RESUMEN

En ciencias e Ingeniería la estadística juega un papel fundamental dado


que a partir de mediciones y datos se toman decisiones en un proceso, es
por esto que el ingeniero civil necesita de estadísticos en una muestra o
parámetros si se dispone de un censo; también es importante resaltar que
la estadística brinda elementos básicos para un proceso de investigación
científica.

GLOSARIO
Población: Cuando se dispone de todos los elementos de un objeto de
estudio (Censo)
Muestra: Subconjunto de la población.
Marco de Muestreo: Listado de unidades muéstrales de la población.

Página 1 de 55
Variable : Característica que al ser medida en diferentes individuos adopta
resultados heterogéneos.
Estadístico: Medida cuantitativa de una muestra cuyo objetivo es inferir
acerca de la población objetivo.
Parámetro : Medida cuantitativa de una población.

Desarrollo temático.
1.1 El método científico y conceptos básicos en estadística.
1.2 Recolección, organización, resumen e interpretación en variables cualitativas,
pictogramas y tablas de contingencia.
1.3 Resumen e interpretación en variables cuantitativas, histogramas , diagramas
de tallos y hojas , diagrama de caja y bigotes ,
1.4 Medidas de tendencia central
1.5 Medidas de dispersión
1.6 Sesgo y curtosis .
1.7 Autoevaluación
1.7 Referencias bibliográficas

Página 2 de 55
UNIDAD 1: Estadística Descriptiva

1.1 El método científico y conceptos básicos en estadística.

La estadística es la ciencia que recolecta, organiza resume e interpreta datos de


un estudio o proyecto específico. Iniciaremos con los conceptos y metodologías de
la investigación científica.

El problema 1

La investigación científica inicia cuando se ha obtenido cierta cantidad de


conocimiento, pero de dicho conocimiento hay algo que no sabemos debido a que
no tengamos la información suficiente para contestar la pregunta, o bien que la
información que tenemos se halle en un estado de desorden que no podemos
relacionarla adecuadamente con el problema.

Fuentes del problema

Los problemas surgen por tres posibles causas: primera , un vacío en el


conocimiento, segundo, resultados contradictorios y tercero explicación de hechos.

Características de los problemas

Los problemas deben ser resolubles y sus repuestas verificables es decir,


determinar si la proposición es verdadera o falsa a partir de la evidencia tomada y
poder determinar el grado de probabilidad del problema.

Implicación de los problemas

Todos los problemas se inician por una pregunta que debe tener los siguientes
componentes: Una descripción ( El que) , Unas discriminación ( El cual ) , un
registro histórico y bibliográfico (El cuándo y dónde hay información ) , El proceso (
como se puede resolver) , la explicación (el por que) y una aplicación (el para
que).

Si se plantea correctamente el problema de investigación se tiene una gran


proporción de éxito en la investigación que se emprenda.

1 Tomado de: Psicología experimental enfoque metodológico, F.J. Mc Guigan


, Editorial trillas México 1971

Página 3 de 55
Conceptos Básicos en Estadística.

Una vez formulado el problema nos enfrentamos a la toma de la evidencia que


ratifique o invalide mi hipótesis (proposición o conjetura acerca de una o más
poblaciones) , si es posible acceder a todos los elementos del objeto de estudio se
dice que tenemos un censo , en general no es fácil y a veces imposible tener
acceso a todos los elementos de la población, por lo que en general se toma una
muestra ( subconjunto de la población) con el ánimo de inferir acerca de la
población.

En el siguiente documento se hace una explicación detallada del muestreo sus


objetivos , fases y ventajas:
http://www.slideshare.net/emmanuelbuap/muestreo-15361912

Variables en Estadística.

Es una característica que al ser medida en diferentes elementos (individuos o


cosas) se obtienen valores diferentes.

Tipos de Variables:

Se tiene básicamente dos: Cualitativas que son aquellas que no se les puede
asignar valor numérico y Cuantitativas en las cuales su escala de medición es
numérica. En el siguiente cuadro sinóptico se describen los tipos de variables
según su clasificación:

Página 4 de 55
  No min al : No hay diferencias entre sus clases (opciones que toma la var iable)
  Ejemplos : EstadoCivil , Raza, genero, etc
 
 Ordinal : Existe una jerarquia entre las clases
 
Cualitativas  Ejemplo : Estructura organica de la iglesia : Papa, arsovispos ovispos ,
 
 sacerdotes.
  Razon : Se le asigna una escala de medicion a las clases
 
  Ejemplo : En una escala de 0 a 100 establesca su gusto por las suguientes
 bebidas Coca cola y Colombiana


Variables 

  Discretas : Son aquellas que toman valores enteros
  Ejemplo : Numero de hijos

Cuantitativas
 Continuas : Son aquellas que toman los reales
  Ejemplo : Estatura, Fuerza, Re sistencia en P.S .I .






1.2 Recolección, organización, resumen e interpretación en variables


cualitativas

Ejercicio de aplicación de un proyecto descriptivo de opinión

Problema
¿Existe una relación entre la actitud y aptitud con el desempeño académico en
Matemáticas?

Población Objetivo
Estudiantes de ingeniería Universidad “X” Grupo 15 de Probabilidad 2013-1.

Variables Independientes
Actitud: Definida de modo básico como el gusto por una actividad
Aptitud: Del latín “ aptus = capaz para” en el lenguaje común la aptitud se refiere a
la capacidad de una persona para realizar adecuadamente una tarea, en
psicología engloba tanto capacidades cognitivas como procesos.
Para la valoración de estas variables se utilizara como instrumento de medición
una encuesta

Variable Dependiente

Página 5 de 55
Desempeño académico en Matemáticas.

Objetivo General
Realizar un diagnostico de las posibles causas de la mortalidad académica en
Matemáticas con el fin de formular planes de acción y prevención.

Objetivos específicos
 Recopilar, organizar y resumir información del desempeño académico y del
gusto por la matemáticas
 Realizar una encuesta donde se trate de medir las causas de la mortalidad
académica.
 Con base a los resultados obtenidos, formular planes de acción y
socializarlos con los docentes de las asignaturas.

Referentes teóricos2:

Actitud
 “En esencia, las actitudes son percepciones acerca de las personas, las
cosas o los hechos ambientales; asimismo, en la medida en que dirigen la
conducta, tienen cualidades motivacionales. Al definir las actitudes debe
tomarse en cuenta, fundamentalmente, el modo en que “disponen” al
individuo para que conciba el mundo y reaccione ante él de determinadas
maneras”. Los expertos en psicología mencionan por lo menos cuatro
componentes para las actitudes. Así, una actitud hacia la matemática que
refleje aprecio e interés por esta ciencia, hace referencia a una componente
afectiva de la actitud hacia esta disciplina. Mientras que referencias hacia la
organización, modo de empleo de las capacidades generales y hábitos de
trabajo hacia esta disciplina, evidencian un componente cognitivo de la
actitud hacia las matemáticas.
 Desde los comienzos de la psicología social, en 1924, se han propuesto
muchas definiciones para el termino actitud, desde simples, como la
enunciada por Bem en 1972, como “lo que gusta y lo que no gusta”, hasta
mas elaboradas: “como medio de la experiencia, que ejerce una influencia
rectora o dinámica en la respuesta del individuo a todos los objetos y
situaciones con los que se relaciona”, dada por Allport (1935); pasando por
definiciones variadas que obedecen a los momentos históricos de la
psicología

Página 6 de 55
Medición de actitudes
La actividad científica durante los años 1920 y 1940, inspirada en el modelo
experimental de la física, hizo que los científicos sociales asumieran como único
procedimiento para validar el conocimiento las reglas metodológicas de esta
corriente. Esta tendencia cuantificadora, el uso de las encuestas y el aumento de
las investigaciones psicológicas llevaron al desarrollo de las escalas de actitud
como un instrumento en la medición de actitudes.

Escalas de actitud
Elejabarrieta e Iñiguez, 1984, se pueden definir técnicamente como: Instrumentos
de medición que permiten acercarse a la variabilidad afectiva de las personas
respecto a cualquier objeto psicológico.

Tipos de Escala
Clásicamente se consideran 3 tipos de escalas:
 Escalas tipo Thurstone
La consideración en 1928 de Louis Thurstone: de la opinión como un
indicador indirecto de la expresión verbal de la actitud de los sujetos hacia
las cosas, lo llevó a diseñar junto a E. J. Chave, un instrumento para medir
actitudes, conocido hoy en día como escala de actitud tipo Thurstone. En
esta escala se presenta a una muestra representativa de la población una
serie de enunciados que, se cree, son pertinentes para medir el grado de
acuerdo/desacuerdo, favorabilidad/desfavorabilidad hacia cierto objeto; es
decir los sujetos no expresan su opinión sino que manifiestan su grado de
favorabilidad a cada enunciado.
 Escala tipo Likert
En 1932, Likert plantea un proceso de elaboración más breve y sencillo que
Thurstone; su técnica acepta expresamente que las actitudes pueden
medirse a través de manifestaciones verbales. Los individuos pueden
situarse en la variable de actitud desde el polo más favorable al más
desfavorable, de tal manera que la variación de las respuestas será debida
a diferencias individuales de los sujetos.
 Thurstone – Likert
Considerando las respuestas: En las escalas Thurstone se pide a los
sujetos que emitan sus respuestas con dos alternativas Si/No; mientras
que, en Likert se presentan distintas alternativas desde la más favorable a
la más desfavorable. Los modelos más habituales varían entre dos y siete
respuestas, siendo el número más común el de cinco.
Desde el punto de vista de la medición: La técnica Likert asume un nivel de
medida ordinal, mientras Thurstone considera una escala de intervalo.

Página 7 de 55
En la actualidad, de entre las múltiples técnicas de observación que se conocen
(entrevistas, cuestionarios, test proyectivos, observaciones de la conducta, etc.), el
instrumento de medida de actitudes es la escala de actitud, porque como indica
Gairín 1987, presentan las ventajas que citamos a continuación:
 Permiten el anonimato.
 Proporcionan tiempo al encuestado para pensar acerca de
 las respuestas antes de responder.
2 Tomado
de:http://ima.usergioarboleda.edu.co/pelusa/pelusa%282%29/documento
s/Cursillo_Cali.pdf

APTITUD.

La aptitud o "facultad" (del latín aptus = capaz para), en psicología, es cualquier


característica psicológica que permite pronosticar diferencias interindividuales en
situaciones futuras de aprendizaje. Carácter o conjunto de condiciones que hacen
a una persona especialmente idónea para una función determinada.

Mientras que en el lenguaje común la aptitud sólo se refiere a la capacidad de una


persona para realizar adecuadamente una tarea, en psicología engloba tanto
capacidades cognitivas y procesos como características emocionales y de
personalidad. Hay que destacar también que la aptitud está estrechamente
relacionada con la inteligencia y con las habilidades tanto innatas como adquiridas
fruto de un proceso de aprendizaje.

JUSTIFICACION

Para el ingreso a un programa de ingeniería generalmente no se abordan


exámenes de actitud y aptitud en Matemáticas, motivo por el cual algunos
estudiantes con dificultades en estas dos variables pueden presentar un bajo
rendimiento situación que puede originar deserción.

PROCEDIMIENTO

 Se realizara una encuesta a la población objetivo con escalas de medición


que traten de identificar y validar el proyecto.
 En la encuesta se tuvieron en cuenta las siguientes variables de
agrupación: Sexo ( Femenino, Masculino) , Estudio en Colegio ( Oficial ,
Privado)

 Para la medición de aptitudes y actitudes se tuvieron en cuenta : escalas


Thurstone – Likert ,con el objeto de que en las escalas Thurstone se pide a
los sujetos que emitan sus respuestas con dos alternativas Si/No; mientras

Página 8 de 55
que, en Likert se presentan distintas alternativas desde la más favorable a
la más desfavorable. Las de tipo Likert fueron: Como fue su desempeño
académico ( notas) para las matemáticas durante el bachillerato ( Bueno ,
Regular, Malo) y Como ha sido su desempeño académico ( notas) para las
matemáticas desde su ingreso a la facultad ( Bueno , Regular, Malo) . Las
de tipo Thurstone fueron: Le gustaron las matemáticas durante el
bachillerato ( si, no) y Le han gustado las matemáticas en la Universidad ( si
, no)
 Para la verificación de la variable de respuesta se trabajo con una escala
Thurstone : Considera usted que debido a las anteriores razones se da el
bajo desempeño en matemáticas en los estudiantes de su facultad ( si , no)
 Una vez aplicado el instrumento se organizo la información en una base de
datos así:

Página 9 de 55
 Nota : Se codificaron las clases asi: Sexo : Femenino 1 , Masculino 2;
Estudio en colegio: Privado 2, Publico 1 ; Como fue su desempeño
académico ( notas) para las matemáticas durante el bachillerato ( Bueno
“1” , Regular “2”, Malo”3”) ; Como ha sido su desempeño académico (
notas) para las matemáticas desde su ingreso a la facultad (Bueno “1” ,
Regular “2”, Malo”3”) ; Le gustaron las matemáticas durante el bachillerato (
si “1”, no”2”) y Le han gustado las matemáticas en la Universidad ( si”1” ,
no”2”) y por ultimo: Considera usted que debido a las anteriores razones se

Página 10 de 55
da el bajo desempeño en matemáticas en los estudiantes de su facultad ( si
“1”, no “2”)

Resumen de las variables de agrupación

El resumen en este tipo de variables se realiza mediante una tabla de


distribución de frecuencias así:

Por ejemplo en el sexo

Clase Frecuencia Absoluta Frecuencia Relativa


Femenino 12 (12/36)*100=33%
Masculino 24 (24/36)*100=67%
Sumatoria Σ= 36

Un grafico puede ser el pictograma en forma de pastel

Distribucion por sexo

Femenino
12
33%

Masculino
24
67%

De la misma forma

Distribucion del Grupo por Tipo de


Colegio

Oficial
10
28%

Privado
26
72%

Página 11 de 55
El resumen de las preguntas para todo el grupo fue:
Aptitud
Desmpeño Academico ( Notas)
Desempeño Academico
durante el Bachillerato (Notas) En la Universidad

Malo
Malo
11% 11%

Regular Bueno
31% Bueno Regular 50%
58% 39%

Actitud

Le gustaron las Matematicas Le han gustado las Matematicas


Durante el Bachillerato desde el Ingreso al Programa

No
No
22%
36%

Si Si
64% 78%

Considera usted que debido a las anteriores


razones se da el bajo desempeño en
matemáticas en los estudiantes de su facultad

No
17%

Si
83%

Página 12 de 55
Tablas de Contingencia

Consiste en realizar la relación entre dos o más variables, por ejemplo si se desea
analizar el desempeño académico en el bachillerato por género tendríamos:

Como se observa a los hombres les fue un poco mejor en el buen desempeño
(63%) contra las damas ( 50%) .

Página 13 de 55
Tambien podemos analizar la relacion para la pregunta desempeño academico
que han tenido en la universidad por generos .

También podemos concluir que el desempeño de los estudiantes consultados les


ha ido mejor a los hombres con un 58% y las mujeres solamente obtienen un 33 %
en las asignaturas de matemáticas.

Como se observa se pueden obtener muchas tablas de contingencia y de esta


manera se les “pregunta a los datos” con el objeto de analizar y responderse a la
pregunta que sirvió de base para el problema de estudio.

1.3 Resumen e interpretación en variables cuantitativas.

Para la descripción de variables cuantitativas tenemos herramientas como el


histograma, la distribución de frecuencias acumuladas, el diagrama de tallos y
hojas, el esquema de caja y bigotes y las medidas de: tendencia central ,
dispersión , asimetría y curtosis.

1.3.1 Histograma
Se refiere a un diagrama de barras donde se observa la distribución de la variable,
su construcción se ilustrara mediante un ejemplo:

Para la aceptación por parte de la interventoría en una placa de entrepiso se


tomaron muestras que al fallarlas su resistencia a compresión en ( P.S.I) fue:

Página 14 de 55
Primer paso
Se calcula el rango de los datos mediante la diferencia entre el mayor y el menor.

Rango  3074  2395


Rango  679

Segundo Paso
Se establece el numero de clases o intervalos donde se va a distribuir el rango,
existen muchas formas de calcularlo pero en general puede ser a criterio del
profesional que este evaluando, se recomienda que no se exceda de 15 intervalos
de clase así se tengan bastantes observaciones, un criterio aproximado puede ser
la raíz cuadrada de la cantidad de observaciones aproximándola al entero mayor,
en este caso:

n  50
N º deIntervalos  50  7.07107  8
Tercer paso
Establecemos el intervalo de clase, mediante el cociente entre el rango y el
número de intervalos así:

Rango
Intervalo de clase 
N º de Intervalos
679
Intervalo de clase   84,875
8
Cuarto paso
Construimos una tabla de distribución de frecuencias contando los datos de cada
intervalo así:

Página 15 de 55
Nota: Hay que tener en cuenta que por ejemplo en el primer intervalo se deben
contar los datos entre 2395 y 2479 y en el segundo intervalo desde 2480 y 2564 ,
es decir no realizar doble conteo.

El grafico basado en la tabla es:

Histograma
12

10 10
10
9

8
Nº de Muestras

7 7

4
4

2
2
1

Resistencia a la Compresion en (P.S.I)

La línea negra que une los centros de cada clase se denomina polígono de
frecuencias.

Podemos concluir que los mayores porcentajes se encuentra en los rangos de:
2395 a 2564 con un 34% de las cincuenta observaciones y entre 2650 a 2819
tenemos un 38% , es claro que la variable tiene una distribución bastante irregular.

1.3.2 Distribución de frecuencias acumuladas

Es muy similar al histograma, la diferencia radica en que se grafica la acumulación


de frecuencias así:

Página 16 de 55
Frecuencia Absoluta Acumulada
60 100%
86% 50
50
74% 78% 43
39
40 37
54%
30 27
34% 36%
17 18
20
20%
10
10

La línea que une las frecuencias acumuladas se llama curva de ojiva.


Una lectura que se puede dar es que el 54% de las muestras están entre 2395 y
2734 P.S.I.

1.3.3 Diagrama de tallos y hojas


Se trata de un grafico que en el tallo se colocan las unidades principales y las
hojas se repiten de acuerdo a las observaciones así:

Página 17 de 55
Es de anotar que la mayor concentración de datos se encuentra el rango de 2400
y 2473 P.S.I.

1.3.4 Diagrama de caja y bigotes


Consiste en elaborar una caja entre el cuartil uno y el cuartil tres, dentro de la caja
se ubica la mediana , y como bigotes los valores mínimo y máximo.

Cuartiles
Se trata de dividir la muestra ordenada en cuatro partes donde la posición para el
primer cuartil es:

n 1
Q1    
4 4
Donde
n  N º de datos
En este caso
 50 1 
Q1    
 4 4
51
Q1   12,75
4
Es decir entre la posición 12 y 13 la cuarta parte o el primer 25% será
(interpolando):

Página 18 de 55
Por lo tanto el primer 25% de las muestras están entre 2395 y 2533.
El segundo cuartil
n 1
Q2  2 *   
 4 4
Q2  2 *12,75  25,5

El segundo cuartil que también se llama la mediana e indica que el 50% de los
datos está por debajo de este valor y el otro 50% de los datos son mayores.

La mitad de las observaciones están por debajo de 2714.5 (P.S.I) y las muestras
restantes son mayores.

El Tercer cuartil
n 1
Q3  3 *   
4 4
Q3  3 *12,75  38,25

Página 19 de 55
El 75% de las muestras o las tres cuartas partes de las muestras están entre 2395
y 2852,5.

El diagrama de caja y bigotes será:

La interpretación puede ser: la mayor concentración de datos será donde la caja


sea más estrecha en este caso hay más muestras entre la mediana 2714,5 y
2852,5. También se observa la mayor dispersión de datos entre el tercer cuartil
2852,5 y el valor máximo 3074.

1.4 Medidas de tendencia central

Nos indican un valor representativo de una muestra o población, las principales


son:

Página 20 de 55
1.4.1 Media aritmética o promedio : Se refiere al fiel de la balanza es decir si
colocáramos los datos ordenados del menor al mayor el fulcro es el promedio:

Es la medida de tendencia central más usada, sus ventajas son: la suma de las
desviaciones ( datos menos la media ) es igual a cero , la media de una muestra
es igual a la media ponderada de las submuestras y la más importante la suma de
los cuadrados de las desviaciones es mínima , con respecto a otras medidas de
tendencia central , la desventaja : ser muy sensible a valores extremos.

Formula
n

x i
x i 1
n
Donde
x  Media Aritmetica o promedio
xi  Datos
n  Tamaño de la muestra

Página 21 de 55
Ejemplo:
Si tomamos los datos del ejemplo de: Para la aceptación por parte de la
interventoría de una placa de entrepiso se tomaron muestras que al fallarlas su
resistencia a compresión en ( P.S.I) fue:

El promedio es:
50

 3023  2815  2759  ...............  2425


i 1
x
50
x  2711 .56 P.S .I

Media aritmética para datos agrupados

Si tenemos la distribución de frecuencias también podemos aproximar el promedio


mediante:

x
x c * Fi
n
Donde
x  Media Aritmetica o promedio
xc  Intervalo Medio de clase
Fi  Frecuencia Absoluta
n  Tamaño de la muestra

Ejemplo: Retomando el ejemplo de las resistencias medidas, tendremos:

Página 22 de 55
Frecuencia
Intervalos de Clase XC XC*Fi
Absoluta Fi
2395_2479,875 2437,4375 10 24.374,38
2479,875_2564,75 2522,3125 7 17.656,19
2564,75_2649,625 2607,1875 1 2.607,19
2649,625_2734,5 2692,0625 9 24.228,56
2734,5_2819,375 2776,9375 10 27.769,38
2819,375_2904,25 2861,8125 2 5.723,63
2904,25_2989,125 2946,6875 4 11.786,75
2989,125_3074 3031,5625 7 21.220,94
Σ= 50 135.367,00
20%

135367
x  2707 .34
50 14%

Como se observa es similar a la media tomando todos los datos (2711.56) , pero
hay que tener en cuenta que la media de los datos agrupados es una
aproximación a la de desagrupados.

Media Ponderada 4%
2%
A partir del concepto de la media para datos agrupados podemos extenderlo con
esta medida en la que básicamente se le asigna un peso o ponderación a cada
dato.

Formula

x * p i i
xp  i 1

p i

Donde
x p  Media Ponderada
xi  Datos
pi  Ponderacion o peso para cada dato

Ejemplo :

Página 23 de 55
Para la asignación de una licitación se tendrá en cuenta el proponente que se
encuentre más cerca del promedio del pecio propuesto, ponderado con los años
de experiencia certificada en obras similares. Una vez abiertas las propuestas se
tienen los siguientes datos:

AÑOS DE
PROPONENTE PRECIO ( Miles) "xi" EXPERIENCIA xi*pi
"Pi"
Compañía "A" 15328 5 76640
Compañía "B" 13890 8 111120
Compañía "C" 17326 15 259890
Compañía "D" 16280 12 195360
Σ= 40 643010

643010
xp   16075 ,25
40
La tabla de diferencias

PRECIO ( Miles)
PROPONENTE Dif con la xp
"xi"

Compañía "A" 15328 -747,25


Compañía "B" 13890 -2185,25
Compañía "C" 17326 1250,75
Compañía "D" 16280 204,75

Entonces la compañía a la que se adjudicaría seria la “D” , como se observa no es


precio más alto ni el más bajo , tampoco la que cuenta con más ni menos años de
experiencia.

1.4.2 Mediana: Se define como el valor central de los datos ordenados, tenemos
dos situaciones:
20%
a) Si el numero de datos es impar tendremos una sola posición que ocupara la
mediana y se tomara el valor de esta posición.
b) Si el número de datos es par la mediana será ocupada por dos posiciones y se 20%
tomara el promedio aritmético de los valores en dichas posiciones. 18%

La posición se calcula asi: 14%

Página 24 de 55
4%
2%
n 1
P  
2 2
Donde
n  N º de datos
La ventaja que tiene esta medida de tendencia central es que no se deja sesgar
por valores extremos.

Ejemplo.

Retomando el mismo ejemplo de las resistencias:


1) Calculamos la posición:
 50 1  51
P    25.5
 2 2 2
2) Ordenamos los datos:

Posicion Dato Posicion Dato


1 2395 24 2703
2 2413 25 2714
3 2422 26 2715
4 2425 27 2723
5 2435 28 2737
6 2445 29 2759
7 2454 30 2769
8 2458 31 2770
9 2468 32 2788
10 2473 33 2801
11 2509 34 2806
12 2512 35 2813
13 2540 36 2815
14 2545 37 2816
15 2553 38 2847
16 2561 39 2868
17 2562 40 2909
18 2576 41 2910 Posicion Dato
19 2664 42 2917 47 3040
20 2675 43 2989
21 2679 44 3004
48 3045
22 2696 45 3004 49 3057
23 2702 46 3023 50 3074

Según la posición la mediana estará entre los la datos de la posición 25 y 26


entonces.
2714  2715
Me   2714 ,5
2

Página 25 de 55
Que se puede interpretar como que el 50% de las muestras están por debajo de
este valor y el restante por encima del mismo.

1.4.3 Moda : También se le denomina modo o valor modal y se define como el


dato que más se repite , presenta grandes desventajas , la más importante es que
puede haber muestras que tengan más de una moda ( bimodal o multimodal) y en
ocasiones se pueden tener modas sumamente sesgadas para tomarla como
valores representativos de la muestra.

Ejemplo:
Con el mismo ejemplo de las resistencias:

M O  3004
Como se aprecia si tomáramos este dato como valor representativo de la muestra
tendría un sesgo altísimo.

1.3.5.4 Media Geométrica: Se define como la raíz enésima del producto de los
datos así:
n
Mg  n
x
i 1
i

Donde
M g  Media geometrica
n  Tamañode la muestra
  Pr oducto
xi  Datos
Las ventajas que tiene no es muy influenciable por datos extremos y se usa
generalmente cuando los valores que se están trabajado siguen una progresión
geométrica o aproximadamente geométrica, ( por ejemplo el cálculo de un valor
representativo a una serie de porcentajes : tasas ) , sus desventajas es que si uno
de los datos es cero su calculo dará cero.

Ejemplo:
Con el mismo ejemplo de las resistencias aunque no sería del todo acertado tomar
como valor representativo de estos datos la media geométrica, se ilustrara para
demostrar que en general da más bajo que la media aritmética:
M g  50 2395 * 2413 * ................* 3074
M g  2704 .11
Si la comparamos con la media aritmética (2711,56) efectivamente es menor.

Página 26 de 55
1.4.5 Media Armónica: Es otro estadígrafo de posición se debe utilizar cuando las
variables medidas son de proporción inversa (velocidades, aceleración, tiempos
que demoran trabajadores en realizar una actividad etc).

n
xA  n
1

i 1 xi
Ejemplo:
Con el mismo ejemplo de las resistencias a la rotura aunque no sería del todo
acertado tomar como valor representativo de estos datos la media armonica , se
ilustrara para demostrar que en general da el estadígrafo más bajo:

50
xA  50
 1 1 1 
  2395  2413  ..............  3074 
i 1

50
xA 
0,00041753 7  0,00041442 2  ............  0,00032530 9
50
xA   2696,70
0,01854117 3
Como se observa da más bajo que el promedio y la media geométrica.

1.5 Medidas de Dispersión

Nos determinan la variabilidad de un proceso ya que con las medidas de


tendencia central no tenemos un resumen adecuado de la naturaleza de la
muestra.

1.5.1 Rango
Simplemente es la diferencia entre el mayor valor y el menor , si este intervalo es
alto existirá bastante dispersión entre los datos de la muestra.

Rango  x máx  x mín

Página 27 de 55
Ejemplo:
Con el mismo ejemplo de las resistencias a la rotura tendríamos:

Rango  3074  2395


Rango  679

1.5.2 Varianza y desviación estándar

Es la medida de dispersión más utilizada en estadística, nos determina como se


agrupan o se dispersan los datos alrededor de un promedio.

Formula de la Varianza

 x 
n
2
i x
S2  i 1

n 1
Donde
S 2 : Varianza
xi : Datos
x : Media Artimetica
n : Numero de datos
Tiene el inconveniente que las unidades ( de la variable) quedan al cuadrado , por
lo tanto su interpretación no es clara , simplemente si es muy alta existirá gran
dispersión, y si es baja los datos estarán bastante agrupados respecto al
promedio. Para evitar el inconveniente tenemos la desviación estándar que es la
raíz de la varianza.

 x 
n
2
i x
S i 1

n 1
Donde
S : Desviacion Es tan dar
xi : Datos
x : Media Artimetica
n : Numero de datos

Página 28 de 55
Ejemplo:
Con el mismo ejemplo de las resistencias a la rotura tendríamos:
xi x  x x  x
i i
2

2395 -316,56 100210,234


2413 -298,56 89138,0736
2422 -289,56 83844,9936
2425 -286,56 82116,6336
2435 -276,56 76485,4336
2445 -266,56 71054,2336
2454 -257,56 66337,1536
2458 -253,56 64292,6736
2468 -243,56 59321,4736
2473 -238,56 56910,8736
2509 -202,56 41030,5536
2512 -199,56 39824,1936
2540 -171,56 29432,8336
2545 -166,56 27742,2336
2553 -158,56 25141,2736
2561 -150,56 22668,3136
2562 -149,56 22368,1936
2576 -135,56 18376,5136
2664 -47,56 2261,9536
2675 -36,56 1336,6336
2679 -32,56 1060,1536
2696 -15,56 242,1136
2702 -9,56 91,3936
2703 -8,56 73,2736
2714 2,44 5,9536
2715 3,44 11,8336
2723 11,44 130,8736
2737 25,44 647,1936
2759 47,44 2250,5536
2769 57,44 3299,3536
2770 58,44 3415,2336
2788 76,44 5843,0736
2801 89,44 7999,5136
2806 94,44 8918,9136
2813 101,44 10290,0736
2815 103,44 10699,8336
2816 104,44 10907,7136
2847 135,44 18343,9936
2868 156,44 24473,4736
2909 197,44 38982,5536
2910 198,44 39378,4336
2917 205,44 42205,5936
2989 277,44 76972,9536
3004 292,44 85521,1536
3004 292,44 85521,1536
3023 311,44 96994,8736
3040 328,44 107872,834
3045 333,44 111182,234
3057 345,44 119328,794
3074 362,44 131362,754

x  2711,56
Sumas 0 2023922,32

Por lo tanto la varianza será:

Página 29 de 55
2023922 ,32
S2 
50  1
S 2  41304,54

Su interpretación será : el valor representativo de la muestra es de 2711.56 P.S.I.


con una dispersión de 41304.54 ( P.S.I) al cuadrado.

La desviación estándar será:

S  41304,54
S  203,24
Cuya interpretación es : el valor representativo de la muestra es de 2711.56 P.S.I.
con una dispersión de todos los datos con respecto a la media de 203.24 ( P.S.I).

1.6 Asimetría o sesgo

Este estadígrafo nos permite identificar si los datos se distribuyen de manera


uniforme con respecto al promedio tendremos tres casos.

Asimetría Negativa: Nos indica que en la distribución de la variable existen más


datos superiores al promedio.

Asimetría Positiva: Nos indica que en la distribución de la variable existen más


datos inferiores al promedio.

Página 30 de 55
Formula
3
n 
n x x
CA    i
n - 1n - 2 i 1  s 

Donde
CA : Coeficient e de Asimetria
n : Numero de Datos
xi : Datos
x  Pr omedio
s : Deviacion Es tan dart

Si el coeficiente de asimetría da negativo se dice que la distribución de la variable


tiene cola derecha, y el caso contrario cola Izquierda , si da cero se dice que la
distribución es simétrica.

Página 31 de 55
Ejemplo:
Con el mismo ejemplo de las resistencias a la rotura tendríamos la siguiente tabla:

xi x  x
i 
3
 xi  x 

 s 
2395 -316,56 -3,77895284
2413 -298,56 -3,17028442
2422 -289,56 -2,89213835
2425 -286,56 -2,80317406
2435 -276,56 -2,51983126
2445 -266,56 -2,25625561
2454 -257,56 -2,03534769
2458 -253,56 -1,94198374
2468 -243,56 -1,72116005
2473 -238,56 -1,61732105
2509 -202,56 -0,99006664
2512 -199,56 -0,946725
2540 -171,56 -0,60152194
2545 -166,56 -0,55044698
2553 -158,56 -0,47488043
2561 -150,56 -0,40656705
2562 -149,56 -0,39851964
2576 -135,56 -0,296755
2664 -47,56 -0,0128153
2675 -36,56 -0,00582133
2679 -32,56 -0,00411203
2696 -15,56 -0,00044878
2702 -9,56 -0,00010408
2703 -8,56 -7,4718E-05
2714 2,44 1,7305E-06
2715 3,44 4,8493E-06
2723 11,44 0,00017835
2737 25,44 0,00196135
2759 47,44 0,01271854
2769 57,44 0,02257598
2770 58,44 0,02377574
2788 76,44 0,05320659
2801 89,44 0,08523123
2806 94,44 0,10033935
2813 101,44 0,12434579
2815 103,44 0,13184659
2816 104,44 0,13570753
2847 135,44 0,29596762
2868 156,44 0,45608604
2909 197,44 0,91687216
2910 198,44 0,93087425
2917 205,44 1,03290024
2989 277,44 2,54396181
3004 292,44 2,97929622
3004 292,44 2,97929622
3023 311,44 3,59854164
3040 328,44 4,22057372
3045 333,44 4,41627849
3057 345,44 4,91044934
3074 362,44 5,67168008

x  2711,56
S= 203,2351769
Sumas 0 6,21936346

Página 32 de 55
50
CA  * 6,21936346
50 - 150 - 2
CA  0,13221435 9

Como el coeficiente dio mayor que cero podemos interpretar como, que en la
distribución existen más datos ponderados por debajo del promedio (2711.56)
tiene cola izquierda.

1.6.1 Curtosis.

Este último estadígrafo nos permite determinar el grado de concentración que


presentan los valores con respecto al promedio. Por medio del Coeficiente de
Curtosis, podemos determinar si existe una gran concentración de valores
(Leptocúrtica), una concentración simétrica (Mesocúrtica) o una baja
concentración (Platicúrtica).

Formula
n n  1 3n  1
4
n 
xi  x 
2

n - 1n - 2n  3 
Cu    
 s  n  2 n  3
i 1  
Donde
Cu : Curtosis
n : Numero de Datos
xi : Datos
x  Pr omedio
s : Deviacion Es tan dart

Página 33 de 55
Si el coeficiente de curtosis da negativo se dice que la distribución de la variable
es plana ( platicurtica) , y el caso contrario apuntada ( leptocurtica) , si da cero se
dice que la distribución es mesocurtica.

Ejemplo:
Con el mismo ejemplo de las resistencias a la rotura tendríamos la siguiente tabla:

Página 34 de 55
xi x  x
i
 s 
4
 xi  x 
 
 
2395 -316,56 5,88611346
2413 -298,56 4,6572652
2422 -289,56 4,12058381
2425 -286,56 3,95245336
2435 -276,56 3,42895627
2445 -266,56 2,95926869
2454 -257,56 2,57939674
2458 -253,56 2,42285516
2468 -243,56 2,0626633
2473 -238,56 1,89843173
2509 -202,56 0,98677749
2512 -199,56 0,92960502
2540 -171,56 0,50777186
2545 -166,56 0,45111506
2553 -158,56 0,37049217
2561 -150,56 0,30119163
2562 -149,56 0,2932691
2576 -135,56 0,1979387
2664 -47,56 0,00299897
2675 -36,56 0,0010472
2679 -32,56 0,00065878
2696 -15,56 3,4359E-05
2702 -9,56 4,8959E-06
2703 -8,56 3,147E-06
2714 2,44 2,0776E-08
2715 3,44 8,208E-08
2723 11,44 1,0039E-05
2737 25,44 0,00024551
2759 47,44 0,00296882
2769 57,44 0,00638061
2770 58,44 0,00683668
2788 76,44 0,02001185
2801 89,44 0,03750867
2806 94,44 0,04662603
2813 101,44 0,06206424
2815 103,44 0,06710556
2816 104,44 0,06973839
2847 135,44 0,19723876
2868 156,44 0,35107161
2909 197,44 0,89072789
2910 198,44 0,90891099
2917 205,44 1,04410579
2989 277,44 3,47280808
3004 292,44 4,28698122
3004 292,44 4,28698122
3023 311,44 5,51444797
3040 328,44 6,82069538
3045 333,44 7,24561526
3057 345,44 8,34631901
3074 362,44 10,1146059

x  2711,56
S= 203,235177
Sumas 0 91,8109017

Página 35 de 55
El coeficiente de curtosis será:

5050  1 350 - 1
2
Cu  * 91,8109017 4 -
50 - 150 - 250  3 50  250  3
Cu  -1,0749493 46

La interpretación es que la distribución es plana ( platicurtica) en el contexto del


problema podemos establecer que los datos en general están alejados de la
media .

Página 36 de 55
UNIDAD ACADÉMICA No. 02.

Nombre de la Unidad: Introducción a la probabilidad.

Introducción:

La Teoría de la probabilidad se extiende prácticamente a todas las áreas de las


ciencias naturales, sociales y por supuesto a la ingeniería. Sus raíces se
encuentran en una sencilla teoría matemática de los juegos de azar que fue
fundada hace más de tres siglos. En la sociedad francesa en 1650 el juego era un
entretenimiento aceptado y con pocas restricciones legales, como cada vez se
complicaban los juegos, se creó la necesidad de un método racional para calcular
las probabilidades de los diversos juegos. Antoine Gombauld , más conocido como
el caballero de de Meré, jugador profesional tuvo la idea de consultar en parís al
famoso matemático y filosofo Blaise Pascal sobre algunas cuestiones relacionadas
con los juegos de azar , lo que dio origen a un intercambio de correspondencia
con Pierre Ferman , de Toulose . Esta correspondencia corresponde el origen de
la teoría moderna de la probabilidad.

Objetivo General de la Unidad: Que el estudiante se apropie y maneje los


axiomas de probabilidad, las técnicas de conteo y el teorema de bayes.

Objetivos Específicos del Unidad:

 Manejar el concepto de la probabilidad a priori.


 Identificar y aplicar los axiomas para: sucesos mutuamente excluyentes,
sucesos compatibles, sucesos independientes y sucesos dependientes.
 Comprender el concepto de espacio muestral y las técnicas de conteo para
calcularlo.
 Entender la vinculación de la probabilidad a posteriori (Teorema de Bayes)

RESUMEN

En el presente capitulo se definirán las reglas y propiedades básicas de la


probabilidad, como también establecer las condiciones mínimas que deben
darse para que una función definida sobre un conjunto de eventos puedan
determinar sus probabilidades.

GLOSARIO

Página 37 de 55
Probabilidad1: Se define como el grado La probabilidad es la posibilidad
que existe entre varias posibilidades, que un hecho o condición se
produzcan. La probabilidad, entonces, mide la frecuencia con la cual se
obtiene un resultado en oportunidad de la realización de un experimento
sobre el cual se conocen todos los resultados posibles gracias a las
condiciones de estabilidad que el contexto supone de antemano.
1Tomadode

http://www.definicionabc.com/general/probabilidad.php#ixzz2TCUO6
Axioma: Proposición clara y evidente que no necesita demostración
Sucesos: Cada uno de los posibles resultados que no se pueden
descomponer en otros más simples en un experimento aleatorio.
Espacio Muestral: Conjunto total de sucesos elementales.

Desarrollo temático.
2.1 Conceptos de probabilidad y sus propiedades.
2.2 Axiomas de Probabilidad
2.3Técnicas de Conteo
2.4 Teorema de Bayes

2.1 Conceptos de probabilidad y sus propiedades.

En la actualidad la probabilidad guarda una estrecha relación con la teoría de


conjuntos y su aplicación de mayor importancia está en el campo de la estadística
inferencial para la tomas de decisiones, en la estadística el uso de predicciones es
de gran utilidad en las investigaciones por muestreo ya que debido a las
imposibilidad ( ensayos destructivos) o costos , no se pueden realizar con todos
los elementos de la población.

2.1.1 Definición básica de la probabilidad: Se define como el número de éxitos


sobre el número de posibilidades en un experimento (Espacio Muestral)

N º de Exitos
p
N º de Posibilidades

Ejemplo 1:

Página 38 de 55
Si lanzamos tres monedas equilibradas cual es la probabilidad de obtener:
a) Dos caras y un sello en cualquier orden
b) Dos caras y un sello este orden estricto.
 El numero de posibilidades (Espacio Muestral se designa con “S” ) es:

cara, cara, cara ; cara, cara, sello ; cara, sello , cara ; cara, sello , sello  
S  
sello , cara, cara ; sello , cara, sello ; sello , sello , cara ; sello , sello , sello 

Como observamos existen ocho posibilidades Fermat consideraba que estos ocho
casos (sucesos) eran recíprocamente simétricos, o, en otras palabras, igualmente
posibles.

 Para el literal a) tenemos como éxito


cara, cara, sello ; cara, sello , cara 
S   
 sello , cara, cara  
Por lo tanto la probabilidad solicitada estará dada por:

N º de Exitos 3
p   0.375  38%
N º de Posibilidades 8
Que se puede interpretar como: si realizamos el experimento cien veces en
aproximadamente 38 obtendremos alguno de estos resultados (dos caras y un
sello en cualquier orden).

 Para el literal b) tendríamos solamente un éxito

S   cara , cara , sello 

N º de Exitos 1
p   0.125  13%
N º de Posibilidades 8

Ejemplo 2.

Si lanzamos dos dados equilibrados, determinar la probabilidad de que:


a) La suma de sus dos caras sea cuatro
b) La suma de sus dos caras sea siete.

 El numero de posibilidades (Espacio Muestral se designa con “S” ) es:

Página 39 de 55
1,1; 1,2; 1,3; 1,4; 1,5; 1,6  
2,1; 2,2 ; 2,3; 2,4 ; 2,5; 2,6 
 
3,1; 3,2; 3,3; 3,4 ; 3,5; 3,6 
S  
 4,1; 4, 2 ; 4,3 ; 4, 4 ; 4,5 ; 4, 6 
5,1; 5,2; 5,3; 5,4; 5,5; 5,6 
 
6,1; 6,2; 6,3; 6,4; 6,5; 6,6 

Son treinta y seis posibilidades

 Para el literal a) tenemos como éxito


S   2,3; 2,2 3,1
Por lo tanto la probabilidad solicitada estará dada por:

N º de Exitos 3
p   0.083  8%
N º de Posibilidades 36
Que se puede interpretar como: si realizamos el experimento cien veces en
aproximadamente 8 obtendremos este resultado.

 Para el literal b) tendríamos los siguientes éxitos

S   1,6 ; 2,5; 3,4 ; 4,3; 5,2 ; 6,1

N º de Exitos 6
p   0.16  17%
N º de Posibilidades 36
Es decir en 100 lanzamientos se obtienen aproximadamente 17 éxitos.

2.1.2 Propiedades básicas y principios matemáticos de la probabilidad:

Como se observa en los anteriores ejemplos la teoría de la probabilidad consiste


en proporcionar un modelo matemático adecuado a la descripción e interpretación
de cierta clase de fenómenos observados. Cualquier intento de describir los
fenómenos observados lleva implícita cierta idealización de los datos reales
observados es decir el modelo matemático solo puede proporcionar una
aproximación de la realidad.

Página 40 de 55
2.1.2.1 Escala de Probabilidad

Las propiedades básicas de las probabilidades teóricas se obtendrán mediante las


propiedades de las razones frecuenciales estadísticas observadas. Si
consideramos un experimento aleatorio (fenómeno que tiene la particularidad que
dé al ser observado, no se puede predecir con exactitud cuál será el resultado
observado) la probabilidad de ocurrencia de un suceso “A” satisface la siguiente
desigualdad.
0  P  A  1
Es decir toda probabilidad estará entre cero y uno en términos absolutos o entre
cero y cien por ciento.

De otra parte si tenemos la probabilidad de éxito de un suceso podemos tener la


probabilidad de fracaso.

P A  P A  1
P A  1  P A

Si en particular un suceso es cierto, es decir, un hecho que se presenta cada vez


que se realice el experimento su probabilidad será uno, por ejemplo la
probabilidad de que al lanzar una moneda con dos caras se obtenga cara es :

N º de exitos 2
p  1
N º Posibilidades 2
Por otra parte si un suceso es imposible su probabilidad es cero, un ejemplo
análogo al anterior podría ser con la misma moneda obtener sello.
N º de exitos 0
p  0
N º Posibilidades 2
2.1.2.2 Reglas Aditivas

Si representamos por A y B dos sucesos que solamente uno de ellos puede ocurrir
en un solo ensayo, se dice que son mutuamente excluyentes, en otras palabras si
ocurre uno no puede suceder el otro. La probabilidad conjunta de que se den los
dos sucesos está dada por :

Página 41 de 55
A B

P  A  B   P  A  P B 
Si tenemos más sucesos se puede extender este concepto

P A  B  C......  N   P A  PB   PC   .........P N 

Ejemplo 1:

Si tenemos un mazo de 52 cartas y extraemos al azar una de ellas ¿ la


probabilidad de obtener una carta negra o una figura roja? , también la
probabilidad de no obtener una carta negra o una figura roja.

El espacio Muestral de una baraja de 52 es:

AS 2-10 J,K,Q
Diamantes 1 9 3
Corazones 1 9 3
Picas 1 9 3
Tréboles 1 9 3

N=26 FR=18

Página 42 de 55
PN  FR  PN   PFR

PN  FR 
26 18 44
   0.846  85%
52 52 52
PN  FR  1  PN  FR

PN  FR  1 
44 8
  0.154  15%
52 52
Ejemplo 2:

Si tenemos una caja con seis bolas rojas, cuatro negras y tres rojas si extraemos
una al azar, determinar la probabilidad de que sea negra o roja.

B=6 B=4

R=3

P  N  R   P  N   P R 

PN  FR 
4 3 7
   0.538  54%
13 13 13
Si tenemos sucesos que comparten alguna característica o que no son
mutuamente excluyentes es decir cuando la posibilidad de que ocurra un suceso
no impide la ocurrencia del otro. En este caso la probabilidad de los dos sucesos
se determina asi:

Página 43 de 55
P  A  B   P  A  P B   P  A  B 
Ejemplo :

Si tenemos un mazo de 52 cartas y extraemos al azar una de ellas ¿ la


probabilidad de obtener un trébol o un as.

PT  A  PT   P A  PT  A

PT  A 
13 4 1
 
52 52 52
PT  A 
16
 0.308  31%
52

Si tenemos tres sucesos que comparten características el axioma es:

P A  B  C   P A  PB   PC   P A  B   P A  C   PB  C   P A  B  C 

Ejemplo :

Si tenemos un mazo de 52 cartas y extraemos al azar una de ellas ¿la


probabilidad de obtener un corazón o un as o una carta roja.

PC  As  R   PC   P As   PR   PC  As   PC  R   P As  R   PC  As  R 

Página 44 de 55
PC  As  R  
13 4 26 1 13 2 1
     
52 52 52 52 52 52 52
PC  As  R  
28
 0.538  54%
52

2.1.2.3 Reglas Multiplicativas

Sucesos Independientes
Dos sucesos son independientes si la probabilidad de presentación de uno no se
ve afectada por el otro, hay que anotar que el enlace en este tipo de sucesos es
“ i “ es decir que se den el uno y el otro, también hay que tener en cuenta que en
estos experimentos el muestreo se hace con reposición. El axioma es:

P A  B  C.......N   P A * PB  * PC  * * * *P N 


Ejemplo 1
Si tenemos un mazo de 52 cartas y extraemos al azar dos de ellas con
reposición (extraemos la primera anotamos el resultado y nuevamente vuelve
al mazo para extraer la segunda) ¿ la probabilidad de obtener una carta negra
y una figura roja?

PN  FR  PN  * PFR

PN  FR 
26 3 78
*   0.0288  2.88%
52 52 2704

Observe que el numero de posibilidades de este suceso “ 2704” es similar al del


lanzamiento de una moneda , que se puede generalizar así:
Tamaño S  m n
Donde m: El número de opciones
n: Numero de ensayos

Para la moneda , si lanzamos tres monedas


Tamaño S  23  8
Al extraer dos cartas con reposición
Tamaño S  52 2  2704
Ejemplo 2

Si tenemos un mazo de 52 cartas y extraemos al azar tres de ellas con


reposición (extraemos la primera anotamos el resultado y nuevamente vuelve
al mazo para extraer la segunda) ¿ la probabilidad de obtener dos figuras y un
as?

Página 45 de 55
P  F  F  A  P  F  * P  F  * P  A

PN  FR 
12 12 4 576
* *   0,0040965  4,09 / 1000
52 52 52 140608
Ejemplo 3

Si tenemos una caja con seis bolas blancas cuatro negras y dos rojas al
extraer al azar tres de ellas con reposición (extraemos la primera anotamos
cual es y nuevamente vuelve a la caja para extraer la segunda) ¿la
probabilidad de obtener: una blanca , una no blanca y otra negra?

PB  B  N   PB * PB * PN 

PN  FR 
6 6 4 144
* *   0,08333333  8%
12 12 12 1708
Ejemplo 4

Cuatro amigos se dirigen a un lugar , toman cuatro rutas diferentes de acuerdo al


riesgo que se corre de tener algún accidente . Si se han tomado datos durante
muchos años y partir de las frecuencias se asignan las probabilidades de riesgo
a cada ruta : 0.2; 0.15; 0.25; 0.10 . ¿Encuentre la probabilidad : a) de que ninguno
sufra accidentes? b) Que los cuatro sufran accidentes ¿ c) los dos primeros sufran
accidentes y los restantes no?

PSA  Pr obablidad de que sufra acccidentes


P SA  Pr obablidad de que no sufra acccidentes

Indivuduo P(SA) P´(SA)


1 0.2 0.8
2 0.15 0.85
3 0.25 0.75
4 0.1 0.9

a) P SA1  2  3  4  P SA1* P SA2* P SA3* P SA4


    
PSA1  2  3  4  0.8 * 0.85 * 0.75 * 0.9  0.459  46%

b) PSA1  2  3  4  PSA1* PSA2* PSA3* PSA4


PSA1  2  3  4  0.2 * 0.15 * 0.25 * 0.1  0.00075  8 / 10.000

c) PSA1  SA2  SA 3  SA 4  PSA1* PSA2* P SA3* P SA4


   
PSA1  2  3  4  0.2 * 0.15 * 0.75 * 0.9  0,02025  2%

Página 46 de 55
Sucesos Dependientes
Los sucesos se consideran dependientes si la probabilidad en un segundo suceso
se ve afectado por el primero y en el tercero por lo que haya sucedido en el
primero y el segundo. Es de anotar que en este tipo de experimentos el muestreo
se realiza sin reposición. El axioma es:


P A  B  C.......N   P A * PB A* PC B A* * * *P N . * * * * * C B A 
Que se lee: El primer suceso será el numero de éxitos sobre el espacio muestral ,
para el segundo suceso será la probabilidad del segundo dado que ya se evaluó la
probabilidad del primero y así sucesivamente.

Realizaremos los mismos ejemplos de los sucesos independientes pero con


reposición.

Ejemplo 1

Si tenemos un mazo de 52 cartas y extraemos al azar dos de ellas sin


reposición ¿la probabilidad de obtener una carta negra y una figura roja?

PN  FR  PN  * PFR N 

PN  FR 
26 3 78
*   0,02941176  2.9%
52 51 2652
Que fue un poco mayor que si el experimento fuera con reposición, aunque no se
puede afirmar que en sucesos dependientes necesariamente la probabilidad es
mayor.

Ejemplo 2

Si tenemos un mazo de 52 cartas y extraemos al azar tres de ellas sin


reposición ¿ la probabilidad de obtener dos figuras y un as?
PF  F  A  PF * PF F * PA F F 

PN  FR 
12 11 4 528
* *   0,0039819  3,98 / 1000
52 51 50 132600
Que fue un poco menor que si el experimento fuera con reposición, lo que
comprueba que no se puede afirmar que en experimentos con reposición la
probabilidad sea mayor o menor , es necesario evaluarla en cada caso.

Página 47 de 55
Ejemplo 3

Si tenemos una caja con seis bolas blancas cuatro negras y dos rojas al
extraer al azar cuatro de ellas sin reposición ¿la probabilidad de obtener: una
blanca , una no blanca , una negra y otra roja?

En este problema tenderemos dos situaciones la primera si asumimos que en


la segunda extracción la no blanca haya sido negra:
PB  B  N  R   PB  * PB B * PN B B * PR N B B 
6 64 N ,2 R  3 2
PN  FR 
216
* * *   0,01818  1.8%
12 11 10 9 11880
La segunda si en la segunda extracción la no blanca haya sido roja.

PB  B  N  R   PB * PB B * PN B B * PR N B B 


6 64 N ,2 R  4 1
PN  FR 
144
* * *   0,012121  1.2%
12 11 10 9 11880
Como son sucesos mutuamente excluyentes la probabilidad total será la suma de
los dos eventos.
PB  B  N  R   0.01818  0.01212  0.0303  3%

Probabilidad Condicional

La probabilidad de que un evento B ocurra cuando se sabe que ya ocurrió un


evento A se la llama probabilidad condicional y se denota por :

P A  B 
P B A 
P  A
Ejemplo:
Supongamos que se realizo una encuesta donde se les pregunto a hombres y
mujeres sobre su situación de empleo obteniéndose:

Empelado Desempleado Total


Hombre 490 60 550
Mujer 160 250 410
Total 650 310 960

Una de estas personas se seleccionara al azar para que realizar un viaje con
todos los gastos pagos.

Página 48 de 55
Si llamamos el evento elegir hombre dado que tiene empleo

PH E  
490
 0,75384615  75%
650
A partir del espacio muestral podemos deducir la probabilidad que tenga empleo.

P E  
650
 0,67708333  68%
960
Y de la misma manera la probabilidad de que en todo el grupo sea elegido un
hombre empleado

P E  H  
490
 0,51041667  51%
960
Al aplicar probabilidad condicional

490
PE  H  960 490
PH E      0.75384615  75%
P E  650 650
960
2.3 Técnicas de Conteo
Uno de los principales retos de la estadística es establecer el tamaño del
espacio muestral de los sucesos en un experimento, como también el número
de veces que ocurrirá un evento de una forma rápida. En este aparte se
trabajaran las técnicas para contar sucesos.

Regla del Producto


Si una operación se puede llevar a cabo en n 1 formas, y si cada una de ellas
se puede realizar una segunda operación en n2 formas, entonces las dos
operaciones se pueden ejecutar de n1*n2 formas.

Ejemplo 1

Una persona desea construir su casa, para lo cual considera que puede
construir los cimientos de su casa de cualquiera de dos maneras (concreto o
block de cemento), mientras que las paredes las puede hacer de adobe, o
ladrillo y el techo puede ser de concreto o lámina galvanizada ¿cuántas
maneras tiene esta persona de construir su casa?

Si enumeramos el espacio muestral:

Página 49 de 55
Concreto, adobe, Concreto ; Concreto, Ladrillo, Concreto  
Concreto, Ladrillo, La min a Galvanizada ; Concreto, adobe, La min a Galvanizada  
 
S  
  Block Cemento, adobe , Concreto ;  Block Cemento, Ladrillo, Concreto  
Block Cemento, Ladrillo, La min a Galvanizada ; Block Cemento, adobe, La min a Galvanizada 

Son ocho posibilidades mediante la regla del producto.

Tamaño S  n1 * n 2 * n3
Donde
n1 : Cimientos
n 2 : Muros
n3 : Techo
Tamaño S  2 * 2 * 2  8

Ejemplo 2

Cuántas placas para automóvil pueden ser diseñadas si deben constar de tres
letras seguidas de cuatro números, si las letras deben ser tomadas del
abecedario español (26 Letras) y los números de entre los dígitos del 0 al 9?,
a. Si es posible repetir letras y números, b. No es posible repetir letras y
números, c. Cuántas de las placas diseñadas en el inciso b empiezan por la
letra D y empiezan por el cero

a) La primer placa para este caso será :


A A A 0 0 0 0
n1=26 n2=26 n3=26 n4=10 n5=10 n6=10 n7=10

Tamaño S= 263*104= 175´760.000

b) La primer placa para este caso será :


A B C 0 1 2 3
n1=26 n2=25 n3=24 n4=10 n5=9 n6=8 n7=7

Tamaño S= 26*25*24*10*9*8*7= 78´624.000


c) La primer placa para este caso será :
D A B 0 1 2 3
n1=1 n2=25 n3=24 n4=1 n5=9 n6=8 n7=7

Tamaño S= 1*25*24*1*9*8*7= 302.400

Página 50 de 55
Permutación simple
Se define como el número de arreglos posibles de un conjunto donde no se repiten los
elementos y no se puede replicar así mismo un evento , es de anotar que se cuenta el
orden de los elementos .

Formula
P  n!
Donde
n= Numero de elementos
!= Factorial

Ejemplo 1
Si tenemos la siguiente palabra AMO  de cuantas formas se pueden generar palabras (
sin sentido ortográfico) .

Si enumeramos el especio muestral seria

S  AMO ; AOM ; OMA; OAM ; MAO ; MOA


Son seis mediante la fórmula:

P=3! =1*2*3 =6

Ejemplo 2
¿De cuantas formas se pueden sentar a la mesa una familia de seis personas?
n= 6
P=6!=1*2*3*4*5*6=720

Permutación con Repetición


Se define como el número de arreglos posibles de un conjunto donde se repiten los
elementos y no se puede replicar así mismo un evento.

Formula
n!
n Pr1 , r2 , r3, .....rk 
r1!*r2!*r3!*........... * rk !
Donde
n= Numero de elementos
r1,r2,r3,……rn = Repeticiones
!= Factorial

Ejemplo 1
Si tenemos la siguiente palabra AMA de cuantas formas se pueden generar palabras (
sin sentido ortográfico) .

Si enumeramos el especio muestral será

Página 51 de 55
S  AMA; AAM ; MAA
Son tres mediante la fórmula:

3! 1* 2 * 3
3P2   3
2! 1* 2

Ejemplo 2
Si tenemos la siguiente palabra CARRASQUIL LA de cuantas formas se pueden generar
palabras ( sin sentido ortográfico) . La letra A , se repite tres veces , la letra R, dos veces y
la L dos veces.

12! 479001600
12 P3 , 2 , 2    19´958.400
3!*2!*2! 6*2*2
Variación
Se define como una permutación donde de un conjunto con “n” elementos , se
selecciona un subconjunto “r” y se establece el numero de arreglos posibles.

Formula

n!
n Pr 
n  r !
Ejemplo 1
Si tenemos la siguiente palabra AMO  de cuantas formas se pueden generar arreglos de
dos letras (sin sentido ortográfico).

Si enumeramos el especio muestral será

S  AM ; MA; OM ; MO ; AO; OA


Son seis mediante la fórmula:

3! 3!
3P 2   6
3  2! 1!
Ejemplo 2
En una urna que contiene 46 balotas numeradas se extraen 6 al azar ¿cuantos
resultados son posibles si me interesa el orden?.

n=46
r=6
46! 46! 5,5026E  57
46 P6     6.744´109. 680,00
46  6! 40! 8,1592E  47
Combinatoria

Página 52 de 55
Se define como el número posible de arreglos de un conjunto con “n” elementos ,
del cual se selecciona un subconjunto “r” sin contar el orden.

Formula

n!
nCr 
r !n  r !
Ejemplo 1
Si tenemos la siguiente palabra AMO  de cuantas formas se pueden generar arreglos de
dos letras sin contar el orden y sin sentido ortográfico.

Si enumeramos el especio muestral seria

S  AM ; OM ; AO
Son tres mediante la fórmula:

3! 3!
3C 2   3
2!3  2! 2!*1!

Ejemplo 2
En una urna que contiene 46 balotas numeradas se extraen 6 al azar ¿cuantos
resultados son posibles si no me interesa el orden?

n=46
r=6
46! 46! 5,5026E  57
46C 6     9´366.819
6!*46  6! 6!*40! 720 * 8,1592E  47

2.4 Teorema de Bayes

Lleva este nombre en honor al matemático ingles que en 1731 se convirtió en


reverendo de la iglesia presbiteriana en Tunbridge Wells , Estudió el problema
de la determinación de la probabilidad de las causas a través de los efectos
observados. Es decir la probabilidad a posteriori : Observado cierto suceso se
valora la probabilidad de su procedencia.

Regla de Bayes: Si los eventos B1,B2,………..,BK constituyen una partición del


espacio muestral S, donde P(BI)≠0 para i=1,2,………,k, entonces , para
cualquier evento A en S tal que P(A)≠0,

Página 53 de 55
PBR  A
PBR A  k

 P B  A
i 1
i

Ejemplo
Cierta fabrica de tornillos dispone de tres maquinas para su producción , la
proporción de tornillos por maquinas es : La maquina A el 35% , La maquina B
el 40% y La maquina C el 25% , debido a la calibración y vetustez algunos
tornillos resultan defectuosos, se han realizado conteos y se determino que el
porcentaje de tornillos defectuosos por maquina es: La maquina A el 5% , La
maquina B el 4% y La maquina C el 2% , toda la producción llega a un mismo
sitio, donde el encargado de control de calidad selecciona un tornillo al azar
que resulta ser defectuoso. ¿Cuál es la maquina donde está la mayor
probabilidad?

Para este problema es recomendable realizar un diagrama de árbol que en


este caso:

P(D)=0.05

P´(D)=0.95
P(A)=0.35

P(D)=0.04
P(B)=0.40

P´(D)=0.96

P(C)=0.25
P(D)=0.02

P´(D)=0.98

La probabilidad conjunta estará dada por:


Para la maquina A
P A  D   P A * PD   0.35 * 0.05  0,0175
P A  D  P A * PD   0.35 * 0.95  0,3325
 0.35

Página 54 de 55
Para la maquina B
PB  D   PB  * PD   0.40 * 0.04  0,016
PB  D  PB  * PD   0.40 * 0.96  0,384
 0.40
Para la maquina C
PC  D   PB * PD   0.25 * 0.02  0,005
PC  D  PB * PD   0.25 * 0.98  0,245
 0.25

La probabilidad de que el tornillo defectuoso provenga de la maquina A es:

P A  D 
PD A 
P A  D   PB  D   PC  D 

PD A 
0.0175
 0,45454545 5  45%
0.0175  0.016  0.005

La probabilidad de que el tornillo defectuoso provenga de la maquina B es:

P B  D 
PD B  
P A  D   PB  D   PC  D 

PD B  
0.016
 0,41558442  42%
0.0175  0.016  0.005
La probabilidad de que el tornillo defectuoso provenga de la maquina C es:
PC  D 
PD C  
P A  D   PB  D   PC  D 

PD C  
0.005
 0,12987013  13%
0.0175  0.016  0.005

Por lo tanto la maquina donde existe más probabilidad de que provenga el tornillo
defectuoso es la Maquina A

Página 55 de 55

Você também pode gostar