Escolar Documentos
Profissional Documentos
Cultura Documentos
FACULTAD DE INGENIERA
ESCUELA PROFESIONAL DE INGENIERA CIVIL
ESTADSTICA Y
PROBABGILIDAD I
ddddd PASO 10
PASO 6 PASO 7 PASO 8 PASO 9
METODOLOGIA DE LA INVESTIGACIN
Roberto Hernandez Carlos Fernndez Pilar Baptista
RECOLLECION DE DATOS
PRESENTACION DE DATOS
DATOS
RESUMEN DE DATOS
PREDICCION DE DATOS
CLASIFICACIN DE LA ESTADSTICA
ESTADSTICA DESCRIPTIVA:
Realiza el estudio sobre la poblacin completa, observando una caracterstica de la misma y
calculando unos parmetros que den informacin global de toda la poblacin.
ESTADSTICA INFERENCIAL:
Realiza el estudio descriptivo sobre un subconjunto de la poblacin llamado muestra y,
posteriormente, extiende los resultados obtenidos a toda la poblacin.
ESTADISTICA DESCRIPTIVA
POBLACION Descripcin
(N)
POBLACION
(N) Parmetro
Inferir
Muestra
(n) Estimador (Indicador)
RECOLECCION DE DATOS
4
Tema Fuentes de
problema Informacin
? POBLACIN (primaria-secundaria)
Objetivos Muestra
INSTRUMENTO
Cuestionario, Test, Examen escrito,
Gua de observacin, Entrevista, etc.
( VALIDEZ - CONFIABILIDAD )
Crear base de datos - Software
Tcnicas de recoleccin de datos
DEFINICIONES BASICAS
POBLACION (N)
Conjunto de elementos que determinan la cobertura de un estudio y tienen al
menos una caracterstica comn.
MUESTRA (n)
Subconjunto adecuado y representativo de la poblacin.
VARIABLE (X, Y, Z, )
Es una caracterstica de los elementos de una poblacin, es observable es
medible.
DATO
Es el valor que toma la variable en cada momento que es analizado.
Ejercicio:
Teniendo como referencia estas definiciones, construya una base de datos.
VARIABLE DE ESTUDIO
5
Se denomina variable en la investigacin cientfica a toda propiedad, rasgo,
aspecto, cualidad, dimensin, atributo etc., de una persona u objeto, si tal
propiedad puede asumir distintos estados o valores, sea por modificacin,
aumento o disminucin, y si esa variacin es observable y medible en una misma
o en distintos unidades de observacin.
VARIABLES ESTADISTICAS
Una variable estadstica es la variable de estudio operacionalizada. Mide una
caracterstica observable y medible, que vara entre los diferentes elementos de
una poblacin. La informacin que disponemos de cada individuo u objeto puede
ser resumido en una o varias variables.
Ejemplos:
CLASIFICACIN DE VARIABLES
SEGN LA NATURALEZA.
6
VARIABLE CUALITATIVA
DISCRETA
VARIABLE CUANTITATIVA
CONTINUA
SEGN LA RELACIN
.
VARIABLE INDEPENDIENTE (X)
VARIABLE INTERVINIENTE
PRESENTACION DE DATOS
CUADRO N 11.3:
7
E S TAC I O N E S PARTES PRINCIPALES
AOS VERANO OTOO INVIERNO PRIMAVERA TOTAL N DEL cuadro
2006 31.7 32.1 33.1 34.7 131.6 Ttulo
2007 38.5 36.8 38.2 37.2 150.7 Encabezamiento o conceptos
2008 37.9 38.7 38.2 38.8 153.6 Cuerpo
2009 41.3 41.7 44.8 45.5 173.3 Nota de pie o llamadas
2010 51.3 51.3 49.8 53.6 206.0 Fuente
2011 53.3 57.5 58.6 61.4 230.8 Nota de unidad de medida
2012 65.5 67.3 68.5 73.9 275.2 Elaboracin
2013 78.6 80.7 82.2 88.6 330.1
PROMEDIO 49.8 50.8 51.7 54.2 206.4
* Son las personas que llegan a la ciudad de Lima y se hospedan en el Hotel de la Polica, se registran y hacen un pago por el.
Fuente: Estadstica mensual del Casino de Polica - Lima-2013
SIMPLE ( fi )
ABSOLUTA
ACUMULADA (Fi)
FRECUENCIA
SIMPLE (hi)
RELATIVA
ACUMULADA (Hi)
N de
4 3 4 2 insistencias N de
3 2 2 2 docentes Fi hi Hi
4 4 2 2
4 3 2 3
4 2 2 4
4 3 2 Total
8
Ingreso Semanal de los trabajadores administrativos de las Universidades de Chimbote - 2014.
440 560 335 587 613 400 424 466 565 393
453 650 407 376 470 560 320 500 528 526
570 430 618 537 409 600 550 432 591 428
440 340 558 460 560 607 382 667 512 492
450 530 501 471 660 470 364 634 580 450
574 500 462 380 518 480 625 507 645 382
Ingreso N de Marca de
Semanal trabajadores Fi hi Hi Clase
[ 320 - 370 ) 4 4 0.067 0.067 345
[ 370 - 420 ) 8 12 0.133 0.200 395
[ 420 - 470 ) 14 26 0.233 0.433 445
[ 470 - 520 ) 9 35 0.150 0.583 495
[ 520 - 570 ) 11 46 0.183 0.766 545
[ 570 - 620 ) 8 54 0.133 0.899 595
[ 620 - 670 ) 6 60 0.100 1.00 645
TOTAL 60 1.00
REDUCCION DE DATOS
MEDIA
(X)
9
( )
MODA (Mo)
MEDIANA (Me)
PERCENTILES (Pi)
ESTADIGRAFOS RANGO ( R )
(Medidas de resumen)
DESVIACION MEDIA (D.M.)
DE DISPERSION
2
VARIANZA (S )
O VARIABILIDAD (2)
DE DEFORMACION
O ASIMETRIA
DE APUNTAMIENTO
O KURTOSIS
10
PREDICCIN DE DATOS
SIMPLE
(X,Y) *Parbola Y= a + b X + c X2
NO
LINEAL *Exponencial
* REGRESION *Potencial
Y ******
CORRELACION
MULTIPLE Y= Bo + B1 X1 + B2 X2
(X,Y)
(X,Y,Z) LINEAL Y= Bo + B1 X1 + B2 X2 + B3 X3
(X,Y,Z,W) *****
******
y 1 x1 ... k xk
NO
LINEAL
* PROMEDIOS MOVILES
* ESTIMACION PUNTUAL
* ESTIMACION INTERVLICA
* PRUEBA DE HIPTESIS
1.1. ESTADIGRAFOS
11
Son medidas de resumen que describen a una muestra. Son las que se utilizan como
ESTIMADORES de los parmetros, los estadgrafos de mayor uso son: La Media Aritmtica , la
Varianza, la desviacin estndar, el Coeficiente de Variacin, proporcin, etc.
Ejemplo1
Xi : 45,1 67,7 73,7 42,5 64,4 66,7 50,5 62,7 60,7 63,6
45.1 67.7 73.7 42.5 64.4 66.7 50.5 62.7 60.7 6.6
x 59.76
10
Mediana (Me)
Es la observacin que se encuentra en el centro cuando los datos estn ordenados, divide a los datos
en dos partes iguales de 50% cada una.
- Si n es impar:
la mediana es la observacin que est en el lugar (n+1)/2, esto es
12
- Si n es par:
la mediana es el promedio de las observaciones n/2 y n/2 +1, esto es
Ejemplo 2
Encuentra la mediana para el siguiente conjunto de datos
X i : 18 24 19 20 19 18 19 22 19 18 17 16 16 20 19
Se ordenan los datos en forma creciente o decreciente y la mediana ocupa el lugar (n+1)/2, en este
caso como n = 15 el lugar que ocupa la Me es, (15+1)/2 = 8 es decir el 8vo lugar.
X i : 16 16 17 18 18 18 19 (19) 19 19 19 20 20 22 24
Mediana = 19 aos
Ejemplo 3
Calcula la mediana para el siguiente conjunto de datos
X i : 62 71 64 66 58 62 65 68 70 58
X i : 58 58 62 62 (64 65) 66 68 70 71
Una vez ordenados, como el nmero de datos es par (10), se busca el nmero que tiene la
posicin n/2 y el que tiene la posicin n/2 +1, o sea 10/2 = 5 y 10/2 +1 = 6.
Los nmeros que tienen la posicin cuarta y quinta son 64 y 65. Estos nmeros se promedian y el
resultado ser la mediana.
13
Moda (Mo)
Es la observacin de mayor frecuencia.
Nota: Si ninguna observacin se repite, se dice que esos datos no tienen moda. Si todos los datos se
repiten el mismo nmero de veces, los datos sern multimodales.
Ejemplo4
Encuentra la moda de los siguientes datos
4 9567
Solucin
Como los datos slo existen una vez, este conjunto de datos no tienen moda.
Ejemplo5
Encuentra la moda del siguiente conjunto de datos
9 367985973
Solucin
El 3 se repite dos veces, el 7 se repite tambin dos veces, pero como el 9 se repite tres veces, este
ltimo nmero es la moda para este conjunto de datos.
Ejemplo6
Calcula la moda para los datos que se presentan a continuacin
6 786978568
Solucin
El mximo nmero de veces que se repiten los datos son tres, y hay dos datos que se repiten tres
veces, el 6 y el 8. El conjunto de datos es bimodal y sus modas son el 6 y el 8.
Ejemplo7
Calcula la moda para estos datos
8 65596865989
Solucin
En este conjunto de datos, todos se repiten tres veces. El 5, 6, 8 y el 9 son moda. Es un caso
multimodal
B. MEDIDAS DE DISPERSIN
Son medidas que nos dicen que tan dispersos se encuentran los datos con respecto a su media.
Smbolos comunes en su uso son:
S2 : Varianza Muestral
VARIANZA (Variancia) S2
La varianza o variancia es el promedio de las desviaciones al cuadrado entre los datos y su media
aritmtica
14
( xi ) 2
x 2
( xi x ) 2 i
n
S
2
n 1 n 1
donde:
xi: es el i-simo dato
: es la media aritmtica para datos no agrupados
n: es el nmero de datos
Ejemplo 01
Calcula la varianza para el siguiente conjunto de datos.
5 9 12 7 15 3
Solucin
Aplicando la definicin (primera frmula).
x = 5 +9 +12 +7 +15 +3 = 51
S2 = [ 533-(51)2/6 ] /5 = 99.5/5 = 19.9 que es el mismo resultado que obtuvimos con la definicin
anterior.
DESVIACIN ESTNDAR
Es la raz cuadrada positiva de la varianza
( xi ) 2
x 2
i
S n
n 1
Ejemplo 02
Calcula la desviacin estndar para el siguiente conjunto de datos.
5 9 12 7 15 3
Solucin
Con el clculo de la varianza previo S2 = 19.9
S 19.9 4.46
15
NOTA:
1. La varianza expresa a la unidad de medida elevada al cuadrado mientras que la desviacin
estndar lo expresa en su unidad original
2.
Ejemplo
Si se ha calculado la varianza de Peso en Kg.
Ejemplo 03:
Determinar la distribucin de notas en estadstica mas variable de estos dos grupos de estudiantes:
X : 08 12 18 06 14 13
Y : 10 16 15 12 12 14
COEFICIENTE DE VARIACIN.(CV%)
A menudo nos interesamos por comparar la variabilidad de dos o ms conjuntos de datos; esto se
resuelve determinando las respectivas varianzas o desviaciones estndar, siempre y cuando las
variables presenten la misma unidad de medida y adems sus MEDIAS sean relativamente cercanas.
Cuando faltan estas condiciones la medida que se utiliza para comparar la variabilidad de dos o ms
conjuntos de datos se conoce como COEFICIENTE DE VARIACION ; que es una medida relativa
de variabilidad, y se define por la siguiente expresin:
S
CV % x100
x
16
1 = 24000 Lb de peso 2 = 1.05 Lb de peso.
S1 = 1285 Lb S2 = 0.16 Lb
* En este caso se puede observar que la unidad de medida es la misma, pero sus promedios o
medias no son relativamente cercanas.
EJERCICIOS PROPUESTOS
1. Cada una de las siguientes afirmaciones diga Ud. si son ciertas (V) o falsas(F):
17
c. A mayor edad mayor presin arterial. ....................................................
d. El rendimiento acadmico es menor si el tiempo de ver televisin es mayor en los alumnos del
segundo ciclo de Enfermera de la USP. .....................................................
b. Para el estudio de presin arterial , edad y nivel depresivo de personas de la tercera edad.
VI: VD:
d. Estudio del nivel de satisfaccin, sueldo y horario de trabajo de los mdicos del Hospital de Polica.
VI: VD:
Grupo Experimental
N Pre Test Post Test
1 07 15
2 09 16
3 07 15
4 12 18
5 05 14
6 12 16
7 12 20
8 09 12
9 11 18
10 08 11
11 11 16
12 04 11
18
13 10 14
14 14 17
15 08 12
Promedio
Desviacin
Estndar
CV%
Determine el Promedio, la desviacin Estndar y el Coeficiente de Variacin para los puntajes en el Pre Test
y Pos Test.
Determine e interprete la Media o promedio y el Coeficiente de Variacin, y compare para los tres
grupos.
19
REFERENCIA BIBLIOGRAFICA:
1. AVILA R.B.(2000), Estadstica Elemental. Nueva Edicin. Estudios y Ediciones Lima-Per.
2. HERNANDEZ S., FERNANDEZ C, BAPTISTA(2005), Metodologa de la Investigacin Cientfica. Mexico. Editorial McGRAW-HILL.
3. MILTON J. SUSAN (2004): Estadstica para Biologa y Ciencias de la Salud, Edit. McGraw-Hill. Espaa.
4. WAYNE, Daniel (2002). Estadistica Aplicada a las Ciencias Sociales. Colombia. Editorial McGRAW-HILL LATINOAMERICANA.
S.A.
5. WAYNE, Daniel (2005). Bioestadstica. Edit. Limusa. Mxico.
Distribucin bidimensional de 150 trabajadores de Chimbote, por simpata poltica (VD) segn
Grado de Instruccin (VI).
Cuadro N 13
TRABAJADORES DE UNA EMPRESA POR SIMPATIA POLITICA SEGN
GRADO DE INSTRUCCIN, CHIMBOTE. 2014.
Ejemplo:
Edad y nmero de hijos de 15 docentes de la Institucin Educativa Jos Olaya, Chimbote -
2014.
Edad : 30 40 30 50 40 40 30 50 50 40 30 40 40 30 30
20
N de hijos: 2 3 1 3 3 2 1 3 3 2 2 2 3 1 2
Con los datos anteriores construir una tabla de distribucin bidimensional de frecuencias (tabla de
contingencia)
Ejemplo:
Analizar la relacin entre el ingreso y egreso diario de 6 trabajadores del distrito Z.
Ingreso : 35 40 38 55 42 60
Egreso : 30 35 30 50 35 50
CALCULO DE r:
Ejemplo:
INGRESO EGRESO
XY X2 Y2
X Y
35 30 1050 1225 900
40 35 1400 1600 1225
38 30 1140 1444 900
21
55 50 2750 3025 2500
42 35 1470 1764 1225
60 50 3000 3600 2500
270 230 10810 12658 9250
X Y XY X 2 Y2
PROPIEDADES DE r:
- 1 r + 1
Ejemplo:
Analizar la relacin entre la edad y el tiempo de servicios de 15 docentes de un Centro Educativo.
Edad : 48 40 30 39 46 42 27 36 34 46 32 42 40 32 27
Tiempo de: 24 18 9 14 22 22 4 13 10 20 12 18 16 8 6
Servicios
22
APUNTES DE:
PROBABILIDAD ESPACIO MUESTRAL EVENTO O SUCESO
INTRODUCCION
Frecuentemente se usa el trmino probabilidad para sugerir que existe duda o incertidumbre sobre lo
que ocurri, lo que ocurre o ocurrir. La experiencia humana demuestra que existe una serie de hechos,
acontecimientos, experimentos cuyos resultados no se pueden determinar anticipadamente; sin embargo si
es posible definir, estimar o predecir el probable resultado. Podemos conocer le pasado, pero nunca el
futuro, pero existe un permanente inters por despejar las incertidumbres.
Todo estos aspectos de ocurrencia de un hecho sern materia de este gua acadmica, donde el
alumno podr asimilar los contenidos de probabilidad, espacio muestral y evento o suceso. Teniendo al
alcance una herramienta muy importante para la toma de decisiones en la organizacin y gestin de datos.
23
COMPETENCIAS :
DEFINICION DE PROBABILIDAD
Definicin de Probabilidad.-
Es el estudio de fenmenos o experimentos puramente aleatorios, o libres de determinacin.
Definicin Clsica de probabilidad.-
Si A es un sub conjunto de , donde el suceso A puede ocurrir de n maneras y puede ocurrir de N
maneras igualmente posibles, entonces la probabilidad de A ser:
n Nmero de elementos de A
P(A) = ---- = -----------------------------------
N Nmero de elementos de
Donde 0 P(A) 1
EXPERIMENTO ALEATORIO.-
Es cualquier experimento u operacin cuyo resultado no puede predecirse con exactitud antes de
realizar el experimento. (No determinstico) y se puede repetir muchas veces.
24
ESPACIO MUESTRAL.-
Espacio muestral es el conjunto de todos los resultados posibles de un experimento aleatorio dado.
Comnmente se denota a este conjunto con .
En la teora de conjuntos representa al conjunto Universal
Experimento 5 : 5: De una urna que contiene 3 bolitas rojas, 4 blancas y 2 verdes, se escoge una
y se anota el color.
Espacio muestral : 5 = { R, R, R, B, B, B, B, V, V }
25
SUCESO O EVENTO.-
Suceso es un subconjunto de resultados posibles, en otras palabras suceso es un subconjunto del
espacio muestral . Es decir, S A es suceso, entonces A . Usualmente los sucesos se
denotan con letras maysculas, tales como: A,B,C,D, etc.
Ejemplos de eventos:
Experimento 1 : 1: Lanzar una moneda y observar la cara superior .
Espacio muestral : 1 = { Cara, Sello } = { C, S }
Eventos : A = { } (suceso imposible)
B={C} (suceso elemental)
C={ S} (suceso elemental)
D = { C, S } (suceso seguro o cierto)
Nota: El nmero mximo de eventos que se puede obtener de un espacio muestral es:
2 = 22 = 2 x 2 = 4 = { { } , { C } , { S }, { C, S } }
Eventos :
A= { } (suceso imposible)
B = { (CC) } (suceso elemental)
C = { (CS) } (suceso elemental)
D = { (SC) }
E = { (SS) }
F = { (CC), (CS) }
G = { (CC), ( SC) }
H = { (CC), (SS) }
I = { (CS), ( SS) }
J = { (SC), (SS) }
K = { (CC), ( SC) }
L = { (CC), (CS), (SC) }
M = { (CC), ( CS), (SS) }
N = { (CC), ( SC), (SS) }
= { (CS), ( SC), (SS) }
O = { (CC), ( CS), (SC), (SS) }
(suceso seguro o cierto)
Nota: El nmero mximo de eventos que se puede obtener de este espacio muestral es:
26
2 = 24 = 2 x 2 x 2 x 2 = 16 sucesos o eventos
Eventos :
A= { } (suceso imposible)
B={1} (suceso elemental)
C={2} (suceso elemental)
---
---
G = { 1, 2 }
H = { 1, 3 }
---
---
K = { 1, 2, 3 }
---
---
M = { 1, 2, 3, 4 }
---
---
P = { 1, 2, 3, 4, 5 }
---
---
Z = { 1, 2, 3, 4, 5, 6 } (suceso seguro o cierto)
Nota: El nmero mximo de eventos que se puede obtener de este espacio muestral es:
2 = 26 = 2 x 2 x 2 x 2 x 2 x 2 = 64 sucesos o eventos
27
EJEMPLOS DE CALCULO DE PROBABILIDAD :
Para el experimento 1:
Donde: 0 P(B) 1
b) Calcular la probabilidad de obtener sello
n Nmero de elementos de C 1
P(C) = ---- = ---------------------------------------- = ------ = 0,5
N Nmero de elementos de 2
Para el experimento 2:
n Nmero de elementos de B 1
P(B) = ---- = ---------------------------------------- = ------ = 0,25
N Nmero de elementos de 4
n Nmero de elementos de D 1
28
P(D) = ---- = -------------------------------------- = ------ = 0,25
N Nmero de elementos de 4
n Nmero de elementos de E 1
P(E) = ---- = ---------------------------------------- = ------ = 0,25
N Nmero de elementos de 4
Para el experimento 3:
Espacio muestral : 3 = { 1, 2, 3, 4, 5, 6 }
n 1
P(E) = ---- = ------ = 0,166
N 6
( R= { 3. 4, 5, 6} ) n 4
P(R) = ---- = ------ = 0,66
N 6
29
EJERCICIOS PROPUESTOS
Para cada uno de los ejercicios propuestos, determinar el espacio muestral, el evento o suceso y
calcular la respectiva probabilidad.
EJERCICIO 1:
Sea el experimento:
2: Lanzar dos monedas y observar el resultado
a) Calcular la probabilidad de obtener como resultado mximo un sello.
b) Calcular la probabilidad de obtener como resultado ms de una cara.
EJERCICIO 2:
Sea el experimento
3: Lanzar un dado y observar el nmero que aparece en la cara superior.
a) Calcular la probabilidad de obtener como resultado un nmero par.
b) Calcular la probabilidad de obtener como resultado mayor o igual a 2.
EJERCICIO 3:
Sea el experimento
4: Designar un delegado de un grupo de 50 personas
a) Calcular la probabilidad de que un alumno sea seleccionado como delegado.
EJERCICIO 4:
Sea el experimento
5: De una urna que contiene 3 bolitas rojas, 4 blancas y 2 verdes, se escoge una y se anota su
color.
a) Calcular la probabilidad de obtener una bolita Roja.
b) Calcular la probabilidad de obtener una bolita verde.
c) Calcular la probabilidad de obtener una bolita blanca.
EJERCICIO 5:
Sea el experimento
7: De un saln de clase de matemticas donde hay 7 mujeres y 6 hombres se elige un alumno al
azar y se anota sexo (genero).
a) Calcular la probabilidad de que el alumno seleccionado sea hombre.
b) Calcular la probabilidad de que el alumno seleccionado sea mujer.
REFERENCIA BIBLIOGRAFICA
R.B. AVILA ACOSTA
Estadstica Elemental , Nueva Edicin, Estudios y Ediciones R.A. Lima - Per , 2002.
RUFINO MOYA C. GREGORIO SARAVIA A.
Teora de Probabilidad e Inferencia Estadstica, Editorial San Marcos, Lima Per, 1998.
30
DISTRIBUCIONES DE PROBABILIDAD
Binomial
DISCRETA Poisson
Hipergeomtrica
DISTRIBUCIN
DE PROBABILIDAD
CONTINUA Normal
t- student
Chi-cuadrado
F
31
DISTRIBUCIN NORMAL
3.14159265.
2.71828
32
Ejercicios para usar la tabla de reas de la Curva Normal Estandarizada
A partir de la Distribucin Normal, Graficar el rea correspondiente y calcular la probabilidad de un suceso,
cuya variable estandarizada (Z) est comprendida entre los siguientes valores:
9) Que Z sea menor que 1,96 o mayor que 1,96 P(Z -1,96 o Z 1,96) =
11) En una muestra de estudiantes de Administracin, se encuentra que la nota promedio en Estadstica fue
12 puntos, con una desviacin estndar igual a 2. Cul es la probabilidad de que un alumno elegido al
azar tenga nota entre 11 y 14 puntos?.
Supongamos que las notas se distribuyen como una normal.
12) La media de los sueldos de 600 empleados de una universidad es de 4300 soles y la desviacin estndar
o tpica 400 soles. Suponiendo que los sueldos se distribuyen normalmente, hallar cuntos empleados
tienen sueldos:
a) Entre 3500 y 4500 soles
b) De 5000 y ms soles
13) Los puntajes en un examen de seleccin para seguir estudios superiores estn distribuidos normalmente
con media 76 y desviacin estndar 15. Se ha establecido que el 15% de los concursantes, que son los
mejores recibirn una beca integral de estudios. Hallar el puntaje mnimo para ganar la beca.
14) El promedio de las alturas de 800 pacientes de un hospital es de 1.50 m. y la desviacin estndar es 0.30
m. asumiendo que las altura estn normalmente distribuidas, encontrar cuntos alumnos miden entre
1.30 m. y 1.70 m.
33
Muestreo es el proceso por el cual se realizan inferencias a la poblacin examinando slo una parte
de ella. Este proceso es aplicable en nuestra vida personal y pblica. As, una pareja contrae
matrimonio en base a un corto enamoramiento; con un simple grano de arroz el ama de casa prueba
si todo el arroz contenido en la olla est cocido; paladeando el caf contenido en una cucharita se
determina la calidad de la marca del caf; los dos ajes o anlisis mdicos (de sangre, de orina, etc..)
se realizan en base a nuestras y finalmente una muestra de roca lunar proporciona informacin
cientfica sobre el origen de la luna y as diferentes aspectos de la vida, cultura y ciencia son
investigados en base a muestras.
Ejemplos:
En las industrias de transformacin de una determinada regin geogrfica del pas y en un
perodo de tiempo determinado es necesario determinar el valor del parmetro: Nmero de
obreros y empleados en dicha industria.
El nmero medio de miembros por familia en la ciudad de Chimbote en el mes de Diciembre
del 2006.
El valor total de la produccin de harina de pescado de las Fabricas Pesqueras del Per, en
el ao 2006.
El porcentaje de aportes al Seguro Social no pagados por los empresarios a nivel nacional y
en los ltimos cinco aos.
Las tcnicas de muestreo permiten estimar lo mismos parmetros que aquellos en el caso de un
censo, es decir, permiten obtenerlos aproximadamente a travs de una muestra. Si esa muestra se
obtiene de una manera probabilstica se le llama muestra PROBABILSTICA y al conjunto de estas
tcnicas se le denomina TCNICAS DE MUESTREO PROBABILSTICA.
Adecuada (tamao), quiere decir que debe incluir un nmero ptimo y mnimo de unidades. Este
nmero se determina mediante el empleo de frmulas estadsticas
Los aspectos referentes a al representatividad o calidad de la muestra, son ms importantes que los
referentes a su cantidad y no debe pensarse que la representatividad de la muestra depende de su
cantidad. Si quisiramos estudiar las caractersticas del pueblo peruano y estudiamos solamente a los
habitantes de la Costa, aunque estudiaremos a todos ellos, nuestra muestra no sera todava
representativa de todo el pas.
34
El estudio de una muestra tiene ventajas potenciales sobre el Censo, razones por las cuales se le
prefiere. Entre otras tenemos:
1. COSTO REDUCIDO
Una muestra requiere relativamente menores recursos para disearla y procesarla
adecuadamente, as, el costo de unidad de observacin es alto en comparacin con el censo,
pero el costo total de un estudio por muestreo es mucho menor cubierto los mismos tems de la
encuesta, debido a que los datos se obtienen nicamente de una pequea fraccin del total.
2. MAYOR RAPIDEZ:
Un nmero pequeo de observaciones pueden recolectarse y procesarse ms rpido que un
censo y dar resultados ms oportunos.
3. MAYOR ALCANCE:
El muestreo tiene un mayor alcance frente al censo con relacin a la variedad de informacin
dada su flexibilidad, adaptabilidad y posibilidad de estudiar la interrelacin de varios factores.
4. MAYOR EXACTITUD
Los datos obtenidos con un censo o una muestra estn sujetos a diferentes tipos de errores y
sesgo, la magnitud de los cuales depende del procedimiento particular de estudios. Sin
embargo, si el mismo procedimiento se sigue para la muestra y el censo, la exactitud de una
observacin ser la misma, pero comparativamente con una pequea escala de operaciones
un estudio muestral posibilita mayor exactitud por practicarse un mejor staff y dar con
intensidad entrenamiento y mejor equipo a los encuestadores.
2. El error debido a muestreo tiende a ser alto en reas administrativas pequeas y de gran
variabilidad. Como las observaciones en la poblacin son muy variables, las muestras que se
pueden seleccionar difieren una de otras y como se estudia una sola muestra para generalizar
a la poblacin, los resultados sern diferentes segn la muestra que hayamos escogido. Esta
diferencia entre el valor dado por la muestra y el verdadero valor poblacional, constituye el error
por muestreo; el cual puede medirse estadsticamente y en cierto modo disminuirse a voluntad
aumentando el tamao de muestra.
35
En operaciones tales como: prueba de procedimientos censales, ordenamiento de tems, evaluacin y
control de datos procesados, adelanto de tabulaciones de variables seleccionadas o ampliacin de
anlisis de variables, se aplica el muestreo como parte integral de un censo.
POBLACIN, Es el conjunto de todas las unidades de anlisis cuyas caractersticas se van a estimar.
La poblacin debe definirse en trminos de su contenido, extensin y tiempo. Es el conjunto de
elementos que determinan la cobertura de un estudio.
Ejemplo: Se trata de disear una encuesta sobre el consumo familiar en el distrito de Nuevo
Chimbote y en el presente ao, tenemos:
Como la poblacin en estudio debe estar definida sin ambigedad, de manera que no de lugar a
confusiones, es necesario aclarar qu entendemos como familia en este estudio: todas las
personas que comparten un mismo presupuesto familiar. As, nuestra poblacin ser: las familias
del distrito de Nuevo Chimbote en el ao 2006; considerando como familia todas las personas que
comparten un mismo presupuesto familiar.
MARCO MUESTRAL.
Es el documento material (lista, fichero, etc) donde se consigna individualmente las unidades o
elementos de muestreo, de tal forma que se pueda sortear de all las unidades que constituirn la
muestra. Este documento es indispensable, al menos cuando se trata de realizar un muestreo
probabilstico. El marco muestral debe estar perfectamente actualizado, sin omisiones ni
duplicaciones. Ejemplos:
Para los Ciudadanos. - los requisitos electorales, es decir de personas mayores de 18 aos de
edad y no privados de sus derechos polticos electorales. Pero es preciso no olvidar que
algunas personas en edad electoral o que acaban de llegar a ella, descuidan su inscripcin,
adems muchos electores olvidan notificar su cambio de residencia, salvo el ao que estn
previstas las elecciones.
Para las Empresas y Establecimiento Industriales. -El mejor marco para la muestra a este
respecto, lo da el registro que lleva el instituto Nacional de Seguridad Social. Cada
establecimiento est all caracterizado adems por su razn social, direccin, actividad
econmica y nmero de personal asalariado, lo que permite estratificar la poblacin de los
establecimientos segn estos dos ltimos criterios esenciales.
Para Muestreo Por reas. - El marco de la muestra es en este caso el mapa geogrfico del
Pas o fotografas areas y la unidad de muestreo es un rea delimitada sobre ese mapa o
plano. Evidentemente interesa poseer un mapa recientemente y a gran escala, en el que
figuren el mximo de detalles que permiten reconocer sobre el terreno las reas mustrales.
36
PLAN MUESTRAL Conjunto de reglas o especificaciones para seleccionar una muestra.
DISEO MUESTRAL Comprende el mtodo de seleccin y estimacin, el cual debe ser indicado
en todo estudio muestra.
Hay ocasiones, sin embargo, en que las muestras de criterio o juicio son tiles. Por ejemplo, un
experto puede coger una muestra de arroz de la parte superior de un montn, para examinar su
calidad. Puede ser fsicamente imposible seleccionar una muestra al azar o probabilstica
tomndola de dentro del montn. Sin embargo, por experiencia el experto puede conocer ciertos
hechos relacionados con el arroz; tal vez, que ste generalmente es uniforme en calidad. En este
caso, una muestra del montn, puede ser suficiente para obtener la informacin necesaria acerca
del arroz.
Se utiliza mayormente para estudios cualitativos y exploratorios.
Se divide la poblacin en grupos o estratos, segn las exigencias del estudio, generalmente edad,
sexo y clase social, aunque pueden utilizarse otras clasificaciones. Demasiados estratos hacen el
estudio difcil y costoso. Los que tienen a cargo el estudio determinan las cuotas a los
entrevistadores se les sealan los sitios especficos para buscar a sus informantes. La seleccin de
stos, corre por cuenta de los entrevistadores y esto puede causar sesgo cuyas consecuencias no
pueden medirse objetivamente.
Al establecer una muestra por cuotas debe procurarse la distribucin de los diversos grupos segn
la proporcin de su importancia en el conjunto de la poblacin. Esto significa que debe estudiarse
la poblacin y analizarla teniendo en cuenta que las clasificaciones abarquen las caractersticas
bsicas, tiles para los propsitos del estudio. Para esto los encargados del estudio, deben valerse
de datos publicados como censos oficiales de poblacin, y produccin.
La rapidez, la economa y simplicidad administrativa son las ventajas de este tipo de muestreo.
37
ii) Exceder el nmero esperado de cuestionarios que retornan,
En los estudios de opinin y de mercado an se emplean estos tipos de muestreo, aunque su uso
tiende a disminuir por sus imprecisiones.
Este tipo de muestras se usa en estudios de laboratorio donde se procura que los sujetos sean
homogneos en variables tales como edad, sexos o inteligencia, de manera que los resultados o
efectos no obedezcan a diferencias individuales, sino a las condiciones a las que fueron sometidos.
MUESTRAS CUALITATIVAS
Muestra variada
Documentar diversidad para buscar diferencias y coincidencias, patrones y particularidades.
Muestra homognea
Enfocarse en el tema a investigar. Enfatizar situaciones, proceso o episodios en un grupo
social.
Muestra en cadena o por redes
Se identifican casos de gente que conoce otra gente que dar riqueza de informacin.
Muestra dirigida por teora o muestra por criterios
Se selecciona los sujetos o al grupo social, porque tiene uno o varios atributos que ayudan a ir
desarrollando una teora.
Casos tpicos
Individuos, sistemas u organizaciones que poseen claramente las situaciones que se analizan
o estudian.
38
B.- MUESTREO PROBABILISTICO
Es un proceso muestral donde cada elemento de la poblacin tiene una probabilidad perfectamente
conocida de ser incluida en la muestra; solo una muestra probabilstica proporciona estimaciones
con medida de su precisin.
Una muestra aleatoria simple se extrae por seleccin aleatoria empleando los nmeros aleatorios o
colocando los elementos de la poblacin numerados del 1 a N en una urna y mezclndolos
perfectamente. Si se usa la urna y se sacan n nmeros en sucesin. Las unidades que llevan
estos nmeros constituyen la muestra, En cualquier etapa del proceso de obtencin de la muestra,
este proceso ofrece la oportunidad de que todos los elementos que no han sido sacados
previamente tengan igual probabilidad de seleccin. Los procedimientos aleatorios evitan la
preferencia o inclinacin a incluir en la muestra, determinadas observaciones que son de
conveniencia.
Una muestra estratificada puede ser proporcional al tamao de los estratos u ptima donde en la
representacin de la muestra se considera la variedad y tamao de cada estrato y/o costo en cada
uno de ellos.
MUESTREO SISTEMTICO
Es el procedimiento de seleccin del K-simo elemento de la poblacin con un comienzo aleatorio.
Si se desea extraer una muestra del 5%=5/100=1/20 de la poblacin, seleccionamos
aleatoriamente un nmero entre 1 y 20, supongamos que el nmero seleccionado es 12, entonces
la 12ava, 32ava, 52ava, etc unidades de la poblacin constituiran la muestra sistemtica. Este
mtodo es muy usual por su simplicidad y se prefiere frente al muestreo estratificado si la poblacin
puede ponerse fcilmente en una disposicin ordenada.
Con el muestreo sistemtico se logra mayor eficiencia si las unidades que se hallan prximas
tienen mayor uniformidad que las unidades que se encuentran alejadas entre s.
Tambin lo empleamos para seleccionar los elementos que sern los que conformarn la muestra,
cuando el tamao (n) de la muestra ya ha sido calculado con otro tipo de muestreo...
Entonces la seleccin sistemtica de elementos maestrales ser 1/K (1/3), es decir, tomaremos 1
elemento de cada 3. Se selecciona al azar el inicio (puede tener 3 cifras), supongamos que el
nmero seleccionado sea el 112, entonces, tomaremos el 112, el 115, el 118, el 121, etc. y
volvemos a empezar por los primeros nmeros si es necesario, hasta completar los 547 unidades
que conformarn la muestra.
Cuando este muestreo se realiza por etapas, tambin se le puede conocer como muestreo
probabilstico por racimos.
Ejemplo:
Problema:
Una compaa de televisin necesita saber con precisin, con la finalidad de planear sus
estrategias, en que momento los adultos de los distritos de Chimbote y Nuevo Chimbote de
1200,00 habitantes, es decir, qu tanto televisin ven, a qu horas, qu contenidos prefieren y sus
opiniones con respecto a los programas noticiosos.
Procedimiento:
Se disear un cuestionario que indague estas reas sobre el uso de la televisin. Los
cuestionarios se aplicarn por entrevistadores a una muestra de sujetos adultos.
Poblacin:
Todos aquellos sujetos hombres y mujeres de ms de 18 aos de edad, y que vivan en una casa o
un departamento propio o rentado de los distritos de Chimbote y Nuevo Chimbote.
Las cuadras se utilizarn como racimos, es decir, como unidades maestrales, a partir de las cuales obtendremos en ltima instancia a
nuestros sujetos adultos mayores de 18 aos.
Se pueden emplear dos o tres tipos de muestreos probabilsticos para obtener el tamao de
muestra y para seleccionar las unidades para el estudio.
NZ 2 S 2
(2) n Para cuando se conoce el tamao de la poblacin.
N 1 E 2 Z 2 S 2
Donde:
Z : Puntaje Z correspondiente al nivel de confianza considerado (para 99% de
confianza Z=2.58, para 95% de confianza Z= 1.96, para 90% de confianza Z=
1.65).
N : Total de elementos de la poblacin en estudio
E : Error permitido (precisin)
S2 : Varianza de la poblacin o su estimacin.
n : tamao de muestra a ser estudiada
Ejemplo 1:
Queremos hacer un estudio para estimar el ingreso medio de las familias del distrito de Nuevo
Chimbote, para esto decidimos hacerlo con un nivel de confianza del 95%. Y deseamos tambin que la
estimacin se encuentre por lo menos en S/20 nuevos soles alejados del ingreso medio poblacional.
qu tamao debe tener la muestra?. Tenemos informacin que la desviacin estndar de los ingresos
en dicho distrito es de S/140.
Ejemplo 2:
Si en el ejercicio anterior tenemos que en el distrito de Nuevo Chimbote tiene 600 familias, entonces
se puede aplicar la frmula para muestras finitas.
1.96 2.140 2.600
n
20 2 (599) 1.96 2.140 2
143.46 n = 144
Ejemplo 3:
Un especialista en mercadotecnia desea calcular el tamao de la muestra de hogares que va ha tomar
del distrito de Coishco para determinar en qu proporcin de hogares por lo menos uno de sus
miembros ve un programa determinado de televisin. En esta comunidad hay en total 500 hogares. El
analista desea que su estimacin est a 0.04 de la proporcin verdadera, con un 90% de confianza. En
42
una muestra piloto de 15 hogares, el 35% de los entrevistados indicaron que alguien de su casa vea
regularmente dicho programa. Con base a esta informacin podemos calcular la muestra
Ejemplo 4:
Un economista desea hacer un estudio sobre los profesores de las Universidades de Chimbote en
referencia a cantidad de dinero por semana que cada profesor dedica a la alimentacin de su familia. Para
ello acude a los niveles administrativos correspondientes, a fin de conseguir un listado de los 2,000
profesores que trabajan en estas universidades. Los niveles administrativos superiores tambin tienen
necesidad de obtener alguna informacin entre los profesores y se ponen de acuerdo para aprovechar esa
encuesta y para introducir 51 preguntas adicionales.
Una vez que el economista tiene estructurado el cuestionario, le pide a un estadstico que le estime el
tamao de muestra apropiado para el estudio. Indicar el procedimiento y determinar el tamao de muestra
apropiado.
1.- El estadstico interroga a los encargados del estudio sobre cul es la pregunta ms importante
en el estudio, a lo cual responden que todas por igual.
2. El estadstico vuelve a hacer la misma pregunta formulada de una y otra manera y al final el grupo
lleg a la conclusin de que las preguntas verdaderamente importantes son las 7 primeras.
4. Determinar la precisin con que se desea cada estimacin. El economista dice que la media
que a l le interesa debe encontrarse en alrededor de 1,000 soles ya que la mayora de los
maestros son casados, entre 30 y 50 aos de edad y el nivel de sueldos de las Universidades
de Chimbote es regular. Adems aade que l ha hecho algunas sondeos que arrojan
resultados congruentes con sus supuestos. Con estos datos el estadstico estima gruesamente
una varianza de 50,000 y como se pide un error del 5% y una confianza del 95%, se obtiene:
43
2 2 (50,000)
n0 80
50 2
Z 2 PQ 2 2 (0.50)(0.50)
n0 400
E2 52
De la misma manera se trabaja el resto de porcentaje hasta obtener los resultados siguientes:
Pregunta : 1 2 3 4 5 6 7
Tamao de Muestrea : 80 98 334 300 200 200 400
Nota.- en este ejemplo se trata de ilustrar la situacin usual en muchas encuestas, donde se incluyen
cada vez mayor nmero de preguntas.
TAR E A
DETERMINACION DE LA MUESTRA: TCNICA DEL MUESTREO PROBABILSTICO
TIPO DE MUESTREO BIETAPICO: MUESTREO ESTRATIFICADO (PRIMERA ETAPA), Y
MUESTREO ALEATORIO SISTEMTICO (SEGUNDA ETAPA)
44
Alumnos matriculados segn carrera profesional y ciclos, Semestre 2013-II
Muestra:
NZ 2 PQ
n
N 1 E 2 Z 2 PQ
Distribucin proporcional
Ni
ni xn
N
Ing.
Ciclos Medicina Ing. Civil Sistemas Derecho Contabilidad Administracin
Ni ni Ni ni Ni ni Ni ni Ni ni Ni ni
I 18 40 123 77 67 58
II 75 29 69 141 42 43
III 44 41 72 75 37 25
IV 53 22 46 154 61 38
V 28 17 38 90 64 14
VI 22 27 83 127 58 35
VII 21 19 50 98 38 19
VIII 19 17 47 110 57 24
IX 14 21 21 80 48 12
X 16 14 31 64 90 24
XI 11 41
XII 15 95
XIII 17
Total 353 n1= 247 n2= 580 n3= 1152 n4= 562 n5= 292 n6=
45
Poblacin Muestra
FACULTAD Ni ni
Educacin N1 = 68 n1 =
Ingeniera N2 = 57 n2 =
Derecho N3 = 68 n3 =
CC. CC. Y ADM. N4 = 39 n4 =
CC. DE LA SALUD N5 = 38 n5 =
TOTAL N = 270 n=
Muestra:
NZ 2 PQ
n
N 1 E 2 Z 2 PQ
Distribucin proporcional
Ni
ni xn
N
46
ESTIMACIN PUNTUAL E INTERVLICA
47
PRUEBA DE HIPOTESIS
48
e) Decisin .-
- Rechazar Ho si el valor experimental es mayor al valor tabular ( p < ), (valor
sugerido de es de 0.05).
- No rechazar Ho si el valor experimental es menor o igual al valor tabular. (p > )
a) Formulacin de Hiptesis.
Ho : = 0
H1 : 0
x 0
t
DE
n
donde :
49
1 n 2
2
DE x n x
(n -1) i 1 i
DE = Desviacin estndar
d) Valor tabular
t tab t (n-1 ; 1 - 2
)
e) Decisin
Criterios de decisin :
Si p < 0.05, Existe diferencia estadsticamente significativa
entre el puntaje promedio real y el valor supuesto.
Si p < 0.01, Existe diferencia altamente significativa entre el
puntaje promedio real y el valor supuesto.
Si p > 0.05, No existe diferencia estadsticamente significativa
entre el puntaje promedio real y el valor supuesto.
Ejemplo :
Un empresario est interesado en averiguar si el sueldo promedio de los trabajadores de
cierta empresa es de 420 dlares como el respectivo de la empresa que el regenta. Para
realizar tal averiguacin se seleccion una muestra aleatoria de 20 de los sueldos de
dichos trabajadores y se encontr un sueldo promedio de 430 dlares con una desviacin
estndar de 100 dlares. Existe evidencia suficiente para afirmar que el sueldo promedio
es de 420 dlares?
a) Formulacin de Ho y Ha .
Ho : = 420
50
Ha : 420
b) = 0.05
c) Estadstica de prueba
-
x 420
t t (19)
S
n
430 420
t 0.45 , p 0.657
100
20
d) Decisin
Como p > 0.05 no se rechaza la hiptesis nula, por tanto no existe evidencia suficiente
para poder afirmar que el sueldo promedio es diferente de 420 dlares.
a) Formulacin de Hiptesis.
Ho : 1 = 2
H1 : 1 2
donde :
51
2 2
(n 1 - 1)S1 (n 2 - 1 )S2
( DE )
2
n 1 n2 - 2
d) Valor de p
p: Es la probabilidad que hay del valor t calculado hacia la derecha
e) Decisin
Rechazar Ho si p < 0.05 p < 0.01
No rechazar Ho si ( p > 0.05 )
Criterios de decisin :
Si p < 0.05, Existe diferencia estadsticamente significativa entre
los puntajes promedio de los 2 grupos de estudio.
Ejemplo
Treinta empleados de una gran empresa fueron distribuidos en dos grupos iguales a dos
diferentes programas de capacitacin industrial. El grupo I fue capacitado con el Mtodo
A, que consiste en adiestrarlos directamente en la maquinaria y el grupo II con el Mtodo
B, con la atencin personal de un instructor. Los puntajes obtenidos despus de la
capacitacin en una prueba apropiada fueron :
Mtodo A Mtodo B
Media ( x ) 78 70
Desviaci estndar (S) 6 4
N 15 15
Solucin
a) Formulacin de Hiptesis.
Ho : 1 = 2
52
H1 : 1 2
c) Nivel de significacin :
= 0,05
c) Estadstica de prueba
78 - 70
t0
1 1
(26) = 4,30
15 15
e) Decisin
Como p < 0.01, se rechaza Ho. Por tanto existe diferencia estadsticamente
significativa en los dos mtodos de capacitacin.
Debe usarse cuando se desea comparar 2 tratamientos y las unidades en estudio son
heterogneas pero es factible conformar parejas homogneas o gemelas, Ejm. Cuando se desea
comparar :
- 2 tipos de cueros de zapatos en diferentes individuos.
- 2 marcas de termmetros en diferentes ambientes.
- Efectividad de una tcnica de ventas (antes y despus de la aplicacin de la tcnica ).
- 2 tipos de alimentacin en cerdos de diferentes camadas.
Prueba de hiptesis :
a) Hiptesis estadsticas
Ho : 1 = 2
H1 : 1 2
b) Nivel de significacin
= 0.05
53
c) Prueba
d n d i X1i X 2i
tc ,
Sd
n
di
d i 1
n
n 2
(d i d)
Sd2 i 1
n -1
d) Valor de p
e) Decisin
Rechazar Ho si p < 0.05 p < 0.01
No rechazar Ho si ( p > 0.05 )
Criterios de decisin :
Ejemplo:
Se llev a cabo un experimento para probar el efecto de dos medicamentos distintos sobre el
tiempo de coagulacin de la sangre (en minutos). Se extrajeron muestras de sangre de 10
personas y se dividieron igualmente en dos partes que se asignaron al azar a uno de los dos
medicamentos. Los resultados fueron los siguientes:
Persona X1 X2 Dif.
54
1 1.5 1.6 -0.1
2 1.4 1.4 0.0
3 1.8 1.6 0.2
4 1.3 1.2 0.1
5 2.0 2.1 -0.1
6 1.1 1.0 0.1
7 1.5 1.6 -0.1
8 1.5 1.5 0.0
9 1.2 1.0 0.2
10 1.5 1.6 -0.1
Solucin
a) Hiptesis
H0 : 1 = 2 H0 : d = 0
H1 : 1 2 H1 : d 0
b) = 0,05
c) Prueba
d 0,0220
t
S 0,12273/ 10
d
0,0220
0.567
0,03881
d) Valor tabular
t = t (9; 0.975) = 2,26 p = 0.5846
e) Decisin
No se puede rechazar H0 puesto que p > 0.05
donde :
d = X 1 - X2
d = 0,022
S2 = 0,12273
n = 10
No existe diferencia estadsticamente significativa entre el efecto de los dos medicamentos en el
tiempo de coagulacin de la sangre.
55
Ejercicio:
Grupos de estudio
1 2 3 . . . t
a) Hiptesis
H0 : 1 = 2 = 3 = . . . = t
H1 : Al menos 1 promedio es diferente
56
b) Nivel de significacin
c) Funcin de prueba
CMT
F F= CMT/CME
CME
d) Valor de la probabilidad a la derecha de F calculado en c)
e) Decisin
Rechazar Ho si p < 0.05 p < 0.01
No rechazar Ho si p > 0.05
- Si p < 0.05, Existe diferencia estadsticamente significativa entre los puntajes promedio
de los t grupos de estudio (Al menos 1 es diferente)
- Si p < 0.01, Existe diferencia altamente significativa entre los puntajes promedio
de los t grupos de estudio (Al menos 1 es diferente)
- Si p>0.05, No existe diferencia significativa entre los puntajes promedio de los t grupos de
estudio.
Tabla ANVA
Fuente Variacin Gl SC CM F
donde :
2 2
Xi . X ..
T
xx t N
E W - T
xx xx xx
57
X2
W Xij2 .. , CMT = SC/gl
xx N
Ejemplo :
En un estudio del efecto de la glucosa sobre la liberacin de insulina, se trataron muestras de
tejio pancrtico de animales de laboratorio con cinco estimulantes distintos. Posteriormente, se
determin la cantidad de insulina liberada. Los resultados referentes a la insulina liberada se
muestran en la tabla a continuacin. El experimentador deseaba saber si existe diferencia
significativa entre las cinco poblaciones con respecto a la cantidad media de insulina liberada.
Estimulante
A B C D E
1.53 3.15 3.89 8.18 5.86
1.61 3.96 3.68 5.64 5.46
3.75 3.59 5.70 7.36 5.69
2.89 1.89 5.62 5.33 6.49
3.26 1.45 5.79 8.82 7.81
1.56 5.33 5.26 9.03
7.10 7.49
8.98
Xi. 13.04 15.60 30.01 47.69 56.81 163.15
Xi 2.6080 2.8080 4.3733 6.6275 7.1013 5.0984
S 0.9959 1.0889 1.6704 1.4238 1.4394 2.2898
2
S i
ri 5 6 6 7 8 32
Solucin
a) Hiptesis
58
H0 : A = B = C = D = E
H1 : Al menos 1 estimulante (tratamiento) es diferente
b) = 0,05
c) Prueba estadstica
F CMT 14,62
CME
d) Valor tabular
F tab = F(4, 28; 0,05) = 2,71
e) Decisin
Se rechaza H0 puesto que F > Ftab
Existe evidencia suficiente para asegurar que al menos 1 tratamiento produce
efectos diferentes.
Uno de los usos ms frecuentes de la distribucin ji-cuadrado es probar la hiptesis nula de que
dos criterios de clasificacin, son independientes. Se dice que dos criterios de clasificacin son
independientes si la distribucin de uno no se ve afectada por la distribucin del otro.
Para realizar el anlisis de los datos o frecuencias conjuntas (O ij) los datos deben disponerse en
una tabla de contingencia, de acuerdo a dos criterios.
Criterio 1
Criterio 2 1 2 ... c ni.
1 O11 O12 ... O1c n1.
2 O21 O22 ... O2c n2.
59
b) Nivel de significacin : = 0,05
c) Funcin pivotal
(Oij - E ij )2
2
E ij
n i. x n . j
E ij
n i.
Oij : Frecuencia observada
Eij : Frecuencia esperada
No rechazar Ho si 2
2
tab , ( p > 0.05)
Esto es :
60
61
62
COMPUTACION
HARDWARE SOFTWARE
Parte fsica Parte intangible
SISTEMAS
CPU, MONITOR, OPERATIVOS
TECLADO, MOUSE,
IMPRESORA, ETC.
LENGUAJES DE
PROGRAMACION
PAQUETES DE
APLICACIN
PROGRAMAS DE
APLICACION
PARA ANALISIS
PARA USO DE CUANTITATIVO PARA ANALISIS EXISTEN
OFICINA -Excel CUALITATIVOS DIFERENTES
OFFICE: Word, -Minitab -Atlas
-The Etnograph
.... PROGRAMAS
Excel, Power -Epi Info PARA CADA
Point, Etc. -Data ming -Nud ist ESPECIALIDAD
-Microstat -Sonar
-Estad graph -Decisin explorer
-HyperQual, Etc.
-SPSS
-Stata
-SAS 63
-STATS
-Abstat PROGRAMA ESTADISTICO PARA
-Epi data, Etc. CIENCIAS SOCIALES
PRACTICA DE EXCEL
A B C D E F G H I J
:
4 N EDAD SEXO PUNTAJE N DE HERM UBIC.VIVI CONDICION
n = 10
5 1 12 MASCULINO 14 2 LADERAS SIN BECA pacientes
LOS de un
6 2 11 FEMENINO 13 0 PINOS SIN BECA consultorio
LOS
7 3 13 MASCULINO 13 2 PINOS SIN BECA
8 4 12 FEMENINO 13 3 LADERAS SIN BECA
9 5 13 MASCULINO 12 2 LADERAS BECA
10 6 11 FEMENINO 12 2 LADERAS SEMI BECA
2 DE
11 7 13 MASCULINO 13 3 JUNIO SEMI BECA
2 DE
12 8 13 MASCULINO 14 1 JUNIO SIN BECA
13 9 12 FEMENINO 11 0 LADERAS SIN BECA
14 10 13 MASCULINO 12 1 LADERAS SIN BECA
15
16
N de
17 EDAD pacient % Ejemplos:
64
18 11 2 20 2 =CONTAR.SI(C5:C14,11)
19 12 3 30 20 =(E18/E$21)*100
20 13 5 50 10 =SUMA(E18:E20)
21 TOTAL 10 100
22
23
24
25
26
27
28
29
30
31
32
33
34
35
38
39 SEXO N Pacientes %
40 MASCULINO 6 60 6 =CONTAR.SI(D5:D14,"MASCULINO")
41 FEMENINO 4 40 60 =(E40/E$42)*100
42 TOTAL 10 100 10 =SUMA(E40:E41)
43
44
45
46
47
48
INTRODUCCIN
En el ejemplo se estudian las caractersticas de una muestra de 40 sujetos. Se estudian siete variables:
Edad, sexo, estatus, regin, ci (cociente intelectual), estatura y peso. La edad es una propiedad (tiempo
vivido) de los casos (sujetos en este caso) que pueden tomar distintos valores: 40, 35, 43, 54, etc. Sexo es
una variable porque puede tomar distintos valores: hombre o mujer.
65
Variables y Casos: Todo conjunto de datos puede ser visto como una matriz. Las filas corresponden con
los distintos sujetos o unidades de investigacin, sobre los que se han realizado las distintas
observaciones(columnas). Los sujetos (filas) suelen denominarse casos y las observaciones (columnas)
suelen denominarse variables.
A modo de ejemplo, por caso, dependiendo del estudio, puede entenderse un alumno, un profesor, o una
sesin de clase. Por variables, asociadas a los casos anteriores, puede entenderse el sexo y la edad del
alumno, el cociente intelectual y el rendimiento en una asignatura determinada obtenida en el desarrollo de
una asignatura. Es importante notar que, con frecuencia se confunde, en este ltimo caso, cul es el sujeto
de anlisis, si el alumno con varios episodios de recurrencia o cada episodio de recurrencia es un caso en
s, pudiendo haber varios episodios para un mismo alumno. La distincin de la unidad de anlisis en cada
situacin la marcar el objetivo de la investigacin.
Tipo de variables
Cualitativas Cuantitativas
Contienen informacin cualitativa de los sujetos Miden la magnitud de una medida sobre un
denotando la cualidad o la categora a la que individuo.
pertenece un sujeto.
Nominales Ordinales Escala
Las observaciones se En esta escala de medicin Estas variables miden una magnitud de los sujetos
clasifican en categoras no tiene sentido medir la resultando en un valor numrico. Utilizan escalas
(mutuamente distancia entre posibles numricas y s tiene sentido medir la distancia que
excluyentes y valores de la variable ni se hay entre posibles valores de los datos. En estas
colectivamente pueden realizar operaciones variables cabe distinguir aquellos casos donde el
exhaustivas) sin que aritmticas con ellos pues punto cero es arbitrario (medicin a nivel de
stas tengan un orden no toman valores numricos intervalo) como por ejemplo la temperatura, o
especfico (por ejemplo especficos ni existe datos donde el cero es un punto fijo (nivel de
los grupos sanguneos). proporcionalidad entre razn) como por ejemplo el peso o la glucemia. Si
Un caso particular de categoras vecinas. S bien el SPSS no hace distincin entre variables del
datos nominales es el pueden sin embargo ser tipo escala, los procedimientos estadsticos
caso de los datos ordenados pues existe una distinguen entre variables discretas y continuas.
dicotmicos en los que relacin de orden entre las En el primer caso el conjunto de posibles valores
existen slo dos distintas clases o de la variable es finito siendo en el segundo
categoras (como por categoras. El pronstico de continuo. Un ejemplo de variable discreta es el
ejemplo en el sexo). una enfermedad (menos nmero de das de ingreso en un Hospital, y un
grave, grave, ms grave) es ejemplo de variable continua es la glucemia.
un dato medido en escala
ordinal.
APLICANDO UN CUESTIONARIO
Sr(a)(ta): Se solicita su valiosa colaboracin que nos permita recolectar datos para analizarlos e
interpretarlos de un Trabajo de Investigacin que favorecer a la ciudad de Chimbote.
66
2.- Edad ( en aos cumplidos): .........................
6.- De las alternativa dadas ubique, la regin o zona en que se ubica su domicilio:
67
PRACTICA N 01: DEFINICIN DE VARIABLES DEL CUESTIONARIO AL PAQUETE
ESTADSTICO
1.- Ingrese al programa estadstico SPSS. Defina las variables segn las referencias. Finalmente
guarde con el nombre practica1
ENCUESTA
Los resultados de una encuesta son producto de varios pasos, que involucran el
plano terico y el prctico; un solo error en cualquier proceso amenaza todo lo
hecho.
ORGANIZACIN DE UNA ENCUESTA
Proyecto de Organizacin
cuestionario del trabajo de
terreno
Aplicacin de la
encuesta
OBJETIVOS
Encuesta
piloto Procesamiento
Confeccin
definitiva del
cuestionario Anlisis final
Organizacin
preliminar del
trabajo de terreno
Plan de CONCLUSIONES
tabulacin
LA ENTREVISTA Y EL CUESTIONARIO
ENTREVISTA CUESTIONARIO
MARCO MARCO
TEORICO SITUACIONAL
MARCO
CUESTIONARIO MARCO DE
METODOLOGICO REFERENCIA
Determinar la codificacin de
preguntas cerradas
Primer Momento: Se disearan los instrumentos y deber consultarse a una muestra de expertos
(profesores especialistas), quienes analizaron y evaluaron la estructura de los mismos, teniendo en
cuenta la correlacin de las preguntas, la cohesin y el grado de pertinencia en la orientacin para el
logro de los objetivos planteados y el marco referencial que lo sustenta.
Cuarto Momento: Finalmente se proceder al diseo definitivo de los instrumentos, los mismos que
debern ser aplicados a las muestras respectivas de estudios.
CONFIABILIDAD
Muy Baja Baja Regular Aceptada Elevada
0
1
0% 100%
k
1
S iS2
k 1 S T2
Donde:
K : Es el nmero de tems.
S2i : Sumatoria de varianzas de los tems.
ST2 : Varianza de la suma de los tems.
: Coeficiente de Alfa de cronbach.
EJEMPLO:
Se tienen los resultados referidos a la opinin de 06 alumnos respecto a los tems formulados en un
cuestionario.
ITEMS
ALUMNO I II III
1 3 5 5
2 5 4 5
3 4 4 5
4 4 5 3
5 1 2 2
6 4 3 3
PROCEDIMIENTO:
Paso 1: Calcular las varianzas de cada uno de los tems; en el cuadro de clculo.
ITEMS
ALUMNO I II III
1 3 5 5
2 5 4 5
3 4 4 5
4 4 5 3
5 1 2 2
6 4 3 3
Xi 21 23 23
Xi 2 83 95 97
Si2 1.9 1.37 1.77
Xi 2
x2
n
2
Donde: S i = __________________
n1
SUMA DE ITEMS
13
14
13
12
5
10
Xi = 67
Xi2 = 803
2 x 2
xi
Donde: ST2 = n ST2 = 10.97
n 1
3
1 0.4594348
2
= 0.81085
= 0.81
Paso 5: Interpretacin de la significancia de = 0.81; lo que significa que los resultados de opinin
de los 06 alumnos respeto a los tems considerados se encuentran correlacionados de manera
altamente confiable y muy aceptable.
ANEXO 1:
AREAS BAJO LA CURVA NORMAL
ANEXO 2:
DISTRIBUCIN t STUDENT
T
ANEXO 3:
VALORES CRTICOS DE JI CUADRADA