Escolar Documentos
Profissional Documentos
Cultura Documentos
Tema 1
ESTADSTICA DESCRIPTIVA: LA CALIDAD Y LA VARIABILIDAD
1
La estadstica descriptiva
La estadstica descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una poblacin, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc.) y trata de extraer conclusiones sobre el comportamiento de estas variables. Las variables pueden ser de dos tipos: Variables cualitativas o atributos: no se pueden medir numricamente (por ejemplo: nacionalidad, color de la piel, genero, tipos de defectos, etc.). Variables cuantitativas: tienen valor numrico (edad, precio de un producto, ingresos anuales, volumen, peso, calibre, etc.). Variables cualitativas o atributos Variables cuantitativas
Variables cualitativas o atributos Variables cuantitativas
Tipos de variables
Las variables tambin se pueden clasificar en: Variables unidimensionales: slo seleccionan informacin sobre una caracterstica (por ejemplo: edad de los alumnos de una clase). Variables bidimensionales: recogen informacin sobre dos caractersticas de la poblacin (por ejemplo: edad y altura de los alumnos de una clase). Variables pluridimensionales: recogen informacin sobre tres o ms caractersticas (por ejemplo: edad, altura y peso de los alumnos de una clase). Cules sern las variables unidimensionales, bidimensionales y pluridimensionales de un proceso de inyeccin de plstico?
4
Variables cuantitativas
Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas: Discretas: slo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: nmero de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podr ser 3.45). Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehculo puede ser 80.3 km/h, 94.57 km/h...etc.
Variables Discretas Variables Continuas
Concepto de muestreo
El muestreo es una herramienta de la investigacin cientfica. Su funcin bsica es determinar que parte de una realidad en estudio (poblacin o universo) debe examinarse con la finalidad de hacer inferencias sobre dicha poblacin. El error que se comete debido a hecho de que se obtienen conclusiones sobre cierta realidad a partir de la observacin de slo una parte de ella, se denomina error de muestreo. Obtener una muestra adecuada significa lograr una versin simplificada de la poblacin, que reproduzca de algn modo sus rasgos bsicos.
7
Muestra
En todas las ocasiones en que no es posible o conveniente realizar un censo, lo que hacemos es trabajar con una muestra, entendiendo por tal una parte representativa de la poblacin. Para que una muestra sea representativa, y por lo tanto til, debe de reflejar las similitudes y diferencias encontradas en la poblacin, ejemplificar las caractersticas de la misma.
8
Muestra
Cuando decimos que una muestra es representativa indicamos que rene aproximadamente las caractersticas de la poblacin que son importantes para la investigacin.
Muestreo probabilstico
Los mtodos de muestreo probabilsticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamao n tienen la misma probabilidad de ser elegidas. Slo estos mtodos de muestreo probabilsticos nos aseguran la representatividad de la muestra extrada y son, por tanto, los ms recomendables.
10
Mtodos de muestreo
Muestreo aleatorio simple Muestreo estratificado Muestreo sistemtico Muestreo polietpico o por conglomerados
11
13
22
23
25
26
Distribucin de frecuencia
La distribucin de frecuencia es la representacin estructurada, en forma de tabla, de toda la informacin que se ha recolectado sobre la variable que se estudia.
Variable
(Valor) x X1 X2 ... Xn-1 Xn x n1 n2 ... nn-1 nn
Frecuencias absolutas
Simple x n1 n1 + n2 ... n1 + n2 +..+ nn-1 n Acumulada x
Frecuencias relativas
Simple x f1 = n1 / n f2 = n2 / n ... fn-1 = nn-1 / n fn = nn / n f1 f1 + f2 ... f1 + f2 +..+fn-1 f Acumulada
Siendo X los distintos valores que puede tomar la variable. Siendo n el nmero de veces que se repite cada valor. Siendo f el porcentaje que la repeticin de cada valor supone sobre el total 28
Estatura
x 1.25 1.28 1.27 1.21 1.22 1.29 1.30 1.24 1.27 1.29
Alumno
x Alumno 11 Alumno 12 Alumno 13 Alumno 14 Alumno 15 Alumno 16 Alumno 17 Alumno 18 Alumno 19 Alumno 20
Estatura
x 1.23 1.26 1.30 1.21 1.28 1.30 1.22 1.25 1.20 1.28
Alumno
x Alumno 21 Alumno 22 Alumno 23 Alumno 24 Alumno 25 Alumno 26 Alumno 27 Alumno 28 Alumno 29 Alumno 30
Estatura
x 1.21 1.29 1.26 1.22 1.28 1.27 1.26 1.23 1.22 1.21 29
34
Porcentaje acumulado
36
200
100
60 100 40 50 0 tensin rayado burbuja fractura mancha rajadura otros Tipos de defectos 20 0
Porcentaje acumulado
150
80
37
40
b) Media geomtrica: se eleva cada valor al nmero de veces que se ha repetido. Se multiplican todo estos resultados y al producto final se le calcula la raz "n" (siendo "n" el total de datos de la muestra).
42
Histograma
El histograma se utiliza para representar las diferencias en frecuencias absolutas y relativas entre los intervalos o clases de una variable. Es un tipo de grfica de barras verticales donde el ancho de cada barra corresponde a los lmites de cada clase. Los lmites de cada clase aparecen en el eje horizontal y la frecuencia en el vertical. A veces se indica la frecuencia exacta sealndola en la parte superior de la barra.
45
Muestra 1 a 10 11 a 20 21 a 30 31 a 40 41 a 50 51 a 60 61 a 70 71 a 80 81 a 90 2.51 2.527 2.529 2.52 2.535 2.533 2.525 2531 2.518 2.517 2.536 2.523 2.514 2.523 2.51 2.515 2.545 2.527 2.522 2.506 2.523 2.512 2.526 2.542 2.52 2.524 2.511
Resultados de la medicin 2.522 2.541 2.523 2.534 2.525 2.524 2.519 2.522 2.519 2.51 2.512 2.519 2.526 2.532 2.53 2.526 2.52 2.531 2.511 2.515 2.528 2.53 2.522 2.521 2.527 2.519 2.527 2.519 2.521 2.543 2.532 2.502 2.522 2.522 2.519 2.529 2.532 2.536 2.538 2.526 2.53 2.535 2.542 2.529 2.528 2.543 2.529 2.518 2.523 2.522 2.54 2.54 2.522 2.519 2.525 2.524 2.534 2.52 2.514 2.528 2.528 2.513 2.521
46
61 a 70
71 a 80 81 a 90
2.525
2531 2.518
2.515
2.545 2.527
2.52
2.524 2.511
2.519
2.522 2.519
2.526
2.52 2.531
2.527
2.519 2.527
2.522
2.519 2.529
2.542
2.529 2.528
2.54
2.522 2.519
2.528
2.513 2.521
2.542
2.545 2.531
2.515
2.513 2.511
2.545
2.502
Determine los lmites de los intervalos de manera que incluyan los valores mnimos y mximos, y escrbalos en la tabla de frecuencia. Primero, determine el lmite inferior de la primera clase y smele la amplitud del intervalo para obtener el lmite entre la primera y la segunda clase. Cuando lo haga cercirese de que la primera clase contiene el valor mnimo. El lmite inferior de la primera clase se ubica de la unidad de medida a partir del valor mnimo observado. Luego, siga sumando la amplitud del intervalo al valor previo para obtener el segundo lmite, el tercero, y as sucesivamente, y por ltimo verifique que la ltima clase contiene al valor mximo.
49
intervalo 1 2 3 4 5 6 7 8 9
clase punto medio conteo 2.5005-2.5055 2.5055-2.5105 2.5105-2.5155 2.5155-2.5205 2.5205-2.5255 2.5255-2.5305 2.5305-2.5355 2.5355-2.5405 2.5405-2.5455 Total
frecuencia
50
Histograma
20 15 10 5 0 2.5 2.51 2.51 2.52 2.52 2.53 2.53 2.54 2.54 Dimetro del eje
52
53
Cuando se construye un histograma jams se debe cortar el eje vertical de las frecuencias. Si esto se hace la grfica es engaosa. Sin embargo el eje horizontal si se puede cortar y hasta el cero se puede excluir, siempre que 54 todas las clases aparezcan en la grfica.
Si se estira el eje horizontal o se encoge el eje vertical, se puede modificar el impacto visual de la grfica dando a entender que el cambio ha sido mayor.
55
A menudo se utilizan barras o figuras para representar frecuencias. El problema con las barras y otras figuras es que los cambios se representan aumentando el volumen total de la figura, no solamente el alto. Esto crea la 56 impresin de que el cambio ha sido mayor.
Medidas de dispersin
Estudia la distribucin de los valores de la serie, analizando si estos se encuentran ms o menos concentrados, o ms o menos dispersos. Existen diversas medidas de dispersin, entre las ms utilizadas podemos destacar las siguientes: 1.- Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor ms elevado y el valor ms bajo. 2.- Varianza: Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatoria de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el nmero de veces que se ha repetido cada valor. La sumatoria obtenida se divide por el tamao de la muestra. La varianza siempre ser mayor que cero. Mientras ms se aproxima a cero, ms concentrados estn los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, ms dispersos estn.
57
Medidas de dispersin
3.- Desviacin tpica: Se calcula como raz cuadrada de la varianza. 4.- Coeficiente de variacin de Pearson: se calcula como cociente entre la desviacin tpica y la media.
58
2. 3.
4.