Escolar Documentos
Profissional Documentos
Cultura Documentos
1
Tipos de variables
Recordando lo mencionado:
Medicin
2
Cualitativas: Indican cualidad (rojo/verde, casado/soltero).
- Dicotmicas: dos valores.
- Politpicas: varios valores
- Ordinal: orden intervalos no siempre regulares. (l/m/h)
Cuantitativas: numrica que indica cantidad.
- Discreta: nmero de hijos 1, 2, 3, etc
- Continua: peso 62.5, 70.1, 53.6, etc
Dependencia
Dependientes: Toman su valor como funcin de otras cantidades.
Independientes: No depende de otro valor, el investigador puede fijarlas
arbitrariamente. Ej: reactivo adicionado.
Influencia
Intervinientes
Moderadoras
En general, son aquellas que pueden cambiar el
escenario o efecto de las variables. Ejemplo: Azucar
diaria requerida: si diabtico / no diabtico.
Descripcin de series de datos
3
Descripcin de series de datos
Recordando lo mencionado:
De la serie de datos
podemos definir:
4
Tendencia central (valor esperado)
Dispersin (distancia al centro)
Distribucin (forma en que se ubican los datos)
Descripcin de series de datos
Supongamos una serie de datos:
5
Podramos ordenarlos de menor a mayor:
Datos 5,4 2,9 5,1 4,2 5,4 4,7 7,9 4,8 7,6 3,2
Datos (ord) 2,9 3,2 4,2 4,7 4,8 5,1 5,4 5,4 7,6 7,9
Del ordenamiento vemos que los datos se encuentran entre 2,9 y 7,9. Entonces ya sabemos el
mnimo, el mximo y el rango (max-min). Para el caso, 2,9, 7,9 y 5,0 respectivamente .
Ubicndolos en un eje, tendremos una idea de cmo estn distribuidos:
A primera vista podemos decir que los datos
estn centrados en algo como 4,9 y que la
mayora est entre 4 y 6.
x
2 3 4 5 6 7 8
x x x x x x x x
Descripcin de series de datos
6
Podramos ordenarlos de menor a mayor:
Datos (ord) 2,9 3,2 4,2 4,7 4,8 5,1 5,4 5,4 7,6 7,9
En un sentido formal, las maneras ms tpicas de definir el centro de los datos son:
Media: el promedio aritmtico de toda la serie: 5,12.
Mediana: El dato que se encuentra justo al centro de los datos ordenados: 4,95.
Moda: El dato que ms se repite: 5,4.
De la misma forma, la dispersin puede ser calculada segn:
Varianza: diferencia cuadrtica media.
Desviacin estndar (tpica o esperada).
Rango inter cuartil.
Descripcin de series de datos
2
3
4
5
6
7
8
9
0 1 2 3 4 5 6 7 8 9 10 11
D
a
t
o
Tiempo
Datos en el tiempo
Demos un vistazo a los datos a travs del tiempo:
Datos 5,4 2,9 5,1 4,2 5,4 4,7 7,9 4,8 7,6 3,2
Es razonable considerar una medida de la dispersin de los puntos respecto al centro calculada
segn:
El problema surge cuando, al haber valores positivos y negativos , la
distancia promedio tiene a anularse y acercarse a cero. Lo cual no
representa.
Podemos trabajar las distancias como valores absolutos :
Pero es una funcin compuesta:
(computacionalmente costosa)
x i i
x d =
x i i
x d =
s
>
= =
x i i x
x i x i
x i i
x x
x x
x d