Você está na página 1de 32

SEMINARIO DE POSGRADO

METODOLOGA DE
INVESTIGACIN
Titular: Agustn Salvia
MDULO 2: MTODOS DE
INVESTIGACIN BASADOS EN EL
ANLISIS DE VARIABLES.

TCNICAS DE ANLISIS ESTADSTICO

ESTADSTICA DESCRIPTIVA
(Medidas de tendencia central y dispersin)
TABLA DE CONTINGENCIA Y ANLISIS PORCENTUALES
(Diferencias porcentuales, perfiles y segmentos)

ANALISIS DE ASOCIACIN
(Correlacin y coeficientes de asociacin)
TECNICAS DE ANALISIS MULTIVARIADO
(Modelos Lazarsfeld, regresiones, factoriales,
clusters)

MEDIDAS ESTADSTICAS
LA ESTADSTICA DESCRIPTIVA TIENE COMO FUNCIN BRINDAR
UN CONJUNTO DE MEDIDAS QUE SINTETICEN LA INFORMACIN
RELEVADA POR LOS DATOS. ESTUDIA CARACTERES O ASPECTOS
REFERIDOS A UN COLECTIVO DE PERSONAS, OBJETO O
ELEMENTOS DE NATURALEZA ESPECFICA.
LA ESTADSTICA DESCRIPTIVA DISPONE DE UNA SERIE VARIADA
DE HERRAMIENTAS PARA RESUMIR INFORMACIN QUE CONTIENE
UNA MUESTRA O POBLACIN: TABLAS, GRFICOS, MEDIDAS DE
TENDENCIA CENTRAL, DE DISPERSIN, ETC.
LA EXTRAPOLACIN DE LOS RESULTADOS DE UNA MUESTRA A LA
POBLACIN Y LA ESTIMACIN DE EFECTOS CAUSALES ES EL
CONTENIDO DE LA ESTADSTICA INFERENCIAL, CUYA FUNCIN ES
INFERIR CONCLUSIONES Y BRINDAR MEDIDAS QUE PERMITAN
CUANTIFICAR LA CONFIANZA DE TALES CONCLUSIONES.

EL EMPLEO DE UN DETERMINADO TIPO Y/O


HERRAMIENTA ESTADSTICA DEPENDE DEL TIPO DE
PROBLEMA/OBJETO DE ESTUDIO Y DEL NIVEL DE MEDIN
DE LOS VALORES DE LA VARIABLE A CONSIDERAR.

LA BASE DE DATOS COMO PUNTO


DE LLEGADA
DADO UN DISEO DE INVESTIGACIN
BASADO EN ENCUESTAS

FORMULACIN DE HIPTESIS, ELABORACIN DE LA


MUESTRA Y EL INSTRUMENTO

APLICACIN CONTROLADA DE CUESTIONARIO

CODIFICACIN, PROCESAMIENTO Y CARGA DE INFORMACIN

BASE DE DATOS

LOS TRES COMPONENTES DE UNA


BASE DE DATOS

Registro (casos)
N

V1

20

V2

V3

Atributo
(variables)
V4

V5

2
A qu se
denomina
Unidad de
Anlisis?

3
4
5
6

Valor
(categora
s)

V.n

DE LOS CONCEPTOS A LOS


INDICADORES

El proceso de operacionalizacin
Determinar las preguntas de
investigacin e hiptesis de trabajo
(proposiciones conceptuales)
Establecer las relaciones esperables
entre dimensiones y variables
(proposiciones empricas)
Creacin / seleccin de indicadores e

REGISTROS: UNIDADES DE
OBSERVACIN

UNIDAD DE ANLISIS / OBSERVACIN


(los registros pueden ser de diversa naturaleza, dependiendo de los
objetivos del estudio)

Ej: personas, familias, empresas,


huelgas, palabras, avisos, muertes,
Eletc.
nmero de registros est dado por el tamao de la muestra de
la poblacin objeto de estudio. Segn las leyes de la estadstica,
cuanto mayor sea el nmero de casos de una muestra probabilstica,
ms confianza y generalizables podrn ser nuestras estimaciones
Por qu? Y si la muestra no es probabilstica?

VARIABLES: ATRIBUTOS DE LA
POBLACIN

Propiedades o atributos observables de


la poblacin o dimensin objeto de
estudio.
Ej:
edad,
nivel
socio-econmico,
preferencias, hbitos de consumo, nivel
educativo
alcanzado,
situacin
ocupacional, condicin de pobreza, etc.
Las variables estadsticas pueden ser:
causales o independientes, contextuales o
intervinientes y descriptivas o dependientes.
Los valores de una variable deben ser
excluyentes y exhaustivos.

VALORES DE LAS VARIABLES

Representacin conceptual cualitativa o


cuantitativa que una propiedad o atributo
objeto de medicin.

Ej: 54 aos, joven, varn, ocupado, catlico,


150$ per cpita, 12 aos de instruccin, feliz,
etc.

MEDIR implica poner en correspondencia una teora o


concepto explicativo y los atributos observables de un objeto a
travs de un lenguaje estndar cuyas reglas de sintaxis
permiten realizar operaciones lgico-matemticas entre sus
valores o categoras. Ej. Masa-Peso / Nivel de Vida-Ingreso.

LAS VARIABLES ESTADSTICAS

NIVEL DE MEDICIN DE LAS VARIABLES


VARIABLES
CATEGRICAS

Divisin en clases

Operaciones bsicas: moda,


porcentajes, tasas, razones.

VARIABLES MTRICAS

Discretas

Continuas

Medidas de tendencia central y


de posicin, varianza, etc.

LAS VARIABLES ESTADSTICAS

Escalas de medida
NOMINAL O DE
CLASIFICACIN
Sexo, ciudad,
situacin laboral,
religin, etc.

DE ORDEN
JERRQUICO
Clase social, nivel
educativo, escalas
de actitud, etc.

INTERVALOS
IGUALES
Fecha del
calendario,
factoriales,
test, etc.

RAZN
N de hijos,
ingresos,
antigedad,
edad, etc.

HERRAMIENTAS BSICAS EN LA ESTADSTICA DESCRIPTIVA

INFORMACIN RESUMEN DE
VARIABLES ALEATORIAS
TENDENCIA CENTRAL
HETEROGENEIDAD O DESVO
FORMA DE LA DISTRIBUCIN

HERRAMIENTAS BSICAS EN LA
ESTADSTICA DESCRIPTIVA

Estadstica
Tabla Descriptiva
de distribucin de
frecuencias

Una de los primeros pasos que se realizan en cualquier


estudio estadstico es la tabulacin de resultados, es
decir, recoger la informacin de la muestra resumida en
una tabla, que denominaremos DISTRIBUCIN DE
FRECUENCIAS, en la que cada valor de la variable o
clase se le asocian el nmero de veces que ha
aparecido, su proporcin con respecto a otros valores
de la variable, etc.
FRECUENCIAS: ABSOLUTAS O PORCENTUALES

En caso de que las variables estn al menos en escala


ordinal aparecen opcionalmente las frecuencias
acumuladas absolutas y acumuladas porcentuales.

Tabla de distribucin de
frecuencias
Definiremos como frecuencia de un dato el nmero de veces que este
aparece en el colectivo. Siendo N la suma de las respectivas frecuencias
de cada dato (N=Xi). Este N ser denominado como frecuencia total. A
efectos prcticos, asumiremos las siguientes definiciones de frecuencias:
a) frecuencias absolutas : es el nmero de veces que aparece dicho valor
de la variable y se representa por fi.
b) frecuencias relativas: es el cociente entre la frecuencia absoluta y el
tamao de la muestra. La denotaremos por fri
c) frecuencias absoluta acumulada: es el nmero de veces que ha
aparecido en la muestra un valor menor o igual que el de la variable, se
puede acumular, en la tabla estadstica) en orden ascendente (fa) o
descendente (fa)
d) frecuencia relativa acumulada: al igual que en el caso anterior se
calcula como el cociente entre la frecuencia absoluta acumulada dividido por
el tamao de la muestra (N).

GRFICOS ESTADSTICOS
Diagrama de barras: Se utilizan rectngulos separados, que tienen
como base a cada uno de los datos y como altura la frecuencia de ese
dato.
Ejemplo: En la siguiente tabla se muestra el total de vacunas aplicadas
durante el verano de l991 en un estado de la Repblica Mexicana.

GRFICOS ESTADSTICOS
Grfica de Torta: Se forma al dividir un crculo en sectores circulares de
manera que: a) cada sector circular equivale al porcentaje
correspondiente al dato o grupo que representa; y b) la unin de los
sectores circulares forma el crculo y la suma de sus porcentajes es 100.

Estadstica
Descriptiva
Variable nominal
PEA

PEA
5000000

Valid

Activo
Inactivo
Total

Frequency
4699861
1207374
5907235

Percent
79,6
20,4
100,0

Valid
Percent
79,6
20,4
100,0

Cumulativ
e Percent
79,6
100,0

4000000

3000000

Frequency

2000000

Statistics
PEA
N
Mode

1000000

Activo

Valid
Missing

5907235
0
1,00

PEA

TEMPORARY .
SELECT IF (h12>25 AND
h12<45) .
FREQUENCIES
VARIABLES=cdea
/STATISTICS=MODE
/BARCHART FREQ

Cases w eighted by PONDERA

Inactivo

GRFICOS ESTADSTICOS
Ojiva de Frecuencias Acumuladas: Una grfica de distribucin de
frecuencias absolutas o relativas acumuladas es llamada una ojiva. Se
trazan los lmites reales superiores contra las frecuencias acumuladas.

ESTADSTICA DESCRIPTIVA
Statistics
Grupos de edad
N
Valid
Missing
Median
Range
Minimum
Maximum
Percentiles
20
25
50
75
80

VARIABLE CUALITATIVA
EN ESCALA ORDINAL
Grupos de edad

Valid

0.- 9 aos y menos


1.- de 10 a 19 aos
2.- de 20 a 29 aos
3.- de 30 a 39 aos
4.- de 40 a 49 aos
5.- de 50 a 59 aos
6.- 60 aos y ms
Total

Frequency
4077127
4506457
4023557
3053744
2917893
2326358
3361616
24266752

Percent
16,8
18,6
16,6
12,6
12,0
9,6
13,9
100,0

Valid
Percent
16,8
18,6
16,6
12,6
12,0
9,6
13,9
100,0

Cumulativ
e Percent
16,8
35,4
52,0
64,5
76,6
86,1
100,0

24266752
0
2,0000
6,00
,00
6,00
1,0000
1,0000
2,0000
4,0000
5,0000

Grupos de edad
5000000

4000000

3000000

2000000

Frequency

FREQUENCIES
VARIABLES=xgedad
/NTILES= 4
/PERCENTILES= 20 80
/STATISTICS=RANGE MINIMUM MAXIMUM
MEDIAN
/BARCHART FREQ
/ORDER ANALYSIS .

1000000
Std. Dev = 2,02
Mean = 2,7
N = 24266752,0

0
0,0

1,0

Grupos de edad
Cases weighted by PONDERA

2,0

3,0

4,0

5,0

6,0

HERRAMIENTAS BSICAS EN LA
ESTADSTICA DESCRIPTIVA
VARIABLES CUANTITATIVAS

GRFICOS ESTADSTICOS
Histograma: Se utiliza en datos cuantitativos en distribuciones de
frecuencia. Son rectngulos verticales unidos entre s, en donde sus lados
son los lmites reales inferior y superior de clase y cuya altura es igual ala
frecuencia de clase.

ESTADSTICA DESCRIPTIVA

Variable cuantitativa
Edad
Statistics

Mean
Std. Error of Mean
Median
Mode
Std. Deviation
Variance
Skewness
Std. Error of Skewness
Kurtosis
Std. Error of Kurtosis
Range
Minimum
Maximum
Sum
Percentiles

Valid
Missing

10
25
50
75
90

24.266.752
0
32,15
,00
28
21
22,03
485,49
,53
,00
-,64
,00
99
0
99
780.121.228
6
14
28
48
65

2000000

1000000
Frequency

Edad
N

3000000

Std. Dev = 22,03


Mean = 32,1

N = 24266756,0

Edad
Cases weighted by PONDERA

FREQUENCIES
VARIABLES=xh12 /FORMAT=NOTABLE
/NTILES= 4
/PERCENTILES= 10 90
/STATISTICS=STDDEV VARIANCE RANGE MINIMUM MAXIMUM
SEMEAN MEAN MEDIAN MODE
SUM SKEWNESS SESKEW KURTOSIS SEKURT
/HISTOGRAM NORMAL
/ORDER ANALYSIS .

ESTADSTICA DESCRIPTIVA MEDIA


ARITMTICA
La MEDIA ARITMTICA O PROMEDIO es una medida
estadstica de tendencia central. De una cantidad finita de
nmeros, es igual a la suma de todos ellos dividida entre el
nmero de sumandos.
Tambin la media aritmtica puede ser denominada como
centro de gravedad de una distribucin, el cual no es
necesariamente la mitad.

ESTADSTICA DESCRIPTIVA - DESVO


ESTNDAR

La desviacin estndar (o desviacin tpica) es


una medida de dispersin para variables de razn
(ratio o cociente) y de intervalo. Es una medida
(cuadrtica) que informa de la media de distancias
que tienen los datos respecto de su media aritmtica,
expresada en las mismas unidades que la variable.
Para tal fin nos valemos la varianza y la desviacin
estndar. Ambas medidas estn estrechamente
relacionadas ya que se define una a partir de la otra.
Expresin de la varianza:

Expresin de la desviacin estndar:

HERRAMIENTAS BSICAS EN LA ESTADSTICA DESCRIPTIVA

UN TIPO PARTICULAR DE
DISTRIBUCIN PARA VARIABLES
ALEATORIAS MTRICAS

LA CURVA NORMAL
SUS PROPIEDADES
SUS ESTADSTICOS

ESTADSTICA DESCRIPTIVA LA
DISTRIBUCIN NORMAL

Muchas variables aleatorias presentan una funcin de densidad que


es simtrica y cuya grfica tiene forma de campana.
Esta distribucin es utilizada en aplicaciones estadsticas como
modelo o parmetro de comparacin dada la frecuencia o normalidad
con la que ciertos fenmenos tienden a parecerse a esta distribucin.
La distribucin normal queda definida por dos parmetros:
LA MEDIA Y EL DESVIACIN ESTNDAR

ESTADSTICA DESCRIPTIVA - DISTRIBUCIN


Para conocer con detalle un conjunto
de datos, no basta con conocer las medidas
NORMAL

de tendencia central, sino que necesitamos conocer tambin la desviacin que


representan los datos en su distribucin respecto de la media aritmtica de dicha
distribucin, con objeto de tener una visin de los mismos ms acorde con la
realidad a la hora de describirlos e interpretarlos para la toma de decisiones.

La media indica la posicin de la campana, de modo que para


diferentes valores de la grfica es desplazada a lo largo del eje
horizontal. La desviacin estndar determina el grado de
apuntamiento de la curva. Cuanto mayor sea su valor ms se
dispersarn los datos. Un valor pequeo indica una gran probabilidad
de obtener datos cercanos al valor medio de la distribucin.

ESTADSTICA DESCRIPTIVA LA CURVA


NORMAL
La curva de distribucin normal presenta
una nica moda, que coincide con
la media y la mediana. La curva normal es asinttica al eje de abscisas. El
rea total bajo la curva es igual a 1. El rea bajo la curva comprendido entre
los valores situados a dos desviaciones estndar de la media es
aproximadamente igual a 0.95. Es decir, existe un 95% de posibilidades de
observar un valor comprendido en el intervalo -1,96 desvo estndar y +1,96
desvo estndar de la media.

ESTADSTICA DESCRIPTIVA - DISTRIBUCIN


NORMAL
El uso extendido de la distribucin normal en las aplicaciones
estadsticas puede explicarse, adems, por otras razones. Muchos
de los procedimientos estadsticos habitualmente utilizados asumen
la normalidad de los datos observados (p. e. el muestreo).
Resulta recomendable contrastar siempre si se puede asumir o no
una distribucin normal. Para ello, la simple exploracin visual de
los datos puede sugerir la forma de su distribucin.
No obstante, existen medidas (simestra y kurtosis), grficos de
normalidad y contrastes de hiptesis que pueden ayudarnos a
decidir, de un modo ms riguroso, si la muestra de la que se dispone
procede o no de una distribucin normal.
Cuando los datos no sean normales, podremos o bien
transformarlos o emplear otros mtodos estadsticos que no exijan
este tipo de restricciones (los llamados mtodos no paramtricos).

GRFICOS ESTADSTICOS
En los grficos PROBABILIDAD NORMAL P-P se confrontan las
proporciones acumuladas de una variable con las de una distribucin
normal. Los grficos permiten conocer la causa de esa desviacin. Una
curva en forma de "U significa que la distribucin es asimtrica,
mientras que un grfico en forma de "S" significar que la distribucin
tiene colas mayores o menores que la normal, esto es, que existen pocas
o demasiadas observaciones en las colas.

TRABAJO PRCTICO N 1
A partir de un tema propuesto formule un problema de investigacin que
requiera de datos estadsticos. Elabore una conjetura o hiptesis general y otra
operativa.
Identifique el dominio emprico al que remite el problema a investigar y elabore
un diseo de investigacin a partir del cual identificar la poblacin, las variables
y los atributos que deben ser estudiados.
Sugiera el tipo de anlisis estadstico descriptivo que deber aplicar para
explorar o testear su hiptesis con la informacin obtenida.

Você também pode gostar