Você está na página 1de 34

1.

CONCEPTO:
Anlisis de datos es la tcnica que consiste en el estudio de los hechos
y el uso de sus expresiones en cifras para lograr informacin.
1.1 OBJETIVOS QUE SE PROPONEN LOS INVESTIGADORES CUANDO
ANALIZAN DATOS

En general, el anlisis pretende hacer explicitas las propiedades,


notas y rasgos de todo tipo que, en relacin a las variables estudiadas.
Greenberg, Goldstucker y Bellenger sealaron con nfasis que
pretenden los investigadores cuando analizan datos:
Hallar lo que hay en los datos.
Conocer que variaciones ocurren en los datos.
Como estn distribuidos los datos.
Qu relacin existe entre las variables.
Las estimaciones que resultan de los datos.
Describir las diferencias entre grupos y variables.
Determinar variables que causan variacin en otras variables.
2. CLASES DE ANLISIS DE DATOS
Existen diversos ordenamientos de los anlisis de datos que dependen
del criterio de clasificacin, de acuerdo al nmero de variables, es
decir si tenemos en cuenta cuantas variables se analizan:
multivariables y multivariable.
De acuerdo al CARCTER DEL ANLISIS, puede ser: exploratorio, si se
quiere encontrar nuevas hiptesis; si se quiere verificar las que
anteriormente se formularon, entonces en este ltimo caso el anlisis
ser confirmado.
Segn la NATURALEZA DEL ANLISIS, vale decir de acuerdo a lo que es
el anlisis, este puede ser cuantitativo o cualitativo.
Segn el objetivo que pretende el anlisis, este ser causal, cuando se
quiere llegar a las causas.
3. USO DEL ANLISIS SEGN EL NMERO DE VARIABLES
En la investigacin universitaria destacamos este anlisis puesto que
permite al investigador la ejecucin de las siguientes operaciones:
a) Sintetizar lo que se observa en una variable.
b) Comparar lo que se observa en dos variables.
c) Expresar la asociacin que existe entre dos o ms variables.
d) Inferir conocimientos a partir de los logros a), b) y c).
4. IMPORTANCIA DE LA DISTINCIN DE VARIABLES PARA USAR LAS
TCNICAS ESTADSTICAS

Precisar las clases de variables es importante en la instancia del


anlisis de datos, puesto que es segn el tipo de variable que se
usaran las tcnicas estadsticas. Las variables pueden clasificarse
entonces segn su utilidad para expresar clculos estadsticos:
VARIABLES NOMINALES: Se caracterizan porque los nmeros se
asignan a las categoras se usan como smbolos o cdigos para
su ulterior clasificacin. Por ejemplo, se asigna a los alumnos el

nmero 1 para
desaprobados.

la

categora

de

aprobados

para

VARIABLES ORDINALES: Son aquellas variables cuyos nmeros

se asignan a quienes tienen una caracterstica determinada, lo


cual permite el ordenamiento o el rango. As, por ejemplo
queremos establecer un orden entre los alumnos de un aula, de
un ao escolar en un colegio, o entre los alumnos de todas las
aulas del tercer ao de secundaria de Lima Metropolitana. Para
cumplir con el objetivo planteado, asignamos el nmero 1 para
alumnos que obtienen la clasificacin entre 17 y 20 en sus
promedios de clasificacin anual, 2 para alumnos que obtienen
la clasificacin entre 14 y 16, etc.
VARIABLES INTERVALORES: Son aquellas variables que se
caracterizan distancias iguales entre objetivos que se estudian
tomando como referencia una determinada propiedad. Por
ejemplo, un estudiante obtuvo de promedio de calificaciones 15,
otro 13, otro 11 y otro 9. La distancia entre 15 y 13 es igual
entre 11 y 9, es decir, 2.
VARIABLES PROPORCIONALES: Son variable que tienen las
mismas caractersticas que las variables intervalores, pero
adems poseen el cero real. Por ejemplo: la edad de las
personas. En este caso existe n cero real, al igual que en los
aos de estudios (escolaridad) y en los ingresos en un periodo
de tiempo determinado.

5. TCNICAS ESTADSTICAS QUE SE PUEDE USAR CON LAS CLASES


DE VARIABLES

Que con tcnicas de estadsticas del anlisis univariado que


puede emplear quien elabora una tesis las variables nominales
solo se pueden usar la tcnicas estadsticas siguientes:
distribucin de frecuencia, el coeficiente de rango y mediana.
Quiere decir que con valores de este tipo de variables no se
pueden calcular medias aritmticas, varianza no desviaciones
estndares.
Que con las variables proporcionales se pueden emplear todas
las tcnicas estadsticas.
Con las variables intervalares se pueden aplicar todas las
tcnicas estadsticas menos el coeficiente de variacin.

6. TCNICAS DE ESTADSTICAS DEL ANLISIS UNIVARIADO QUE


PUEDE EMPLEAR QUIEN ELABORA UNA TESIS

La interpretacin es posible para el investigador en tanto este pueda


comparar los resultados entre s o tambin compararlos con otros
resultados ofrecidos en otras circunstancias.

Es posible ofrecer un panorama del proceso que sigue el investigador


cuando lleva a cabo el anlisis e interpretacin de datos. He aqu una
presentacin de los pasos:
a) El investigador toma como punto de partida los resultados
estadsticos
b) Ejecuta la normalizacin de los resultados, lo cual quiere decir
que el
investigador formula las pautas para realizar
comparaciones.
c) Hace la comparacin entre unos valores de la variable
(comparacin interna), correspondiente al mismo grupo
poblacional y puede tambin hacer comparaciones con valores
de otra poblaciones (comparacin externa).
d) Enuncia los estadsticos que reflejan las conclusiones del anlisis
estadstico.
e) Contrasta sus hallazgos con la teora existente respecto del os
que estudia.
7. PROPIEDAD QUE SE DESCRIBEN CUANDO SE ESTUDIA UNA
VARIABLE:

Cuando se estudia una variable se describen tres propiedades,


llamadas tambin caractersticas mayores:
Posicin
Dispersin
Forma
8.
MEDIDAS DESCRIPTIVAS CON LAS QUE SE REPRESENTA LAS
PROPIEDADES DE POSICIN, DISPERSIN Y FORMA

El siguiente cuadro resume que propiedades de datos se describen


cuando se estudia una variable. Las medidas descriptivas que
corresponden a cada una de las tres propiedades (posicin, dispersin
y forma), as como sus expresiones.
Estudio de datos de una variable
Propiedad
Posicin

Dispersin

Forma

Tipo de medida

Expresiones
(estadsticos)
Medidas
de Media aritmtica
tendencia central Mediana
Moda o modo
Medida
de Cuartles
tendencia
no
central
Medidas
de Recorrido
dispersin
o Varianza
variabilidad
Desviacin estndar
Coeficiente de variacin
Simetra
Asimetra o sesgada
Simtrica
o
con

Modalidad
Curtosis

sesgamiento
Modos
en
una
distribucin
Razn de momentos de
Pearson

8.1 CONCEPTOS DE LAS PROPIEDADES O CARACTERSTICAS MAYORES

Aqu ofrecemos las definiciones que permiten precisar los conceptos de


las propiedades o caractersticas mayores que corresponden al anlisis
de datos de una varianza.
Posicin : Caractersticas la ms importante que permite describir o

resumir la ubicacin de un grupo de datos, expresndola


estadsticamente con medidas de tendencia central (media aritmtica,
mediana y modo) y con medidas de tendencia no central: los cuartiles.
Dispersin: Propiedad o caracterstica que expresa la cantidad de

variacin o disminucin expresada en los datos.


Forma: Propiedad o caracterstica mayor que expresa la manera en

que se distribuyen los datos. Los tipos de medida que se usa para
expresar la forma de los datos son la simetra, la modalidad y la
curtosis.
8.2

CONCEPTO DE MEDIDAS DE TENDENCIA CENTRAL

Se denomina medidas de tendencia central a aquellas medidas que


describen la localizacin de los valores de las variables que se
estudian. La media aritmtica, la mediana y el modo (o moda) son
medidas de tendencia central.
9. CONCEPTO Y REGLAS PARA EL USO DE CADA UNA DE LAS MEDIDAS
DE LA TENDENCIA CENTRAL
9.1. MEDIA ARITMTICA (X)

Se denomina media aritmtica (x) a aquella medida que caracteriza a


un grupo de estudio con un solo valor y que se expresa como el
cociente que resulta de dividir la suma de todos los valores o puntajes
entre el nmero total de los mismos.
El investigador sabe que para hallar la media aritmtica debe usar las
siguientes formulas:
a) Cuando se usa datos no agrupados

Dnde:
= Media aritmtica

= Suma
= Valores individuales de la variable
= nmero de valores o casos.
Ejemplo:
A seis estudiantes se les interroga: Cuntas veces a la semana
acuden a la biblioteca de la facultad a la que pertenecen? Y ellos
respondieron de la siguiente manera:
1 - 2 - 2 1 3 3 (seis respuestas, es decir, el primero respondi
que una vez a la semana acude a la biblioteca de su facultad, el
segundo contest que dos, el tercero que dos, le cuarto que una, el
quinto que tres y el sexto que tres), entonces, aplicando la formula
anterior, es decir, reemplazando las expresiones de la frmula pro
sus valores respectivos, tenemos:

Segn el resultado, los alumnos acuden a la biblioteca de la


facultad, en promedio, dos veces a la semana.
b) Cuando se usa datos agrupados
Dnde:
= punto medio de la clase
= frecuencia dela clase i de la distribucin
= suma de productos f1 x1
Usar la media aritmtica en la investigacin universitaria sirve
para:
I. Expresar globalmente una informacin que frecen los datos
II.
Expresar una media estable
III.
Tener una media consistente
IV.
Obtener un dato fundamental para otros estadstico
9.2. LA MEDIANA (MDN)

Es la medida de tendencia central que expresa el valor que ocupa el


lugar central entre los valores ordenados segn su magnitud.
Ejemplo de mediana:
La produccin diaria en una fbrica de calzado en la cual se trabaja los
siete das de la semana, expresada en docenas de calzado y
presentada ordenadamente, es como sigue:
40 42 43 47 48 50 51
Se observa fcilmente que el valor central es 47.

Vamos al siguiente cuadro en el cual se expresan los aos de estudio


de un grupo de trabajadores de una fbrica:
En este caso, como es un fenmeno acumulativo se tiene el siguiente
cuadro de frecuencias:
X1
F1
11
3
6
2
16
7
18
2
19
1
Los valores obtenidos son los siguientes
11 11 11 6 6 16 16 16 16
19
Al ordenar los valores se obtiene:
6 6 11 11 11 16 16 16 16
19
Al apreciar el valor central, se tiene 16

16

16

16

18

18

16

16

16

18

18

9.2.1. PROCESO PARA OBTENER LA MEDIANA CUANDO EL NMERO DE


VALORES ES PAR

En el caso en que el nmero de valores ordenados sea par, se


considera el promedio de los dos valores centrales. Por ejemplo: si el
registro de los valores fuera:
10 42 43 47 53 55 59 60 61 63
Los valores centrales son 53 y 55, para considerar su promedio se
tiene:

La mediana en este caso es 54


9.2.2 CUNDO SE USA LA MEDIANA?

Los investigadores usan la medida cuando los valores estn muy


seguidos y hay dato con valor extremo. La mediana no es afectada por
el hecho de que los valores apareados aparezcan cargados a un
extremo, pues se trata de un valor que esta entre 50% de unos y 50%
de otros.
9.2.3 LA MODA (MO)

La moda o modo es el valor tpico o comn en un conjunto de datos, es


decir, el valor que mas se repite, el que se presenta con mayor
frecuencia.
9.3.1 LOS DATOS BIMODALES

Cuando los datos presentan situaciones en las que son dos los valores
que se repiten con ms frecuencia, los datos se llaman bimodales.
Por ejemplo: Considrese que la seccin maestra de una escuela de
posgrado tiene 14 aulas. En cada aula hay diferentes nmeros de
carpetas, segn la siguiente tabla:
x1
20
25
26
28
30

f1
1
4
4
3
2
14
Tal como se puede observar fcilmente, los valores que hay ms se
repiten son dos: 25 y 26, los que se reconocen como datos bimodales.
Cuando no se repite ningn valor no hay moda.
9.3.2 CUANDO USAR LA MODA

Aunque la moda se puede usar con todas las escalas, se usa


preferentemente cuando se trabaja con escalas nominales. En realidad
el uso de la moda la restringe el investigador solo a los casos en los c
pretende ofrecer una idea aproximada acerca de donde esta la mayor
concentracin de observaciones.
9.3.3 APLICACIN DE LA RELACIN DE PEARSON

La relacin de Pearson es una estimacin prctica del modo, siempre


que la distribucin no sea bimodal y se acerque bastante a la modal.
10. MEDIDAS DE TENDENCIA NO CENTRAL
10.1. CONCEPTO

Son medidas tiles para una posicin no central, empleadas para


resumir y describir un conjunto de datos. Estas medidas de tendencia
no central se denominan cuartles.
10.2. CONCEPTO DE CUARTLES

Los cuartiles constituyen una clase de los (n-1) valores de


participacin de una aleatoria que dividen a la frecuencia total de una
poblacin o de una muestra dado n de partes iguales.
10.3. CLASES DE CUARTLES

Los cuartles dividen de una distribucin de n partes iguales. Cuando


estas partes son cuatro se denominan cuartiles. Si se divide en diez
partes son deciles y si se dividen en cien, percentiles.
Si S tiene una distribucin cuyo total de observaciones las dividimos en
cuatro partes iguales, para expresarla grficamente requerimos de tres
cuartiles, como lo muestra el siguiente grafico:

1er. Cuartil: Q1
2do. Cuartil: Q2
3er. Cuartil: Q3
Donde Q1 divide las observaciones en dos grupos: el 25% de las
observaciones son menores al valor del Q1 y 75% de las observaciones
son mayores.
Q2 es la mediana: ya sabemos que el50% de las observaciones son
menores a la mediana (que en este caso coincide con el segundo
cuartl) y 50% de las observaciones son menores que ella.
Q3 divide a las observaciones en dos grupos: 75% de ellas son menores
al Q3 y el 25% son mayores.
10.4. CONCEPTO DE RANGO APLICADO A LOS CUARTILES

Se denomina rango de cuartiles a las posiciones que les corresponde a


los cuartiles les correspondern los siguientes rangos:
Rango del primer cuartil

Rango del segundo cuartl

Rango del tercer cuartl

10.5. OBTENCIN DE LOS DECILES Y PERCENTILES

Para obtener los deciles se divide el total de frecuencias entre diez,


mientras que para la obtencin de los percentiles necesitamos dividir
el total de frecuencias entre 100.
10.6. IMPORTANCIA DE LOS PERCENTILES

Trabajar con los percentiles es importancia para el investigador. Le


permite comparar unos datos con otros que participan en los mismos
hechos. Como dice Joan Welkowitz,

10.7. CONCEPTO DE RANGO DEL PERCENTIL

Se denomina el rango del percentil de un valor dado al nmero que


expresa el tanto por ciento de casos en el grupo es pacfico de
referencia y cuyo valor es igual o inferior al dado. As, si al puntaje de
41 le corresponde un rango de 85, entonces esto significa que el 85%
del grupo que dio examen obtuvo una puntuacin igual o menor que
41 mientras que solo el15% obtuvo calificaciones ms altas. Pero, si a

41 le corresponde un rango de 55, esto significa que el 55% de los que


dieron examen obtuvo puntuaciones iguales o ms bajas, pero tambin
significa que el 45% logro calificaciones ms altas, y por tanto su
calificacin de 85 no es alta como pareca al comienzo.
10.8. CALCULO DEL GRUPO PERCENTIL CUANDO SE CONOCE EL
VALOR BRUTO

Esta operacin estadstica consiste en determinar el rango del


percentil cuando se conoce el valor bruto, es decir, la puntuacin
origina o puntuacin directa.
Las calificaciones de los estudiantes que conforman el grupo al que
pertenece nuestro personaje que obtuvo 41 puntos fueron las
siguientes.
Intervalo de clase

Frecuencia (f)

48 50
45 47
42 44

1
3
4
39 41

36 38
33 35
30 32
27 29
24 26
21 23
18 20
15 17
12 14
9 11

Frecuencia
acumulada (fa)
Intervalo 85
superior 84
81
6

7
9
14
8
10
8
4
3
3
5

71
64
55
71
41
Intervalo
33
.
inferior
23
15
11
8
5

Para obtener el rango del percentil se sigue el proceso que pasamos a


describir:
a) Se localiza el intervalo de clase al que pertenece la clasificacin.
Para una mejor ilustracin este intervalo aparece recuadrado: es la
cuarta lnea en el cuadro anterior.
b) Se clasifican las frecuencias (f) de las tres categoras, las que
corresponden a las tres clases de clasificaciones:
Calificaciones superiores al intervalo crtico.
Calificaciones del intervalo crtico.
Calificaciones inferiores al intervalo crtico.
c) Logro de porcentajes de intervalos. Para el logro del porcentaje de
intervalo de cada caso se divide la frecuencia del intervalo
correspondiente entre la frecuencia acumulada:
Por lo tanto, el proceso para hallar cada uno de los intervalos es el
siguiente:

Intervalos superiores: f:8


8/85 9,4% (S%)
Intervalos crtico: f:6
6/85 71,5%
(C%)
Intervalos inferiores: f:71 71/8583,5%
(I%)
En el cuadro puede apreciarse que:
8 persona obtuvieron puntajes superiores al intervalo crtico.
6 persona obtuvieron puntajes en el intervalo crtico.
71 persona obtuvieron puntajes inferiores al intervalo crtico.
(Esta cifra se obtiene siempre tomando nota de las frecuencias
acumuladas para el intervalo inmediatamente inferior al intervalo
crtico)
S%, representa el porcentaje de persona con calificaciones
superiores a las del intervalo crtico y se lee porcentaje superior
C%, se lee porcentaje crtico, representa el porcentaje de
calificaciones que puntan en el intervalo crtico.
I%, porcentaje de la suma de las frecuencias inferiores, representa
el porcentaje de la suma de calificaciones que puntan debajo del
intervalo inferior.
d) Determinacin del lmite del intervalo crtico. Es conveniente
sealar como podra creerse que el lmite del intervalo crtico
no es 39. En efecto, tenemos que ponernos en el caso de que
alguien obtenga una puntuacin decimal y en este caso habra una
dificultad, puesto que l intervalo crtico seria ms estrecho que el
que le corresponde.
e) Determinacin del tamao del intervalo. El tamao del intervalo es
la distancia existente entre los puntajes que comprende cada uno
de los intervalos. As, entre los puntajes 9 y 11 del primer intervalo
inferior es 3, entre12 y 14, es 3, igualmente entre los otros
restantes.
En el ejemplo, motivo del anlisis el tamao del intervalo es 3
10.9. OBTENCIN DEL RANGO DEL PERCENTIL

Para la obtencin del rango del percentil se suma el porcentaje de la


suma de las frecuencias inferiores con el producto del intervalo
expresado en fraccin por el porcentaje crtico (C%).
Como vimos, la suma del porcentaje de las frecuencias inferiores es
83,5; el tamao del intervalo es 3, pero expresado en fraccin en el
caso del ejemplo- equivale a 2,5/3 puntos, o sea 0,83; y tambin,
vimos que C% es 7,1, entonces el rango del percentil ser:
Rango del percentil
= 83,5%
(0,83)
(7,1%)
= 83,5
5,98%
= 89,4%
10.10. FORMULA
PERCENTIL

ABREVIADA

PARA

OBTENER

EL

RANGO

DEL

Dnde:
I % = porcentaje de la suma de las frecuencias inferiores.
Calificacin obtenida = en
el ejemplo, 41.
LIR = limite de intervalo crtico. En este ejemplo (vase la tabla
de intervalos de
Frecuencias) = 38,5
C%
= porcentaje de calificaciones que se ubican en el
intervalo crtico.
h
= tamao del intervalo.
Reemplazando las expresiones de la
correspondientes en el ejemplo, se tiene:

formula

por

cifras

11. LAS MEDIDAS DE DESVIACIN


11.1. CONCEPTO DE MEDIDAS DE DESVIACIN

Se denominan medidas de desviacin aquellas medidas que usa el


investigador para ofrecer informacin de la heterogeneidad u
homogeneidad de los datos, es decir, aquellas medidas que se refieren
a las variaciones o dispersiones de los datos en su conjunto.
11.2. MEDIDAS QUE SE USAN PARA MEDIR LA DISPERSIN DE DATOS

Las medidas que ms usan los investigadores para expresarla


dispersin de los datos son: el rango (denominado tambin recorrido),
la varianza (o variancia), la desviacin estndar y el coeficiente de
variacin.
11.2.1. EL RANGO O RECORRIDO

Se denomina rango o recorrido a la diferencia entre el valor


mximo y el valor mnimo en un conjunto de datos ordenados.
Por ejemplo, si hay un grupo de alumnos que ingreso a la Facultad
de Estomatologa en 1995, y dentro de el hay seis que tienen la
menor edad (15 aos); hay uno que tiene la mayor edad (62 aos)
y los otros tienen diversas edades, pero mayores que 15 y menores
que 62. En este caso el valor mximo es 62 y el mnimo es 15.

El recorrido se obtendr por la diferencia: se resta el valor mnimo


al valor mximo.
Recorrido = 62 15 = 47
El recorrido o rango es fcil de obtener, pero la desventaja de esta
medida radica en el hecho de que no informa absolutamente nada
acerca de la distribucin de los datos entre los valores extremos.
11.2.2. LA VARIANZA O MEDIDA DE LO CUADRADOS

La varianza o medida de cuadrados es la medida de la variabilidad


mas usada para apreciar las diferencias entre los hechos: expresa
el grado de dispersin o diseminacin de los valores respecto a los
valores de una serie con relacin a su media aritmtica.
La gran importancia de calcular la media y la varianza de grupos
experimentales esta en el hecho de que cumple con una tarea
fundamental en la investigacin: estudiar relaciones entre hechos.
Kerlinger afirma que la varianza es una medida de dispersin del
conjunto de puntuaciones.
Un caso de uso de varianza en la investigacin en el rea de
educacin es el siguiente:
11.2.2.1 LAS CLASES DE VARIANZA

Segn el uso del investigador le da a la varianza en tanto medida


de variabilidad, suelen distinguirse diversos tipos de varianza. De
acuerdo a la extensin de la poblacin que estudia puede ser de
poblacin y varianza de muestra. Segn el conocimiento de las
influencias: varianza sistemtica (debidas a influencias conocidas)
y de error
(debida a la casualidad). Entre las varianzas
sistemticas se destaca la varianza entre grupos o varianza
experimental.
11.2.2.1.1. VARIANZAS SEGN LA EXTENSIN DE LOS GRUPOS
QUE SE ESTUDIAN

De acuerdo a la extensin de los grupos que se estudian, las


varianzas pueden ser de poblacin o de muestras.
a) Varianza de poblacin
Se denomina as a la varianza que estudia la dispersin de datos
correspondientes a una poblacin completa, es decir, a un
universo. Cuando se reconocen todas la medidas de un universo
que se estudia, entonces la varianza tambin es conocida. Tal
hecho no ocurre siempre, por lo que los investigadores se
preocupan por estudiar y de aplicar otro tipo de varianza: la
varianza de muestras.
b) Varianza de muestras
La varianza de muestras es aquella varianza que se usa cuando no
es posible estudiar toda la poblacin o universo o no hay

dificultades para estudiar todo el universo o, tambin, cuando se


prefiere no causar problemas por las condiciones para poder
estudiar toda una poblacin completa, como el dinero requiere, el
tiempo de dedicacin o la paralizacin de una poblacin.
Veamos el siguiente ejemplo: se quiere estudiar la duracin de todo
los fluorescentes. Habra que paralizar todas las fbricas de
fluorescentes? Indudablemente que no. Habra que recurrir a las
muestras.
11.2.2.1.2 VARIANZAS SEGN EL CONOCIMIENTO DE LAS
INFLUENCIAS

Segn el conocimiento de las influencias, las varianzas pueden


ser varianzas sistemticas o varianzas de error.

a) Varianza sistemtica
Se denomina varianza sistemtica a aquella variabilidad que
encuentra su explicacin en las influencias que se conocen.las
influencias de fenmenos naturales, as como las producidas por el
hombre y que se pueden predecir con influencias sistemtica.
b) La varianza entre grupos de medidas o experimental
La varianza entre grupos o varianza experimental es una clase de
varianza sistemtica, que se denomina as por expresar diferencias
sistemticas entre grupos de medida.
Las dispersiones de daros, como la cita diferencia de puntuaciones
de compresin de lectura, establecen diferencias entre grupos y
propiamente entre individuos de un grupo. Pero es posible hacer
distinciones respecto de puntajes de compresin de lectura entre
estudiantes de grupo distintos de procedencia: de universidades
nacionales y de universidades privadas. Cabe hablar de varianza
intra-grupos, cuando se distingue subgrupos dentro de uno
existente y reconocido, y de varianza extra grupos.
c) La varianza de error
Se denomina varianza de error a la dispersin de datos medidos y
que obedecen a la causalidad, debido a hechos que ignora o no
conocer bien el investigador
Por ms providencias que tome el investigador ocurren
dispersiones de datos por hechos que el investigador no identifica
cono controla. Lgico es que si los conociera, sil os identificara,
entonces adoptara una estrategia.
11.2.3. LA DESVIACIN ESTNDAR

Se denomina desviacin estndar a la medida de dispersin de


datos relacionada con la varianza, pues en tanto que esta ltima se
expresa en unidades elevadas al cuadrado, y de acuerdo a las
unidades de los valores elevados al cuadrado (metros al cuadrado,
dlares al cuadrado, etc.), para hacer practico el enunciado, se usa

la medida de desviacin estndar, que por esta razn es la raz


cuadrada positiva dela varianza.
La frmula para hallar la desviacin estndar (S) es:

Donde: S = desviacin estndar


Xi = valores individuales
= media aritmtica
f1 =frecuencia del valor x
n = casos
11.2.4. EL COEFICIENTE DE VARIACIN

Es la medida de dispersin de datos que mide el grado de


desviacin con relacin a la media, de all que se le conciba como
una medida de dispersin relativa. Se expresa en trminos de
porcentajes.
Para hallar el coeficiente de variacin se aplica la siguiente
formula:
Donde:
S = desviacin estndar

coeficiente

de

variacin

= Media Aritmtica

11.2.4.1. IMPORTANCIA DEL USO DE LA DESVIACIN ESTNDAR


EN COMPARACIN CON OTRAS MEDIDAS DE DISPERSIN

12.

La desviacin estndar resulta ms estable de un muestreo a


otro
Sus propiedades permiten que los investigadores puedan
hacer interpretaciones que se aplican en las aferencias
estadsticas.
Se aplica en el anlisis de inversin y medio con de riesgos.
Los investigadores saben que a menor desviacin estndar,
menor el riesgo del proyecto.
LA PRESENTACIN DE DATOS:

12.1. CONCEPTO

La presentacin de datos es la forma en que el investigador expone al


jurado calificador y a los lectores de su informe, los datos que encontr
al aplicar sus instrumentos de medicin.
12.2. LAS FORMAS POSIBLES DE PRESENTAR LOS DATOS

Un investigador que hace una tesis tiene un conjunto de posibilidades


de presentar los datos. Generalmente combina los diversos recursos,
esmerndose en alcanzar la informacin al jurado y sus lectores.
Vemos seguidamente estos recursos.
12.2.1 LA TABLA DE FRECUENCIAS

Consiste propiamente en un mtodo por el cual se clasifican y


ordenan los datos en clases o intervalos, de tal manera que quera
claramente definida la frecuencia con que se producen los hechos.
El nmero de observaciones que registra, est tratando de tal
manera que puede manejarse con versatilidad aunque implique
cantidades considerables
Para elaborar una tabla de frecuencia el investigador que hace una
tesis sigue las siguientes prescripciones.
a)
b)
c)
d)

El ttulo expresa las variables, de las cuales se ofrecen datos.


Seguidamente se establecen las clases o intervalos.
La tabla expresa el tamao del muestreo.
Hacer el conteo de cada clase o intervalo y presentarlo en
forma de frecuencia.
e) Se el investigador presenta datos secundarios, incluir una nota
indicando all las fuentes.
f) El nmero de clases o intervalos, as como su tamao debe
definirse de tal manera que cada uno de los nmeros
pertenezca siempre slo a una clase o intervalo.
12.2.2. CMO ESTABLECER LAS CLASES DE DISTRIBUCIN?

Para establecer las clases de distribucin se siguen los siguientes


pasos:
a) Determinar el rango.
b) Se decide el numero de clases (para algunos autores, el numero
de clases no debe ser mayor de 15 ni menor de 5). Es
recomendable el siguiente criterio: extraer la raz cuadrada del
tamao del muestreo.
c) Se establece la amplitud de la clase o intervalo. Se sugiere
establecer esta amplitud dividiendo el rango entre el nmero de
clases.
d) Establecer los intervalos preliminares. Para lograr este paso se
considera un numero por debajo del valor ms pequeo del
lmite inferior; para establecer el lmite inferior con la amplitud
de clase.
e) Presentar claramente las clases, es decir, el investigador no
puede dar pie para que la distribucin que presente, admita la
repeticin de un mismo nmero en dos clases diferentes.

En este caso de que el investigador use nmeros continuos,


instrumentar el signo <, de tal manera que en las clases o
intervalos aparezcan expresiones como:
2a<5
5a<8
8 a < 11, etc.
Veamos un ejemplo que nos presenta Naghi. He aqu el registro
de la produccin mensual de una fbrica textil en los ltimos 28
meses:
Produccin de la fbrica textil X en millones de metros
121,1
14,4
90,7
54,8
13,5
66,5
77,3
Donde:

100,0
19,2
13,2
112,6
29,2
38,7
46,2

33,7
45,1
116,4
119,1
99,8
100,0
58,1

72,9
81,3
59,5
45,3
121,6
108,1
39,7

Rango: 10,4
Raz cuadrada del muestreo= 5,3 y se consideran 6

clases
Amplitud de clase: 108/6 = 18
Lmite inferior de la clase = 13
Lmite superior: 13 + 18 = 31
12.2.3. DISTRIBUCIN DE FRECUENCIAS

Es la frecuencia acumulada. Veamos al siguiente cuadro:


Cuadro de distribucin de frecuencias
Clase
13 a < 31
31 a < 49
49 a < 67
67 a < 85
85 a < 103
103 a <121

Frecuencia
5
6
4
3
4
6

12.2.4. DISTRIBUCIN DE FRECUENCIAS Y DETERMINACIN DE


PORCENTAJES.

Una vez que el investigador estableci las frecuencias, determina


los porcentajes correspondientes, pues busca tener criterio para

comparar categoras y para ello considera como si tuviera 100


elementos. Los porcentajes hacen lo mismo que las frecuencias
relativas, pero estas ltimas suman 1, mientras que los porcentajes
suman 100.
Cuando un presentador presenta tablas con porcentajes, debe
indicar la base numrica sobre la que descansa la tabla: nunca
obtener porcentajes basados en cifras menores que 20. La ley de
los grandes nmeros sustenta la estabilidad de los porcentajes y
frecuencias relativas en cifras mayores de 20 y no de cifras
menores a ella. Es por esta razn que se confa ms en 50%
sustentando en 5000 que 50% sustentado en 6.
Para la precisin de los datos se prefiere usar nmeros enteros, sin
embargo, hay un peligro. Cuando se redondean cifras, el
redondeo puede hacer que se acumulen decimales que
inmediatamente pueden incomodar con la exactitud.
13. ANLISIS E INTERPRETACIN BIVARIADO
13.1. EJEMPLO DE CORRELACIN DE VARIABLES

En el mundo empresarial, los administradores saben que existen


relaciones que los hachos comparten. Por ejemplo, por su experiencia
se puede afirmar que mientras ms retroalimentacin del trabajo en
las distinta fases del trabajo, mejores resultados habr y mayor ser el
logro de la calidad del producto. Cierto es que podra darse el caso de
que algunos apliquen la retroalimentacin del trabajo y no siempre
logren resultados positivos; es decir, que a pesar de la aplicacin de la
retroalimentacin no se consigue una mejora de la calidad del
producto. Pese a que se reconoce esto ltimo, hay sin embargo una
tendencia general que puede expresarse en estos trminos: poca
retroalimentacin o ausencia de ella en el trabajo traer consigo baja
calidad del producto, mientras que ms retroalimentacin producir el
logro mayor de la calidad.
La vigencia de esta ltima expresin es lo que permite obtener logros
en la investigacin, cuando se aplican estadsticas.
13.2. QU
VARIABLES?

ES

CORRELACIN?

QU

ES

CORRELACIN

ENTRE

El Diccionario de trminos estadsticos dice: En su sentido general,


correlacin denota la independencia entre datos cuantitativos o
cualitativos. En este sentido, incluira la asociacin de atributos
clasificados conforme a mltiples caractersticas. El concepto es
bastante general y puede ser extendido a ms de dos variables
aleatorias.
El empleo ms frecuente del concepto tiene un significado un tanto
ms limitado y se refiere a la relacin entre variables aleatorias

medibles o entre rangos. Los autores italianos distinguen estos dos


sentidos mediante el empleo de palabras diferentes para el ms
restringido
Y respecto a la covarianza el mismo Diccionario de trminos
estadsticos dice: Correlacin de los rangos que mide la intensidad de
correlacin entre o conjuntos de ordenamientos y el grado de
correspondencia entre ellos. Hay dos coeficientes principales de
correlacin de los rangos, de Kandall (1938) y de Spearman (1904).
En esta oportunidad nos preocupamos de la correlacin entre
variables.
13.3. CONCEPTO DE ANLISIS BIVARIADO

El anlisis bivariado es un anlisis estadstico cuyo objetivo principal es


el hallazgo de una relacin posible entre dos variables, para lo cual se
usa dos tcnicas: la regresin lineal para efectos de la prediccin, y el
anlisis de correlacin lineal para medir la fortaleza de la asociacin
entre dos variables.
El nombre de anlisis bivariado proviene del punto de vista
matemtico: las expresiones de datos bivariado son pares ordenados
que se designan as: (x, y) x es el valor de la primera variable e y es el
valor de la segunda.
13.4. CONCEPTO DE DIAGRAMA DE DISPERSIN

Diagrama de dispersin es una grfica en dos dimensiones


(bidimensional) en la cual es posible el registro simultneo de los
valores de dos variables que estn asociadas a un hecho.
He aqu algunos ejemplos de relacin entre variables en un evento
especfico y que se puedan registrar simultneamente en el diagrama
de dispersin:
o El tiempo diario dedicado al estudio fuera del aula y las
calificaciones en promedio que obtienen los estudiantes.
o El rendimiento en test de aptitud matemtica (de los alumnos
Y) y el rendimiento de una prueba de ciencias.
o La temperatura del da y la venta de helados.
13.5. EL CUADRO DE REGISTRO DE DATOS DE DOS VARIABLES

El cuadro de registro de datos de dos variables es una presentacin


segn el registro de una variable que ocurre primero (x) y tambin, al
lado de cada uno de los datos correspondiente a la otra variable (y).
Conforme a su ordenamiento, que en general los alumnos que se
dedican ms horas a estudiar fuera de clase obtienen mayores
calificaciones en promedio. Pero tambin se observan excepciones. Por
ejemplo, llama la atencin que Ral, quien tiene el promedio ms alto
solo le dedica 5 horas, ocupando el cuarto lugar en la dedicacin al
estudio adicional fuera de las horas de clase, y a la inversa que el caso

anterior, Lizette le dedica, ms horas al estudio adicional fuera del aula


y solo ocupa el tercer lugar en rendimiento.
13.6. PARA QU NOS SIRVE EL DIAGRAMA DE DISPERSIN?

Tal como se puede apreciar e el ejemplo anterior y la respectiva


elaboracin de su diagrama de dispersin, este permite como en
todos los casos registrar simultneamente los valores de dos
variables: en el caso de Carlos, se seala que l estudia dos horas y
que a la vez su promedio es 12. As, tambin Gaby estudia dos horas
adicionales diarias y tiene un rendimiento promedio de 13. Estos dos
ltimos sucesos se registran de lado a lado en el diagrama de
dispersin.
13.7. LAS CLASES DE CORRELACIN

Teniendo en cuenta el criterio del sentido de las modificaciones, las


correlaciones pueden ser: positivas, negativas y nulas.
13.8. CORRELACIN POSITIVA

Existe correlacin positiva entre dos variables X e Y cuando la variacin


es directa, esto significa que si aumenta la variable X, entonces
aumenta la variable Y, y si disminuye la variable X, entonces
disminuye la variable Y.
13.9. LA CORRELACION NEGATIVA
Existe una correlacin negativa entre dos variables X y Y cuando hay
una relacin inversa, es decir, que al aumentar X disminuye Y, y al
disminuir X aumenta Y.
Ejemplos de correlacin negativa seran las siguientes:

A ms inasistencias menos rendimiento


A menores preocupaciones familiares, mayor concentracin y
aprovechamiento
A mayor desaseo en la practica de ingerir alimentos, mayor
adquisicin de enfermedades

13.10. CORRELACION NULA


Existe correlacin nula cuando las variables no estn relacionadas
entre s. Los siguientes son ejemplos de relacin nula:

La practica del tenis y el rendimiento en matemticas


El nmero de veces que se asiste al ao a la iglesia y el
rendimiento acadmico
Cantidad de llamadas que se hace diariamente por telfono y
el nmero de libros que posee en casa

13.11. COEFICIENTE DE CORRELACION

Se denomina coeficiente de correlacin o coeficiente de


asociacin a los ndices numricos obtenidos que se logra
haciendo operaciones estadsticas que expresan con
exactitud el grado de correlacin que existe entre dos
variables.
El grado de correlacin entre dos variables oscila entre dos
cifras numricas: de 0 a 1 -1 a 1

13.11.1 IMPORTACIA DE QUE


COEFICIENTE DE CORRELACION

EL

INVESTIGADOR

USE

EL

La importancia de que un investigador haga uso del


coeficiente de correlacin est en el hecho de que as puede
determinar el grado de asociacin entre variables y
establecer de esta manera en qu medida corrobora la
hiptesis que en un determinado momento formul.

13.11.2. CLASIFICACION DE LOS TIPOS DE CORRELACION

Restituto Sierra Bravo presenta las clasificaciones de los


coeficientes de correlacin que con ligeras modificaciones
reproducimos a continuacin.

13.11.3. EL COEFICIENTE DE CORRELACIN DE PEARSON

Se denomina cuantitativa que se usa para detectar y medir la


asociacin entre variables intervalos o de razn. Los valores
del coeficiente oscilan entre 1 y -1. El valor 1 indica una
relacin perfecta, en tanto que -1 expresa una relacin nula.

13.11.4. FRMULA PARA HALLAR LA CORRELACIN ENTRE


VARIABLES INTERVALARES

El coeficiente de correlacin entre variables intervalares


supone que las variables intervalares racionales ofrecen
informacin como valores de igualdad, rango y distancia. No
slo ofrecen el valor de la relacin, es decir, como la variable
independiente influye en la variable dependiente.
La formula para hallar la correlacin de intervalos es:

13.11.5 LA PRUEBA DE SIGNIFICACIN DE COEFICIENTE DE


CORRELACIN (Z CALCULADA)

La formula es:

Ho valor poblacional de r = 0
Hi valor poblacional de r 0
Se compara el valor de Z calculada con el valor de Z de la
tabla.
En el caso de
que: -Z critica Z calculada +Z crtica, no se rechaza Ho.

13.11.6 CORRELACIN ENTRE DOS VARIABLES NOMINALES

Como lo afirma Galtung: puesto que en la escala nominal los


valores son completamente arbitrarios, no existe modo
alguno en que se puedan usar estos valores para definir
coeficientes. Por lo tanto, todos los coeficientes tienen que
estar basados en una comparacin dencia permite rigorizar
la relacin entre las variables nominales.
En el vocabulario estadstico, a la relacin entre dos variables
se le denomina relacin cero grados; cuando en la relacin
entre dos variables hay una variable de control se le llama
relacin de primeros grados; y si se sigue aumentando otra
variable de control, la relacin se denominar relacin en
segundo grado y as sucesivamente.

13.11.7. MEDIDAS DE LA CORRELACIN CUANDO LOS DATOS


TIENEN DOS Y MS CATEGORAS

Cuando las variables tienen slo dos categoras, es posible


expresar tal relacin con la correlacin (phi). Y cuando las
variables nominales tienen varias categoras se aplica la
correlacin (lambda).
se halla con la siguiente frmula:

Donde a, b, c y d son frecuencias. Veamos el siguiente cuadro


esquemtico:
Los (+) y (-) sirven para ayudar al investigados en la
interpretacin, as, si las variables que se estudian son: sexo,
cuya subvariables son varn y mujer, y la otra variable es
nivel de estudios.

13.11.8. TABLA DE INTERPRETACIN DE

. Es posible usar la tabla que sigue para efectos de


interpretacin:
Tabla de interpretacin de

Valor
de

absoluto

la correlacin

Interpretacin de
la relacin
Muy fuerte

Mas de 0,80

De 0,61 a 0,80

Mas o
fuerte

menos

De 0,41 a 0,60

Dbil

De 0,21 a 0,40

Muy dbil

De 0,00 a 0,20

Imperfecta
baja

El valor cuadrado de la correlacin muestra la proporcin de


la varianza de las dos variables explicada por la otra.

13.11.9. PRUEBA DE SIGNIFICANCIA DE LA CORRELACIN

cuando el investigador use la medida de correlacin


tendrs que precisar la probabilidad de error muestral que
produce la correlacin, por lo que se aplica una prueba
usando el chi cuadrado, aplicando la frmula:

Donde:
R = nmero de categoras en las variables de regin
C = nmero de categoras en las variables de
columna
Oij = frecuencia del valor observado en la celda ij
Eij = frecuencia del valor observado en la celda ij

13.11.10. RELACIN ENTRE VARIABLES ORDINALES

La relacin entre variables ordinales resulta ms compleja


que la relacin entre variables nominales. La complejidad
deriva de las propiedades de igualdad y ordenamiento. En
efecto, en vez de ocurrir una relacin como en la relacin
entre variable, entonces, conjuntamente, ocurre otra
categora

13.11.11. EL COEFICIENTE DE SPEARMAN O CORRELACIN POR


RANGOS (R) PARA MEDIR LA RELACIN ENTRE VARIABLES
ORDINALES.

Un procedimiento para medir la asociacin entre variables


ordinales es el coeficiente (rho) propuesto en 1960 por
Spearman, quien sostuvo que si los ordenamientos son a i bi y
se define: di = ai - bi, con i = 1, 2, n, el coeficiente est
dado por:

El coeficiente de Spearman es fcil de calcular (en relacin,


por ejemplo, al coeficiente de Pearson).
sucesivamente. Entonces luego de ordenar, tenemos el
siguiente cuadro:
Estudiante
s

Rendimient
o

Inasistenci
as

Carlos

100

Rolando

60

Pedro

120

Percy

40

Ral

160

Una vez que el investigador determina los rangos, el


cuadrado
Cuadros de resumen ordinal
de
las
Rangos en Rango en
diferencias
Estudiant
2
los
rendimient Inasistenci D D de
es
rangos nos
o
as
ofrece
la
Carlos
3
1
2 4
medida de
las
Rolando
4
5
1 1
Pedro

Percy

Ral

9
2
4

divergencias entre los rangos.

Al aplicar la formula de de Spearman se tiene:

13.11.12. PRUEBA DE SIGNIFICANCIA DE

Teniendo en cuenta que la correlacin se calcula sobre la


base de los datos de un muestreo, cuando el investigador usa
la medida de correlacin , tendr que apreciar la
probabilidad de error muestral que produce la correlacin.
Para llevar a efecto esta prueba el investigador supone:
Ho: el valor poblacional es = 0
Ha: el valor poblacional es

Entonces usar el estadstico Z para la estimacin de la


significacin:

13.11.13. LIMITACIN DEL USO DEL COEFICIENTE DE

Una limitacin para usar el coeficiente de es la siguiente:


los datos tienen que ser mayores de 10; adems, no debe
hacer muchos pares.

14. ANLISIS DE VARIANZA


14.1. CONCEPTO
Se denomina anlisis de varianza al procedimiento estadstico
investigado por Ronald Fisher, que consiste en descomponer la
variacin total existente en un conjunto de datos en los distintos
elementos que lo componen. Cada elemento o componente se
identifica con un origen o causa de variacin conocida, a dems hay un
componente que representa la variacin que obedece a factores
incontrolables (llamados errores).
14.2. FACTORES QUE INTERVIENEN EN LA VARIANZA
Los factores que intervienen en la varianza son dos: los que se dan
dentro de los grupos (varianza intragrupos) y los que ocurren entre los
grupos (varianza intergrupos).
14.3. LA VARIANZA TOTAL

De acuerdo a la conceptualizacin de los factores que intervienen en la


varianza, la varianza total es la suma de la varianza intragrupos ms la
varianza intergrupos.

14.4. LA VARIANZA INTERGRUPOS


La varianza intergrupos es la modificacin que ocurre en cada uno de
los grupos cuando estos se someten a un tratamiento, es decir a una
manipulacin experimental. De acuerdo al tratamiento los frupos y sus
medias defieren: habr una varianza intergrupos.
14.4. LA VARIANZA INTRAGRUPOS
Se define la varianza intragrupos como el error aleatorio. Es la varianza
que se da por equivocacin en el muestreo, por la divisin de los
grupos, etc. Se trata de una varianza de las mediciones.
14.6. CLCULO DE LA VARIACIN TOTAL
La variacin total se ogra disponiendo de la tabla de ANOVA, que se
conoce como tabla de anlisis de varianza de ANOVA y su clculo se
obtiene mediante la razn F (razn de Fisher)

Como vimos, la varianza intergrupos se debe a los tratamientos


mientras que la varianza intragrupos es por el error.
14.6.1 TABLA DE ANOVA
La tabla de ANOVA es una elaboracin condensada den la cual se
expresa el conjunto de relaciones que se dan en el anlisis de varianza,
tal como se aprecia a continuacin:
Tabla de Anova
Fuente de
Variacin

Grado
de
liberta
d

Tratamient K - 1
o

Suma de
cuadrado
s
SCTR

Cuadrados
medios

CMTR

Fe

Ft

Error
total

n-k
n-k

SCE

CME

SCT

Con
= ,
05

Donde:

SCTR = nj
SCE = -
SCT =

F se puede obtener mediante la formula:

14.6.2. EL ANOVA DE UN SOLO FACTOR


El anlisis de varianza de un solo factor (que en la literatura se conoce
como ANOVA de un solo factor), es el anlisis ms simple de varianza,
que consiste en analizar el efecto de un solo factor (variable
independiente no mtrica) que en trminos de posibilidad influye en
una variable dependiente.

14.7. EL ANLISIS DE VARIANZA DE DOS VARIABLES O DISEO


FACTORIAL)
En este tipo de anlisis de varianza se estudia el efecto de dos o ms
variables independientes no mtricas sobre una variable dependiente
mtrica. A este anlisis de lo denomina anlisi8s factorial.
En el anlisis de varianza de dos factores existen cuatro fuentes de
variacin.
1) Entre columnas

2) Entre reglones
3) Interacciones
4) El error (varianza de error)
La varianza de error es la varianza intragrupo mientras que las otras
tres son varianzas intergrupo.

15. ANLISIS DE REGRESIN


15.1. CONCEPTO
La regresin es una tcnica estadstica que describe un relacin entre
una variable dependiente y una o ms variables independientes
mediante una lnea o ecuacin matemtica. Con el anlisis de
regresin el investigador determina la significacin estadstica de la
relacin entre variable dependiente y la variable independiente
15.2. QU CONCIBE LA REGRESIN?
La regresin concibe si una variable es aleatoria y est formada por
dos componentes: una variable aleatoria y un elemento sistemtico
F(x) dependiente de la variable x, es decir, si:
Y = f(x) +
Se dice que la regresin de y sobre x es la ecuacin
Y= f (x)
En la que se supone que la esperanza de es cero. Esta concepcin de
la regresin vale tambin para lo casos en que x es un conjunto de
variables: x1, x2, etc.
la forma f(x) ms frecuentemente considerada es la de un polinomio,
particularmente una funcin lineal, resultando la regresin de y sobre
x
-Un ejemplo de anlisis de regresin simple:
Se desea conocer la relacin entre las horas de trabajo de los obreros y
el nmero de decenas de sillas fabricadas en Stylo Lima. Se tiene los
siguientes datos:

El modelo de regresin lineal se formula as:


Y = bo + b1 x
El modelo estadstico es el siguiente:
yi = bo + b1 x1 + i
teniendo en cuenta que i = 1, n
y donde:
y1 = variable dependiente i
bo = intercepcin
b1 = pendiente de la lnea
x1 = variable independiente
16. ANLISIS DE REGRESIN MLTIPLE
Se denomina regresin mltiple a las correlaciones de la variable
dependiente y de variable independiente tomadas por separado y
adems, a la interpretacin de las variables independientes entre s
y a su correlacin con la variable dependiente.
16.1. CMO SE OBSERVA
VARIABLES DADAS?

LA

CORRELACIN

(R)

ENTRE

Tenemos un ejemplo que trata de estudiar una correlacin, la ms


simple: la correlacin entre una variable dependiente y dos
variables independientes. Veamos:
Variable independiente
Variable dependiente
1. Puntaje de una prueba de
1. Cantidad de graduados
aptitud
2. Edad
Mostremos los resultados de las mediciones de las variables y sus
respectivas representaciones graficas.

Notemos los resultados (mediciones) de las variables que nos


llaman la atencin. El bloque A nos impresiona puesto que es el
puntaje ms bajo (20 graduados); en sentido contrario, fcilmente,
dirigimos la mirada a R (70 graduados), ya que su diferencia es
mayor que cualquier otro sentido que se escoja, sea hilera o
columna.
De lo anterior podemos hacer una prediccin, teniendo en cuenta
dos variables conjuntas (independientes) y relacionados con otra
(dependiente). En este caso son variables independientes: puntaje
en una prueba de aptitud y edad, y variable dependiente: cantidad
de graduados.
16.2. USOS DE LA REGRESIN MLTIPLE EN LA INVESTIGACIN
CIENTFICA
La regresin mltiple tiene varios usos
a) Como un modelo descriptivo para hacer predicciones, en tanto
permite hallar la mejor ecuacin lineal especfica o conjunto de
variables
b) Como modelo de inferencias para probar hiptesis, puesto que
evala valores poblacionales mediante datos muestrales. Por
ejemplo, se desea saber (prever, predecir) la condicin de
liquidez de una empresa luego de una devaluacin de 100%.
Como un modelo estadstico en la prueba de hiptesis estadsticas
especficas:
En el anlisis de regresin, las hiptesis que se plantean los
investigadores tienen las siguientes formas:
a) No existe relacin lineal entre la variable dependiente y un
conjunto de variables independientes.
Una variable independiente no tiene relacin lineal con la variable
dependiente:
El modelo de regresin mltiple se expresa con la siguiente
frmula:
Y= a + b1 x1 + b2 x2 + + bn xn
Donde:
a = valor de y cuando os x son ceros
b1 = coeficiente de regresin asociada con cada unidad de x1

16.3. CMO INTERPRETAR EL COEFICIENTE DE REGRESIN?

La ecuacin Y= a + b1 x1 + b2 x2 + + bn xn expresa el cambio


esperado en y con un cambio de unidades determinadas en x,
siempre que x2 est sujeto al control.
16.4. EVALUACIN DE LA SIGNIFICACIN DE REGRESIN
Luego de que se ha establecido la relacin entre las variables
independientes y dependientes se impone probar el modelo de
regresin. Para cumplir con la tarea de evaluar del significado de
regresin se usa el coeficiente de correlacin mltiple R.
16.5. USO DEL COEFICIENTE DE CORRELACIN MLTIPLE R
Para usar el coeficiente de correlacin mltiple R se tiene en cuenta
que la suma cuadrada de y es igual a la suma cuadrada de la
regresin ms la suma cuadrada del residual.
En trminos formales sera:

La proporcin de la variacin y que da cuenta del modelo de


regresin en su totalidad se examina por el cuadrado del
coeficiente de correlacin mltiple:
16.6. DETERMINACIN DEL GRADO DE RELACIN ENTRE
VARIABLES
(DETERMINACIN
DEL
GRADO
DE
_______
SIGNIFICANCIA SUSTANTIVAS DEL MODELO DE
REGRESIN)
Para evaluar la significacin sustantiva del modelo de regresin el
investigador toma en cuenta la relacin entre el nmero de
variables y el tamao del muestreo.
R2 esperado =

16.7. CMO AJUSTAR LA R2


La formula ms divulgada para ajustar R2 es la siguiente:

Donde:
R2 Es el coeficiente de determinacin ajustada, a fin de minimizar el
efecto de exageracin de R2.
17. PRUEBA DE HIPTESIS
17.1 SUPERACIN DE LA ESTADSTICA CLSICA EN
TRATAMIENTO DE LAS INVESTIGACIONES DE LA CONDUCTA

EL

La obra de Sdney Siegel Estadstica no paramtrica para la ciencia


de la conducta, publicada en 1956, produjo una renovacin en las
investigaciones de la conducta.
17.2. LA INFERENCIA ESTADSTICA Y SU IMPORTANCIA EN LA
PRUEBA DE HIPTESIS
La inferencia estadstica es una de las categoras con que se
designa un conjunto de procedimientos que se usan para estudiar
las estimaciones de la poblacin, basados en el muestreo, que
vimos anteriormente, y que conducen a la prueba de hiptesis.
17.3. EL PROCEDIMIENTO ESTRATGICO QUE SIGUE LA PRUEBA
DE HIPTESIS
Al probar hiptesis el investigador sigue criterios estadsticos, esto
quiere decir que dispone de modelos estadsticos consistentes.
Hipottica podra ser:
a) Existe una relacin positiva entre la cantidad de horas de
estudio y el rendimiento acadmico
b) siempre que se mida a un estudiante con ms cantidad de horas
de estudio, tal medicin se corresponder con otra en
rendimiento acadmico que ser siempre mayor que la de los
estudiantes con menos horas de estudio.
17.4 ETAPAS DEL PROCEDIMIENTO ESTRATGICO EN LA PRUEBA
DE HIPTESIS
El investigador sigue los siguientes pasos cuando procede a probar
sus hiptesis:
a) formula sus hiptesis nulas y alternas
b) escoge la distribucin muestral y los procedimientos estadsticos
c) especifica el nivel de significancia () y define el rea de
rechazo
d) hace el calculo para rechazar (o no rechazar) las hiptesis nulas,
haciendo uso de pruebas estadsticas
Hay dos formas o maneras de realizar la prueba de significancia:
1) haciendo una comparacin del estadstico (valor muestral)
con el parmetro (valor poblacional)
2) comparando dos a ms muestras

17.5. HIPTESIS QUE SE DISTINGUEN EN LA PRUEBA DE


HIPTESIS
En un proceso de prueba de hiptesis se distinguen dos tipos:

a) la hiptesis nula (H0), que afirma que no existe diferencia entre


el valor muestral (estadstico) y el valor poblacional (parmetro)
b) La hiptesis alterna (Ha), que afirma operacionalmente lo que el
investigador desea conocer y se opone a la afirmacin de la H 0,
En teora de la prueba de hiptesis: cualquier hiptesis
admisible, alternativa a otra sometida a pruebas.

17.6 POR QU LA NECESIDAD DE FORMULAR DOS HIPTESIS?


La necesidad de formular dos hiptesis deriva del hecho de que la
hiptesis nula est basada en una inferencia negativa para evitar la
consecuencia afirmativa, razn por la cual se debe eliminar la
hiptesis falsa en lugar de aceptar la hiptesis verdadera.
17.7. MECANISMO DE LA PRUEBA DE HIPTESIS
El mecanismo de la prueba consiste en que el investigador
confronta las hiptesis con los resultados de la muestra H 0: 1 = 2,
para lo cual el investigador toma una muestra al azar de cada una
de las poblaciones
17.8. EL NIVEL DE SIGNIFICANCIA Y LOS TIPOS DE ERROR
Se denomina niveles de significancia a la suma de probabilidades
de que los resultados de las muestras estn en la zona de rechazo.
Los niveles de significancia se expresan con porcentajes
17.9. REGLAS PARA PROBAR LAS HIPTESIS
Para probar una hiptesis se siguen las siguientes normas:
1) Si el anlisis muestra que no se puede rechazar la H o, se
acepta y por lo tanto no se pueden tomar acciones correctivas
Planteamientos hipotticos
La hiptesis es La hiptesis es
falsa
Rechazar la correcta
Ho
Error de tipo I ()
Decisin correcta
Aceptar la Ho Decisin correcta
Error tipo II ()

El error tipo I () consiste en rechazar la hiptesis correcta. El valor


de es el nivel de significancia, o sea la probabilidad de rechazar
la Ho.
En el error tipo II () se acepta la Ho que es falsa.
17.10. ANLISIS DE UN EJEMPLO DE ERROR
Si, considerando el ejemplo anterior, la poltica de cobranzas ha
cambiado y suponiendo que:
a) El promedio poblacional es de 50 das (poltica inicial)
b) La desviacin estndar es de 10 das
c) Las muestras son las cuentas por cobrar (de clientes): n = 25
Con estos datos se calcula el error estndar del promedio

, es

decir la desviacin estndar del promedio muestral, que es dos


das:

18. USO DEL


ESTADSTICAS

COMPUTADOR

PARA

UTILIZAR

TCNICAS

18.1. USOS DEL SPSS


Se usan paquetes estadsticos especializados para resolver los
problemas estadsticos del investigador. Uno de ellos es el SPSS
que es la abreviatura en ingls de Paquete Estadstico para las
Ciencias Sociales.
A continuacin mencionamos, a manera de motivacin solamente,
los usos que puede tener el SPSS. Contiene programas estadsticos
que permiten hacer lo siguiente:
a) Operaciones de estadstica descriptiva. Medidas de tendencia
central,
b) Elaboracin de tablas de contingencia y tabulaciones
cruzadas.
c) Correlaciones entre dos variables.
d) Regresiones mltiples.
e) Anlisis de varianza
f) Anlisis discriminatorios
g) Anlisis factorial
h) Anlisis de escalograma

18.2. USO DEL STATPAC


El conjunto de operaciones de las que puede disponer el
investigador con el uso de este paquete estadstico es el siguiente:
a) Parmetros: permite conocer una cantidad que el planteamiento
de un problema aparece como desconocida .
b) Distribucin de frecuencias, que permite especificar la manera
en la que se distribuye una poblacin segn los valores de las
variables aleatorias que le corresponden.
c) Estadsticas descriptivas: medidas de tendencia central,
medidas de dispersin y varianza.
d) Tabulacin cruzada y que permite comparar los resultados
empricos con formulaciones tericas.
e) Correlaciones: se establecen relaciones entre variables. tiles
para determinar si existe real .
f) Regresiones: es posible conocer la relacin entre una variable
independiente y otra dependiente o entre una variable
independiente y ms de una variable dependiente
g) Anlisis de varianza: permite conocer las variaciones e
influencias entre grupo.

Você também pode gostar