Você está na página 1de 66

ASIGNATURA: ESTADSTICA EDUCATIVA

CARRERA: Pedagoga en Ingls

Orlandode
dela
laBarra
BarraCasanova
Casanova
Orlando
Titulaciones en el rea Educacin
Titulaciones en el rea Educacin

Profesor de Estado en Educacin General Bsica


Profesor de Estado en Educacin General Bsica
Psicopedagogo
Psicopedagogo
Diplomado en Estadstica para Educacin
Diplomado en Estadstica para Educacin
Magster en Administracin Educacional, mencin
Magster en Administracin Educacional, mencin
Gestin de Sistemas Educativos.
Gestin de Sistemas Educativos.

Titulaciones en el rea Privada


Titulaciones en el rea Privada
Relacionador Pblico
Relacionador Pblico
Mediador Familiar
Mediador Familiar
Doctor en Administracin
Doctor en Administracin

El proceso estadstico

Se basa en el tratamiento de la

Informacin
Lo cual implica

Tabulacin
de los Datos

Recoleccin
de la Informacin

Donde se incluye

Definicin de la
poblacin
Seleccin de
instrumentos

Anlisis
Descriptivo
Que contempla medidas

Representacin Grfica
de la Informacin

Que depende del tipo de


variable que se maneje

Cuantitativas
Cualitativas

De Tendencia
De Dispersin
De Posicin

Presentacin
de la
Informacin

Donde podemos
encontrar

Que puede darse a


travs de

Distintos
tipos de
Grficos

Tablas
Grficos
Planillas, etc.

Todo este proceso puede ser aplicado a la Administracin a fin de favorecer el proceso de Toma de Decisin

Unidad I: ESTADSTICA DESCRIPTIVA BSICA CONCEPTUAL


Variables: cuantitativas y cualitativas
La Estadstica es la tcnica o proceso matemtico
de recogida, descripcin, anlisis e interpretacin
de datos numricos.
La Estadstica la podemos clasificar en dos grandes
partes:
Estadstica
Estadstica
Estadstica

Estadstica
Descriptiva
Descriptiva

Se centra en analizar
un grupo particular y
donde las conclusiones
obtenidas solamente
son vlidas para ese
grupo

Inferencial
Inferencial

Que necesita un proceso de


muestreo en el cual se
selecciona un grupo
representativo de un grupo
mayor y en donde las
conclusiones obtenidas en esa
muestra pueden ser extendidas
a todo el grupo mayor

En forma breve podemos definir variable como un factor, atributo o


caracterstica que se expresa en la realidad mediante valores, los cuales, a su
vez, asumen la forma de un sistema clasificatorio.
Segn su naturaleza se pueden distinguir las variables cualitativas y las
variables cuantitativas.
Las variables cualitativas son aquellas cuyos elementos de variacin tienen
carcter cualitativo y no numrico.
Son ejemplos de estas variables: el sexo, la profesin, domicilio, religin,
nacionalidad, color, etc.
Las variables cuantitativas se pueden subdividir, dependiendo de los valores
que pueden tomar en discretas y continuas
Las variables continuas pueden tomar cualquier valor dentro de su rango
(matemticamente cualquier nmero real), por ejemplo: notas de las pruebas, el
peso, la edad, el CI, la temperatura, etc.
Las variables discretas se hayan restringidas a determinados valores dentro de
su rango (slo valores enteros), en este caso encontramos, como ejemplo:
nmero de hijos, nmero de alumnos, cantidad de libros, etc.

VARIABLE: Propiedad de algo que cambia (vara),


cuyos cambios son susceptibles de ser medidos

Variable
Variable
Dependiente
Dependiente
y))
(( y

VARIABLE
VARIABLE
INDEPENDIENTE
INDEPENDIENTE
x))
(( x

Siempre que los valores de una variable y


dependen de los valores de otra variable x, se
dice que y es funcin de x. La palabra funcin
indica dependencia

Si un metro de tela cuesta $2, el costo de una pieza


de tela depender del nmero de metros que tenga
la pieza. Si la pieza tiene 5 metros, el costo de la
pieza ser $10. Si tiene 8 metros, el costo ser $16,
etc. Aqu el costo de un metro ser siempre igual:
$2, es una CONSTANTE, y el nmero de metros de la
pieza y el costo de la pieza, que toman diversos
valores, son VARIABLES.
De qu depende en este caso el costo de la pieza? Del
nmero de metros que tenga. El costo de la pieza es la
variable dependiente y el nmero de metros es la
variable independiente.

LaMedicin
Las ciencias llamadas exactas se basan en la
medicin. Otras ciencias en cambio, lo principal es
la descripcin y la clasificacin
Todo aquello que puede medirse se llama

magnitud.

As el peso, la longitud, el tiempo, el volumen, la


temperatura son magnitudes.

MEDIR es comparar una cantidad de una


magnitud cualquiera con otra cantidad de la
misma magnitud.

Prefijos para los mltiplos y submltiplos de las


unidades

PREFIJO

SMBOLO

PREFIJO

SMBOLO

exa

E 10

18

peta

P 10

15

centi

c 10

tera

T 10

12

mili

m 10

giga

G 10

micro

mega

M 10

nano


-9
n 10

kilo

K 10

hecto

H 10

deca

D 10

deci

d 10

-1

-2
-3

-12

pico

p 10

femto

f 10

atto

a 10

-15
-18

METRO:
Es igual a 1.650.763,73 longitudes de onda de la luz
anaranjada del kriptn de masa atmica 86, cuando
la lmpara emisora est a - 210 Celsius.
SEGUNDO:
Es la 86.400 ava parte de un da solar
KILOGRAMO:
Kilogramo: es la masa de la medida patrn
Kilogramo-fuerza: Peso de la medida patrn

Unidad II: DISTRIBUCIN DE FRECUENCIAS


Tipos de Datos. Poblacin y Muestra.
Tabulacin: Distribucin de Frecuencias, tablas (absoluta,
relativa y acumulada)
Representacin grfica.
Exploracin de datos.

Poblacin
Muestra
Poblacin blanco

Conjunto global de casos que cumplen


una serie predeterminada de criterios.
Subconjunto de unidades que integran la
poblacin.
Aquella que rene al total de sujetos que
interesa al investigador y hacia la cual se
realizar la extrapolacin de los
resultados.

muestra

Poblacin accesible

Poblacin (universo)
Poblacin blanco

La poblacin accesible es el conjunto de


sujetos que pertenecen a la poblacin
blanco, pero que estn disponibles para la
investigacin.

La poblacin blanco queda definida por caractersticas demogrficas y


de investigacin.

La poblacin accesible est determinada por caractersticas


geogrficas y temporales.

Los Sujetos de la investigacin

Cuales? Cuantos? Cmo los selecciono? De dnde los obtengo? Por qu esa
seleccin?...

Por Ejemplo: Pregunta: El nuevo medicamento


AXC3098 permite disminuir la mortalidad por
cncer de cuello del tero?
En cules realizaremos nuestra
investigacin?
En cuntas mujeres probaremos la
eficacia del medicamento?
Cmo las seleccionaremos?
Cmo las reclutaremos?
= 10.000 mujeres con cncer crvico-uterino

Por qu en sas y no en otras?

Tabulacin: Distribucin
Distribucinde
deFrecuencias,
Frecuencias, tablas
tablas
Tabulacin:
(absoluta, relativa
relativa yyacumulada)
acumulada)
(absoluta,
53-36-43-28-34-56-36-38-44-38-34-48-4736-57-54-19-38-24-41-40-41-16-38-26-3643-47-38-38-42-42-39-43-21-49-53-30-3449-45-47-48-32-48-29-34-41-24-31
La informacin as presentada, no indica
nada. Slo podemos ver que el nmero
menor es 16 y el mayor es 57. estos dos
valores nos permiten definir la amplitud de
recorrido o rango de la variable.
Aparte de esta informacin, no podemos
extraer otra, ya que solamente tenemos
nmeros aislados. Los agruparemos
entonces en conjuntos de cinco nmeros
correlativos (podramos elegir otro nmero
distinto de cinco)

Con un test de 60 puntos mximo, se


mide la autoestima a 50 alumnos, y
se obtiene las siguientes
puntuaciones:

16-17-18-19-20
21-22-23-24-25
26-27-28-29-30
31-32-33-34-35
36-37-38-39-40
41-42-43-44-45
46-47-48-49-50
51-52-53-54-55
56-57-58-59-60

Intervalo
16 - 17 18 19 - 20
21 22 23 24 - 25
26 27 28 29 - 30
31 32 33 34 - 35
36 37 38 39 - 40
41 42 43 44 - 45
46 47 48 49 - 50
51 52 53 54 -55
56 57 58 59 - 60

Hemos formado as nueve grupos, cada uno del mismo


tamao. Cada uno de estos conjuntos recibe el nombre
de categora o intervalo.
El tamao del intervalo, recibe el nombre de amplitud
intervalar y se designa por la letra i. En este caso, la
amplitud intervalar es 5.
Si observamos los valores que hay entre 16 y 20,
encontramos un 16 y un 19, es decir, en la primera
categora hay dos valores. Si hacemos lo mismo con los
valores de la segunda categora, entre 21 y 25,
encontramos un 21 y dos 24, o sea, tres valores. Este 3
es la frecuencia del segundo intervalo As hasta
completar la tabla de frecuencias con los valores hasta
el ltimo intervalo.

53-36-43-28-34-56-36-38-44-38-34-48-4736-57-54-19-38-24-41-40-41-16-38-26-3643-47-38-38-42-42-39-43-21-49-53-30-3449-45-47-48-32-48-29-34-41-24-31

Intervalo

Frecuencia

16 - 17 18 19 - 20
21 22 23 24 - 25
26 27 28 29 - 30
31 32 33 34 - 35
36 37 38 39 - 40
41 42 43 44 - 45
46 47 48 49 - 50
51 52 53 54 -55
56 57 58 59 - 60

2
3
4
6
12
10
8
3
2

Pero esta tabla todava


contiene demasiados
nmeros. Por lo que se
simplificar anotando
solamente los valores
extremos de cada categora.
Estos valores extremos
reciben el nombre de lmites
aparentes. Tenemos as,
lmites aparentes inferiores,
que son los valores que
aparecen a la izquierda y
lmites aparentes superiores
que aparecen a la derecha
de cada intervalo.

Categora
16
21
26
31
36
41
46
51
56

20
25
30
35
40
45
50
55
60

Frecuencia
2
3
4
6
12
10
8
3
2

A esta ordenacin se le conoce como Tabla de


Distribucin de Frecuencias. En esta tabla, los
datos quedan agrupados en clases, categoras o
intervalos. No es conveniente que el nmero de
clases sea muy reducido o muy extenso. De
preferencia se eligen tablas de frecuencia que
tengan entre 16 y 12 categoras. El segundo
intervalo, incluye tericamente todos los valores
comprendidos entre 20,5000 y 25,5000.

Estos valores representados por los nmeros 20,5 y 25,5 se conocen como lmites reales del
intervalo. As 20,5 es el lmite real inferior del segundo intervalo y 20,5 es su lmite real
superior. En el quinto intervalo (36 40) el lmite real inferior es 35,5 y el lmite real superior es
40,5.
En el sexto intervalo (41 45) el lmite real inferior es 40,5. Pero si nos fijamos 40,5 es el lmite
real para dos intervalos: el quinto y el sexto. En el quinto intervalo es el lmite superior y en el
sexto intervalo es lmite inferior. Esta superposicin de valores permite graficar el histograma,
grfico que de otra manera no se podra hacer.
En un intervalo, el valor que queda al centro, se denomina marca de clase y se designa como
Xc As en la tabla de frecuencia, la marca de clase del tercer intervalo es 28 y del cuarto
intervalo es 33

An as esta presentacin resulta escueta y no es suficiente para interpretar la


informacin. Se hace necesario calcular las frecuencias relativas, o las medidas de
tendencia central y/o de variabilidad o dispersin.
Las distribuciones de frecuencia pueden completarse agregando las frecuencias
relativas y las frecuencias acumuladas. Las frecuencias relativas son los porcentajes de
casos de cada categora y pueden calcularse as:

Categora
16
21
26
31
36
41
46
51
56

20
25
30
35
40
45
50
55
60

Frecuencia

Frecuencia
Acumulada

Frecuencia
Relativa

2
3
4
6
12
10
8
3
2

2
5
9
15
27
37
45
48
50

4%
6%
8%
12%
24%
20%
16%
6%
4%

TOTAL

100%

Unidad III: MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIN.

Tendencia central
1. Media aritmtica
2. Mediana.
3. Moda.

Posicin
4.
5.
6.
7.

Percentil
Decil
Cuartil
Quintil

Medidas de Tendencia
Central

MEDIA
ARITMTICA

MEDIANA

MODA
Cuartiles,
Quintiles
Deciles,
Percentiles.

CLCULO DE LA MEDIA ARITMTICA O PROMEDIO:


Para calcular la media aritmtica o promedio con datos tabulados, se utiliza la siguiente
frmula:
En ella d es la distancia de cada intervalo con respecto a un intervalo que se elige
como referencia. Se sugiere escoger el intervalo central o el que tenga la mayor
frecuencia. Xc es la marca de clase del intervalo en que se ubic el cero arbitrario. fd
es el producto de la frecuencia de cada intervalo por el respectivo valor de d, i
representa la amplitud intervalar (Todos los intervalos deben tener la misma amplitud
intervalar)
Categora
16
21
26
31
36
41
46
51
56

20
25
30
35
40
45
50
55
60

TOTAL

Frecuencia (f)

fxd

2
3
4
6
12
10
8
3
2

-4
-3
-2
-1
0
1
2
3
4

-8
-9
-8
-6
0
10
16
9
8

50

-31+43= 12

12
38+ -----------50

60
38+ -----------50

38 + 1,2
39,2
Como el puntaje en autoestima es una variable discreta, se aproxima al entero ms
cercano, en este caso es 39.

Otra frmula para calcular la Media Aritmtica es la siguiente:

Xm =
nn)

(X1 * n1) + (X2 * n2) + (X3 * n3) + (Xn *

----------------------------------------------------------Se calcula multiplicando cada valor por el nmero de


veces que se repite. La
n
suma de todos estos productos se divide por el total de datos de la muestra:

53-36-43-28-34-56-36-38-44-38-34-48-4736-57-54-19-38-24-41-40-41-16-38-26-3643-47-38-38-42-42-39-43-21-49-53-30-3449-45-47-48-32-48-29-34-41-24-31
16-19-21-24-24-26-28-29-30-31-32-34-3434-34-36-36-36-36-38-38-38-38-38-38-3940-41-41-41-42-42-43-43-43-44-45-47-4747-48-48-48-49-49-53-53-54-56-57

Si ordenamos los valores del


test aplicado segn la tabla de
frecuencia, obtenemos el
siguiente orden de menor a
mayor:
(16x1)+(19x1)+(21x1)+(24x2)+(26x1)+(28x1)+(29x1)
+(30x1)+(31x1)+(32x1)+(34x4)+(36x4)+(38x6)+(39x1
)+(40x1)+(41x3)+(42x2)+(43x3)+(44x1)+(45x1)+(47x
3)+(48x3)+(49x2)+(53x2)+(54x1)+(56x1)+(57x1)
50

16+19+21+48+26+28+29+30+31+32+136+144+228+39+40+123+84+129+44+45+141+144+98+106+54+56+57

1948

50

50

Por lo tanto, el promedio es


de:

38,96=

39

CLCULO DE LA MEDIANA:
La mediana es un valor o puntuacin que divide un conjunto de valores ordenados en
dos grupos de igual nmero de casos, o sea, es un valor bajo (y sobre) el que se
encuentra el 50% de los casos. Para calcular la mediana con datos agrupados en tablas
de frecuencia, se utiliza la siguiente frmula:

En ella se reconocen los siguientes smbolos: Lim. Inf. Real, que es el lmite inferior real
del intervalo en el que se ubica la mediana, o sea, el intervalo cuya frecuencia
acumulada contiene la mitad de los casos. La frecuencia acumulada se obtiene
sumando la frecuencia de un intervalo con la frecuencia del intervalo siguiente. Luego se
identifica n que es el nmero total de los casos, la frecuencia acumulada anterior y la
frecuencia del intervalo en que se ubica la mitad de los casos.
Para aplicar la frmula, es necesario calcular en qu intervalo se encuentra la mitad de
los casos (n/2).
Es decir, 50 / 2 = 25 casos.

Categora
16
21
26
31
36
41
46
51
56

Frecuencia

Frecuencia
Acumulada

2
3
4
6
12
10
8
3
2

2
5
9
15
27
37
45
48
50

20
25
30
35
40
45
50
55
60

TOTAL

Hasta el cuarto intervalo, tenemos


acumulados 15 casos, como necesitamos
25 casos, pasamos al intervalo siguiente.
En este intervalo aplicamos la frmula:

50

25 - 15
Md =

10
35,5+ -----------12

50
x5

35,5+ -----------12

35,5+ ------------

12
Md = 35,5 + 4,17
Md = 39,67

Como la variable es discreta, el valor se aproxima al entero ms cercano, en este caso: 40

Otra frmula para calcular la Mediana, cuando los datos no estn en una tabla de
frecuencia, es la siguiente:

En donde n es el nmero total de los casos: (50 + 1) / 2 = 25,5 que se aproxima a


26. la explicacin es que la mediana es el valor que ocupa el lugar 26, en ningn
caso es 26. Al ordenar los datos, se observa lo siguiente:

16-19-21-24-24-26-28-29-30-31-32-34-34-34-34-36-36-36-36-38-38-38-38-38-3839 -40-41-41-41-42-42-43-43-43-44-45-47-47-47-48-48-48-49-49-53-53-54-56-57
En este caso la mediana es 39 (el valor que ocupa el 26 lugar). Tambin, como n es par
(50) los valores 38 y 39 centrales se promedian, obteniendo 38,5, que aproximado da 39, lo
que coincidira con la frmula anterior, si no se consideran los decimales.

La mediana es una medida de tendencia central propia de los niveles de medicin ordinal,
por intervalos y de razn. No tiene sentido con variables nominales, porque en este nivel
no hay jerarquas, no hay nocin de encima o debajo. Tambin la mediana es
particularmente til cuando hay valores extremos en la distribucin. No es sensible a
estos, por ejemplo en los siguientes datos: 24 31 35 35 38 43 45 50 246.
La mediana sigue siendo 38, a pesar que la media es 61.

Tambin utilizando esta frmula de la Mediana, podemos obtener otras medidas de


posicin: Los Cuartiles, los Deciles y los Percentiles.
Los cuartiles se representan con la letra Q, son tres y dividen la distribucin en cuatro
partes iguales:
El primer cuartil (Q1) deja bajo s el 25% de la distribucin.
El segundo cuartil (Q2) deja bajo s el 50% de la distribucin, o sea, equivale a la
mediana.
El tercer cuartil (Q3) deja bajo s el 75% de la distribucin.
Los percentiles (y los deciles) dividen, como su nombre lo indica, la distribucin en cien
partes (los deciles en 10 partes) y segn el percentil (o decil) que usemos, nos indica la
cantidad de frecuencias de la distribucin que queda bajo dicho valor.
Se utiliza la misma frmula de la mediana, slo hay que realizar un cambio: n/2 se
reemplaza por el % de n que queremos calcular, es decir, queda as:

Mediana

Medida de Posicin

CLCULO DE LA MODA:
La Moda es el valor que ms se repite en un conjunto ordenado de datos. En una tabla
de frecuencia, es el valor que ocurre con ms frecuencia. Puede ocurrir que exista ms
de un Modo o Moda, entonces decimos que la distribucin es bimodal, trimodal o
polimodal.

16-19-21-24-24-26-28-29-30-3132-34-34-34-34-36-36-36-36-3838-38-38-38-38- 39-40-41-41-4142-42-43-43-43-44-45-47-47-4748-48-48-49-49-53-53-54-56-57-

En este caso en que tenemos datos no agrupados se observa que el valor que
ms se repite es el 38, que es la moda o modo de esta distribucin

Categora
16
21
26
31
36
41
46
51
56

20
25
30
35
40
45
50
55
60

TOTAL

Frecuencia

Frecuencia
Acumulada

2
3
4
6
12
10
8
3
2

2
5
9
15
27
37
45
48
50

50

En el caso de datos agrupados, la


moda se acerca al punto medio o
marca de clase que tiene el intervalo
de mayor frecuencia y se calcula con la
siguiente frmula:

En donde,
Li= Lmite inferior de la clase donde
est ubicada la mayor frecuencia o
frecuencia modal. (36)

d1= diferencia entre la frecuencia mayor y la frecuencia del intervalo inmediatamente


superior a la mayor frecuencia. (12 6) = 6
d2= diferencia de la frecuencia modal y la frecuencia de la clase inmediatamente
inferior. (12 10) = 2, es decir:

Como la variable es discreta, el valor se aproxima a 37 que se acerca bastante a la marca de


clase del intervalo modal (38) coincidiendo con la Moda de los datos no agrupados.

Unidad IV: MEDIDAS DE DISPERSIN Y FORMA.


Medidas de dispersin.
Rango muestral: desviacin estndar y varianza muestral,
propiedades de la desviacin estndar

mediana de las desviaciones absolutas (mad)


Distancia o rango intercuartil
Grfico de dispersin (Scater Plot)

Medidas de
Variabilidad
RANGO

DESVIACIN
ESTANDAR

COEFICIENTE
CORRELACIN

PUNTAJE Z
VARIANZA

Rango
Rango

Mide la amplitud de los valores de la muestra y se


calcula por diferencia entre el valor ms elevado y el
valor ms bajo.
16-19-21-24-24-26-28-29-3031-32-34-34-34-34-36-36-3636-38-38-38-38-38-38- 39-4041-41-41-42-42-43-43-43-4445-47-47-47-48-48-48-49-4953-53-54-56-57-

57 16 = 41

Varianza
Varianza

Mide la distancia existente entre los valores de la serie y la media. Se calcula


como la sumatoria de las diferencias al cuadrado entre cada valor y la media,
multiplicadas por el nmero de veces que se ha repetido cada valor. La
sumatoria obtenida se divide por el tamao de la muestra.
La varianza siempre ser mayor que cero. Mientras ms se aproxima a cero,
ms concentrados estn los valores de la serie alrededor de la media. Por el
contrario, mientras mayor sea la varianza, ms dispersos estn.
Es un concepto estadstico importante, ya que muchas de las pruebas
cuantitativas se fundamentan en la varianza. Sin embargo, con fines
descriptivos se utiliza preferentemente la desviacin estndar.

Aprendiendo sobre la Varianza

8 cms.

Aqu tenemos 9 rectngulos cuya altura es de 8 centmetros (y todos


tienen la misma base).
Existe alguna variacin respecto de su altura entre estos rectngulos?
Cul es el promedio de la altura de estos rectngulos?
8+8+8+8+8+8+8+8+8
9

72
=8
9

10 cms
6 cms
8 cms.

El quinto rectngulo y el octavo rectngulo en un acto de rebelda


cambiaron su altura. El quinto rectngulo, ahora de color rojo, mide
10 centmetros, y el octavo rectngulo, de color azul, mide 6
centmetros?
Cul es el nuevo promedio de estos 9 rectngulos?
8 + 8 + 8 + 8 + 10 + 8 + 8 + 6 + 8
9

72
=8
9

... el mismo promedio! Pero... ha habido variacin?

10 cms
6 cms
8 cms.

El rectngulo rojo tiene +2 centmetros sobre el promedio, y el rectngulo


azul tiene 2 centmetros bajo el promedio. Los otros rectngulos tienen
cero diferencia respecto del promedio.
Si sumamos estas diferencias de la altura respecto del promedio, tenemos
0+0+0+0+2+0+02+0 =0
Este valor nos parece indicar que No ha habido variabilidad! y sin
embargo, ante nuestros ojos, sabemos que hay variacin.

10 cms
6 cms
8 cms.

Una forma de eliminar los signos menos de aquellas diferencias que


sean negativas, esto es de aquellos mediciones que estn bajo el
promedio, es elevar al cuadrado todas las diferencias, y luego sumar...
02 + 02 + 02 + 02 + 22 + 02 + 02 + ( 2)2 + 02 = 8
Y este resultado repartirlo entre todos los rectngulos, es decir lo
dividimos por el nmero de rectngulos que es 9
02 + 02 + 02 + 02 + 22 + 02 + 02 + ( 2)2 + 02 =
9

8
9

= 0,89

10 cms
6 cms
8 cms.

Se dice entonces que la varianza fue de 0,89


Observemos que las unidades involucradas en el clculo de la varianza
estn al cuadrado. En rigor la varianza es de 0,89 centmetros cuadrados.
De manera que se define

0,89 0,943
La raz cuadrada de la varianza se llama desviacin estndar

10 cms
6 cms
8 cms.

Que la desviacin estndar haya sido de 0,943 significa que en promedio


la altura de los rectngulos variaron (ya sea aumentando, ya sea
disminuyendo) en 0,943 centmetros.
Es claro que esta situacin es en promedio, puesto que sabemos que
los causantes de la variacin fueron los rectngulos quinto y octavo.
Esta variacin hace repartir la culpa a todos los dems rectngulos
que se portaron bien.
La desviacin estndar mide la dispersin de los datos respecto del
promedio

10 cms
8 cms.
8 cms.8 cms.
8 cms.
8 cms.
7 cms.
6 cms
4 cms

Cul es la varianza y la desviacin estndar de las alturas de los


rectngulos?
En primer lugar debemos calcular el promedio
8 + 4 + 8 + 8 + 10 + 8 + 7 + 6 + 8
= 7,44
9
Luego debemos calcular la varianza (Cada valor se resta al
promedio, la diferencia se eleva al cuadrado)

10 cms
8 cms.

8 cms.

8 cms.

8 cms.

7 cms.

4 cms

0,56

-3,44

0,56

0,56

2,56

0,56 -0,44

8 cms.
6 cms

-1,44
0,56

7,44
Promedio
0,562 + (-3,44)2 + 0,562 + 0,562 + 2,562 + 0,562 + (-0,44)2 + (-1,44)2 + 0,562
9
Este es el valor de la varianza

22,2224
9

= 2,469

10 cms
8 cms.

8 cms.

8 cms.

8 cms.

4 cms

7 cms.

8 cms.
6 cms

7,44
Promedio
Si la varianza fue de 2,469, entonces la Desviacin Estndar (S) es
de...

2, 469 1,57

Lo que significa que, en promedio, los rectngulos se desviaron ms o


menos (ms arriba o ms abajo) en 1,57 centmetros.

Para que aprendamos la varianza necesariamente debemos saber:


Sumar
Restar
Multiplicar
Dividir
Potencia de orden 2
Raz cuadrada
Y es claro que esto no es suficiente (salvo que queramos
aprender de memoria los clculos). Necesitamos estimular
nuestra imaginacin para que veamos la variabilidad existente
en la naturaleza.
Podemos usar una lista de fenmenos en que un mismo atributo
tenga variabilidad si se mide este atributo a un nmero de
individuos u objetos.

He aqu unos sencillos


ejemplos:
La altura de los estudiantes del curso.
La nota obtenida en Lenguaje de los estudiantes del curso.
El valor del dlar diario en pesos en el transcurso de una
semana.
El consumo mensual de agua potable durante 5 meses en la
casa.
El nmero de accidentes de trnsito diarios durante un mes en
la ciudad.
Las faltas de ortografa en el dictado de un pequeo texto que
comete cada estudiante del curso.
Imaginemos ejemplos, de tal forma que se pueda calcular el
promedio, la varianza y la desviacin estndar.

16-19-21-24-24-26-28-29-30-31-32-34-3434-34-36-36-36-36-38-38-38-38-38-38-3940-41-41-41-42-42-43-43-43-44-45-47-4747-48-48-48-49-49-53-53-54-56-57
(16-39)2x1 + (19-39)2x1 + (21-39)2x1 + (24-39)2x2 + ( 26-39)2x1 +( 28-39)2x1 + (29x1)2x1 +
(30-39)2x1 + (31-39)2x1 + (32-39)2x1 + (34-39)2x4 + (36-39)2x4 + (38-39)2x6 + (39-39)2x1 + (4039)2x1 + (41-39)2x3 + (42-39)2x2 + (43-39)2x3 + (44-39)2x1 + (45-39)2x1 + (47-39)2x3 + (4839)2x3 + (49-39)2x2 + (53-39)2x2 + (54-39)2x1 + (56-39)2x1 + (57-39)2x1
50
529 + 400 + 324 + 450 + 169 + 121 + 100 + 81 + 64 + 49 + 100 + 36 + 6 +
0 + 1 + 12 + 18 + 48 + 25 + 36 + 192 + 243 + 200 + 392 + 225 + 289 + 324
50
4434
50

Por tanto la varianza en este caso es: 88,68

DesviacinTpica
Tpicaoo
Desviacin
Desviacinestndar
estndar
Desviacin

Se entiende como la RAZ CUADRADA DE LA VARIANZA.


Representa todas las diferencias individuales del grupo en relacin a un
punto fijo de referencia que es el promedio.
Se calcula como raz cuadrada de la varianza.

CLCULO DE LA DESVIACIN ESTNDAR:


El procedimiento es el siguiente:
1. Se ordenan las puntuaciones:

2. Se calcula la Media:

16-19-21-24-24-26-28-29-30-31-32-34-3434-34-36-36-36-36-38-38-38-38-38-38-3940-41-41-41-42-42-43-43-43-44-45-47-4747-48-48-48-49-49-53-53-54-56-57
38,96 = 39

3. Se determina la desviacin de cada puntuacin con respecto a la media (a cada valor se


resta la media)
16 39 = -23

32 39 = - 7

38 39 = - 1

42 39 = 3

48 39 = 9

19 39 = -20

34 39 = - 5

38 39 = - 1

42 39 = 3

48 39 = 9

21 39 = -18

34 39 = - 5

38 39 = - 1

43 39 = 4

48 39 = 9

24 39 = -15

34 39 = - 5

38 39 = - 1

43 39 = 4

49 39 = 10

24 39 = -15

34 39 = - 5

38 39 = - 1

43 39 = 4

49 39 = 10

26 39 = -13

36 39 = - 3

39 39 = 0

44 39 = 5

53 39 = 14

28 39 = -11

36 39 = - 3

40 39 = 1

45 39 = 6

53 39 = 14

29 39 = -10

36 39 = - 3

41 39 = 2

47 39 = 8

54 39 = 15

30 39 = - 9

36 39 = - 3

41 39 = 2

47 39 = 8

56 39 = 17

31 39 = - 8

38 39 = - 1

41 39 = 2

47 39 = 8

57 39 = 18

4. Se eleva al cuadrado cada desviacin: (los resultados de cada resta) y se obtiene la


sumatoria de las desviaciones elevadas al cuadrado
529 + 400 + 324 + 450 + 169 + 121 + 100 + 81 + 64 + 49 + 100 + 36 + 6 +
0 + 1 + 12 + 18 + 48 + 25 + 36 + 192 + 243 + 200 + 392 + 225 + 289 + 324
2. Se aplica la frmula:

= 9,42

= 4434

La frmula de la desviacin estndar, para datos tabulados o agrupados se calcula con la


siguiente frmula:

s = 5

182

50
Categora
16
21
26
31
36
41
46
51
56

20
25
30
35
40
45
50
55
60

TOTAL

Frecuencia
(f)

fxd

f x d2

2
3
4
6
12
10
8
3
2

-4
-3
-2
-1
0
1
2
3
4

-8
-9
-8
-6
0
10
16
9
8

32
27
16
6
0
10
32
27
32

12

182

50

12
50

s = 5

3,64

(0,24)2

s = 5

3,64

0,0576

s = 5

3,6976
S = 5 x 1,92
S = 9,6

Coeficiente de
deVariacin
Variacin
Coeficiente
Sirve para determinar la homogeneidad del grupo o serie estadstica que se
analiza. Su valor se expresa en porcentajes.
Se calcula como cociente entre la desviacin tpica (o desviacin estndar) y la
media. El valor obtenido se compara con el valor convencional de 33% que
indica el lmite de homogeneidad (menos de 33%) o de heterogeneidad (mayor
de 33%). O sea, a menor valor mayor es la homogeneidad.
Para los efectos de nuestro ejemplo, tenemos:
Media = 38,96
Desviacin Estndar = 9,513

(9,513 / 38,96) x 100 = 24,4% < 33%


Por tanto el grupo de alumnos sometidos a la prueba de
autoestima es un grupo con resultados homogneos

RESUMEN:
Al describir nuestros datos, interpretamos las medidas de tendencia central y de
variabilidad en conjunto, no aisladamente. Tomamos en cuenta todas las medidas. Para
interpretarlas, lo primero que hacemos es tomar en cuenta el rango potencial de la
escala.
El anlisis de datos, a travs de la estadstica descriptiva, se efecta para cada variable
con tablas de frecuencias, medidas de tendencia central y medidas de variabilidad.
Las Medidas de Tendencia Central o Estadgrafos de Posicin son:
Media Aritmtica o Promedio: que resulta de la suma de todos los valores
dividido por el tamao del grupo o muestra. Es la ms usada y es solamente
aplicable a mediciones por intervalos o de razn.
Mediana: que divide la distribucin en dos mitades. Es una medida propia
de los niveles de medicin ordinal, por intervalos y de razn.
Modo o Moda: es la categora o puntuacin que ocurre con mayor
frecuencia. Se utiliza con cualquier nivel de medicin.

Las Medidas de Variabilidad o Estadgrafos de Dispersin son:


Rango, Recorrido, Campo de Variacin, Desviacin Mxima: es la
diferencia entre la puntuacin mayor y la puntuacin menor. Mientras ms
grande sea el rango mayor es la dispersin de los datos de una distribucin.
Desviacin Cuartil: Se usa en aquellas distribuciones en que la medida de
tendencia central representativa es la Mediana.
Desviacin Estndar, Desviacin Tpica, Desviacin Cuadrtica Media: es
el ndice de variabilidad ms frecuentemente usado y de mayor confianza, es
decir, vara menos cuando se calcula para distintas muestras extradas de una
misma poblacin. Como consecuencia de la normalidad de la curva de
frecuencias o anormalidad de las mismas, permite calificar los niveles o
categoras de rendimiento en superior al promedio, promedio, inferior al
promedio. Cuanto mayor es el valor de la desviacin estndar, mayor es la
dispersin de la distribucin. Cuando los resultados del anlisis se acercan a la
curva de Gauss o campana de la curva normal, permite demostrar la
confiabilidad y validez de los resultados de una medicin realizada o el
comportamiento normal de la muestra.
Coeficiente de Variacin: determina la homogeneidad del grupo o serie
estadstica que se analiza. Su valor se expresa en porcentaje, en que el 33% o
menos representa homogeneidad y sobre el valor convencional del 33% indica
heterogeneidad.
Puntaje Z: nos permite comparar puntuaciones en dos grupos de datos o en
Pre-Test y Post-test y ver cuanto se alejan los valores individuales de la media del
grupo.

PuntuacinTpica
Tpicaoo
Puntuacin
PuntajeZZ
Puntaje

Es esencialmente la razn de la desviacin del


puntaje del sujeto respecto a la media y la
desviacin estndar
La frmula de clculo es:

A travs del puntaje Z, podemos comparar las calificaciones de dos asignaturas, por
ejemplo: si el alumno tiene una nota 5 en matemticas y una nota 5 en castellano, la
tendencia normal es decir que tiene la misma calificacin, por lo tanto, los resultados son
iguales. Pero si analizamos las calificaciones utilizando el puntaje Z, a lo mejor, podemos
tener mejor informacin para tomar decisiones correctas:

Si comparamos estos valores de puntajes Z, vemos que la calificacin en matemticas es


ms significativa o tiene mayor valor que la nota obtenida en castellano.

Anlisis de la Informacin:
De los clculos estadsticos se deduce que el promedio aritmtico en autoestima es de
39 puntos sobre un mximo de 60 puntos. La desviacin estndar es de 9,42 puntos y
llama la atencin que el 50% de los alumnos se encuentra sobre los 40 puntos. El rango
de variabilidad fluctu entre 16 y 57 puntos.

Clculo del STATS V1

Clculo de los Datos del Ejemplo:

Media = 38,96

Media = 38,96 (39)

Moda = 38

Moda = 38

Mediana = 38,5

Mediana = 38,5 (39)

Varianza = 90,488

Varianza = 88,68

Rango = 41

Rango = 41

Desviacin Estndar = 9,513

Desviacin Estndar = 9,42

Valor Mnimo = 16

Valor Mnimo = 16

Valor Mximo = 57

Valor Mximo = 57

Error Estndar = 1,345

Coeficiente Variacin = 24,4

Resumen de Frmulas:

Media en datos agrupados

Moda en datos agrupados

Mediana en datos agrupados y no agrupados

Desviacin Estndar en datos no agrupados

Varianza

Puntaje Z

Coeficiente de variacin

Desviacin Estndar
en datos agrupados

EJEMPLOS:
Estatura de una Muestra de alumnos
en metros.
Alumno

Estatura

Alumno

Estatura

Alumno

Estatura

Alumno 1

1,25

Alumno 11

1,23

Alumno 21

1,21

Alumno 2

1,28

Alumno 12

1,26

Alumno 22

1,29

Alumno 3

1,27

Alumno 13

1,30

Alumno 23

1,26

Alumno 4

1,21

Alumno 14

1,21

Alumno 24

1,22

Alumno 5

1,22

Alumno 15

1,28

Alumno 25

1,28

Alumno 6

1,29

Alumno 16

1,30

Alumno 26

1,27

Alumno 7

1,30

Alumno 17

1,22

Alumno 27

1,26

Alumno 8

1,24

Alumno 18

1,25

Alumno 28

1,23

Alumno 9

1,27

Alumno 19

1,20

Alumno 29

1,22

Alumno 10

1,29

Alumno 20

1,28

Alumno 30

1,21

TABLA DE FRECUENCIAS.

Variable

Frecuencias absolutas

Frecuencias relativas

(Valor)

Simple

Acumulada

Simple

Acumulada

1,20

3,3%

3,3%

1,21

13,3%

16,6%

1,22

13,3%

30,0%

1,23

11

6,6%

36,6%

1,24

12

3,3%

40,0%

1,25

14

6,6%

46,6%

1,26

17

10,0%

56,6%

1,27

20

10,0%

66,6%

1,28

24

13,3%

80,0%

1,29

27

10,0%

90,0%

1,30

30

10,0%

100,0%

Unidad V: RELACIONES ENTRE VARIABLES NUMRICAS

Coeficiente de correlacin
Coeficiente de correlacin de Pearson
Coeficiente de correlacin de Spearman

Coeficiente Correlacin

-1
Correlacin
NEGATIVA (Inversa)

0
NO HAY
CORRELACIN

+1
Correlacin
POSITIVA (Directa)

Coeficiente de DETERMINACIN

Su valor representa el porcentaje


en que una Variable est asociada con otra,
sin que esto indique relacin causal

Você também pode gostar