Você está na página 1de 57

UNIVERSIDAD EVANGLICA DEL PARAGUAY

FACULTAD DE HUMANIDADES Y CIENCIAS DE LA EDUCACIN

Lgica Estadstica

Prof. Eduardo Lysak


2013
Contenidos a ser desarrollados:

Introduccin a la Estadstica Descriptiva


Tablas de frecuencia
Grficos
Medidas de Tendencia Central
Medidas de Variabilidad
Donde surgi Estadstica ?
La palabra Estadstica procede del vocablo
Estado, pues era funcin principal de los
Gobiernos de los Estados establecer registros de
poblacin, nacimientos, defunciones, impuestos,
cosechas.
La necesidad de poseer datos cifrados sobre la
poblacin y sus condiciones materiales de
existencia han debido hacerse sentir desde que
se establecieron sociedades humanas
organizadas.
Historia de la Estadstica

los egipcios observamos en uno existan los Se erigi la figura


ya analizaban de los libros del censos chinos del censor, cuya el paso de la
los datos de la Pentateuco, bajo el ordenados por misin consista en estadstica
poblacin y la nombre de Nmeros, el emperador controlar el nmero deductiva a la
renta del pas el censo que realiz Tao hacia el ao de habitantes y su estadstica
mucho antes Moiss despus de 2.200 a.C. distribucin por los inductiva
de construir la la salida de Egipto. distintos territorios 1830.
pirmides Textualmente dice:
"Censo de las tribus:

3100 aC 2011
0
ESTADSTICA
La Estadstica se ocupa de los
mtodos y procedimientos para
recoger, clasificar, resumir, hallar
regularidades y analizar los datos,
as como de realizar inferencias a
partir de ellos, con la finalidad de
ayudar a la toma de decisiones y en
su caso formular predicciones.
Mtodo Cientfico y Estadstica

Plantear Disear
hiptesis experimento

Obtener Recoger datos


conclusiones y analizarlos
ESTADSTICA

DESCRIPTIVA INFERENCIAL

El problema crucial de la
comprende las tcnicas que estadstica inferencial es
se emplean para resumir y llegar a proposiciones
describir datos numricos acerca de la poblacin a partir
de la observacin efectuada
en muestras bajo
condiciones de incertidumbre
Tablas, Grficos, Medidas
de Dispersin, Medidas de
Centralizacin, etc.
Muestreo, Estimacin de
parmetros, Contraste de
Hiptesis
Poblacin y Muestra

POBLACIN MUESTRA
Poblacin y muestra

Poblacin es el conjunto sobre el que


estamos interesados en obtener
conclusiones (hacer inferencia).

Normalmente es demasiado grande
para poder abarcarlo.

Muestra es un subconjunto suyo al que


tenemos acceso y sobre el que realmente
hacemos las observaciones (mediciones)

Debera ser representativo

Esta formado por miembros
seleccionados de la poblacin
(individuos, unidades experimentales).
Poblacin y muestra
Queremos conocerla Disponemos de ella para
conocer

Muestra
aleatoria

POBLACION MUESTRA

Inferencia
Parmetros estadstica
Estadgrafos

ejemplo : x ; S 2
NATURALEZA DE LOS DATOS: Variables y
Escalas de Medicin
VARIABLE
Se llama variable a una caracterstica que se observa en una poblacin o muestra,
y a la cual se desea estudiar.

La variable puede tomar diferentes valores dependiendo de cada individuo.


Una variable se puede clasificar de la siguiente manera.

DISCRETA

CUANTITATIVA
toma valores
numricos CONTNUA

VARIABLE

CUALITATIVA
describe
cualidades
Identifica cada una de las siguientes variables
de acuerdo a su tipo.

Edad
Sexo
N de hijos
N de llamadas diarias en un Callcenter
Religin
Estado Civil
Grado Militar
Opinin sobre atencin en un Banco
Tiempo empleado para medir una reaccin qumica
ESCALAS DE MEDICIN DE VARIABLES

NOMINAL
CUALITATIVAS

ORDINAL

ESCALA
DE INTERVALO
CUANTITATIVAS

DE RAZN
ESCALAS DE MEDICIN DE VARIABLES

Escala Nominal

nicamente nos permite establecer relaciones de


igualdad/desigualdad entre los objetos que estamos midiendo.
Los nmeros asignados a estos objetos podran ser sustituidos
por letras o nombres sin que ello afecte al resultado de la medicin.

Ejemplo: si medimos la variable estado civil ,


(1) soltero/a
(2) casado/a
(3) viudo/a
(4) divorciado/a
ESCALAS DE MEDICIN DE VARIABLES

Escala Ordinal
Es aquella que, adems de relaciones de igualdad/desigualdad, nos
permite establecer relaciones de orden entre los objetos que
estamos midiendo.

Ejemplo: El seleccionador de personal de una empresa establece un orden


tras entrevistar a los candidatos a un puesto de trabajo.

1 2 3 4

no es posible afirmar que la distancia que separa a los candidatos


ESCALAS DE MEDICIN DE VARIABLES

Escala de Intervalo
Nos permite establecer relaciones de igualdad/desigualdad y de
orden entre los objetos que medimos. Asimismo, los intervalos entre
los nmeros de la escala son iguales, por lo que podemos realizar
operaciones de suma y resta

Ejemplo: Para medir la temperatura utilizamos una escala de


intervalo.
Como la temperatura en celsius 0 es arbitraria, no
implica ausencia de temperatura hace que no podamos
afirmar por ejemplo que la mitad de 80 es 40
ESCALAS DE MEDICIN DE VARIABLES

Escala de Razn
Es la que permite el nivel ms alto de medicin. En esta escala
existe el 0 emprico, por lo que podemos realizar cualquier tipo de
operacin aritmtica con los nmeros de la escala.

Ejemplo: la estatura de un grupo de estudiantes, n de hijos,


edad, tiempo de reaccin, longitud.
Presentacin de Datos. Tablas y Grficos
Tablas

La presentacin de los cuadros o tablas varia de acuerdo


al contenido y al uso a los que estn destinados.

En su elaboracin, deben considerarse dos requisitos


primordiales:
Ser de fcil lectura e interpretacin.
Ser auto explicativos.

No existen pautas uniformes de presentacin de los


cuadros estadsticos. Lo que se busca es que el usuario
interprete la informacin dada.
En la presentacin de la informacin se deben tener en
cuenta el sentido comn y el punto de vista de los
usuarios.
TABLAS DE FRECUENCIAS
Tabular datos consiste en confeccionar una tabla en la que
aparecen bien organizados los valores de la variables que se
estn estudiando, junto con otros datos que ahora explicamos:

Frecuencia absoluta: f Nmero de individuos que toma cada


i
valor.
Frecuencia relativa: fi /n Resulta de dividir la frecuencia
absoluta entre el total de la poblacin. Da el tanto por uno.
Frecuencia absoluta acumulada Fi : Suma de las frecuencias
relativas de los valores menores o iguales que l (slo tiene
sentido para variables estadsticas cuantitativas)
Frecuencia relativa acumulada: Fi /n Suma de las frecuencias
relativas de los valores menores o iguales que l.
TABLAS DE FRECUENCIAS DE
VARIABLES CUALITATIVAS
Ejemplo: suponiendo que se ha recolectado la opinin de 10
estudiantes sobre la despenalizacin de la marihuana.
INDIFERENTES A FAVOR
EN CONTRA

ORDENAMOS
LOS DATOS
AGRUPAMOS

Frecuencias Absolutas Frecuencias relativas Porcentajes

Opinin fi fi /n f%

A favor 3 3/10 = 0,3 50%


categoras

En contra 5 5/10 = 0,5 30%


Indiferente 2 2/10 = 0,2 20%

fi =10 1 100%

n
TABLAS DE FRECUENCIAS DE
VARIABLES CUANTITATIVAS DISCRETAS

Ejemplo: los datos siguientes corresponden al numero de


intentos realizados para ingresar a la facultad de medicina de
20 estudiantes.

Intentos: 3 3 1 4 2 3 2 5 5 4 3 2 1 2 1 3 5 1 2 3

ORDENAMOS
LOS DATOS

Intentos: 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 4 4 5 5 5
Intentos: 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 4 4 5 5 5

Frecuencias Absolutas Frecuencias relativas Frecuencias


acumuladas

intentos fi fi /n Fi

1 4 0,20 4
2 5 0,25 9
3 6 0,30 15
4 2 0,10 17
5 3 0,15 20
fi =20 1
Como leer tablas de frecuencias?

intentos fi fi /n Fi

1 4 0,20 4
2 5 0,25 9
3 6 0,30 15
4 2 0,10 17
5 3 0,15 20

Cuntos estudiantes ingresaron en 3


intentos (X=3)?
Como leer tablas de frecuencias?

intentos fi fi /n Fi

1 4 0,20 4
2 5 0,25 9
3 6 0,30 15
4 2 0,10 17
5 3 0,15 20

Cuntos estudiantes lograron ingresar en


menos de 3 intentos

X3={1, 2}
Como leer tablas de frecuencias?

intentos fi fi /n Fi

1 4 0,20 4
2 5 0,25 9
3 6 0,30 15
4 2 0,10 17
5 3 0,15 20

Cuntos estudiantes lograron ingresar en por lo


menos 3 intentos

X3 ={3, 4, 5}
TABLAS DE FRECUENCIAS DE
VARIABLES CUANTITATIVAS CONTNUAS
MARCA DE CLASE = (Li + Ls) / 2
Li Ls
(lmite inferior) (lmite superior)

Ingresos mensuales en
miles de Gs.
fi X
INTERVALOS

1000 1990 12 1495

2000 2990 16 2495

3000 3990 8 3495

4000 4990 4 4495

5000 5990 2 5495


fi = n
Grficos

Un grfico es una representacin pictrica, de figuras geomtricas


o de superficies con el fin de estudiar los cambios en una sola
variable, o bien, para comparar diversas variables similares o
relacionadas.

Para un estudio estadstico no basta con la adecuada presentacin


del material numrico, sino que, adems, es necesario un grfico
que ayude a facilitar su comprensin, pues, todo grfico es la
expresin de los nmeros proporcionados por los cuadros
estadsticos y es un complemento de este.

Las cualidades esenciales del grfico son: simplicidad, claridad


y veracidad.

Permite identificar con facilidad las caractersticas similares o


diferenciadas de una variable.
Grficos

Ventajas

Rpida y fcil interpretacin de los datos

numricos de los cuadro.

Agradable a la vista

Los grficos estadsticos pueden clasificarse


segn el mtodo de representacin empleado:

Grficos

1- DIAGRAMA DE BARRAS:

Aplicable en variables nominales, ordinales y discretas


50,0%

41%
40,0%

30,0%
24%
21%
20,0%

14%

10,0%

0%
0,0%
menos de una hora entre una y dos horas entre dos y tres ms de tres horas no me conecto
diaria diarias horas diarias diarias

Grfico 1. Cantidad de horas dedicadas por los alumnos a conectarse a Internet.


Grficos

2- DIAGRAMAS CIRCULARES
Toda clase de variable, los datos deben estar en %
Linkedin 3%
Taringa 7%
Orkut 3%

Twitter 17%

Facebook 83%

Grafico 3. Redes Sociales utilizadas con mayor frecuencia.


Grficos

3- HISTOGRAMAS:

Un histograma es una representacin grfica de


una variable en forma de barras.

Se utilizan para variables continuas o para


variables discretas, con un gran nmero de datos, y
que se han agrupado en clases.
Grficos

Los histogramas se obtiene a partir de tablas en las que hay


intervalos de clases.

Ingresos mensuales en
miles de Gs.
fi X

1000 1990 12 1495

2000 2990 16 2495

3000 3990 8 3495

4000 4990 4 4495

5000 5990 2 5495


Histograma de frecuencias de ingresos mensuales
18

16

14

12

10

1000 1990 2000 2990 3000 3990 4000 4990 5000 5990
MEDIDAS DESCRIPTIVAS
Media o
promedio
Tendencia
Central Mediana

Moda

Cuartiles

Medidas Posicin Deciles


Descriptivas
Percentiles

Rango

Varianza
Variabilidad
Desviacin Tpica
x Estadstico (media muestral)

1. Media
Parmetro (media poblacional)

=
xi
Calculo de la Media:
n
Calcular el promedio de las siguientes edades: 25, 31, 28, 29, 30

2531282930 143
= = =28,6
5 5
como calcular promedio cuando los datos estn
tabulados?
=
f . xi Frmula de la Media cuando
los datos estn agrupados.
n

intentos fi fi .xi

1 4 4
2 5 10
3 6 18
4 2 8
55
5 3 15 = =2,75
f . x i =55 20
2. Mediana (Me)

Es una medida de centralizacin que divide a la


distribucin de una poblacin en dos partes iguales

Calcular la Me de las siguientes edades: 25, 31, 28, 29, 30


n= 5 (impar) n+ 1 5+ 1 6
Me i = = = =3
2 2 2
Posicin
Me=29 de la
mediana
25,
1
28, 2
29, 30,
3
31
4 5

ORDENAR
2. Mediana (Me)

Otro ejemplo:
25, 31, 28, 28, 30, 26, 29, 30

n= 8 (par) n+ 1 8+ 1 9
Me i = = = =4,5
2 2 2
Se promedia

25, 26, 28, 28, 29, 30, 30, 31


1 2 3 4 5 6 7
8

Me=(28+29)/2= 28,5
COMPARACIN ENTRE MEDIA Y MEDIANA: ROBUSTEZ

Un rasgo que diferencia a media y mediana es su comportamiento


frente a datos atpicos.

EJEMPLO:
Supongamos que tenemos las siguientes observaciones:

1,5 1,8 1,7 1,5 1,6 1,9


2,1 1,8 1,6
x =1,72
M e =1,70 Me

x
COMPARACIN ENTRE MEDIA Y MEDIANA: ROBUSTEZ

Ahora, hagamos la suposicin que nos equivocamos al


escribir el valor 21 en vez de 2,1

1,5 1,8 1,7 1,5 1,6 1,9 21


1,8 1,6
x =3,82
M e =1,70

Me x
Dato atpico


x
SIMETRA
CUARTLES
Los cuartiles son medidas estadsticas de posicin
que tienen la propiedad de dividir la serie
estadstica en cuatro grupos de nmeros iguales
de trminos.
Diagrama de Caja - Boxplot

Los diagramas de Caja-Bigotes (boxplots) son una


presentacin visual que describe varias
caractersticas importantes al mismo tiempo, tales
como la dispersin y simetra.

Para su realizacin se representan los tres cuartiles


y los valores mnimo y mximo de los datos, sobre
un rectngulo, alineado horizontal o verticalmente.
Diagrama de Caja - Boxplot
O
Datos atpicos O - Valor Mximo

- Q3

- Mediana

- Q1

- Valor Mnimo
Medidas de dispersin

Mediante la media, la mediana y la moda conocemos


una parte de la informacin acerca de las caractersticas
de los datos, pero para completar esa informacin
necesitaramos saber si todos los estn prximos o no a
estas medidas.

Para medir esta desviacin respecto a los valores


centrales utilizamos los parmetros de dispersin.
Medidas de dispersin
PARA ENTENDER LAS MEDIDAS DE DISPERSIN
CONSIDEREMOS EL SIGUIENTE EJEMPLO:

EDAD

x =23 x =23
GRUPO 1 GRUPO 2

=
SON
IGUALES?
GRUPO 1

GRUPO 1 23
24
23
23
23
x =23
22
24
22





21 22 23 24 25
GRUPO 2

GRUPO 2 5
12
25
23
12 x =23
7
23
77



5 7 9 12 23 25 77
RANGO
Algo que responde a la identificacin de la dispersin de
los datos de una muestra es el rango, el cual se define
como la diferencia entre el dato mayor menos el dato
menor de un conjunto de datos.

Rango=x mx x mn

2 4 8 17 24 32
Rango = 32 2 = 30
VARIANZA y DESVIACIN TPICA
Son las dos medidas de variabilidad mas importantes, tienen
por objetivo medir en grado de variacin de los datos
respecto al valor de la media
Estadstico (varianza muestral)
Varianza

Parmetro (varianza poblacional)

Desviacin Tpica: es la raz cuadrada de la varianza


Propiedades de la varianza
1. La varianza ser siempre un valor positivo o cero,
en el caso de que las puntuaciones sean iguales.

2. Si a todos los valores de la variable se les suma


un nmero la varianza no vara.

3. Si todos los valores de la variable se multiplican


por un nmero la varianza queda multiplicada por el
cuadrado de dicho nmero.

4. Si tenemos varias distribuciones con la misma


media y conocemos sus respectivas varianzas se
puede calcular la varianza total.
Supongamos que un grupo de profesionales en
un pas A tienen un salario promedio de
US$26.888 y varianza US$14.400. En un pas B
otro grupo de profesionales con iguales
caractersticas reciben un salario promedio de
US$8.570 con desviacin estndar de US$80.
Cul grupo de salarios presenta una menor
variabilidad?

Você também pode gostar