Escolar Documentos
Profissional Documentos
Cultura Documentos
la información de fenómenos
naturales y procesos sociales
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
Índice
Presentación
1. Metodología científica
Cierre
Fuentes
Presentación
Propósito:
Indicadores de desempeño:
2/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
• Utiliza las TIC para obtener información y procesarla a través de una hoja de
cálculo.
Punto de partida
3/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
1. Metodología científica
La metodología científica es un cúmulo grande de
actividades, herramientas, técnicas y teorías. En tal
sentido no hay una metodología única para todas las
ciencias que se conocen. Por ejemplo, la medicina
tiene una metodología para investigar la propagación
de enfermedades, la sociología tiene metodologías
para investigar la violencia policial en las sociedades,
y así para cada disciplina.
4/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
g) Depura la muestra
5/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
6/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
7/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
8/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
9/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
Actividad
1. Busca en Internet 10 ejemplos de análisis estadísticos y 10 ejemplos
de estudios de probabilidad.
2. Elabora un cuadro comparativo donde indiques las diferencias.
10/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
11/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
Valor Frecuencia
12 10
30 13
32 4
40 2
12/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
Para calcular la media hay que notar que no sólo se tienen 4 valores, sino que
en realidad son 29. Entonces para obtener el valor que se desea es conveniente
completar la tabla con las cantidades que cada valor aportará a la suma para
obtener la media; es decir, se puede agregar la columna de valor x frecuencia . De
esta manera es más sencillo calcular la suma total de todos los valores:
30 13 390
32 4 128
40 2 80
Suma 29 718
Por tanto, la suma total de los 29 datos es 718 y la media se obtiene de la manera
siguiente:
x =
718 ≈ 24.7586
29
Las operaciones anteriores pueden hacerse fácilmente en una tabla de Excel . Esta
herramienta permite multiplicar y sumar los valores de las entradas de una tabla,
una a una. Además, si en una tabla de Excel , se tiene la lista con todos los valores,
y cada valor en una celda, una manera muy sencilla de calcular la media es con el
comando: =PROMEDIO( ). Los paréntesis indican que ahí se enlistan las celdas con
los valores que deseas promediar. Por ejemplo, si los datos están en la columna A ,
en las filas 4 a la 10, entonces el comando es =PROMEDIO(A4:A10) 1, o simplemente
se anotan dentro del paréntesis todos los valores que se quieren promediar
separados por comas.
Para saber más del uso básico de Excel, consulta el siguiente enlace:
http://articulos.softonic.com/10-formulas-excel-nuy-utiles
1
Se asume conocimientos muy básicos de Excel, como su sistema de celdas y de referencias entre
las celdas.
13/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
14/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
v = 20 + 30 = 25 km/h
2
Para notar el problema con este resultado se supondrá que la distancia entre las
dos casas es de 6 km, entonces el tiempo que le tomó realizar el recorrido es de:
t = d + 6 km km
= 0.3 h = 18 minutos de ida
v 20
h
t = d + 6 km km
= 0.2 h = 12 minutos de vuelta
v 30
h
Recorrió una distancia de 12 km en un tiempo de 0.5 horas. De esta manera, su
velocidad promedio fue:
v = d + 12 km = 24 km
t 0.5 h h
El resultado no se obtuvo únicamente con promediar las velocidades, pero es
posible llegar a él por medio de la media armónica de las velocidades:
2 km
= 24
1 + 1 h
2 2
15/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
Rango medio. Es el promedio de los valores máximos y mínimos de todos los datos.
Valor Frecuencia
25 18
31 8
42 6
59 4
94 3
Para la media es necesario agregar la columna Valor por frecuencia y la fila de las
sumas
31 8 248
42 6 252
59 4 236
94 3 282
Suma 39 1468
16/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
Hasta el momento se han calculado las medidas, en caso de que los datos no
sean agrupados. Sin embargo también es posible aproximar estos valores a partir
de la tabla de frecuencias agrupadas. Esto es útil cuando son muchos datos muy
diferentes, como en la siguiente tabla con datos generados aleatoriamente con
ayuda de Excel y la fórmula =ALEATORI.ENTRE(0,50).
0 6 4 42 37 10 46 1
39 14 24 0 15 15 12 23
48 18 9 26 17 42 31 0
25 14 41 0 4 40 46 39
1 6 0 8 34 23 23 31
14 43 29 28 1 24 36 42
22 32 11 25 50 15 3 34
46 18 6 16 24 40 35 38
48 4 39 31 0 41 40 14
26 29 3 16 17 48 1 36
17/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
Número Amplitud
n Máximo Mínimo Rango
de clases de clase
80 50 0 50 7 7
18/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
Este valor se aproxima al promedio de todos los datos que se tienen, ya que la
media exacta es 22.9875, la cual está bastante cerca del resultado de la media.
También es necesario considerar que a más datos es posible que el resultado
mejore aún más.
19/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
Las medidas de tendencia central dan información de los valores que pueden
pensarse puntos medios en diferentes sentidos, por tanto es importante saber si
éstos coinciden, o su cercanía o variación. A este análisis se le conoce como sesgo y
relaciona la media, la mediana y la moda.
Sesgo. El sesgo describe la distribución de los datos, al indicar hacia dónde tienden
a concentrarse. La construcción de la gráfica facilita esta apreciación al mostrar los
resultados de manera visual. De esta manera, una distribución puede ser:
20/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
Varianza. Esta medida es un promedio del cuadrado de las distancias de todos los
datos a la media, es decir, si se tienen los datos x 1 , x 2 , ... x n ,𝑚 la varianza es:
(x1 - x ) 2 + ••• + (xn - x) 2
v=
n
21/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
Veamos un ejemplo.
Coahuila de Michoacán de
75.7 74.7 Tabasco 74.8
Zaragoza Ocampo
Veracruz de Ignacio
Chihuahua 72.9 Nuevo león 76.4 74.1
de la llave
Promedio
Guanajuato 75.5 Querétaro 75.4 75
Nacional
2
Fuente: http://www3.inegi.org.mx/sistemas/sisept/Default.aspx?t=mdemo56&s=est&c=23600
22/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
Se calculará la varianza y la desviación estándar para saber qué tan lejos están
los datos en general de la media.
Entidad federativa Edad (xi - x ) 2
Aguascalientes 75.9 0.7821
Baja California 74 1.0315
Baja California Sur 76 0.9690
Campeche 75.2 0.0340
Coahuila de Zaragoza 75.7 0.4684
Colima 75.9 0.7821
Chiapas 75.8 4.9090
Chihuahua 72.9 4.4759
Distrito Federal 76.1 1.1759
Durango 75.6 0.3415
Guanajuato 75.5 0.2346
Guerrero 72.9 4.4759
Hidalgo 74.4 0.3790
Jalisco 75.5 0.2346
México 75.2 0.0340
Michoacán de Ocampo 74.7 0.0996
Morelos 75.7 0.0071
Nayarit 75.1 0.0071
Nuevo león 76.4 1.9165
Oaxaca 73 4.0627
Puebla 74.8 0.0465
Querétaro 75.4 0.1477
Quintana Roo 75.6 0.3415
San Luis Potosí 74.7 0.0996
Sinaloa 75.5 0.2346
Sonora 75.3 0.0809
Tabasco 74.8 0.0465
Tamaulipas 75.8 0.6152
Tlaxcala 75.2 0.0340
Veracruz de Ignacio de la llave 74.1 0.8384
Yucatán 75.5 0.2346
Zacatecas 75.3 0.0809
Suma 29.6822
23/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
Se tomaron las alturas de 10 hombres y de sus hijos, sus resultados son los
siguientes:
Padre (m) 1.70 1.77 1.68 1.75 1.80 1.75 1.69 1.72 1.73
Hijo (m) 1.74 1.78 1.77 1.78 1.77 1.71 1.76 1.73 1.74
Al representar los datos en la gráfica de dispersión, uno de los valores será el eje x.
Por ejemplo, se podrá poner la altura de los padres como coordenada x, y la altura
del hijo como coordenada y 𝑦. La gráfica queda de la siguiente forma:
24/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
Para generar el gráfico anterior en Excel, basta con seleccionar los datos de la tabla
como se presentó e insertar el gráfico de tipo dispersión.
Cuando se estudia la relación entre dos variables, una puede considerarse causa y
la otra resultado o efecto de la primera. El supuesto de la existencia de una relación
de causalidad es sólo una decisión teórica. Dependiendo de las gráficas que se
obtienen, pueden verse diferentes fenómenos de relación entre las variables:
3. No hay relación entre las variables. Cuando las variables son independientes,
tales como el salario que obtiene una persona y su estatura (debe verse que la
relación no puede establecerse de manera clara).
4. Hay relación pero no es lineal. Esto puede ocurrir, por ejemplo, si se tienen
datos que se elevan hasta cierto punto para después bajar, y las variables se
relacionan en cada uno de esos intervalos. Estos tipos de relaciones no serán
estudiados en este curso, ya que requieren de una explicación teórica más
profunda.
25/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
∑
determina mediante la fórmula:
n
i=1 (xi - x) (yi - y)
xy = n
Se pueden observar los comportamientos:
Y
3
3
2
2
1
1
0
0
-1
-1
-2
-2
Y -3
Y -3 -3 -2 -1 0 1 2 3
-3 -2 -1 0 1 2 3 X
X X
Con la lista de los datos es posible calcular la covarianza en Excel por medio de
la función es igual a =COVARIANCE.P( ). Siguiendo con el ejemplo, ya sea con la
resolución de las operaciones o con ayuda de la función en Excel, el gráfico de
dispersión es xy 𝜎𝑥𝑦=0.00078. Al ser positiva se obtiene lo que se veía en la gráfica, una
relación lineal positiva.
26/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
Donde xy es la covarianza, en tanto que x1, y 𝜎𝑥,𝜎𝑦 son las varianzas de los dos
diferentes tipos de datos. El valor del coeficiente de correlación oscila entre -1 y +1.
Según su valor se puede afirmar:
• Si r =0 no hay correlación lineal entre las variables (puede ser de otro tipo).
• Si 0 <r < 1 existe correlación positiva, y mientras más cerca esté de 1 es más
fuerte, así como si está más cerca de 0 es más débil.
• Si −1< r <0 existe correlación lineal negativa y es más fuerte en la medida en que
el valor se acerca a 1.
27/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
Hasta ahora, en Excel existe una función que permite calcular este coeficiente y
sólo necesita de la lista de los datos de cada variable por separado. Esta función es
=COEF.DE.CORREL(datos x, datos y). Para el ejemplo de las alturas de padres e hijos
puede calcularse la desviación estándar de las dos variables, teniendo:
xy
r= = 0.9053
x y
Con lo cual existe una correlación lineal positiva y fuerte. Si se quiere estudiar
la dependencia entre las variables x y y , de manera que la variable 𝑚 se ve como
dependiente de la variable x . Para realizar ese estudio es posible estimar o
pronosticar la relación de causalidad, siendo necesario un valor que determine si la
variable x es buena para explicar estadísticamente la variable y . Así, esta medida
es conocida como coeficiente de determinación.
28/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
esté más próxima a 1, es mejor para explicar a y. Por otro lado, si el coeficiente
de determinación es cercano a 0, entonces el valor de x no afecta de manera
importante el comportamiento de la variable y 𝑦. Es posible determinar este coeficiente
directamente en Excel elevando al cuadrado el coeficiente de correlación.
Esto es claro con toda la ayuda de Excel. Sin embargo, es posible aproximar la recta
que ajusta mejor a los datos. Este proceso es conocido como regresión lineal. En
general, la teoría de regresión universal permite hacer predicciones basándose en
la dependencia de datos pasados de las variables y es de gran importancia en la
estadística. En este curso se considerará solo el tipo de regresión lineal simple, por
medio de los métodos de regresión lineal por covarianza y regresión lineal por el
método de mínimos cuadrados.
29/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
Regresión lineal por covarianza. La regresión lineal permite definir la recta que
mejor se ajusta a la nube de puntos. La ecuación que define cualquier recta es
y = ax + b; por lo tanto, es necesario determinar los valores de a y b para que la recta
quede completamente definida, los valores que se deben tomar son:
30/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
Método de mínimos cuadrados. Para este curso se mencionará sólo este método,
ya que sus expresiones son un poco más complicadas de entender. Sin embargo,
los programas como Excel y uno especializado llamado R, usan este método
para ajustar los datos. El método lo que hace es considerar que y = f (x). En otras
palabras, existe una relación de causalidad entre las variables, donde la función de
la recta es la que mejor ajusta los datos. El siguiente paso consiste en establecer
que para cada xi se determina el error (e) entre la aproximación f (xi) y el valor de la
variable yi esto es:
ei = yi - f (xi)
Entonces, lo que se busca es minimizar el valor de la suma del cuadrado de todos
esos errores (ei ):
n
∑e 2i
i =o
31/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
Cierre
32/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
Fuentes
Bibliográficas
SAGE . (2009). Glossary of the Social and Behavioral Sciences. New York: SAGE
Publications.
Dasinger et. al., M. L. (2003). Comparision of the Atkis, Ornish Weight Watchers and
Zone Diets for weight loss and heart disease risk reduction. Journal od American
Medical Association , 43-53.
33/34
Módulo 17. Estadística en fenómenos naturales y procesos sociales
Unidad II. Tratamiento estadístico de la información de fenómenos naturales y procesos sociales.
Electrónicas
Bienestar 180. (2016). 4 razones por las que el estrés aumenta tu peso. Recuperado
el 10 de marzo de 2016. Disponible en: HTTP://BIENESTAR.SALUD180.COM/
SALUD-DIA-DIA/4-RAZONES-POR-LAS-QUE-EL-ESTRES-AUMENTA-TU-PESO
Revista Índice. (15 de mayo de 2006). Quien es quien: Adolphe Quetelet. Disponible
en: HTTP://WWW.REVISTAINDICE.COM/NUMERO16/P2.PDF
Rojas Portilla et. al., E. (28 de septiembre de 2009). Probabilidades. Disponible en:
HTTP://ECA-M-MATEMATICA-2MEDIO-PROBABILLIDAD.BLOGSPOT.MX/: HTTP://
ECA-M-MATEMATICA-2MEDIO-PROBABILLIDAD.BLOGSPOT.MX/2009/09/
PROBABILIDAD-1-SUCESOS-ALEATORIOS-Y.HTMLH
34/34