Escolar Documentos
Profissional Documentos
Cultura Documentos
1.1.
Es un hecho indiscutible que el ser humano precisa comprender la realidad del mundo en el que
vive, y que para alcanzar este objetivo es preciso que lo que se conoce por experiencia o por
razonamiento pueda presentarse y organizarse de forma coherente, tarea que es posible gracias a la
capacidad simblica de los humanos para establecer relaciones y transmitirlas con significado. Este
conocimiento adquirido se organiza como ciencia, una de cuyas ramas es la Estadstica. Pero, qu es la
Estadstica dentro de la ciencia?
Desde un punto de vista elemental la Estadstica consiste en un procedimiento de recapitulacin y
acumulacin de datos numricos. As se habla de estadsticas de empleo, de nacimientos, de ventas, de
accidentes de trfico o laborales, etc. Esta concepcin de la Estadstica suele incluir la presentacin de los
datos en tablas o grficos y tambin el clculo de totales, promedios o porcentajes, entre otros. Sin
embargo todas estas operaciones ms o menos rutinarias son slo una parte de un concepto mucho ms
global, y as hoy en da para los especialistas la Estadstica es un mtodo cientfico, un poderoso
instrumento de pensamiento que incluso ha transformado completamente otras ramas de la ciencia, de
forma que desde esta perspectiva la Estadstica debe considerarse como una parte de la ciencia
relativamente joven, con enorme evolucin en los ltimos tiempos y estrechamente relacionada con las
Matemticas.
Las dos concepciones son complementarias, aunque la primera es menos ambiciosa y est
estructurada de forma ms simple. Pero estas diferencias en la profundizacin, en la metodologa y en el
desarrollo histrico han dado lugar a que tradicionalmente la Estadstica se considere dividida en dos
ramas:
a) La Estadstica Descriptiva, entendida como aquellos mtodos que incluyen la recoleccin,
presentacin y caracterizacin de un conjunto de datos con el fin de describir sus caractersticas
ms destacables, aunque sin pretensiones de extrapolar ms all de donde existe informacin. Esta
concepcin abarca campos como los censos de poblacin, datos econmicos, aritmtica poltica,
etc., con una antigedad histrica de varios miles de aos.
b) La Estadstica Inferencial, que comprende aquellos mtodos que hacen posible la estimacin de las
caractersticas de una poblacin o la toma de decisiones sin necesidad de observar toda esa
poblacin, sino slo una parte de ella a travs de una muestra. Una muestra slo es una parte de
toda la poblacin (por regla general slo una parte pequea), y as las afirmaciones que se pueden
realizar utilizando estos mtodos no suelen ser totalmente precisas, sino que usualmente existir
una incertidumbre y un riesgo que se cuantifica mediante la probabilidad. Los primeros
antecedentes histricos de la Probabilidad y de los mtodos inferenciales tiene que ver con el
estudio de los juegos de azar, y son tcnicas que slo se empezaron a desarrollar a partir de la
segunda mitad del siglo XVII.
Etimologa y breve historia de la Estadstica
La palabra estadstica procede del italiano statista, y deriva del latn status, que significa estado o
situacin. El vocablo data del siglo XVII, y empez a utilizarse para hacer referencia a las caractersticas
de los Estados polticos. Ms tarde el trmino se generaliz para referirse a datos cualesquiera de
relevancia social, de forma que ha terminado por relacionarse con todo tipo de material numrico surgido
de la observacin, tal y como se entiende hoy en da.
Orgenes de la Estadstica: la Estadstica como descripcin social.
Desde la ms remota antigedad el hombre ha necesitado anotar sus posesiones y dems datos de
inters general, por lo que en todas las civilizaciones antiguas hay evidencias de recogida de informacin
sobre poblacin, bienes races y produccin, bien con fines administrativos, militares o de recaudacin de
impuestos. Los sumerios, por ejemplo, usaban ya pequeas tablillas de arcilla para recopilar datos acerca
de la produccin agrcola y del comercio en general, y en el Egipto antiguo se registraban las crecidas del
Nilo y se analizaban datos de poblacin y renta. Tambin los chinos efectuaron censos hace ms de
cuarenta siglos, y hay trabajos similares en otras civilizaciones como la hind o la persa. En general, al
aumentar el poder de los reinos o estados, se hace necesario el conocimiento ms exacto posible de la
poblacin, a veces incluso con fines electorales para regular la eleccin de gobernantes, tal y como
suceda con los censos electorales en la antigua Grecia.
Tambin la administracin romana constituy en su momento un ejemplo de eficiencia en el
control de los datos de inters social, y los funcionarios pblicos anotaban nacimientos, defunciones y
matrimonios, adems del recuento de ganado y de las riquezas en tierras conquistadas. Tambin durante
la Edad Media los pases resultantes heredaron la prctica estadstica romana, y a medida que se avanza
en el tiempo hay cada vez ms noticias sobre registros y estudios, aunque siempre referidos a problemas
ms o menos locales, no globales. De hecho las comunicaciones no estaban suficientemente
desarrolladas, no haba registros de datos fiables y la cuantificacin era un enorme problema.
Primeras observaciones de las leyes empricas y su descubrimiento.
Es ya en pleno siglo XVII cuando se plantea por primera vez la investigacin de fenmenos
polticos y sociales, lo que posteriormente llevar a descubrir las leyes cuantitativas que rigen tales
fenmenos. Concretamente en Londres, y desde 1632, se empiezan a publicar semanalmente las
defunciones y nacimientos clasificados por sexo, documentacin que utiliz John Graunt para estimar y
predecir las tasas de mortalidad y las frecuencias de los nacimientos de hombres y mujeres, as como el
nmero de habitantes de esa ciudad. Otros estudiosos utilizaron tcnicas similares para analizar varios
fenmenos sociales (matrimonios, ingresos, comercio, educacin o empleo) y esta proliferacin de tablas
numricas permiti observar las frecuencias con que aparecan estos fenmenos, lo que a su vez condujo
al descubrimiento de las leyes estadsticas. Paralelamente, y tambin durante la segunda mitad del siglo
XVII, se empiezan a estudiar y analizar determinados problemas relacionados con los juegos de azar.
Todos estos estudios pusieron de manifiesto un principio ignorado hasta entonces, esto es, que la
regularidad en las observaciones aparece ms y ms acentuada conforme crece el nmero de casos que se
consideran, principio que hoy en da se conoce de forma general con el nombre de Ley de los Grandes
Nmeros.
Relieve internacional de la Estadstica. Desarrollo hasta la primera guerra mundial.
Durante el siglo XVIII la Estadstica empieza a aplicarse a la resolucin de problemas en
numerosos campos, como la ciencia actuarial, la demografa y o la depuracin de errores en las
mediciones astronmicas, campos a los se fueron aadiendo otros como la antropometra, la gentica, la
sociologa o la agricultura. Una figura destacada de la poca en su aplicacin a los asuntos humanos fue
el belga AdolpheQutelet, quien por ejemplo, en 1844 utiliz la distribucin Normal para calcular con
bastante exactitud el nmero de hombres franceses que haban aducido falsamente una estatura inferior a
Estadstica del grado en ADE: Notas de clase. Curso 2015-16
pg 2
la mnima establecida a fin de evitar el servicio militar. Y un contemporneo famoso de Qutelet fue el
austriaco Gregor Mendel, abad del monasterio de Brnn, quien entre 1855 y 1856 public los resultados
de sus experimentos sobre la hibridacin de guisantes con lo que por primera vez en la historia la
herencia se relacionaba con la Estadstica.
Durante la primera mitad del siglo XIX el desarrollo industrial europeo hace aumentar el inters
pblico acerca de la situacin social, y se inicia un proceso de fundacin de sociedades y oficinas en
distintos pases. La funcin principal de estos organismos era poder utilizar la Estadstica en cada pas en
comunicacin con los dems para comparar y determinar los factores de crecimiento, as como unificar
mtodos de trabajo y de recogida de datos. En consecuencia empiezan a celebrarse congresos
internacionales, el primero de ellos organizado por Qutelet en Bruselas en 1853, al que asistieron 153
delegados de 26 pases.
Poco despus, en 1859, Charles Darwin publica su obra El origen de las especies, lo que supone
una revolucin en la biologa y suscita el reto de comprobar empricamente los dos mecanismos de
seleccin natural que postula su teora: produccin de variabilidad mediante el azar y seleccin mediante
la lucha por la existencia. Francis Galton (1822-1911), primo de Darwin, espoleado por este objetivo se
interesa por los estudios de Estadstica y aporta la siguiente gran contribucin de la poca con varias
investigaciones. A esta labor se une la de Walter Frank R. Weldon (1860-1906), catedrtico de Zoologa
en la Universidad de Londres y entusiasta partidario del enfoque estadstico propugnado por su maestro
Galton. Con el apoyo de Galton, l y su colaborador, Karl Pearson (1857-1936), fundaron la revista
Biometrika, una publicacin sobre la biometra, la ciencia de la medida de la vida, revista que se
convierte en referencia clave para los investigadores de la poca.
Tambin que en la segunda mitad del siglo XIX se desarrolla de la teora de los nmeros ndices
con las respectivas formulaciones en 1871 y 1874 de los economistas alemanes Laspeyres y Paasche. No
obstante, la obra que marc una poca apareci en 1922 de la mano del estadounidense Irving Fisher con
el ttulo TheMaking of IndexNumbers. Desde entonces la mayor parte de los trabajos sobre esta materia
han seguido las directrices all establecidas.
La Estadstica moderna: desarrollo hasta la segunda guerra mundial.
La etapa anterior supone la consolidacin de la Estadstica Matemtica, mientras que el siguiente
perodo de desarrollo est centrado en la figura del tambin ingls Ronald Aylmer Fisher (1890-1962),
quien planta los fundamentos de la Estadstica actual.
Fisher cre nuevas directrices personales aportando una extraordinaria riqueza de ideas nuevas a lo
largo de los aos veinte y treinta del siglo pasado Con l se cierra completamente el proceso histrico del
paso desde un modelo descriptivo a una modelizacin plenamente probabilstica, pues en la dcada de
1930 la teora de la probabilidad, de la estimacin y de los contrastes estn ya plenamente establecidas.
Con su labor en la Estacin de Experimentos Agrcolas de Rothamsted, donde trabaj como bilogo,
Fisher puso adems las bases del diseo de experimentos que muy pronto hizo surgir otros centros de
investigacin en pases de la Commonwhealth como la India y Australia.
Sin embargo parte de la metodologa de Fisher se basaba en la intuicin, y fueron principalmente
JerzyNeyman (1894-1981) y EgonSharpe Pearson (1895-1980), hijo de Karl, quienes se encargaron a
partir de 1926 de elaborar una teora sistemtica de la inferencia estadstica. Neyman adems desarroll
despus una teora de muestreo y Pearson trabaj en mtodos estadsticos de control de calidad durante la
Segunda Guerra Mundial.
pg 3
pg 4
1.2.
Definicin de Estadstica.
Al intentar definir la Estadstica podemos encontrar centenares de definiciones sobre la misma. Este
conjunto de definiciones podramos dividirlo en dos grandes grupos, y ms que hablar de distintas
definiciones de Estadstica habra que distinguir distintas filosofas en la definicin del trmino. La
diferencia radica en si la relacionamos con coleccin de datos (descriptiva) o bien con mtodos
estadsticos que ayuden en su anlisis (inferencia) comentados anteriormente.
Las dos concepciones son complementarias, aunque la primera es menos ambiciosa y est
estructurada de forma ms simple. Pero estas diferencias en la profundizacin, en la metodologa y en el
desarrollo histrico han dado lugar a que tradicionalmente la Estadstica se considere dividida en dos
ramas:
a) La Estadstica Descriptiva, entendida como aquellos mtodos que incluyen la recoleccin,
presentacin y caracterizacin de un conjunto de datos con el fin de describir sus caractersticas
ms destacables, aunque sin pretensiones de extrapolar ms all de donde existe informacin.
Esta concepcin abarca campos como los censos de poblacin, datos econmicos, aritmtica
poltica, etc., con una antigedad histrica de varios miles de aos. Dentro de este primer grupo
de definiciones de esta disciplina (restringida al estudio de fenmenos de masa con el fin de
detectar regularidades del comportamiento colectivo, sin hacer mencin expresa a los fenmenos
pg 5
pg 6
1.3.
1.4.
pg 7
conjunto determinado de ellos, llamado dominio de la variable. Si la variable puede tomar solamente un valor,
se llama constante."
Todos los elementos de la poblacin poseen los mismos tipos de caracteres, pero como estos en
general no suelen representarse con la misma intensidad, es obvio que las variables toman distintos
valores. Por lo tanto estos distintos nmeros o medidas que toman los caracteres son los "valores de
la variable". Todos ellos juntos constituyen una variable.
2) De tipo cualitativo (atributos) cuando no cabe medicin numrica para esos caracteres y slo se
pueden describir mediante palabras, tal y como sucede con el color del pelo, el estado civil de las
personas, su ideologa poltica, etc. Las diferentes formas de aparicin de los atributos se denominan
modalidades. As por ejemplo las modalidades del atributo color del pelo podran ser moreno, rubio,
pelirrojo, castao,...; o las modalidades del atributo estado civil podran ser soltero, casado, separado,
divorciado, viudo, pareja de hecho, etc.
Se considera que las variables pueden ser de dos tipos:
1) Discretas: cuando entre dos valores distintos que pueda tomar esa variable siempre hay una
distancia o separacin mnima, como por ejemplo en el nmero de hijos, en que la distancia
mnima entre dos valores es de 1.
2) Continuas: son aquellas variables que no son discretas, como por ejemplo el peso o la estatura.
Suelen ser variables que pueden tomar todos los valores de un cierto intervalo.
Esta clasificacin en realidad es meramente terica pues en la prctica todas las variables son
discretas debido a los lmites de precisin en los instrumentos de medida, sin embargo es muy importante
a la hora de establecer modelo tericos para la variable.
Una clasificacin ms prctica en el mbito de la Estadstica Descriptiva, relacionada con los datos
disponibles, es el siguiente:
1) No agrupadas: cuando el nmero de valores diferentes observados en la variable no es
excesivamente grande para su presentacin en una tabla. La variable toma pocos valores
distintos.
2) Agrupadas: Se presentan agrupadas en intervalos aquellas variables que han tomado un gran
nmero de valores diferentes, de manera que la presentacin en una tabla de todos ellos no es
operativa.
Escalas de medicin de caracteres
Desde el punto de vista estadstico es interesante hacer referencia a las propiedades mtricas de las
escalas bajo las cuales pueden aparecer las observaciones, ya que dependiendo de la escala los
procedimientos estadsticos aplicables son distintos. Una de las clasificaciones ms populares es la
propuesta por el psiclogo S.S. Stevens en 1946 y que distingue entre las siguientes escalas de
mediciones:
a) Escala nominal: Escala en la que se presentan los atributos cuyas modalidades no tienen asociadas
de forma natural un orden. Ejemplo de atributos que se presentan en esta escala son el estado civil,
el color, la ideologa poltica, etc.
b) Escala ordinal: Escala tambin propia de los atributos, pero se diferencia de la anterior en que
ahora s se puede establecer entre las modalidades algn tipo de orden jerrquico para su
clasificacin. Un ejemplo de atributo perteneciente a esta escala sera el nivel de estudios que
podra clasificarse en nulos, primarios, medios o superiores.
pg 8
c) Escala de intervalos (de diferencias): Se aplica a aquellas variables en las que es posible establecer
algn tipo de unidad de medida que cuantifica las diferencias entre dos observaciones
cualesquiera, pero en las que sin embargo cualquier origen de medicin que se considere es
arbitrario, de forma que comparar proporciones entre distintos valores de la variable no tendr
sentido. Un ejemplo de variable perteneciente a esta escala sera la temperatura medida en grados
centgrados, pues cuando se pasa de 5 a 10 grados s tiene significado lgico decir que la
temperatura ha aumentado en 5 grados, pero no lo tiene decir que la temperatura se ha duplicado.
Otro ejemplo sera el cmputo de los aos segn nuestro calendario, ya aqu tambin el ao cero u
origen es arbitrario y en otros cmputos como el musulmn o el hebreo es diferente.
d) Escala de razn (de proporcin): Se aplica a aquellas variables en las que tienen sentido tanto la
diferencia entre mediciones como la fijacin de cierto origen natural que s permite establecer
comparaciones de tipo proporcional entre los diferentes valores. A diferencia de la escala anterior
el origen natural significa la ausencia de la propiedad que se intenta medir. Ejemplos seran las
variables aos cumplidos por un individuo, ventas de un comercio (en ambas el origen es cero),
nmero de plazas para los ocupantes que admiten un colectivo de vehculos (ahora el origen sera
el 1), etc.
El siguiente cuadro sintetiza la clasificacin anterior
1.5.
Escalas
Nominal
Relacin de igualdad
Ordinal
Intervalo
Determinacin de diferencias
Razn
Los estudios estadsticos admiten adems otra clasificacin dependiendo de su referencia temporal:
a) Estudios transversales (o cross-section): Cuando las observaciones se refieren todas al
mismo instante de tiempo, como sucede por ejemplo si se analizan los salarios de los trabajadores
de una empresa en un mismo mes.
b) Estudios temporales o histricos: Cuando se procede a observar una caracterstica de
inters o un fenmeno a lo largo de cierto tiempo, como por ejemplo ocurre cuando se estudia la
evolucin de las ventas de una empresa a lo largo de varios meses.
c) Datos panel: Se denominan as los estudios que son combinacin de ambos tipos
anteriores.
Una caracterstica importante que diferencia el tipo de observaciones anteriores es la dependencia
de una observacin con las anteriores que se suele dar en el caso temporal y no en el transversal.
pg 9