Você está na página 1de 7

1

Estadstica en Ciencias Medioambientales Departament dEstadstica i Investigaci Operativa


TEMA 0. Introduccin.
0.1. Qu es la Estadstica?
0.2. Para qu sirve?
0.3. Orgenes y evolucin de la Estadstica.
0.4. Algunos ejemplos.
0.1. Qu es la Estadstica?
La Estadstica es el resultado de la unin de dos disciplinas que evolucionan de forma
independiente hasta que confluyen en el siglo XIX:
La estadstica (o ciencia del Estado), que estudia la descripcin de datos y tiene una
raz muy antigua.
El clculo de probabilidades, que nace en el siglo XVII como una teora matemtica
de los juegos de azar.
La integracin de estas dos lneas de pensamiento da lugar a una ciencia que estudia como
obtener conclusiones de la investigacin emprica mediante el uso de modelos matemticos.
La estadstica acta como disciplina puente entre los modelos matemticos y los fenmenos
reales. Un modelo matemtico es una abstraccin simplificada de una realidad ms
compleja, existiendo siempre cierta discrepancia entre lo observado y lo previsto por el
modelo. La estadstica proporciona una metodologa para evaluar estas discrepancias,
convirtindose as en una herramienta bsica en todas aquellas ramas de la ciencia aplicada
(como las Ciencias Medioambientales) que requieren del anlisis de datos y del diseo de
experimentos.
2
Estadstica en Ciencias Medioambientales Departament dEstadstica i Investigaci Operativa
Tema 0. Introduccin
0.2. Para qu sirve?
La Estadstica se utiliza para resolver multitud de problemas de muy diferente
ndole. En este curso nos centraremos principalmente en los siguientes:
Descripcin de datos
El primer problema que, histricamente, aborda la estadstica es la descripcin de datos.
La estadstica nos proporcionar procedimientos para resumir la informacin contenida en los datos,
que ser de gran utilidad cuando trabajamos con grandes conjuntos de datos. En el Tema 1
veremos las principales herramientas descriptivas.
Anlisis de muestras
Es frecuente que, por razones tcnicas o econmicas, no sea posible estudiar todos los elementos
de una poblacin. La estadstica nos indicar como seleccionar una muestra representativa y
realizar inferencias respecto de la poblacin a partir de los valores observados en la muestra. Estos
aspectos se analizaran en los Temas 2 y 3.
Contrastes de hiptesis
En muchas situaciones nuestro objetivo ser contrastar si, a partir de la informacin suministrada por
los datos, hay suficiente evidencia para aceptar o rechazar una determinada hiptesis. En los temas 4
y 5 veremos algunos ejemplos concretos de contrastes de hiptesis.
Medida de relaciones
Las relaciones que observamos entre variables fsicas, sociales o tcnicas no son totalmente
deterministas, ya que los datos observados suelen estar afectados por errores sistemticos y
casuales. Es por ello que las relaciones que observaremos no sern exactas sino estadsticas. En
el Tema 6 analizaremos los modelos estadsticos que permitirn relacionar variables entre si y
estudiar su relacin.
3
Estadstica en Ciencias Medioambientales Departament dEstadstica i Investigaci Operativa
Tema 0. Introduccin
0.3. Orgenes y evolucin de la Estadstica.
El Clculo de Probabilidades.
Como veremos ms adelante, el clculo de probabilidades nace como respuesta a una
necesidad de gran importancia, analizar los resultados de los JUEGOS DE AZAR.
Los dados ms antiguos datan de unos 3.000 aos a.C., y se utilizaban tanto en juegos de
azar como en ceremonias religiosas. Como no era posible encontrar las causas que
permitieran predecir el resultado de tirar un dado, las civilizaciones antiguas basadas en el
determinismo atribuan los resultados de los fenmenos aleatorios (dados, lluvia, viento,...) a
la voluntad divina. Por ello, el resultado de los dados poda utilizarse para predecir el futuro.
Los juegos de azar tienen una antigedad de ms de 40.000 aos. En numerosas
excavaciones arqueolgicas se han encontrado huesos astrgalos, precursores de los
dados.
El Renacimiento supone un nuevo enfoque global de la concepcin del mundo. El progresivo abandono
de les explicaciones teolgicas conduce a una reconsideracin de los experimentos aleatorios, y los
matemticos italianos del siglo XVI empiezan a interpretar los resultados de determinados
experimentos aleatorios simples.
Por ejemplo, Cardano establece en 1526, utilizando simples condiciones de
simetra, la equiprobabilidad de aparicin a largo trmino de las caras de un
dado.
Tambin Galileo responde a un jugador, el Prncipe de Toscana, porqu tirando
3 dados es ms difcil sacar un 9 que un 10. Para ello muestra que, de les 216
combinaciones posibles, 25 conducen a un 9 y 27 a un 10 (con una diferencia
nicamente de 2/2161%, lo que indica el intuitivo pero preciso anlisis
emprico de los resultados aleatorios que se tena ya en el siglo XVI).
Gerolamo Cardano
(1501 - 1576)
Galileo Galilei
(1564 - 1642)
4
Estadstica en Ciencias Medioambientales Departament dEstadstica i Investigaci Operativa
Tema 0. Introduccin
Numerosos autores sitan el origen del clculo de probabilidades en la correspondencia
mantenida entre Pascal y Fermat, dos cientficos franceses, para resolver los problemas
planteados por Antoine Gombard, caballero De Mer y jugador empedernido de la Francia
del siglo XVII.
LA APUESTA INTERRUMPIDA.-
Dos jugadores A y B apuestan a cara o cruz, tirando sucesivamente una
moneda. Cada vez que juegan, el jugador que gana se anota un punto.
Aquel jugador que primero llegue a cinco puntos, ganar la apuesta. El
juego se interrumpe en un momento en que A tiene 4 puntos y B tiene 3
puntos. Cmo deben repartirse la cantidad apostada para ser justos?
APUESTAS VENTAJOSAS.-
El Caballero De Mer saba que era ventajoso apostar por el resultado de
obtener al menos un seis en una serie de 4 lanzamientos de un dado.
Entonces De Mer argument que deba ser igual de ventajoso apostar por
el resultado de obtener al menos un doble seis en una serie de 24
lanzamientos con un par de dados. El anlisis no corrobor la suposicin de
De Mer.
Las soluciones encontradas por Pascal y Fermat en 1654 establecieron las bases del Clculo de
Probabilidades.
Blaise Pascal
(1623-1662) Pierre de
Fermat (1601-
1665)
5
Estadstica en Ciencias Medioambientales Departament dEstadstica i Investigaci Operativa
Tema 0. Introduccin
El clculo de probabilidades se consolida como una disciplina independiente durante la
segunda mitad del siglo XVII y principios del XVIII, y se aplica fundamentalmente a los
juegos de azar.
Bernoulli proporciona la primera solucin al problema de la estimacin de una cantidad
desconocida a partir de un conjunto de medidas que, debido al error experimental,
presentan cierta variabilidad.
Pierre Simon, marqus de Laplace, introdujo la primera definicin explcita de
probabilidad y desarroll la ley normal para describir los errores de medida.
Legendre resuelve el problema de estimacin de modelos estticos inventando el
mtodo de estimacin de mnimos cuadrados, y Gauss demuestra su optimalidad
cuando los errores de medida siguen una distribuci normal.
Durante el siglo XVIII se extiende a problemas relacionados con la astronoma y con la
fsica a partir de la constatacin emprica de la teora de Newton. La obra de Newton
constituye la mayor revolucin cientfica de los siglos XVII y XVIII. A lo largo del siglo
XVIII y parte del XIX, la investigacin en fsica y astronoma estar dirigida por el
paradigma de Newton, y estas investigaciones tendrn una importancia fundamental en
el desarrollo de la estadstica.
Sir Isaac Newton
(16431727)
Durante la primera mitad del siglo XIX, los matemticos astrnomos continan ampliando la teora de
errores y aparecen nuevos problemas y mtodos que tendrn gran influencia posterior. Bravais es el
primero que considera la relacin entre los errores de medida dependientes entre s, Pierce propone el
primer criterio para rechazar observaciones heterogneas con el resto, y Newcomb introduce los
primeros mtodos de estimacin robusta.
Por lo tanto, a mediados del siglo XIX ya existen los principios bsicos que darn lugar a la estadstica
actual, aunque su aplicacin se restringe a la fsica y a la astronoma sin ejercer influencia sobre otros
reas de conocimiento.
Johann Carl
Friedrich Gauss
(17771855)
6
Estadstica en Ciencias Medioambientales Departament dEstadstica i Investigaci Operativa
Tema 0. Introduccin
La estadstica hasta el siglo XIX.
Desde la antigedad, los estados han recogido informacin sobre la poblacin y riqueza
de sus dominios (censos romanos, inventarios de Carlomagno,...). Esta aritmtica poltica
o estadstica descriptiva evoluciona durante los siglos XVII y XVIII tomando
progresivamente un carcter ms cuantitativo. Durante el siglo XVIII se producen los
primeros censos oficiales de poblacin, y a principios del siglo XIX casi todos los pases
europeos realizan estas operaciones censales.
En esta poca se producen los primeros intentos de aplicar un razonamiento propiamente estadstico en
la estimacin de tasas demogrficas o el clculo de tablas de mortalidad para calcular las cuotas de los
seguros de vida.
Durante el siglo XVIII y la mayor parte de XIX la estadstica evoluciona de forma separada del clculo de
probabilidades. La unin entre ambas corrientes se produjo al comienzo del siglo XX, favorecida por los
nuevos problemas tericos y metodolgicos que planteaba la constatacin emprica de la teora de
Darwin.
El nacimiento de la estadstica actual.
La obra de Darwin supuso una revolucin en la biologa. Los dos mecanismos de la
seleccin natural, produccin de variabilidad y seleccin mediante lucha por la
existencia, tenan un atractivo inmediato desde el punto de vista estadstico. La
produccin de variabilidad mediante el azar entronca con el clculo de probabilidades;
la seleccin natural, con el estudio de poblaciones y con la idea de correlacin.
Aquellos organismos ms adaptados sobrevivirn un mayor perodo de tiempo y
dejarn un mayor nmero de descendientes, por lo que deber existir una correlacin
entre determinadas caractersticas genticas transmisibles y el grado de supervivencia
y descendencia del individuos de una especie.
Charles Robert
Darwin
(1809- 1882)
7
Estadstica en Ciencias Medioambientales Departament dEstadstica i Investigaci Operativa
Tema 0. Introduccin
El primero en resaltar la necesidad de acudir a los mtodos estadsticos para contrastar
la teora de Darwin fue su primo Galton, quien estudi exhaustivamente la distribucin
normal e introdujo el concepto de lnea de regresin comparando la estatura de padres e
hijos.
Galton encontr que los padres altos tenan, en media, hijos altos, pero sin embargo, en
media, ms bajos que sus padres, mientras que los padres bajos tenan, en media, hijos
bajos sin embargo, en media, ms altos que sus padres. Este fenmeno de regresin se
ha encontrado en numerosas caractersticas hereditarias, de manera que los
descendientes de personas extremas en alguna caracterstica estarn, en media, ms
cerca de la media de la poblacin que sus progenitores, producindose as un efecto de
regresin a la media de la poblacin.
La resolucin de los problemas que surgieran a la biologa como consecuencia de
las teoras de Darwin requirieran el desarrollo de nuevos mtodos estadsticos
ms avanzados.
Uno de los estadsticos ms importantes fue Pearson, que dedic una importante
parte de sus esfuerzos a la publicacin de tablas estadsticas que permitieran la
utilizacin prctica de los nuevos mtodos, lo cual contribuy definitivamente a su
rpida difusin. A lo largo del curso iremos encontrndonos con algunas de las
contribuciones ms importantes de Pearson.
El laboratorio de Pearson se convirti en un polo de atraccin para todos aquellos
interesados en el anlisis emprico de datos. Uno de sus alumnos fue Gosset, que
se encontr en sus estudios con el problema de las muestras pequeas. Fue el
primero al utilizar el mtodo de Montecarlo y encontr la distribucin t, que public
con el seudnimo de Student.
Sir Francis
Galton
(18221911)
Karl Pearson
(1857- 1936)
William Sealy Gosset
(1876 1937)
8
Estadstica en Ciencias Medioambientales Departament dEstadstica i Investigaci Operativa
Tema 0. Introduccin
Los fundamentos de la estadstica actual y muchos de los mtodos de inferencia que
veremos a lo largo del curso son debidos a Fisher. Entre ellos, podemos destacar el
ANOVA (Anlisis de la Variancia), el estadstico exacto para tablas de contingencia 2x2,
la teora del diseo de experimentos o el anlisis discriminante.
Fisher asent las bases de la gentica poblacional, demostrando que la posibilidad que
una mutacin incremente la adaptacin de un organismo disminuye con la magnitud de la
mutacin y que las poblaciones ms grandes comportan ms variacin, de manera que
tienen una mayor probabilidad de supervivencia.
La expansin del estadstica durante el siglo XX.
Entre 1920 y el final de la Segunda Guerra Mundial se extiende la aplicacin de los mtodos
estadsticos en reas tan diversas como la ingeniera, la economa, la medicina, la antropologa o la
psicologa. La bsqueda de respuestas a los nuevos interrogantes planteados por estas aplicaciones
impulsan, a su vez, el desarrollo de nuevos mtodos estadsticos (mtodos de regresin, mtodos
multivariantes, procesos estocsticos, ...)
A finales del siglo XX el espectacular aumento de la potencia de clculo de los ordenadores y la
cada de costes de almacenamiento de la informacin han hecho posible la recogida automtica de
grandes masas de datos de cualquier actividad humana. El reto del estadstica en el siglo XXI es
como extraer la informacin ms relevante de estas masas de datos y utilizarla de forma efectiva
para aumentar nuestro conocimiento, orientar la toma de decisiones y dirigir la mejora de procesos y
servicios.
Ronald A.Fisher
(1890 1962)
9
Estadstica en Ciencias Medioambientales Departament dEstadstica i Investigaci Operativa
Tema 0. Introduccin
0.4. Algunos ejemplos.
1. VACUNA PARA EL NTRAX.
El ntrax es una enfermedad grave del ganado vacuno y lanar. En 1881 Louis Pasteur
realiz un famoso experimento para demostrar el efecto de su vacuna contra el ntrax.
Un grupo de 24 ovejas fue vacunado; otro grupo de 24 ovejas no vacunadas sirvi de
control. Los 48 animales fueron inoculados con un cultivo virulento de bacilos de ntrax.
La siguiente tabla muestra los resultados.
TRATAMIENTO
RESPUESTA Vacunados No vacunados
Muertos de ntrax 0 24
Supervivientes 24 0
Total 24 24
% Supervivientes 100 % 0 %
2. BACTERIA Y CNCER.
Para estudiar el efecto de cierta bacteria sobre el desarrollo de un tipo de tumor, los investigadores
utilizaron un linaje de ratones que tena una alta incidencia natural de tumores en el hgado. Un
grupo de ratones fue mantenido totalmente libre de grmenes, mientras otro grupo fue expuesto a
la bacteria Escherichia coli. La incidencia de tumores de hgado se muestra en la siguiente tabla.
TRATAMIENTO
RESPUESTA E. Coli Libre de grmenes
Tumores 8 19
No tumores 5 30
Total 13 49
% con tumores 62% 39%
Louis Pasteur
(1822 - 1895)
10
Estadstica en Ciencias Medioambientales Departament dEstadstica i Investigaci Operativa
Tema 0. Introduccin
3. INUNDACIN Y ATP
En un experimento sobre el metabolismo de las races, un
fisilogo realiz una plantacin de plantones de abedules en
un invernadero. Inund cuatro plantones con agua durante
un da y dej cuatro como control. Entonces recogi los
plantones y analiz la presencia de trifosfato de adenosina
(ATP) en las races. Las cantidades de ATP (nmero de
moles por mg de tejido) figuran en la tabla siguiente:
INUNDADOS CONTROL
1,45 1,70
1,19 2,04
1,05 1,49
1,07 1,91
SEMILLAS
C
o
n
c
e
n
t
r
a
c
i
o
n

A
T
P
Inundadas Control
Concentracion ATP
1
1.2
1.4
1.6
1.8
2
2.2
.8 1 1.2 1.4 1.6 1.8 2 2.2
4. ELECCIN DE ALIMENTO POR LARVAS DE INSECTOS
El curculinido de la raz del trbol, Sitona hispidulus, es un insecto daino que se come la raz de la
alfalfa. Una entomloga efectu un experimento para estudiar la eleccin de alimento por parte de las
larvas de Sitona. Ella deseaba investigar si las larvas elegiran preferentemente races de alfalfa
noduladas (el estado natural) o bien races con la nodulacin suprimida. Las larvas fueran depositadas
en una bandeja donde haba races noduladas y no noludadas. Despus de 24 horas, la investigadora
cont las larvas que claramente haban realizado una eleccin entre los dos tipo de races. Los
resultados se muestran en la tabla siguiente
ELECCIN NM. DE LARVAS
Races noduladas 46
Races no noduladas 12
Otras (no eligen, muertes o prdidas) 62
Total 120
11
Estadstica en Ciencias Medioambientales Departament dEstadstica i Investigaci Operativa
Tema 0. Introduccin
5. MAO Y ESQUIZOFRENIA
La monoaminooxidasa (MAO) es una enzima de la que se piensa que interviene en la
regulacin del comportamiento. Por ver si diferentes categoras de pacientes
esquizofrnicos tienen niveles distintos a actividad MAO, los investigadores recogieran
muestras de sangre de 42 pacientes y midieran la actividad MAO de las plaquetas. Los
resultados se presentan en la mesa siguiente:
DIAGNOSTICO ACTIVIDAD MAO
I: Esquizofrnicos crnicos 6,8 4,1 7,3 14,2 18,8 9,9
no diferenciados 7,4 11,9 5,2 7,8 7,8 8,7
(18 pacientes) 12,7 14,5 10,7 8,4 9,7 10,6
II: No diferenciados con 7,8 4,4 11,4 3,1 4,3 10,1
caractersticas paranoides 1,5 7,4 5,2 10,0 3,7 5,5
(16 pacientes) 8,5 7,7 6,8 3,1 1
III: Esquizofrnicos paranoides 6,4 10,8 1,1 2,9 4,5 5,8
(8 pacientes) 9,4 6,8
DIAGNOSTICO
A
c
t
i
v
i
d
a
d

M
A
O
Actividad MAO
0
2
4
6
8
10
12
14
16
18
20
.75 1 1.25 1.5 1.75 2 2.25 2.5 2.75 3 3.25
12
Estadstica en Ciencias Medioambientales Departament dEstadstica i Investigaci Operativa
Tema 0. Introduccin
6. POLUCIN DEL AIRE Y CRECIMIENTO DE LAS PLANTAS
En un estudio del efecto mutuo de los contaminantes del aire, ozono y dixido de sulfuro,
se plantaron judas Blue Lake en cmaras de cultivo con el techo abierto. Algunas
cmaras fueran fumigadas repetidamente con dixido de sulfuro. En algunas cmaras, el
aire fue filtrado con carbn para eliminar el ozono ambiental. Haba tres cmaras con
combinacin de tratamientos, asignadas aleatoriamente. Despus de un mes de
tratamiento, la cosecha de vainas de judas fue pesada en cada cmara. Los resultados
figuran en la tabla siguiente:
AUSENCIA DE OZONO PRESENCIA DE OZONO
DIXIDO DE SULFURO DIXIDO DE SULFURO
Ausente (1) Presente (2) Ausente (3) Presente (4)
1,52 1,49 1,15 0,65
1,85 1,55 1,30 0,76
1,39 1,21 1,57 0,69
TRATAMIENTO
5,0 4,0 3,0 2,0 1,0 0,0
P
r
o
d
u
c
c
i

n

(
k
g
r
.
)
2,0
1,8
1,6
1,4
1,2
1,0
,8
,6
,4
,2
0,0
13
Estadstica en Ciencias Medioambientales Departament dEstadstica i Investigaci Operativa
Tema 0. Introduccin
7. PESO DEL CUERPO Y CONSUMO DE ENERGA.
Cunto alimento necesita una persona? Para investigar la dependencia de los
requerimientos nutricionales respecto del tamao del cuerpo, ciertos investigadores
utilizaron tcnicas de pesado bajo el agua para determinar la masa del cuerpo libre de
grasa de siete hombres. Tambin midieron el gasto total de energa en 24 horas bajo
condiciones de inactividad; esto fue repetido dos veces para cada individuo. Los
resultados se muestran en la siguiente tabla:
SUJETO PESO LIBRE GASTO DE ENERGA
DE GRASA EN 24 HORAS (Kcal)
1 49.3 1.851 1.936
2 59.3 2.209 1.891
3 68.3 2.283 2.423
4 48.1 1.885 1.791
5 57.6 1.929 1.967
6 78.1 2.490 2.567
7 76.1 2.484 2.653
PESO
80 75 70 65 60 55 50 45 40
E
N
E
R
G
I
A
2,8
2,7
2,6
2,5
2,4
2,3
2,2
2,1
2,0
1,9
1,8
1,7
1,6

Você também pode gostar