Você está na página 1de 20

INSTITUTO TECNOLGICO SUPERIOR DE

VILLA LA VENTA, TAB.

NOMBRE DEL FACILITADOR:


ING. ANGEL ARMANDO CARRILLO PEREZ

MATERIA:
ESTADFISTICA INFERENCIAL 1

UNIDAD 1
INTRODUCCION A LA ESTADISTICA

INGENIERIA INDUSTRIAL
ALUMNO:
ALEXIS ENRIQUE CASTILLO JUAREZ

3 U

INSTITUTO TECNOLGICO SUPERIOR DE


VILLA LA VENTA, TAB.

UNIDAD 1
INTRODUCCIN A LA ESTADSTICA INFERENCIAL
1.1._ BREVE HISTORIA DE LA ESTADSTICA
Los comienzos de la estadstica pueden ser hallados en el antiguo Egipto, cuyos
faraones lograron recopilar, hacia el ao 3050 antes de Cristo, prolijos datos
relativos a la poblacin y la riqueza del pas. De acuerdo al historiador griego
Herodoto, dicho registro de riqueza y poblacin se hizo con el objetivo de preparar
la construccin de las pirmides. En el mismo Egipto, Ramss II hizo un censo de
las tierras con el objeto de verificar un nuevo reparto.
Tambin los chinos efectuaron censos hace ms de cuarenta siglos. Los griegos
efectuaron censos peridicamente con fines tributarios, sociales (divisin de
tierras) y militares (clculo de recursos y hombres disponibles). La investigacin
histrica revela que se realizaron 69 censos para calcular los impuestos,
determinar los derechos de voto y ponderar la potencia guerrera.
Pero fueron los romanos, maestros de la organizacin poltica, quienes mejor
supieron emplear los recursos de la estadstica. Cada cinco aos realizaban un
censo de la poblacin y sus funcionarios pblicos tenan la obligacin de anotar
nacimientos, defunciones y matrimonios, sin olvidar los recuentos peridicos del
ganado y de las riquezas contenidas en las tierras conquistadas. Para el
nacimiento de Cristo suceda uno de estos empadronamientos de la poblacin
bajo la autoridad del imperio.
Durante los mil aos siguientes a la cada del imperio Romano se realizaron muy
pocas operaciones Estadsticas, con la notable excepcin de las relaciones de
tierras pertenecientes a la Iglesia, compiladas por Pipino el Breve en el 758 y por
Carlomagno en el 762 DC.
Por el ao 1540 el alemn Sebastin Muster realiz una compilacin estadstica
de los recursos nacionales, comprensiva de datos sobre organizacin
poltica, instrucciones sociales, comercio y podero militar. Durante el siglo XVII
aport
indicaciones
ms concretas de mtodos de observacin y anlisis
cuantitativo y ampli los campos de la inferencia y la teora Estadstica.
Los eruditos del siglo XVII demostraron especial inters por la Estadstica
Demogrfica como resultado de la especulacin sobre si la poblacin aumentaba,
decreca o permaneca esttica.

INSTITUTO TECNOLGICO SUPERIOR DE


VILLA LA VENTA, TAB.
Durante el siglo XVII y principios del XVIII,
matemticos como Bernoulli, Francis Maseres, Lagrange y
Laplace desarrollaron la teora de probabilidades. No obstante durante cierto
tiempo, la teora de las probabilidades limit su aplicacin a los juegos de azar y
hasta el siglo XVIII no comenz a aplicarse a los grandes problemas cientficos.
Godofredo Achenwall, profesor de la Universidad de Gotinga, acu en 1760 la
palabra estadstica, que extrajo del trmino italiano statista (estadista).Crea, y
con sobrada razn, que los datos de la nueva ciencia seran el aliado ms eficaz
del gobernante consciente.
Jacques Qutelect es quien aplica las Estadsticas a las ciencias sociales. Este
interpret la teora de la probabilidad para su uso en las ciencias sociales y
resolver la aplicacin del principio de promedios y de la variabilidad a los
fenmenos sociales. Qutelect fue el primero en realizar la aplicacin prctica de
todo el
mtodo Estadstico, entonces conocido, a las diversas ramas de la
ciencia. Entretanto, en el perodo del 1800 al 1820 se desarrollaron dos conceptos
matemticos fundamentales para la teora Estadstica; la teora de los errores de
observacin, aportada por La place y Gauss; y la teora de los mnimos cuadrados
desarrollada por Laplace,Gauss y Legendre.
Los progresos ms recientes en el campo de la Estadstica se
refieren
al
ulterior desarrollo
del
clculo
de
probabilidades,
particularmente en la rama denominada indeterminismo o relatividad, se ha
demostrado que el determinismo fue reconocido en la Fsica como resultado
de las investigaciones atmicas y que este principio se juzga aplicable
tanto a las ciencias sociales como a las fsicas.

1.2._ CONCEPTO DE ESTADSTICA


La Estadstica es la ciencia cuyo objetivo es reunir una informacin
cuantitativa concerniente a individuos, grupos, series de hechos, etc. y
deducir de ello gracias al anlisis de estos datos unos significados precisos o
unas previsiones para el futuro.
La estadstica, en general, es la ciencia que trata de la recopilacin,
organizacin presentacin, anlisis e interpretacin de datos numricos con el fin
de realizar una toma de decisin ms efectiva.

INSTITUTO TECNOLGICO SUPERIOR DE


VILLA LA VENTA, TAB.
Otros

autores tienen definiciones de la Estadstica


semejantes a las anteriores, y algunos otros no tan
semejantes. Para Chacn esta se define como la ciencia que tiene por objeto
el estudio cuantitativo de los colectivos; otros la definen como la
expresin cuantitativa del conocimiento dispuesta en forma adecuada para el
escrutinio y anlisis.
La ms aceptada, sin embargo, es la de Mnguez, que define la Estadstica como
La ciencia que tiene por objeto aplicar las leyes de la cantidad a los hechos
sociales para medir su intensidad, deducir las leyes que los rigen y hacer su
prediccin prxima.
Los estudiantes confunden comnmente los dems trminos asociados
con las Estadsticas, una confusin que es conveniente aclarar debido a que esta
palabra tiene tres significados: la palabra estadstica, en primer trmino se
usa para referirse a la informacin estadstica; tambin se utiliza para
referirse al conjunto de tcnicas y mtodos que se utilizan para analizar la
informacin
estadstica;
y
el
trmino
estadstico,
en singular y en
masculino, se refiere a una medida derivada de una muestra.

1.3._ ESTADSTICA DESCRIPTIVA


La estadstica descriptiva es la rama de las Matemticas que
recolecta, presenta y caracteriza un conjunto de datos (por ejemplo, edad
de una poblacin, altura de los estudiantes de una escuela, temperatura en
los meses de verano, etc.) con el fin de describir apropiadamente las diversas
caractersticas de ese conjunto.
Al conjunto de los distintos valores numricos que adopta un carcter cuantitativo
se llama variable estadstica.
Las variables pueden ser de dos tipos:
Variables cualitativas o categricas: no se pueden medir numricamente (por
ejemplo: nacionalidad, color de la piel, sexo).
Variables cuantitativas: tienen valor numrico (edad, precio de un producto,
ingresos anuales).
Las variables tambin se pueden clasificar en:

INSTITUTO TECNOLGICO SUPERIOR DE


VILLA LA VENTA, TAB.

Variables unidimensionales: slo


recogen
informacin sobre una caracterstica (por ejemplo: edad de
los alumnos de una clase).
Variables bidimensionales: recogen informacin sobre dos caractersticas
de la poblacin (por ejemplo: edad y altura de los alumnos de una clase).
Variables pluridimensionales: recogen informacin sobre tres o ms
caractersticas (por ejemplo: edad, altura y peso de los alumnos de una clase). Por
su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:
Discretas: slo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo:
nmero de hermanos (puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podr
ser 3.45).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por
ejemplo, la velocidad de un vehculo puede ser 90.4 km/h, 94.57 km/h...etc.
Cuando se estudia el comportamiento de una variable hay que distinguir los
siguientes conceptos:
Individuo: cualquier elemento que porte informacin sobre el fenmeno que se
estudia.
As, si estudiamos la altura de los nios de una clase, cada alumno es un
individuo; si se estudia el precio de la vivienda, cada vivienda es un individuo.
Poblacin: conjunto de todos los individuos (personas, objetos,
animales, etc.) que porten informacin sobre el fenmeno que se estudia. Por
ejemplo, si se estudia el precio de la vivienda en una ciudad, la poblacin ser el
total de las viviendas de dicha.
Muestra: subconjunto seleccionado de una poblacin. Por ejemplo, si se estudia
el precio de la vivienda de una ciudad, lo normal ser no recoger informacin
sobre todas las viviendas de la ciudad (sera una labor muy compleja), sino que se
suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente
representativo.

INSTITUTO TECNOLGICO SUPERIOR DE


VILLA LA VENTA, TAB.
1.4._

ESTADISTICA INFERENCIAL

El origen de la Estadstica descriptiva puede relacionarse con el inters por


mantener registros gubernamentales hacia fines de la Edad Media.
Cuando los estados empezaron a surgir durante ese perodo, se volvi
necesario obtener informacin acerca de los territorios bajo la jurisdiccin de
cada nacin. Esta necesidad de informacin numrica acerca de los ciudadanos y
recursos lleva al desarrollo de tcnicos para obtener y organizar datos numricos.
Hacia fines del siglo XVII, ya existan investigaciones semejantes a
nuestros
censos modernos. Al mismo tiempo, las compaas de seguros
empezaban a recopilar tablas de mortalidad para determinar las primas de
seguros de vida. En las primeras etapas de desarrollo, la estadstica inclua poco
ms que la obtencin, clasificacin y presentacin de datos numricos. An hoy en
da, estas actividades siguen siendo una parte importante de la Estadstica.
La Estadstica
inferencial o Inferencia
estadstica, estudia
cmo
sacar
conclusiones generales para toda la poblacin a partir del estudio de
una muestra, y el grado de fiabilidad o significacin de los resultados
obtenidos.

1.5._ BREVE INTRODUCCION A LA INEFRENCIA ESTADISTICA


El principal objeto de la Estadstica es inferir o estimar caractersticas de una
poblacin que no es completamente observable (o no interesa observarla en su
totalidad) a travs del anlisis de una parte de ella a la que llamamos muestra. Las
razones por las que generalmente se trabaja con muestras son principalmente:
Econmicas
Tiempo: si la poblacin es muy grande llevara tanto tiempo analizarla que
incluso la caractersticas de inters podra variar en ese periodo. Por ejemplo, la
tasa de paro.
Destruccin: la medicin de ciertas caractersticas podra llevar a la destruccin
del individuo. Por ejemplo, al estudiar la supervivencia de ciertos animales a un
tratamiento.
Lo que se hace entonces es analizar la muestra y extrapolar
conclusiones desde la muestra a la poblacin. Ahora bien, para
considerar vlidas en la poblacin las conclusiones obtenidas en la muestra,
sta ha de representar bien a la poblacin (representativa). Por lo tanto,
la seleccin de la

INSTITUTO TECNOLGICO SUPERIOR DE


VILLA LA VENTA, TAB.

muestra es de suma importancia, y para ello hay diversos mtodos (mtodos de


muestreo). Cuando se intuye que la caracterstica en estudio puede presentar
valores homogneos en la poblacin, una forma de obtener una
muestra
representativa es eligindola al azar. A este mtodo de seleccin de la
muestra se le llama muestreo aleatorio simple y es el ms sencillo.
La Inferencia Estadstica se puede clasificar en inferencia paramtrica e
inferencia no paramtrica. La inferencia paramtrica tiene lugar cuando se conoce
la distribucin de la variable de estudio en la poblacin, y el inters recae sobre los
parmetros desconocidos de la misma. La inferencia no paramtrica tiene lugar si
no se conoce la distribucin y slo se suponen propiedades generales de la
misma. Nosotros nos centramos en la inferencia paramtrica, y nuestro objetivo
ser inferir o estimar parmetros poblacionales a partir de la informacin que nos
proporciona una muestra.
Supongamos que estudiamos una variable X en una poblacin y sabemos que
presenta una distribucin F, donde es el parmetro de la distribucin y es
desconocido. Los problemas de inferencia que pueden darse son: de estimacin,
en los que se busca un valor (estimacin puntual) para o un conjunto
de valores posibles para el mismo (estimacin por intervalos de confianza), y de
contraste, cuyo objetivo es comprobar si es cierta o falsa cierta hiptesis
formulada sobre el parmetro . En el Tema 7 se estudia la estimacin puntual y
por intervalos de confianza, y en Tema 8 estudiaremos problemas de contraste de
hiptesis. Ejemplo: Supongamos que queremos estudiar el tiempo de fallo de una
poblacin de cierto tipo de componentes. Intuimos (por estudios
anteriores
por ejemplo) que el tiempo de fallo X sigue una distribucin
Exponencial, X Exp(), con desconocido, ya que no observamos el tiempo de
fallo de todos los componentes de la poblacin.

1.6._ TEORA DE DECISIN EN ESTADSTICA


El problema de la Decisin, motivado por la existencia de ciertos estados de
ambigedad que constan de proposiciones verdaderas
(conocidas o
desconocidas), es tan antiguo como la vida misma. Podemos afirmar que todos
los seres vivientes, aun los ms simples, se enfrentan con problemas de decisin.
As, un organismo unicelular asimila partculas de su medio ambiente, unas
nutritivas y

INSTITUTO TECNOLGICO SUPERIOR DE


VILLA LA VENTA, TAB.
otras

nocivas para l. La composicin biolgica del


organismo y las leyes fsicas y qumicas determinan qu
partculas sern asimiladas y cules sern rechazadas.
Conforme aumenta la complejidad del ser vivo, aumenta tambin la complejidad
de sus decisiones y la forma en que stas se toman. As, pasamos de una toma de
decisiones guiada instintivamente, a procesos de toma de decisiones que deben
estar guiados por un pensamiento racional en el ser humano. La Teora de la
Decisin tratar, por tanto, el estudio de los procesos de toma de decisiones
desde una perspectiva racional.
CARACTERSTICAS Y FASES DEL PROCESO DE DECISIN
Un proceso de decisin presenta las siguientes caractersticas principales:
Existen al menos dos posibles formas de actuar, que llamaremos alternativas o
acciones, excluyentes entre s, de manera que la actuacin segn una de ellas
imposibilita cualquiera de las restantes.
Mediante un proceso de decisin se elige una alternativa, que es la que se lleva
acabo.
La eleccin de una alternativa ha de realizarse de modo que cumpla
un fin determinado.
El proceso de decisin consta de las siguientes fases fundamentales:
Prediccin de las consecuencias de cada actuacin. Esta prediccin deber
basarse en la experiencia y se obtiene por induccin sobre un conjunto de datos.
La recopilacin de este conjunto de datos y su utilizacin entran dentro del campo
de la Estadstica.
Valoracin de las consecuencias de acuerdo con una escala de bondad o
deseabilidad.
Esta escala de valor dar lugar a un sistema de preferencias.
Eleccin de la alternativa mediante un criterio de decisin adecuado. Este punto
lleva a su vez asociado el problema de eleccin del criterio ms adecuado
para nuestra decisin, cuestin que no siempre es fcil de resolver de un modo
totalmente satisfactorio.

INSTITUTO TECNOLGICO SUPERIOR DE


VILLA LA VENTA, TAB.
CLASIFICACIN DE LOS PROCESOS
DE DECISIN
Los procesos de decisin se clasifican de acuerdo segn el grado de conocimiento
que se tenga sobre el conjunto de factores o variables no controladas
por el decisor y que pueden tener influencia sobre el resultado final
(esto es lo que se conoce como ambiente o contexto). As, se dir que:
El ambiente es de certidumbre cuando se conoce con certeza su estado, es
decir, cada accin conduce invariablemente a un resultado bien definido.
El ambiente de riesgo cuando cada decisin puede dar lugar a una
serie
de consecuencias a las que puede asignarse una distribucin de
probabilidad conocida. El ambiente es de incertidumbre cuando cada decisin
puede dar lugar a una serie de consecuencias a las que no puede asignarse
una distribucin de probabilidad, bien porque sea desconocida o porque no
tenga sentido hablar de ella.
Segn sea el contexto, diremos que el proceso de decisin (o la toma de
decisiones) se realiza bajo certidumbre, bajo riesgo o bajo incertidumbre,
respectivamente.

ELEMENTOS DE UN PROBLEMA DE DECISIN


En todo problema de decisin pueden distinguirse una serie de elementos
caractersticos:
El decisor, encargado de realizar la eleccin de la mejor forma de actuar de
acuerdo con sus intereses.
Las alternativas o acciones, que son las diferentes formas de actuar posibles,
de entre las cuales se seleccionar una. Deben ser excluyentes entre s.
Los posibles estados de la naturaleza, trmino mediante el cual se designan a
todos aquellos eventos futuros que escapan al control del decisor y
que influyen en el proceso.
Las consecuencias o resultados que se obtienen al seleccionar las
diferentes alternativas bajo cada uno de los posibles estados de la naturaleza.
La regla de decisin o criterio, que es la especificacin de un procedimiento
para identificar la mejor alternativa en un problema de decisin.

INSTITUTO TECNOLGICO SUPERIOR DE


VILLA LA VENTA, TAB.
COMPONENTES
INVESTIGACION ESTADISTICA
1.7._

DE

UNA

El estudio estadstico de una situacin con propsitos inferenciales se


centra en dos conceptos fundamentales: poblacin y muestra, los cuales
sern definidos a continuacin:
Poblacin. Es el conjunto formado por todos los valores posibles que puede
asumir, la variable objeto de estudio.
As por ejemplo, en un estudio sobre la preferencia de los votantes
en una eleccin presidencial, la poblacin consiste en todas las respuestas de los
votantes registrados. Pero el trmino no slo est asociado a la coleccin de seres
humanos u organismos vivos; y tenemos as que, si se va a hacer una
investigacin de las ventas anuales de los supermercados, entonces las
ventas anuales de todos los supermercados constituyen as mismo la
poblacin. Es bueno
tener en cuenta
que el trmino poblacin se
interpreta de dos maneras cuando se hace un estudio estadstico, a saber:
La interpretacin propia en el Anlisis Estadstico, que corresponde a
la que hemos presentado anteriormente. Como el conjunto de objetos sobre los
cuales acta la variable considerada.
Por tanto, no es extrao escuchar expresiones tales como, "se hizo un estudio de
los niveles de ingreso de la poblacin trabajadora colombiana", entendindose
con ello que el elemento estadstico objeto de anlisis fue el registro numrico de
los ingresos.
Muestra. Es cualquier subconjunto de la poblacin, escogido al seguir ciertos
criterios de seleccin.
La muestra es el elemento bsico sobre el cual se fundamenta la posterior
inferencia acerca de la poblacin de donde se ha tomado. Por ello, su escogencia
y seleccin debe hacerse siguiendo ciertos procedimientos que son ampliamente
tratados en la parte de la estadstica llamada Teora de muestreo.
El concepto de muestra tiene tambin las dos connotaciones que hemos sealado
para la poblacin.
Las caractersticas de una poblacin se resumen para su estudio generalmente
ir mediante lo que se denominan
parmetros; stos a su vez se toman o
consideran como valores verdaderos de la caracterstica estudiada. Por ejemplo,
la proporcin de todos los clientes que declaran cierta preferencia por una

INSTITUTO TECNOLGICO SUPERIOR DE


VILLA LA VENTA, TAB.
marca
de la
de la poblacin.

particular de un producto dado, es un parmetro


poblacin de todos los clientes; es la verdadera proporcin

Igualmente, la media aritmtica de las cuentas corrientes de los


clientes de un banco determinado constituye un parmetro de la poblacin
de las cuentas de los clientes de ese banco.
Cuando la caracterstica de la poblacin estudiada se reduce a una
muestra el resumen de esa caracterstica se hace mediante sta (medida) o
estadgrafo. As por ejemplo. Si se toman 100 de todos los posibles clientes y se
les entrevista para ver si estn a favor de una marca particular de un producto,
estos 100 clientes la constituyen una muestra. Si hay 70 clientes que prefieren
dicha marca entonces la proporcin muestra ser 0.70 y constituir un
estadgrafo; de igual manera si se escogen 1,000 cuentas del total de las cuentas
comentes; las 1,000 observaciones conforman una muestra y el promedio
aritmtico de estas cuentas un estimador.
La inferencia estadstica se orienta a sacar conclusiones acerca del
parmetro o parmetros poblacionales con base en el valor de un estimador
obtenido a partir de los datos mustrales extrados de esa poblacin. Para llegar a
ese objetivo a travs de un proceso racional y eficaz, se aconseja que se tengan
en cuenta los siguientes pasos:
Formulacin del problema. En este punto se debe especificar de manera
clara la pregunta que se debe responder y la poblacin de datos asociada a la
pregunta.
Los conceptos deben ser precisos y deben ponerse limitaciones adecuadas al
problema motivadas el tiempo, dinero disponible y la habilidad de los
investigadores.
Algunos
conceptos
como,
artculo
defectuoso,
econmico,
salario,
pueden variar en cada caso y para cada problema debemos coincidir con las
ideas sealadas en el estudio.
Diseo del experimento. Este aspecto es de gran importancia, puesto
que la recoleccin de datos requiere dinero y tiempo. Es siempre
nuestro
deseo obtener mxima Informacin con el mnimo costo (dinero y
tiempo) posible.
Incluir excesiva Informacin en la muestra es a menudo
antieconmico.

costoso

INSTITUTO TECNOLGICO SUPERIOR DE


VILLA LA VENTA, TAB.
Incluir

poca tambin es poco satisfactorio. Esto


implica, entre otras cosas, que debemos determinar el
tamao de la muestra o la cantidad o tipo de datos que nos permita resolver el
problema de la manera ms eficiente.

Recoleccin de datos. Esta parte, por lo general, es la que exige ms tiempo en


la Investigacin. Esta recoleccin debe ajustarse a reglas estrictas ya
que de los datos esperamos extraer la Informacin deseada.
Tabulacin y descripcin de los resultados. En esta etapa, los datos
mustrales se exponen
de
manera
clara
y
se
ilustran
con
representaciones tabulares y grficas (diagramas, histogramas, etc.); adems
se calculan las medidas estadsticas apropiadas al proceso inferencial que
haya sido escogido. Inferencia estadstica y conclusiones. Este ltimo paso
constituye tal vez la contribucin ms importante de la estadstica al proceso
inferencial. Aqu se fija el nivel de confiabilidad para la inferencia; esto es
debido a que las conclusiones derivadas de inferencias estadsticas
jams se pueden tomar con un 100% de certeza, pero s se les puede
asociar un nivel de confiabilidad; en trminos de probabilidad denominados nivel
de confianza y nivel de significancia. El proceso Inferencial nos llevar a una
conclusin estadstica que servir de orientacin a quien o quienes deban
tomar la decisin (administrativa o clnica) sobre el tema objeto de
estudio.

1.8._ RECOLECCIN DE DATOS


La nocin de recoleccin refiere al proceso y el resultado de recolectar (reunir,
recoger o cosechar algo). Un dato, por su parte, una informacin que
permite generar un cierto conocimiento.
Esto quiere decir que la recoleccin de datos es la actividad que
consiste en la recopilacin de informacin dentro de un cierto contexto. Tras
reunir estas informaciones, llegar el momento del procesamiento de datos,
que consiste en trabajar con lo recolectado para convertirlo en conocimiento
til.
Dentro de la recoleccin de datos se pueden apelar a diversas tcnicas: las
encuestas, la observacin, la toma de muestras y las entrevistas, entre otras,
permiten realizar la tarea. De acuerdo al tipo de datos, la persona utilizar
distintos instrumentos (grabadora de audio, cmara de fotos, etc.).

INSTITUTO TECNOLGICO SUPERIOR DE


VILLA LA VENTA, TAB.
Supongamos que un periodista est realizando
una
investigacin sobre un funcionario gubernamental que
habra participado de un acto de corrupcin. Para realizar su trabajo periodstico,
inicia la recoleccin de datos entrevistando a otros funcionarios, polticos
opositores, policas y autoridades judiciales. Adems

accede a documentos que le permiten probar el hecho. Una vez que


recolecta todos los datos, los procesa y los presenta con forma de artculo en un
diario.
Los cientficos tambin desarrollan la recoleccin de datos. Un antroplogo puede
visitar un pueblo indgena para observar sus costumbres, conversar con los
pobladores y tomar fotografas. Los datos recopilados luego pueden ser volcados
en una investigacin acadmica.
La recoleccin de datos es muy importante ya que permite sustentar el
conocimiento que se generar luego. De todas formas, la recoleccin por s sola
no garantiza la calidad del saber producido.

1.9._ ESTADISTICA PARAMETRICA


MUESTREA ALEATORIA)

(POBLACION

Una
poblacin
en
estadstica
es
el
conjunto
de
todas
las
observaciones
en
las
que estamos interesados. Se llama tamao de la
poblacin al nmero de individuos que la componen, siendo cada posible
observacin un individuo; as pues, las poblaciones pueden ser finitas e
infinitas.
Cada observacin en una poblacin es un valor de una variable
aleatoria X con una funcin de probabilidad o densidad determinada f(x).
Normalmente, se denomina a las poblaciones con el
nombre de la
distribucin de la variable; es decir, hablaremos de poblaciones normales,
binomiales, etc.
Para estudiar una poblacin existen dos posibilidades. Una de ellas consiste en
estudiar todos sus elementos y sacar conclusiones; la otra consiste en estudiar
slo una parte de ellos, una muestra, elegidos de tal forma que nos digan algo
sobre la totalidad de las observaciones de la poblacin. El mejor mtodo ser el
primero, cuando es posible, lo cual slo ocurre en las poblaciones finitas y

INSTITUTO TECNOLGICO SUPERIOR DE


VILLA LA VENTA, TAB.
razonablemente pequeas; en el caso de
poblaciones muy grandes o infinitas ser muy difcil o
imposible realizar un estudio total.
En este caso necesitaremos tomar una muestra y nos surgir el problema de
cmo hacer para que la muestra nos diga algo sobre el conjunto de la poblacin.
La condicin ms obvia que se le puede pedir a una muestra es que sea
representativa de la poblacin. Est claro que si no conocemos la poblacin no
podemos saber si la muestra es representativa o no. La nica forma de tener
cierta garanta de que esto ocurra es tomar nuestra muestra de forma que cada
individuo de la poblacin y cada subgrupo posible de la poblacin tengan igual

probabilidad de ser elegidos. A este tipo de muestras se les llama muestras


aleatorias o muestras al azar.
Una muestra aleatoria de tamao n es un conjunto de n individuos
tomado de tal manera que cada subconjunto de tamao n de la poblacin tenga
la misma probabilidad de ser elegido como muestra; es decir, si la poblacin tiene
tamao N, cada una de las combinaciones posibles de n elementos debe ser
equiprobable. Los sistemas de muestreo se basan normalmente en la asignacin
de un nmero a cada uno de los individuos de la poblacin y la posterior
obtencin de una muestra de n nmeros aleatorios que se obtendr por
sorteo utilizando bolas numeradas, ordenadores, etc.
Otra variante del muestreo es cuando se divide la poblacin en n
grupos, que no correspondan con ninguna clasificacin relacionada con el
problema en estudio, que se ordenan. Por sorteo se elige un elemento del primer
grupo y a continuacin los elementos correspondientes de los dems grupos. Este
tipo de muestra se denomina muestra al azar sistemtico.
Si la poblacin est subdividida en grupos podemos tomar otro tipo de muestra en
la que cada grupo de la poblacin est representado por un porcentaje de
individuos igual al porcentaje de individuos de la poblacin integrados en ese
grupo. Este tipo se llama muestra al azar estratificado.

PARMETROS Y ESTADSTICOS
Parmetros poblacionales
Se llama parmetros poblacionales a cantidades
partir de las observaciones de la variable y sus

que se obtienen a
probabilidades y que

INSTITUTO TECNOLGICO SUPERIOR DE


VILLA LA VENTA, TAB.
determinan perfectamente la distribucin de esta,
as
como las caractersticas de la poblacin, por ejemplo: La
media, , la varianza 2, la proporcin de determinados sucesos, P.
Los Parmetros poblacionales son nmeros reales, constantes y nicos.
Parmetros mustrales
Los Parmetros mustrales son resmenes de la informacin de la muestra
que nos "determinan" la estructura de la muestra.

Los Parmetros mustrales no son constantes sino variables aleatorias pues sus
valores dependen de estructura de la muestra que no es siempre la misma
como consecuencia del muestreo aleatorio. A estas variables se les suele llamar
estadsticos.
Los estadsticos se transforman en dos tipos: estadsticos de centralidad y
estadsticos de dispersin.
Estadsticos de centralidad:
Son medidas de la tendencia central de la variable. Los ms conocidos son:
1) La media aritmtica
Es el valor esperado de las observaciones de la muestra calculada como si la
muestra fuera una variable completa, es decir, multiplicando observaciones por
frecuencias y sumando.
Si x1, x2,.., xn representan una muestra de tamao n de la poblacin, la media
aritmtica se calcula como:

La media aritmtica es la medida de la tendencia central que posee menor


varianza.
Engloba en ella toda la informacin de la muestra; esto, con ser una ventaja,
supone una cierta desventaja pues los valores muy extremos, en muestras
pequeas afectan mucho a la media.

INSTITUTO TECNOLGICO SUPERIOR DE


VILLA LA VENTA, TAB.
La

media de la media aritmtica es igual a la de las


observaciones () y su varianza es igual a la de las
observaciones partidas por n. En poblaciones normales, la distribucin de la media
es normal,

Si la poblacin no es normal, pero la muestra es grande (n 30), por el teorema


central del lmite la distribucin de la media ser asintticamente normal.
2) La mediana
En una variable se define como el punto para el cual la funcin de distribucin
alcance el valor 0.5; en una muestra la mediana es el valor central.
Para calcularla se ordenan las observaciones de menor a mayor. Si
n es impar, la mediana es la observacin central

Si n es par, la mediana se define como la media de las dos observaciones


centrales

En resumen, podramos decir que la mediana es el valor que es mayor o igual que
el 50% de las observaciones de la muestra y menor o igual que el otro 50%.

INSTITUTO TECNOLGICO SUPERIOR DE


VILLA LA VENTA, TAB.
No
de

la

tiene por qu ser igual a una de las observaciones


muestra.

Es ms fcil de calcular que la media aritmtica y apenas se afecta por


observaciones extremas; sin embargo tiene mayor varianza que X y slo toma en
cuenta la informacin de los valores centrales de la muestra.

3) La moda
Es el valor ms frecuente.
Su clculo es el ms simple de los tres correspondientes a estadsticos de
centralidad pero la moda es el estadstico de mayor varianza.
La moda puede no existir y cuando existe no es necesariamente nica. No tiene
sentido en muestras pequeas en las que la aparicin de coincidencias en los
valores es con gran frecuencia ms producto del azar que de otra cosa.
La media es el estadstico de centralidad ms usado cuando uno espera que la
poblacin tenga una distribucin ms o menos simtrica, sin estar clasificada en
grupos claramente diferenciados.
En el caso de distribuciones muy asimtricas, con una cola muy larga, la mediana
es, normalmente, el valor de eleccin dado que la media suele estar desplazada
respecto al ncleo principal de observaciones de la variable. En estos casos, la
mediana es el valor que mejor expresa el punto donde se acumulan
mayoritariamente las observaciones de la variable.
En el caso de poblaciones o muestras subdivididas en grupos claramente
definidos la media y la mediana carecen, normalmente, de sentido y los valores
que ms claramente reflejan el comportamiento de las observaciones de la
variable son las modas.
Otros estadsticos de centralidad son los cuartiles.
Los cuar-tiles o percentiles
Un percentil X, PX, es un valor de la distribucin muestral o poblacional de la
variable que es mayor o igual que el X% de las observaciones de la variable P(Y
PX) = X%.

INSTITUTO TECNOLGICO SUPERIOR DE


VILLA LA VENTA, TAB.
Existe

un tipo especial de cuantiles llamados cuartiles.

Los cuartiles son tres valores que dividen la distribucin en cuatro partes
equivalentes porcentualmente.
El primer cuartil es el valor que es mayor o igual que el 25% de las
observaciones de la muestra y menor o igual que el 75%.
El segundo cuartil es la mediana.

El tercer cuartil es mayor o igual que el 75% de las observaciones de la


muestra y menor o igual que el 25%.
Estadsticos de dispersin
Los estadsticos de dispersin son parmetros mustrales que expresan la
dispersin de los valores de la variable respecto al punto central, es decir, su
posicin relativa. Los ms importantes son:
El rango
Es la diferencia entre las dos observaciones extremas, la mxima menos
la mnima.
Expresa cuantas unidades de diferencia
mximo, entre dos valores de la variable.

podemos

esperar,

como

El rango estima el campo de variacin de la variable.


Se afecta mucho por observaciones extremas y utiliza nicamente una pequea
parte de la informacin.
La varianza
Es la desviacin cuadrtica media de las observaciones a la media muestral.

Su concepto es anlogo al de la varianza poblacional. No obstante esta expresin


de clculo de la varianza muestral no se utiliza mucho pues sus
valores tienden a ser menores que el de la autntica varianza de la variable

INSTITUTO TECNOLGICO SUPERIOR DE


VILLA LA VENTA, TAB.
(debido a que la propia media muestral tiene una
varianza que vale un ensimo de la de las
observaciones)
Para compensar esta deficiencia y obtener valores que no
subestimen la varianza poblacional (cuando estamos interesados en ella y
no en la varianza muestral) utilizaremos una expresin, esencialmente
igual que la anterior salvo que el denominador est disminuido en una unidad.

Normalmente, estaremos interesados en saber cosas acerca de la varianza


poblacional y no de la varianza muestral. Por tanto, en adelante,
cuando
hablemos
de
varianza muestral, salvo indicacin expresa, nos
referiremos a la segunda.
Es el estadstico de dispersin ms usado por las propiedades de su distribucin.
Si la poblacin de la que procede la muestra es normal:

Con n-1 grados de libertad.


Adems, utiliza toda la informacin de la muestra.
Su mayor inconveniente consiste en que se expresa en unidades cuadrticas. Por
ello, para muchos propsitos se utiliza otro estadstico de dispersin que la
desviacin tpica.
Si no disponemos de una calculadora, el clculo de la varianza puede ser
complicado porque, habitualmente, los valores de las desviaciones de las
observaciones a la media resultan ser nmeros con varias cifras decimales. Por
ello, se suele utilizar una ecuacin que deriva directamente de la anterior:

INSTITUTO TECNOLGICO SUPERIOR DE


VILLA LA VENTA, TAB.

O, alternativamente, la equivalente a aquella de "la media de los cuadrados


menos el cuadrado de la media".

La desviacin tpica
Es la raz cuadrada positiva de la varianza y, por tanto, se expresa en las unidades
de medida de la variable.

Su concepto es anlogo al de la desviacin tpica poblacional.


Coeficiente de variacin
Es el cociente entre la desviacin tpica y la media aritmtica muestrales y expresa
la variabilidad de la variable en tanto por uno, sin dimensiones.

Permite comparar muestras de variables de distinta naturaleza o muestras de la


misma variable en poblaciones en las que el orden de magnitud de las
observaciones sea muy diferente.

Você também pode gostar