Escolar Documentos
Profissional Documentos
Cultura Documentos
TIPOS DE POBLACION
POBLACIONES FINITAS
POBLACIONES INFINITAS
En muchos problemas interesa saber cómo se comporta una, o varias variables, al observarlas
cuando se repite un experimento definido de antemano, pero no existe un número fijo, finito,
de experimentos ya que teóricamente se los puede repetir cuantas veces se quiera. Si
estudiamos pacientes hipertensos y medimos su tensión arterial, estas mediciones se pueden
repetir cuantas veces se quiera, por lo menos en teoría, en pacientes actuales y futuros
repartidos a lo largo del mundo.
Si vamos a utilizar una calculadora de muestra en línea o si por el contrario decidimos realizar el
procedimiento nosotros mismos, debemos conocer ciertos puntos o conceptos que se manejan
dentro de la fórmula. Estos son:
La población es el número completo de individuos con características afines que conforman los
posibles participantes de nuestro estudio. En la fórmula la población es representada con la letra
N
El margen o posibilidad de error es la diferencia que pueda darse entre los resultados obtenidos
con la muestra y los que se hubieses obtenido si la encuesta se aplicara a toda la población. Lo
ideal es que el margen de error ronde el 5 %. Este es representado con la letra e.
Estadístico
Un estadístico es una medida usada para describir alguna característica de una muestra , tal
como una media aritmética, una mediana o una desviación estándar de una muestra.
Parámetro
Una parámetro es una medida usada para describir alguna característica de una población, tal
como una media aritmética, una mediana o una desviación estándar de una población.
Cuando los dos nuevos términos de arriba son usados, por ejemplo, el proceso de estimación
en inferencia estadística puede ser descrito como le proceso de estimar un parámetro a partir
del estadístico correspondiente, tal como usar una media maestral.
Error Estándar:
La desviación estándar de una distribución, en el muestreo de un estadístico, es
frecuentemente llamada el error estándar del estadístico. Por ejemplo, la desviación estándar
de las medias de todas la muestras posibles del mismo tamaño, extraídas de una población, es
llamada el error estándar de la media. De la misma manera, la desviación estándar de las
proporciones de todas las muestras posibles del mismo tamaño, extraídas de una población, es
llamada el error estándar de la proporción. La diferencia entre los términos "desviación
estándar" y "error de estándar" es que la primera se refiere a los valores originales, mientras
que la última está relacionada con valores calculados. Un estadístico es un valor calculado,
obtenido con los elementos incluidos en una muestra.
Una muestra debe ser representativa si va a ser usada para estimar las características de la
población. Los métodos para seleccionar una muestra representativa son numerosos,
dependiendo del tiempo, dinero y habilidad disponibles para tomar una muestra y la naturaleza
de los elementos individuales de la población. El número de muestras tomadas de una población
dada para un estudio y
Métodos de muestreo
Muestreo
Simple:
Este tipo de muestreo toma solamente una muestra de una población dada para el propósito de
inferencia estadística. Puesto que solamente una muestra es tomada, el tamaño de muestra
debe ser el suficientemente grande para extraer una conclusión. Una muestra grande muchas
veces cuesta demasiado dinero y tiempo.
Muestreo:
Muestreo múltiple
El procedimiento bajo este método es similar al expuesto en el muestreo doble, excepto que el
número de muestras sucesivas requerido para llegar a una decisión es más de dos muestras.
Métodos de muestreo clasificados de acuerdo con las maneras usadas en seleccionar los
elementos de una muestra.
Los elementos de una muestra pueden ser seleccionados de dos maneras diferentes:
a. Basados en el juicio de una persona.
b. Selección aleatoria (al azar)
Muestreo de juicio
Una muestra es llamada muestra de juicio cuando sus elementos son seleccionados mediante
juicio personal. La persona que selecciona los elementos de la muestra, usualmente es un
experto en la medida dada. Una muestra de juicio es llamada una muestra probabilística,
puesto que este método está basado en los puntos de vista subjetivos de una persona y la
teoría de la probabilidad no puede ser empleada para medir el error de muestreo, Las
principales ventajas de una muestra de juicio son la facilidad de obtenerla y que el costo
usualmente es bajo.
Muestreo Aleatorio
Una muestra se dice que es extraída al azar cuando la manera de selección es tal, que cada
elemento de la población tiene igual oportunidad de ser seleccionado. Una muestra aleatoria
es también llamada una muestra probabilística son generalmente preferidas por los
estadísticos porque la selección de las muestras es objetiva y el error muestral puede ser
medido en términos de probabilidad bajo la curva normal. Los tipos comunes de muestreo
aleatorio son el muestreo aleatorio simple, muestreo sistemático, muestreo estratificado y
muestreo de conglomerados.
Una muestra aleatoria simple es seleccionada de tal manera que cada muestra posible
del mismo tamaño tiene igual probabilidad de ser seleccionada de la población. Para
obtener una muestra aleatoria simple, cada elemento en la población tenga la misma
probabilidad de ser seleccionado, el plan de muestreo puede no conducir a una muestra
aleatoria simple. Por conveniencia, este método pude ser reemplazado por una tabla de
números aleatorios. Cuando una población es infinita, es obvio que la tarea de numerar
cada elemento de la población es infinita, es obvio que la tarea de numerar cada
elemento de la población es imposible. Por lo tanto, ciertas modificaciones del muestreo
aleatorio simple son necesarias. Los tipos más comunes de muestreo aleatorio
modificado son sistemático, estratificado y de conglomerados.
B. Muestreo sistemático.
Una muestra sistemática es obtenida cuando los elementos son seleccionados en una manera
ordenada. La manera de la selección depende del número de elementos incluidos en la
población y el tamaño de la muestra. El número de elementos en la población es, primero,
dividido por el número deseado en la muestra. El cociente indicará si cada décimo, cada
onceavo, o cada centésimo elemento en la población va a ser seleccionado.
Muestreo Estratificado
C. Muestreo de conglomerados.
En donde
Z = nivel de confianza,
P = probabilidad de éxito, o proporción esperada
Q = probabilidad de fracaso
D = precisión (error máximo admisible en términos de proporción)
Tipos de muestreo
El muestreo es una herramienta para determinar qué parte de una población debemos analizar
cuando no es posible realizar un censo. Depende de los objetivos del estudio el elegir una
muestra probabilística o no probabilística.
MUESTREO PROBABILÍSTICO
Se basa en el principio de equiprobabilidad, esto quiere decir que todos los individuos de la
muestra seleccionada, tendrán las mismas probabilidades de ser elegidos. Lo anterior nos
asegura que la muestra extraída contará con representatividad.
Al azar simple
Sistemática
Estratificada
Conglomerados
Características:
MUESTREO NO PROBABILÍSTICO
No sirven para hacer generalizaciones pero sí para estudios exploratorios. En este tipo de
muestras, se eligen a los individuos utilizando diferentes criterios relacionadas con las
características de la investigación, no tienen la misma probabilidad de ser seleccionados ya que
el investigador suele determinar la población objetivo.
Por cuotas.
De bola de nieve.
De conveniencia.
Características:
La muestra es discrecional
Seleccionar una función de la muestra (estadístico), cuyo valor tomaremos como valor
aproximado del parámetro a estimar.
En nuestro ejemplo del número de hijos por familia, para el que admitimos el modelo de Poisson,
podríamos seguir los siguientes pasos:
Definir un estimador adecuado para estimar λ. Como sabemos que la esperanza de una
distribución de Poisson es λ (que es el parámetro a estimar), parece razonable estimar dicho
parámetro mediante un estadístico de la tendencia central, como por ejemplo la media
aritmética de los valores observados.
Determinar la media de nuestra muestra. Esto nos dará un valor numérico que será la estimación
del parámetro.
Un estimador es un tipo de estadístico y, por tanto, una variable aleatoria cuyos valores variarán
en función de la muestra concreta escogida.
Una estimación es el valor numérico que toma el estimador cuando se calcula sobre una muestra
concreta. Es decir, es el valor que toma la variable aleatoria que es el estimador en la realización
de una experiencia aleatoria concreta.
Estimada
Estimar qué va a ocurrir respecto a algo (o qué está ocurriendo, o qué ocurrió), a pesar de ser
un elemento muy claramente estadístico, está muy enraizado en nuestra cotidianidad. Dentro
de ello, además hacemos estimaciones dentro de un intervalo de posibilidades. Por ejemplo:
“creo que terminaré la tarea en unos 5-6 días”.
Lo que hacemos en el terreno del análisis de datos es aplicar matizaciones técnicas a este hábito.
Vamos a dedicar este documento al concepto de estimación, comenzando con la estimación
puntual. Después nos ocuparemos de desarrollar un modelo de estimación por intervalo donde
identificaremos los elementos fundamentales, con su significado y símbolo. Y, por último, habrá
que desarrollar cómo se calculan esos elementos. La estimación puntual Estimar puede tener
dos significados interesantes. Significa
querer e inferir. Desde luego, el primer significado es más trascendente. Pero no tiene ningún
peso en la estadística, disciplina que no se ocupa de los asuntos del amor. El segundo significado
es el importante aquí. Una estimación estadística es un procesomediante el que establecemos
qué valor debe tener un parámetro según deducciones que realizamos a partir de estadísticos.
En otras palabras, estimar es establecer conclusiones sobre características poblacionales a partir
de resultados muestrales. Vamos a ver dos tipos de estimaciones: puntual y por intervalo. La
segunda es la más natural. Y verás que forma parte habitual de nuestro imaginario como
personas sin necesidad de una formación estadística. La primera, la estimación puntual, es la
más sencilla y, por ese motivo, vamos a comenzar por ella. Ocurre, además, que la estimación
por intervalo surge, poco más o menos, de construir un intervalo de posibles valores alrededor
de la estimación puntual.
Una estimación puntual consiste en establecer un valor concreto (es decir, un punto) para el
parámetro. El valor que escogemos para decir “el parámetro que nos preocupa vale X” es el que
suministra un estadístico concreto. Como ese estadístico sirve para hacer esa estimación, en
lugar de estadístico suele llamársele estimador. Así, por ejemplo, utilizamos el estadístico
“media aritmética de la muestra” como estimador del parámetro “media aritmética de la
población”. Esto significa: si quieres conocer cuál es el valor de la media en la población,
estimaremos que es exactamente el mismo que en la muestra que hemos manejado. Insesgadez
Del párrafo anterior podemos concluir erróneamente que todo parámetro se infiere a partir de
un estadístico que resulta ser la misma fórmula o función pero calculado en la muestra. Si
queremos estimar la media poblacional, le asignamos directamente la media de la muestra. Si
queremos estimar la proporción poblacional, le asignamos el valor de la proporción en la
muestra. Si queremos estimar la varianza poblacional, le asignamos el valor de la varianza de la
muestra. Esa norma general tiene excepciones, por lo que es mejor no pensar en ella como
norma. De los tres ejemplos, es cierto en los dos primeros
1casos: estimación puntual de una media o de una proporción; pero no en el tercero: estimación
puntual de una varianza. La razón proviene del objetivo de la insesgadez.Un sesgo es una
tendencia constante. En un ejemplo clásico, solemos afirmar que las escopetas de feria están
diseñadas para errar, para desviarse. Si esa desviación es fija, es decir, si esa desviación es una
tendencia a errar hacia un sentido concreto, entonces hablamos de sesgo. Si no es fija, entonces
se trata de una variación aleatoria.
Estadística:
Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980) definen la estadística como
un valor resumido, calculado, como base en una muestra de observaciones que generalmente,
aunque no por necesidad, se considera como una estimación de parámetro de determinada
población; es decir, una función de valores de muestra.
"La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos de
masa o colectivo, cuya mediación requiere una masa de observaciones de otros fenómenos más
simples llamados individuales o particulares". (Gini, 1953.
Murria R. Spiegel, (1991) dice: "La estadística estudia los métodos científicos para recoger,
organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones
razonables basadas en tal análisis.
"La estadística es la ciencia que trata de la recolección, clasificación y presentación de los hechos
sujetos a una apreciación numérica como base a la explicación, descripción y comparación de
los fenómenos". (Yale y Kendal, 1954).
Cualquiera sea el punto de vista, lo fundamental es la importancia científica que tiene la
estadística, debido al gran campo de aplicación que posee.
Población:
El concepto de población en estadística va más allá de lo que comúnmente se conoce como tal.
Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan
características comunes.
"Una población es un conjunto de todos los elementos que estamos estudiando, acerca de los
cuales intentamos sacar conclusiones". Levin & Rubin (1996).
"Una población es un conjunto de elementos que presentan una característica común". Cadenas
(1974).
Ejemplo:
Cuando la población es muy grande, es obvio que la observación de todos los elementos se
dificulte en cuanto al trabajo, tiempo y costos necesarios para hacerlo. Para solucionar este
inconveniente se utiliza una muestra estadística.
Es a menudo imposible o poco práctico observar la totalidad de los individuos, sobre todos si
estos son muchos. En lugar de examinar el grupo entero llamado población o universo, se
examina una pequeña parte del grupo llamada muestra.
Muestra
"Se llama muestra a una parte de la población a estudiar que sirve para representarla". Murria
R. Spiegel (1991).
"Una muestra es una colección de algunos elementos de la población, pero no de todos". Levin
& Rubin (1996).
"Una muestra debe ser definida en base de la población determinada, y las conclusiones que se
obtengan de dicha muestra solo podrán referirse a la población en referencia", Cadenas (1974).
Ejemplo;
El estudio de muestras es más sencillo que el estudio de la población completa; cuesta menos y
lleva menos tiempo. Por último se aprobado que el examen de una población entera todavía
permite la aceptación de elementos defectuosos, por tanto, en algunos casos, el muestreo
puede elevar el nivel de calidad.
Una muestra representativa contiene las características relevantes de la población en las
mismas proporciones que están incluidas en tal población.
Los expertos en estadística recogen datos de una muestra. Utilizan esta información para hacer
referencias sobre la población que está representada por la muestra. En consecuencia muestra
y población son conceptos relativos. Una población es un todo y una muestra es una fracción o
segmento de ese todo.
Muestreo:
Esto no es más que el procedimiento empleado para obtener una o más muestras de una
población; el muestreo es una técnica que sirve para obtener una o más muestras de población.
Este se realiza una vez que se ha establecido un marco muestral representativo de la población,
se procede a la selección de los elementos de la muestra aunque hay muchos diseños de la
muestra.
Al tomar varias muestras de una población, las estadísticas que calculamos para cada muestra
no necesariamente serían iguales, y lo más probable es que variaran de una muestra a otra.
Variables y Atributos:
Las variables, también suelen ser llamados caracteres cuantitativos, son aquellos que pueden
ser expresados mediante números. Son caracteres susceptibles de medición. Como por ejemplo,
la estatura, el peso, el salario, la edad, etc.
Según, Murray R. Spiegel, (1992) "una variable es un símbolo, tal como X, Y, Hx, que puede tomar
un valor cualquiera de un conjunto determinado de ellos, llamado dominio de la variable. Si la
variable puede tomar solamente un valor, se llama constante."
Todos los elementos de la población poseen los mismos tipos de caracteres, pero como estos
en general no suelen representarse con la misma intensidad, es obvio que las variables toman
distintos valores. Por lo tanto estos distintos números o medidas que toman los caracteres son
los "valores de la variable". Todos ellos juntos constituyen una variable.
Los atributos también llamados caracteres cualitativos, son aquellos que no son susceptibles de
medición, es decir que no se pueden expresar mediante un número.
La forma de expresar los atributos es mediante palabras, por ejemplo; profesión, estado civil,
sexo, nacionalidad, etc. Puede notar que los atributos no se presentan en la misma forma en
todos los elementos. Estas distintas formas en que se presentan los atributos reciben el nombre
de "modalidades".
Ejemplo;
El estado civil de cada uno de los estudiantes del curso de estadísticas I, no se presenta en la
misma modalidad en todos.
Una observación continua; como su nombre lo indica es aquella que se lleva acabo de un modo
permanente.
Ejemplo: la contabilidad comercial, llevada en cuanto a compras, ventas y otras operaciones que
se van registrando a medida que van produciéndose.
Una observación periódica; es aquélla que se lleva a cabo a través de períodos de tiempo
constantes. Estos períodos de tiempos pueden ser semanas, trimestres, semestres, años, etc. Lo
que debemos destacar es que los períodos de tiempo tomados como unidad deben tomarse
constantes en los posible.
Observación Parcial. Dados que las poblaciones en general son grandes, la observación de todos
sus elementos se ve imposibilitada. La solución para superar este inconveniente es observar una
parte de esta población.
Estadística Descriptiva:
Tienen por objeto fundamental describir y analizar las características de un conjunto de datos,
obteniéndose de esa manera conclusiones sobre las características de dicho conjunto y sobre
las relaciones existentes con otras poblaciones, a fin de compararlas. No obstante puede no solo
referirse a la observación de todos los elementos de una población (observación exhaustiva)
sino también a la descripción de los elementos de una muestra (observación parcial).
En relación a la estadística descriptiva, Ernesto Rivas Gonzáles dice; "Para el estudio de estas
muestras, la estadística descriptiva nos provee de todos sus medidas; medidas que cuando
quieran ser aplicadas al universo total, no tendrán la misma exactitud que tienen para la
muestra, es decir al estimarse para el universo vendrá dada con cierto margen de error; esto
significa que el valor de la medida calculada para la muestra, en el oscilará dentro de cierto límite
de confianza, que casi siempre es de un 95 a 99% de los casos.
Estadística Inductiva:
Está fundamentada en los resultados obtenidos del análisis de una muestra de población, con el
fin de inducir o inferir el comportamiento o característica de la población, de donde procede,
por lo que recibe también el nombre de Inferencia estadística.
Según Berenson y Levine; Estadística Inferencial son procedimientos estadísticos que sirven para
deducir o inferir algo acerca de un conjunto de datos numéricos (población), seleccionando un
grupo menor de ellos (muestra).
En relación a la estadística descriptiva y la inferencial, Levin & Rubin (1996) citan los siguientes
ejemplos para ayudar a entender la diferencia entre las dos.
Definición de dato
Un dato es la representación de una variable que puede ser cuantitativa o cualitativa, indican
un valor que se le asigna a las cosas. Los datos son información. Los datos describen en su
conjunto nos hablan de hechos empíricos. Un dato por sí solo no puede demostrar demasiado,
siempre se evalúa el conjunto para poder examinar los resultados. Para examinarlos, primero
hay que organizarlos o tabularlos.
Los datos pueden ser generados de forma automática y acumulativa con diferentes tipos de
programas informáticos o bien tienen que ser siempre ingresados para formar una base de
datos.
Qué es dato:
Los datos que se ingresan en una base pueden ser de diversos tipos, según la información que
se acumule en dicha base. Por ejemplo puede ser una base de datos de información personal,
entonces los datos serán numéricos, alfabéticos y alfa-numéricos.
Siguiendo con la temática de la informática, dentro de los archivos también encontramos datos.
Estos datos consisten generalmente en paquetes más pequeños de otros datos, que son
llamados registros. Estos datos están reunidos por características iguales o similares.
Cualitativos: son aquellos que responden a la pregunta ¿cuál? O ¿cuáles? Aquí hay datos como
el color, los sentimientos, etcétera.
Cuantitativos: son aquellos datos que siempre están referidos a los números. Por ejemplo
precio, altura, edad, etcétera
BIBLIOGRAFIA
ALEA, V. et al. (1999) Estadística Aplicada a les Ciències Econòmiques i Socials. Barcelona:
Edicions McGraw-Hill EUB.
FERNáNDEZ CUESTA, C., y FUENTES GARCíA, F. (1995) Curso de Estadística Descriptiva. Teoría y
Práctica. Madrid: Ariel.
FREIXA, M., et al. (1992) Análisis exploratorio de datos: Nuevas técnicas estadísticas. Barcelona:
PPU.