1er Lapso de Estadistica

Conceptos Básicos de utilidad primer lapso
La Estadística. Como disciplina académica se podría definir como la ciencia que provee los métodos
para analizar e interpretar datos numéricos y por lo tanto un conocimiento de ella sería de utilidad en
muchos campos. La estadística, como ciencia, constituye la aplicación de los métodos científicos a
la programación de la recolección de datos, su clasificación, elaboración, análisis e interpretación.
DEFINICIONES. Se puede decir que, un conjunto de datos constituye un grupo de valores o

características registradas para cada uno de los individuos (pacientes, personal de los servicios de
salud, etc.), u objetos (consultorios, servicios dentro del hospital, etc.). La característica principal de
los datos estadísticos es que los valores cambian de un individuo a otro, esto se expresa diciendo que
presentan variabilidad. Si no hay variabilidad, entonces no tiene sentido el uso de la estadística.
ESTADISTICA: es una disciplina cuya finalidad es: 1). La reducción de datos, que es un proceso
de sustitución de la masa de datos originales por un pequeño número de características descriptivas
(Estadística Descriptiva). Lo que se refiere a resumen de la información es lo que se conoce como
estadística descriptiva. Y 2). El análisis científico de datos experimentales y de los fenómenos
observados (Inferencia Estadística). Es decir que a partir del análisis de una parte de la población
(muestra) se infieren o generalizan los resultados a la población de la cual fue seleccionada esta
muestra.
ALGUNOS CONCEPTOS PREVIOS
Población: La palabra "población" se usa en el lenguaje cotidiano como significado de "todas las
personas que viven en una determinada región geográfica", frecuentemente en un país. En estadística,
el término "población" o “Universo”, se asocia a los individuos u objetos (personas, animales, cosas)
de interés para el estudio y otra se asocia a los valores de la o las características que se estudian en
dichos individuos. Si el interés es evaluar diferentes tratamientos de la diabetes, la población o
universo son "todos los diabéticos".
Por ejemplo, si estamos interesados en la presión sanguínea de un paciente particular, la población

es "todos los posibles valores de presión sanguínea en aquel paciente". Cuando los integrantes de
una población pueden ser listados, es decir, se puede realizar una lista de los individuos u objetos que
componen la población, aunque ella sea muy grande, entonces diremos que tenemos una población
finita, por ejemplo, todos los niños de San Juan entre 10 y 14 años. Si la población es muy compleja
o imposible de contar entonces es infinita.
.
MUESTRA. Es una porción o subconjunto de la población o el universo que presenta características

semejantes observables que son susceptibles a estudio. Este subconjunto se denomina muestra y esta
deberá ser “representativa” en el sentido de tratar de reproducir lo más idénticamente posible las
características de la población de la cual fue seleccionada.
UNIDAD DE OBSERVACIÓN . Es la unidad mínima de observación o individuos que componen

la población. Por ejemplo si el objetivo de la investigación es determinar el mejor tratamiento para
pacientes diabéticos, la unidad de observación es “paciente con diabetes.
DATOS. Son los valores observados o medidos de una variable y constituyen la información
disponible.
VARIABLE. Es una característica que puede tomar diferentes valores (no necesariamente
numéricos) en las distintas unidades de observación. Por ejemplo, edad, sexo, tiempo de evolución
de la diabetes, tipo de tratamiento administrado, etc. Las propiedades o características susceptibles
de tomar distintos valores o intensidades es lo que se conoce con el nombre de variables.
Clasificación. Si la variable presenta un atributo o cualidad se denomina cualitativa. Si la variable

presenta valores numéricos es cuantitativa.
Variables cualitativas. Este tipo de variables representan una cualidad o atributo que clasifica a
cada caso en una de varias categorías. La situación más sencilla es aquella en la que se clasifica cada
caso en uno de dos grupos (hombre/mujer, enfermo/sano, fumador/no fumador).
Escalas nominales: esta es una forma de observar o medir en la que los datos se ajustan por categorías
que no mantienen una relación de orden entre sí (color de los ojos, sexo, profesión, presencia o
ausencia de un factor de riesgo o enfermedad, etc.)
Escalas ordinales: en las escalas utilizadas, existe un cierto orden o jerarquía entre las categorías
(grados de disnea, estadio de un tumor, nivel de instrucción, etc.) Además las variables cualitativas
de acuerdo a la cantidad de categorías (posibles respuestas) en las cuales se clasifican pueden ser
dicotómica (solo dos categorías, por ejemplo diagnóstico de diabetes: si-no) y politómicas (tres o
más categorías, por ejemplo nivel de formación en enfermería: auxiliar, enfermero, licenciado)
Variables cuantitativas. Son las variables que pueden medirse, cuantificarse o expresarse
numéricamente. Podemos distinguir dos tipos: Continuas: son las variables que pueden variar en
forma continua, como el contenido de hemoglobina en la sangre, la presión arterial, estatura, edad,
etc. Estas pueden tomar cualquier valor entre un máximo y un mínimo. Discretas: son las que pueden
variar sólo en números enteros o en fracciones bien definidas sin valores intermedios, como por
ejemplo: Número de hijos de una mujer: puede tener 1, 2, 3,…hijos; nunca 1,5 o 3,8 hijos.
ESTADÍSTICAS DE SALUD Se conoce como estadísticas de salud al conjunto de sistemas de

registros continuos, complementados con datos provenientes de fuentes censales y maestrales.
Estadísticas Demográficas o de población. La demografía (del griego demos=pueblo y grafos=trazo,

descripción) Es la ciencia que tiene como objetivo el estudio de las poblaciones humanas y que trata
de su dimensión, estructura, evolución y características generales; considerados desde un punto de
vista cuantitativo. Por tanto la demografía estudia estadísticamente la estructura (edad, sexo, estado
civil, etc.), distribución (urbana, rural) y la dinámica (migraciones) de las poblaciones humanas y las
leyes que rigen estos fenómenos.
.Estadísticas Vitales. Basadas en el registro de los hechos vitales, es decir los hechos relacionados
con el comienzo y final de la vida y los cambios de estado civil.
Estadísticas en el campo de la Salud.
Brinda información acerca de los recursos disponibles del sector salud, para atender las necesidades
de salud de la población. Atención y acciones de salud Derivadas del registro permanente que se
realiza en todos los establecimientos de salud en cuanto a realización de actividades de promoción,
protección, recuperación y rehabilitación de la salud.
Comprende también las acciones de salud pública sobre el ambiente, vigilancia de riesgos y
enfermedades. Importante también al determinar factores que influyen sobre las necesidades de salud
de cada grupo social y abordar otros procesos de fundamentación de las decisiones de salud. En la
vida diaria estamos rodeados de estadísticas (en plural) en el sentido de datos numéricos. Las técnicas
estadísticas constituyen una herramienta de trabajo útil a lo largo de todo el proceso de investigación,
desde la planificación hasta el análisis e interpretación de los resultados.
DISTRIBUCIONES DE FRECUENCIAS. Es el conjunto de las frecuencias de todas las categorías
Los tipos de frecuencia pueden ser:
- Frecuencia Absoluta (f).- Es el número de veces que se repite el valor de cada variable. La suma
de frecuencias absolutas es siempre al total de datos observados, o sea n. (muestra).
- Frecuencia Relativa (fr).- Indica la proporción con que se repite un valor. Es el cociente entre la
frecuencia absoluta y el número total de datos. La suma de las frecuencias relativas es siempre 1
- Frecuencia Acumulada (fa).- Indica el número de valores que son menores o iguales que el valor
dado. Es la suma de la frecuencia absoluta primera con la segunda, este valor con la tercera, y así
sucesivamente.
- Frecuencia Porcentual (f%).- Llamada también frecuencia relativa porcentual. Se obtiene

multiplicando la frecuencia relativa por 100. La suma de las frecuencias porcentuales es siempre
100%. Se calcula así:
REGLAS GENERALES PARA FORMAR DISTRIBUCIONES DE FRECUENCIAS PARA

DATOS AGRUPADOS EN INTERVALOS
Cuando los datos contienen una gran cantidad de elementos, para facilitar los cálculos es necesario
agruparlos, a estos grupos se los llama intervalos o clases.
Un intervalo es una serie de números incluidos entre dos extremos, así por ejemplo, el intervalo 40
– 45 está formado por 40, 41, 42, 43, 44 y 45, siendo 40 el límite inferior, 45 el límite superior, 39,5
límite real inferior (límite inferior disminuido en 5 décimas) y 40,5 el límite real superior (límite
superior aumentado en 5 décimas).
1) Rango (R).- También se llama recorrido o amplitud total. Es la diferencia entre el valor mayor y
el menor de los datos. Ejemplo: Si una distribución de 40 datos el valor
mayor es 41 y el menor es 20 se tiene:
2) Número de Intervalos de Clase (ni).- No debe ser menor de 5 y mayor de 12, ya que un
número mayor o menor de clases podría oscurecer el comportamiento de los datos. Para calcular el
número de intervalos se aplica la regla de Sturges:
Siendo (n) el tamaño de la muestra.
Calculando el número de intervalos se obtiene:
3) Ancho del Intervalo (i).- Se obtiene dividiendo el Rango para el número de intervalos
Cuando el valor de i no es exacto, se debe redondear al valor superior más cercano.

Esto altera el valor de rango. Pero es el cálculo más sencillo. Por lo tanto:
4) Forme los Intervalos de Clase agregando i-1 al límite inferior de cada clase,
comenzando por el X mín del rango.
5) Se realiza el Conteo de Datos que cae dentro de cada clase (frecuencia absoluta)
6) Calcule la Marca de Clase o punto Medio (xm).- Es el valor medio de cada clase, se
obtiene sumando los límites superior Real (Ls) e inferior Real (Li) del intervalo y
dividiendo ésta suma entre 2. Para cálculos mejor no redondear el punto medio
7) Calcule las Frecuencias
A estos 40 estudiantes de la UNERG, se les pidió que estimen el número de horas que habrían
dedicado a estudiar Bioquímica la semana pasada (tanto en clase como fuera de ella), obteniéndose
los siguientes resultados:
36 30 47 60 32 35 40 50
54 35 45 52 48 58 60 38
32 35 56 48 30 55 49 39
58 50 65 35 56 47 37 56
58 50 47 58 55 39 58 45
1) Calculando el Rango se obtiene:
Ya que 65 es el número mayor de horas y 30 es el número menor de horas
2) Calculando el número de intervalos se obtiene
3) Calculando el ancho se obtiene:
Redondeando se obtiene: i = 6,
5) Formando los intervalos de clase comenzando por el límite inferior que es 30 le sumamos seis
incluyendo el 30 y se obtiene:
30+6 = 35; 36+6 = 41; 42+6 = 47; 48+6 = 53; 54+6 = 59; 60+6 = 65
6) Realizando el conteo de datos que cae dentro de cada clase, calculando la marca de clase y las
frecuencias se obtiene:
Xm (punto
Clases f fr fa f% fra%
medio)
30-35 8 (30+35)/2 = 32,5 0,2 8 20 20
36-41 6 (36+41)/2 = 38,5 0,15 14 15 35
42-47 5 (42+47)/2 = 44,5 0,125 19 12,5 47,5
48-53 7 (48+53)/2 = 50,5 0,175 26 17,5 65
54-59 11 (54+59)/2 = 56,5 0,275 37 27,5 92,5
60-65 3 (60+65)/2 = 62,5 0,075 40 7,5 100
Total 40 1 100
A manera de comentario, se presenta algunas interpretaciones de la tabla:
El valor de f =8: Significa que 8 estudiantes dedicaron a estudiar la semana pasada entre 30 y 35
horas.
El valor de xm = 50,5: Significa que 7 estudiantes dedicaron en promedio a estudiar la semana

pasada 50,5 horas.
El valor de fr = 0,15 y f% = 15%: Significa que el 0,15 o el 15% de los estudiantes dedicaron a
estudiar la semana pasada entre 36 y 41 horas.
El valor de fa = 26: Significa que 26 estudiantes dedicaron a estudiar la semana pasada entre 30 y
53 horas.
El valor de fra = 0,65 y fra% = 65%: Significa que el 0,65 o el 65% de los estudiantes dedicaron a
estudiar la semana pasado entre 30 y 53 horas.
MEDIDAS DE TENDENCIA CENTRAL

Representan valores que se ubican en la parte central dentro de un conjunto de datos, es decir miden
el centro, el foco o el medio de un fenómeno. Entre ellas encontramos:
a.- Media aritmética: Es el valor de tendencia central más frecuentemente utilizado para
representar los datos de una serie.
b.- Mediana: Es el punto que divide a una distribución ordenada de datos en dos partes iguales
dicho de otra manera es el punto por encima del cual se encuentra el 50% de los elementos, es decir
la mitad de los valores.
c.- Moda: Se define como el valor que más se repite en un conjunto de datos.
Medidas de Tendencia Central
Representan valores que se ubican en la parte central dentro de un conjunto de datos, es decir miden
el centro, el foco o el medio de un fenómeno. Entre ellas encontramos:
a.- Media aritmética: Es el valor de tendencia central más frecuentemente utilizado para
representar los datos de una serie.
b.- Mediana: Es el punto que divide a una distribución ordenada de datos en dos partes iguales
dicho de otra manera es el punto por encima del cual se encuentra el 50% de los elementos, es decir
la mitad de los valores.
c.- Moda: Se define como el valor que más se repite en un conjunto de datos.
Ahora veamos cómo se hace el cálculo de cada una de estas medidas:
La media aritmética es conocida también como promedio e indica la tendencia de la variable (X)
en una muestra de n sujetos.
Es la suma de todos los valores observados dividida entre el total de los elementos.
Entre sus propiedades se encuentran:

a.- Solo puede ser calculada con variables cuantitativas
b.- Es sensible a valores extremos
Media aritmética para datos agrupados:
Cuando queremos calcular la media con datos agrupados, lo primero que debemos hacer es elaborar
una tabla de frecuencia que contenga los intervalos de clase, las marcas de clase (Xmi), la
frecuencia absoluta para cada intervalo (fi), la sumatoria de las frecuencias absolutas y la sumatoria
de la multiplicación de la frecuencia absoluta por la marca de Clase. Una vez elaborada la tabla
sustituimos los datos en la formula y Obtenemos la media.
Fórmula para el cálculo de la media con datos agrupados:
Mediana: Es el punto que divide a una distribución ordenada de datos en dos partes iguales dicha
manera es el punto por encima del cual se encuentra el 50% de las cosas de tal forma que la mitad
de los valores. Es el valor que ocupa el lugar central de todos los datos cuando éstos están
ordenados de menor a mayor. La mediana se representa por Me. La
mediana se puede hallar sólo para variables cuantitativas.
Es el valor central de un conjunto de datos ordenados de menor a mayor o viceversa, es decir es el

valor que deja por debajo o por encima de él, el 50% de los datos.
La forma de calcular la mediana en datos directos o no agrupados va a depender de si el conjunto de
datos es par o es impar.
1.- Cuando los datos son impares los ordenamos de manera creciente o decreciente y la mediana va
a estar representada por el valor ubicado en el medio de los datos

1er Lapso de Estadistica

Enviado por

Dados do documento

Descrição original:

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

1er Lapso de Estadistica

Enviado por

Direitos autorais:

Formatos disponíveis

Conceptos Básicos de utilidad primer lapso

DEFINICIONES. Se puede decir que, un conjunto de datos constituye un grupo de valores o

ALGUNOS CONCEPTOS PREVIOS

Por ejemplo, si estamos interesados en la presión sanguínea de un paciente particular, la población

MUESTRA. Es una porción o subconjunto de la población o el universo que presenta características

UNIDAD DE OBSERVACIÓN . Es la unidad mínima de observación o individuos que componen

Clasificación. Si la variable presenta un atributo o cualidad se denomina cualitativa. Si la variable

ESTADÍSTICAS DE SALUD Se conoce como estadísticas de salud al conjunto de sistemas de

Estadísticas Demográficas o de población. La demografía (del griego demos=pueblo y grafos=trazo,

Estadísticas en el campo de la Salud.

DISTRIBUCIONES DE FRECUENCIAS. Es el conjunto de las frecuencias de todas las categorías

Los tipos de frecuencia pueden ser:

- Frecuencia Porcentual (f%).- Llamada también frecuencia relativa porcentual. Se obtiene

REGLAS GENERALES PARA FORMAR DISTRIBUCIONES DE FRECUENCIAS PARA

Siendo (n) el tamaño de la muestra.

Calculando el número de intervalos se obtiene:

Cuando el valor de i no es exacto, se debe redondear al valor superior más cercano.

7) Calcule las Frecuencias

1) Calculando el Rango se obtiene:

Ya que 65 es el número mayor de horas y 30 es el número menor de horas

2) Calculando el número de intervalos se obtiene

3) Calculando el ancho se obtiene:

A manera de comentario, se presenta algunas interpretaciones de la tabla:

El valor de xm = 50,5: Significa que 7 estudiantes dedicaron en promedio a estudiar la semana

MEDIDAS DE TENDENCIA CENTRAL

Ahora veamos cómo se hace el cálculo de cada una de estas medidas:

Entre sus propiedades se encuentran:

Fórmula para el cálculo de la media con datos agrupados:

Es el valor central de un conjunto de datos ordenados de menor a mayor o viceversa, es decir es el

Você também pode gostar