Você está na página 1de 24

Estadstica

La Estadstica es una ciencia formal que estudia la recoleccin, anlisis e interpretacin de datos de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algn fenmeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadstica es ms que eso, es decir, es el vehculo que permite llevar a cabo el proceso relacionado con la investigacin cientfica. LA ESTADSTICA SE DIVIDE EN DOS GRANDES REAS: La estadstica descriptiva: se dedica a la descripcin, visualizacin y resumen de datos originados a partir de los fenmenos de estudio. Los datos pueden ser resumidos numrica o grficamente. Ejemplos bsicos de parmetros estadsticos son: la media y la desviacin estndar. Algunos ejemplos grficos son: histograma, pirmide poblacional, grfico circular, entre otros. La estadstica inferencial: se dedica a la generacin de los modelos, inferencias y predicciones asociadas a los fenmenos en cuestin teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la poblacin bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hiptesis), estimaciones de unas caractersticas numricas (estimacin), pronsticos de futuras observaciones, descripciones de asociacin (correlacin) o modelamiento de relaciones entre variables (anlisis de regresin). Otras tcnicas de modelamiento incluyen anova, series de tiempo y minera de datos.

La estadstica descriptiva es una gran parte de la estadstica que se dedica a recolectar, ordenar, analizar y representar un conjunto de datos, con el fin de describir apropiadamente las caractersticas de ese conjunto. Este anlisis es muy bsico. Aunque hay tendencia a generalizar a toda la poblacin, las primeras conclusiones obtenidas tras un anlisis descriptivo, es un estudio calculando una serie de medidas de tendencia central, para ver en qu medida los datos se agrupan o dispersan en torno a un valor central. Esto es lo que podria ser un concepto aproximado.La estadstica descriptiva es una gran parte de la estadstica que se dedica a recolectar, ordenar, analizar y representar un conjunto de datos,

con el fin de describir apropiadamente las caractersticas de ese conjunto. Este anlisis es muy bsico. Aunque hay tendencia a generalizar a toda la poblacin, las primeras conclusiones obtenidas tras un anlisis descriptivo, es un estudio calculando una serie de medidas de tendencia central, para ver en qu medida los datos se agrupan o dispersan en torno a un valor central. Esto es lo que podria ser un concepto aproximado. Es el arte de realizar inferencias y sacar conclusiones a partir de datos imperfectos. Los datos son generalmente imperfectos en el sentido que an cuando posean informacin til no nos cuentan la historia completa. Es necesario contar con mtodos que nos permitan extraer informacin a partir de los datos observados para comprender mejor las situaciones que los mismos representan. Algunas tcnicas de anlisis de datos son sorprendentemente simples de aprender y usar ms all del hecho que la teora matemtica que las sustentan pueden ser muy compleja. Todos, an los estadsticos, tenemos problemas al enfrentarnos con listados de datos. Existen muchos mtodos estadsticos cuyo propsito es ayudarnos a poner de manifiesto las caractersticas sobresalientes e interesantes de nuestros datos que pueden ser usados en casi todas las reas del conocimiento. Los mtodos estadsticos pueden y deberan ser usados en todas las etapas de una investigacin, desde el comienzo hasta el final. Existe el convencimiento de que la estadstica trata con el ANLISIS DE DATOS (quizs porque esta es la contribucin ms visible de la estadstica), pero este punto de vista excluye aspectos vitales relacionados con el DISEO DE LAS INVESTIGACIONES. Es importante tomar conciencia que la eleccin del mtodo de anlisis para un problema, se basa tanto en el tipo de datos disponibles como en la forma en que fueron recolectados. LA ESTADSTICA DESCRIPTIVA: es la rama de las Matemticas que recolecta, representa y caracteriza un conjunto de datos (por ejemplo, edad de una poblacin, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc.) con el fin de describir apropiadamente las diversas caractersticas de ese conjunto. Al conjunto de los distintos valores numricos que adopta un carcter cuantitativo se llama variable estadstica. Las variables pueden ser de dos tipos:

DISTRIBUCIN DE FRECUENCIAS

La distribucin de frecuencias la agrupacin de datos en categoras mutuamente excluyentes que indican el nmero de observaciones en cada categora. Esto proporciona un valor aadido a la agrupacin de datos. La distribucin de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el nmero existente en cada clase. Estas agrupaciones de datos suelen estar agrupadas en forma de tablas. Una distribucin de frecuencias es un formato tabular en la que se organizan los datos en clases, es decir, en grupos de valores que describen una caracterstica de los [datos] y muestra el nmero de observaciones del conjunto de datos que caen en cada una de las clases. La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numrico. En principio, en la tabla de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos junto con el nmero de

veces que aparece, es decir, su Frecuencia. Se puede complementar la frecuencia absoluta con la denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el total de datos. En variables cuantitativas se distinguen por otra parte la frecuencia simple y la frecuencia acumulada. La tabla de frecuencias puede representarse grficamente en un histograma(Diagrama De Barras). Normalmente en el eje vertical se coloca las frecuencias y en el horizontal los intervalos de valores. La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente.

TIPOS DE FRECUENCIA

FRECUENCIA ABSOLUTA: La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estadstico. Se representa por ni. La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N. Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee suma o sumatoria. puesto que es mentira se hace el intercambio en la interfaz de la frecuencia absoluta.

FRECUENCIA RELATIVA

La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento y se representa por fi. La suma de las frecuencias relativas es igual a 1. FRECUENCIA ACOMULADA

La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por Fa.31 8 24 0.258 0.774 32 3 27 0.097 0.871 33 3 30 0.097 0.968 34 1 31 0.032 1 Este tipo de tablas de frecuencias se utiliza con variables discretas. DISTRIBUCIN DE FRECUENCIAS AGRUPADAS

La distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un nmero grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. Lmites de la clase. Cada clase est delimitada por el lmite inferior de la clase y el lmite superior de la clase. La amplitud de la clase es la diferencia entre el lmite superior e inferior de la clase. La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el clculo de algunos parmetros. Construccin de una tabla de datos agrupados: 3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. 1 Se localizan los valores menor y mayor de la distribucin. En este caso son 3 y 48. 2 Se restan y se busca un nmero entero un poco mayor que la diferencia y que sea divisible por el nmero de intervalos queramos establecer. Es conveniente que el nmero de intervalos oscile entre 6 y 15. En este caso, 48 - 3 = 45, incrementamos el nmero hasta 50 : 5 = 10 intervalos.

Se forman los intervalos teniendo presente que el lmite inferior de una clase pertenece al intervalo, pero el lmite superior no no pertenece intervalo, se cuenta en el siguiente intervalo. ci fi Fi ni Ni [0, 5) 2.5 1 1 0.025 0.025 [5, 10) 7.5 1 2 0.025 0.050 [10, 15) 12.5 3 5 0.075 0.125 [15, 20) 17.5 3 8 0.075 0.200 [20, 25) 22.5 3 11 0.075 0.2775 [25, 30) 27.5 6 17 0.150 0.425 [30, 35) 32.5 7 24 0.175 0.600 [35, 40) 37.5 10 34 0.250 0.850 [40, 45) 42.5 4 38 0.100 0.950 [45, 50) 47.5 2 40 0.050 1 Total: 1 MEDIDAS DE TENDENCIA CENTRAL.

Las medidas de tendencia central son valores numricos que tienden a localizar la parte central de un conjunto de datos. Nos dan un centro de la distribucin de frecuencias, es un valor que se puede tomar como representativo de todos los datos. Hay diferentes modos para definir el "centro" de las observaciones en un conjunto de datos. A continuacin se presentan los ms usados. Al describir grupos de observaciones, con frecuencia es conveniente resumir la informacin con un solo nmero. Este nmero que, para tal fin, suele situarse hacia el centro de la distribucin de datos se denomina medida o parmetro de tendencia central o de centralizacin. Cuando se hace referencia nicamente a la posicin de estos parmetros dentro de la distribucin, independientemente de que sta est ms menos centrada, se habla de estas medidas como medidas de posicin.1 En este caso se incluyen tambin los cuantiles entre estas medidas. Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por lo que las medidas de posicin o medidas de tendencia se usan de acuerdo al tipo de variable que se est observando, en este caso se observan variables cuantitativas. LA MEDIA

En matemticas y estadstica una media o promedio es una medida de tendencia central que segn la Real Academia Espaola (2001) [] resulta al efectuar una serie determinada de operaciones con un conjunto de nmeros y que, en determinadas condiciones, puede representar por s solo a todo el conjunto. Existen distintos tipos de medias, tales como la media geomtrica, la media ponderada y la media armnica aunque en el lenguaje comn, el trmino se refiere generalmente a la media aritmtica. Y se define como la suma de los valores de todas las observaciones divididas por el nmero total de datos. Se representa por x o por la letra segn se calcule en una muestra o en la poblacin, respectivamente PROPIEDADES DE LA MEDIA ARITMTICA Puede ser calculada en distribuciones con escala relativa e Todos los valores son incluidos en el clculo de la media. Una serie de datos solo tiene una media. Es una medida muy til para comparar dos o ms poblaciones. Es la nica medida de tendencia central donde la suma de las desviaciones de cada valor respecto a la media es igual a cero. Por lo tanto, podemos considerar a la media como el punto de balance de una serie de datos. DESVENTAJAS DE LA MEDIA Si alguno de los valores es extremadamente grande o extremadamente pequeo, la media no es el promedio apropiado para representar la serie de datos. No se puede determinar si en una distribucin de frecuencias hay intervalos de clase abiertos.

Ejemplos de medias

Existen numerosos ejemplos de medias , una de las pocas propiedades compartidas por todas las medias es cualquier media est comprendida entre el valor mximo y el valor mnimo del conjunto de datos:

MEDIA ARITMTICA

La media aritmtica es un promedio estndar que a menudo se denomina "promedio". La media se confunde a veces con la mediana o moda. La media aritmtica es el promedio de un conjunto de valores, o su distribucin; sin embargo, para las distribuciones consesgo, la media no es necesariamente el mismo valor que la mediana o que la moda. La media, moda y mediana son parmetros caractersticos de una distribucin de probabilidad. Es a veces una forma de medir el sesgo de una distribucin tal y como se puede hacer en las distribuciones exponencial y de Poisson. Por ejemplo, la media aritmtica de 34, 27, 45, 55, 22, 34 (seis valores) es

MEDIA ARITMTICA PONDERADA A veces puede ser til otorgar pesos o valores a los datos dependiendo de su relevancia para determinado estudio. En esos casos se puede utilizar una media ponderada. Si es un conjunto de datos o media muestral y son nmeros reales positivos, llamados "pesos" o factores de ponderacin, se define la media ponderada relativa a esos pesos como:

La media es invariante frente a transformaciones lineales, cambio de origen y escala, de las variables, es decir si X es una variable aleatoria e Y es otra variable aleatoria que depende linealmente de X, es decir, Y = aX + b (donde a representa la magnitud del cambio de escala y b la del cambio de origen) se tiene que: MEDIA ESTADSTICA

La media estadstica se usa en estadstica para dos conceptos diferentes aunque numricamente similares: La media muestral, que es un estadstico que se calcula a partir de la media aritmtica de un conjunto de valores de una variable aleatoria. La media poblacional, valor esperado o esperanza matemtica de una variable aleatoria. En la prctica dada una muestra estadstica suficientemente grande el valor de la media muestral de la misma es numricamente muy cercano a la esperanza matemtica de la variable aleatoria medida en esa muestra. Dicho valor esperado, slo es calculable si se conoce con toda exactitud la distribucin de probabilidad, cosa que raramente sucede en la realidad, por esa razn, a efectos prcticos la llamada media se refiere normalmente a la media muestral.

LA MEDIANA En el mbito de la estadstica, la mediana, representa el valor de la variable de posicin central en un conjunto de datos ordenados. De acuerdo con esta definicin el conjunto de datos menores o iguales que la mediana representarn el 50% de los datos, y los que sean mayores que la mediana representarn el otro 50% del total de datos de la muestra. La mediana coincide con el percentil 50, con el segundo cuartil y con el quinto decil. Su clculo no se ve afectado por valores extremos.

Clculo de la mediana 1 Ordenamos los datos de menor a mayor. 2 Si la serie tiene un nmero impar de medidas la mediana es la puntuacin central de la misma. 2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5 3 Si la serie tiene un nmero par de puntuaciones la mediana es la media entre las dos puntuaciones centrales. 7, 8, 9, 10, 11, 12Me= 9.5 CALCULO DE LA MEDIANA PARA DATOS AGRUPADOS La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas.

Es decir tenemos que buscar el intervalo en el que se encuentre

Li es el lmite inferior de la clase donde se encuentra la mediana.

es la semisuma de las frecuencias absolutas. Fi-1 es la frecuencia acumulada anterior a la clase mediana. ai es la amplitud de la clase. La mediana es independiente de las amplitudes de los intervalos. Ejemplo Calcular la mediana de una distribucin estadstica que viene dada por la siguiente 100/2 = 50 Clase de la mediana: [66, 69)

MODA

Es el valor de la variable que ms veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. Puede haber ms de una moda en una distribucin. Se denota por Mo. En estadstica, la moda es el valor con una mayor frecuencia en una distribucin de datos. Hablaremos de una distribucin bimodal de los datos adquiridos en una columna cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta mxima. Una distribucin trimodal de los datos es en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que no hay moda. El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos agrupados antes de definir la moda, se ha de definir el intervalo modal. La moda, cuando los datos estn agrupados, es un punto que divide al intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:

Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los intervalos anterior y posterior, respectivamente, al intervalo modal.

Para averiguar la moda en un grupo de nmeros: Ordena los nmeros segn su tamao. Determina la cantidad de veces de cada valor numrico. El valor numrico que ms se repite es la moda. Puede haber ms de una moda cuando dos o ms nmeros se repiten la misma cantidad de veces y adems este es el mximo nmero de veces del conjunto. No hay moda si ningn nmero se repite ms de una vez. EJEMPLO Hallar la moda de la distribucin: 2, 3, 3, 4, 4, 4, 5, 5 Mo= 4 Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la mxima, la distribucin es bimodal omultimodal, es decir, tiene varias modas. 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9 Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda. 2, 2, 3, 3, 6, 6, 9, 9 Si dos puntuaciones adyacentes tienen la frecuencia mxima, la moda es el promedio de las dos puntuaciones adyacentes. 0, 1, 3, 3, 5, 5, 7, 8 Mo = 4 MEDIDAS DE POSICIN CENTRAL.

Las medidas de posicin no central permiten conocer otros puntos caractersticos de la distribucin que no son los valores centrales. Entre las medidas de posicin no central ms importantes estn los cuantiles. Las medidas de posicin central nos facilitan informacin sobre la serie de datos que estamos

analizando. Estas medidas nos permiten conocer diversas caractersticas de esta serie de datos. Informan sobre los valores medios de la serie de datos. Las principales medidas de posicin central son: MEDIA: Es el valor medio ponderado de la serie de datos. se puede calcular diversos tipos de media. MEDIANA: Es el valor de la serie de datos que se sita justamente en el centro de la muestra. MODA: Es el valor que ms se repite el la muestra.

CUARTILES

Se llama cuartiles a tres valores que dividen a los datos en cuatro partes iguales. Se representan por Q1, Q2 y Q3, y se llaman cuartil primero(supera el 25% de los datos), segundo(50%) y tercero(75%) respectivamente. Estos parmetros son del tipo de la mediana se calculan de la misma forma. Ejemplo: Las calificaciones en una determinada asignatura de los 40 alumnos de un curso de COU vienen dadas por la siguiente tabla: CALIFICACIONES 1 2 3 4 5 6 7 8 9 N DE ALUMNOS 2 2 4 5 8 9 3 4 3 F. Acumuladas 2 4 8 13 21 30 33 37 40 Despus de construir la tabla en la que aparezca la frecuencia absoluta acumulada, para calcular Q1, hay que tener en cuenta que el cuartil primero deja la cuarta parte de la distribucin a la izquierda y como N/4=40/4=10, se verifica que Q1=4 porque este es el primer valor de la variable cuya frecuencia absoluta acumulada excede a la cuarta parte del nmero de datos.Q2 coincide con la mediana vale 5.Para calcular Q3 tendremos en cuenta que deja las tres cuartas partes de la distribucin la izquierda. Como , se verifica que Q3= (6+7) / 2 = 6.5. Al coincidir exactamente con un valor tenemos que hacer la media. Ejemplo: Se ha aplicado un test sobre un determinado tema a 88 trabajadores de una fbrica,obtenindose los siguientes resultados: PUNTUACIONES N.TRABAJADORES Ni N / 4 = 22 [38,44) 7 7 [44,50) 8 15 [50,56) 15 30 Clase del 1 cuartil [56,62) 25 55 3 N / 4 = 3A88 / 4 = 66 [62,68) 18 73 Clase del 3 cuartil [68,74) 9 82 Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q2 coincide con la mediana. Clculo de los cuartiles 1 Ordenamos los datos de menor a mayor.

Buscamos

el

lugar

que

ocupa

cada

cuartil

mediante

la

expresin

. Nmero impar de datos 2, 5, 3, 6, 7, 4, 9

Nmero par de datos 2, 5, 3, 4, 6, 7, 1, 9

Clculo de los cuartiles para datos agrupados

En primer lugar buscamos la clase donde se encuentra de las frecuencias acumuladas.

, en la tabla

Clculo del segundo cuartil

Clculo del tercer cuartil

Deciles: son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados. Son medidas que describen las posiciones es un conjunto de datos ordenados de menor a mayor. Son nueve valores que divide un conjunto de datos en 10 partes porcentualmente iguales se expresan como: D1, D2, D3,.....D9. Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos. D5 coincide con la mediana.

Clculo de los deciles

En primer lugar buscamos la clase donde se encuentra de las frecuencias acumuladas.

, en la tabla

del primer decil

Clculo del segundo decil

Clculo del tercer decil

Clculo del cuarto decil

PERCENTILES: son 99 valores que distribuyen la serie de datos, ordenada de forma


creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados.repeticiones. Los Percentiles, (P), son los que dividen a la distribucin en cien partes. Hay 99 percentiles que dividen a una serie en 99 partes iguales CLCULO DE LOS PERCENTILES Estos valores se calculan Tambin en base a: Datos no agrupados Datos agrupados de tablas de distribucin de frecuencias Percentiles Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos. P50 coincide con la mediana.

En primer lugar buscamos la clase donde se encuentra , en la tabla de las frecuencias acumuladas.

Percentil 35

Percentil 60

Clculo de los percentile

DATOS SIN AGRUPAR


Sean mediana como los datos de una muestra ordenada en orden creciente y designando la , distinguimos dos casos:

a) Si n es impar, la mediana es el valor que ocupa la posicin una vez que los datos han sido ordenados (en orden creciente o decreciente), porque ste es el valor central. Es decir: . Por ejemplo, si tenemos 5 datos, que ordenados son: , => El valor central es el tercero: mediana de ese conjunto de datos, deja dos datos por debajo ( l ( , ). , , , ,

. Este valor, que es la ) y otros dos por encima de

b) Si n es par, la mediana es la media aritmtica de los dos valores centrales. Cuando par, los dos datos que estn en el centro de la muestra ocupan las posiciones Es decir: y

es .

DATOS AGRUPADOS

Al tratar con datos agrupados, si coincide con el valor de una frecuencia acumulada, el valor de la mediana coincide con la abscisa correspondiente. Si no coincide con el valor de ninguna abcisa, se

calcula a travs de semejanza de tringulos en el histograma o polgono de frecuencias acumuladas, utilizando la siguiente equivalencia: Donde y son las frecuencias absolutas acumuladas tales que , y son los extremos, interior y exterior, del intervalo donde se alcanza la mediana y es la abscisa a calcular, la moda. Se observa que es la amplitud de los intervalos seleccionados para el diagrama

Datos sin agrupar Sean mediana como los datos de una muestra ordenada en orden creciente y designando la , distinguimos dos casos:

a) Si n es impar, la mediana es el valor que ocupa la posicin una vez que los datos han sido ordenados (en orden creciente o decreciente), porque ste es el valor central. Es decir: . Por ejemplo, si tenemos 5 datos, que ordenados son: => El valor ce ntral es el tercero: conjunto de datos, deja dos datos por debajo ( , , , , ,

. Este valor, que es la mediana de ese ) y otros dos por encima de l ( , ). es par, los dos . Es decir:

b) Si n es par, la mediana es la media aritmtica de los dos valores centrales. Cuando datos que estn en el centro de la muestra ocupan las posiciones . . y

VARIABLES
una variable es un nombre asociado a un elemento de datos que est situado en posiciones contiguas de la memoria principal, y su valor puede cambiar durante la ejecucin de un programa. Una variable representa un valor numrico o de cadena o un objeto de una clase. El valor que la variable almacena puede cambiar, pero el nombre sigue siendo el mismo. Variables estadsticas. Una variable estadstica es cada una de las caractersticas, cualidades o modalidades (atributos) que poseen los individuos de una poblacin. Una variable es un contenedor de informacin, en el que podemos almacenar nmeros enteros, nmeros decimales, caracteres. El contenido de las variables se puede leer y se puede cambiar durante la ejecucin de una pgina PHP. En PHP todas las variables comienzan con el smbolo del dlar $ y no es necesario definir una variable antes de usarla. Tampoco tienen tipos, es decir que una misma variable puede contener un nmero y luego puede contener caracteres.

VARIABLE. Caracterstica de inters sobre cada elemento individual de una poblacin o muestra. (La
edad de un estudiante que ingresa a la Universidad, el color de su cabello, su estatura y su peso son cuatro variables).

VARIABLE. Cualquier propiedad o caracterstica de algn evento, objeto o persona, que puede tener
diversos valores en diversos instantes, segn las condiciones.

VARIABLE CUANTITATIVA O NUMRICA. Variable que cuantifica un elemento de una


poblacin. Las operaciones aritmticas, como sumar y obtener promedios, s son significativas para datos que resultan de una variable cuantitativa

VARIABLE DEPENDIENTE. Variable en un experimento, medida por un investigador para


determinar el efecto de la variable independiente.

VARIABLE DISCRETA. Variable para la cual no existen valores posibles entre las unidades
adyacentes en una escala. son aquellas cuyas observaciones se agrupan inherentemente o naturalmente en categoras, porque dichas variable por su naturaleza slo pueden tomar ciertos valores muy especficos. El gnero de un sujeto es un buen ejemplo de una variable discreta: los seres humanos pueden ser mujeres u hombres, se ajustan a una u otra categora y no hay continuidad ni puntos intermedios entre ellas. Los pases o regiones del mundo tambin son buenos ejemplos de variables discretas. Otro ejemplo son las calificaciones o educacin de los maestros. Podemos crear las siguientes categoras para describir esta ltima variable: (a) educacin primaria completa, (b) educacin secundaria completa, (c) educacin superior incompleta, (d) educacin superior completa y (e) educacin de postgrado.

VARIABLE CONTINUAS. slo se pueden agrupar en forma arbitraria en categoras, porque por su
naturaleza pueden tomar cualquier valor a lo largo de un continuo (o de una escala numrica continua). La estatura de los habitantes de un pas es un ejemplo de variable continua, as como el ingreso de las familias en dicho pas. Un buen ejemplo en el rea de la educacin son las calificaciones de pruebas, que slo se pueden agrupar arbitrariamente creando intervalos artificiales, como por ejemplo 1-20, 2140, etc. Note que los intervalos tambin podran ser 1-10, 11-20, 21-30, etc, o cualquier otro intervalo que se prefiera, ya que la variable no se ajusta naturalmente a categoras predeterminadas como en el caso de las variables discretas.

VARIABLE CUALITATIVA
Es una variable que no puede expresarse numricamente sino que tiene naturaleza de categora, es decir, que genera datos expresados con palabras denotan cualidades o atributos. Si la informacin de la variable que vamos a organizar corresponde a una variable cualitativa y si los datos generados no implican orden al enunciarlos, dicha informacin se reagrupa en categoras.

VARIABLE CUALITATIVA NO ORDENABLE


Cuando los sucesos elementales se reagrupan en categoras, pero no requieren un orden determinado, pero si tiene un lmite definido excluyentes unas de otras. Ejemplo: Variable Categora Estado civil Soltero, casado, viudo, unin libre Religiosidad Catlico, protestante, budista, etc Sexo Femenino, masculino Nacionalidad Colombiano, peruano, etc Rendimiento acadmico Excelente, Bueno, Regular, Deficiente Nivel Socio-econmico Alto, Medio, Bajo

VARIABLE CUALITATIVA
Son variables que expresan, distintas cualidades o modalidades, cada modalidad que se presenta se denomina atributo o categora y la medicin consiste en una clasificacin de dichos atributos.Las variables cualitativas pueden ser dicotmicas cuando slo pueden tomar dos valores posibles como s y no, lo son politmicas cuando pueden tomar o adquirir tres o ms valores. Las variables cualitativas se refieren a caractersticas o cualidades que no pueden ser medidas con nmeros. Podemos distinguir dos tipos: Variable cualitativa nominal Una variable cualitativa nominal presenta modalidades no numricas que no admiten un criterio de orden. Por ejemplo: El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.

VARIABLE CUALITATIVA ORDINAL


Una variable cualitativa ordinal presenta modalidades no nmericas, en las que existe un orden. Por ejemplo: La nota en un examen: suspenso, aprobado, notable, sobresaliente. Puesto conseguido en una prueba deportiva: 1, 2, 3, ... Medallas de una prueba deportiva: oro, plata, bronce.

VARIABLES CUANTITATIVAS
Son variables que se expresan cantidades numricas. En las variables cuantitativas es muy importante definir si es un nmero entero o un nmero decimal. Por ello se debe estar claro del conjunto referencial de dicha variable.

Definicin Dominio de la variable.


Las variables estadsticas se representan con un smbolo, tal como A, B o C, x, y, z, que puede tomar un valor perteneciente a un conjunto de valores, llamado dominio de la variable. Las variables cuantitativas pueden ser: Discretas: Toman un valor del dominio de la variable (los nmeros naturales) y no pueden tomar ningn valor entre dos consecutivos. Ejemplo: nmero de hijos, goles metidos por un equipo de ftbol, es decir se pueden contar. Anota lo siguiente La columna conteo, en la tabla 2, se agrega para facilitar el clculo de la frecuencia absoluta (f). Continuas: Es la que, tericamente, puede tomar cualquier valor en una escala de medidas, entero o fraccionario. Por ejemplo, la estatura de una alumna. Variables estadsticas.

El estudio estadstico est basado en la observacin de la persona o individuo, donde se determinan una o ms caractersticas de estos elementos, por ejemplo, la edad, preferencias, gnero, nacionalidad. Definicin Variable estadstica. Una variable estadstica es cada una de las caractersticas, cualidades o modalidades (atributos) que poseen los individuos de una poblacin.

Variables cualitativas o categricas: los alumnos de una clase). no se pueden medir numricamente (por ejemplo: nacionalidad, color de la piel, sexo). Variables cuantitativas: tienen valor numrico (edad, precio de un producto, ingresos anuales). Las variables tambin se pueden clasificar en:

VARIABLES UNIDIMENSIONALES: Considere los siguientes datos, que reproducen las


calificaciones obtenidas por los 14 alumnos de 2 de LADE en la asignatura de Macroeconoma, que se presentaron en una convocatoria extraordinaria. 0, 1,75, 3, 4,25, 5, 5, 5, 6, 6, 6, 6, 7, 8,5, 10 Convendremos que la informacin as presentada no es demasiado manejable. Quiz podamos mejorar esta presentacin, tabulando los datos, es decir, ponindolos en una tabla de dos columnas: reservamos la primera para la variable notas y en la segunda, la frecuencia de cada nota, esto es, el nmero de veces que se repite cada observacin. Xi (notas) ni (frecuencia) 01 1,75 1 31 4,25 1 53 64 71 8,5 1 10 1 Estar de acuerdo con nosotros, en que la informacin as, se puede analizar mejor. Por ejemplo, podemos apreciar, a simple vista que la nota ms repetida ms frecuente- es el 6, que ha sido obtenida por cuatro alumnos. Observe tambin, que nos es fcil, saber el nmero total de presentados, sin ms que sumar los datos de la columna de frecuencias

DISTRIBUCIONES UNIDIMENSIONALES DE FRECUENCIAS


- Frecuencia absoluta de un determinado valor de la variable xi (y lo representaremos por ni ): es el nmero de veces que se presenta ese determinado valor xi . - Frecuencia relativa de un determinado valor de la variable xi (y lo representaremos por fi ): es el cociente de su frecuencia absoluta (ni ) y el nmero total de datos. - Frecuencia absoluta acumulada de un determinado valor de la variable xi (y lo representaremos por Ni ): es la

suma de las frecuencias absolutas de todos los valores de la variable menores o iguales que dicho valor xi. - Frecuencia relativa acumulada de un determinado valor de la variable xi (y lo representaremos por Fi ): es la suma de las frecuencias relativas de todos los valores de la variable menores o iguales que dicho valor xi. Cuando en un conjunto de valores observados de una variable, se realizan las operaciones de: Ordenacin y agrupacin de los valores que se repiten, (determinacin de la frecuencia de cada valor), se obtiene una tabla estadstica de distribucin de frecuencias. A dicho conjunto de operaciones se le denomina: Tabulacin. Las distribuciones de frecuencias se pueden clasificar en varios tipos de acuerdo con el nmero de los valores observados de la variable, as como el nmero de observaciones totales recorrido o rango de una variable, se define como la diferencia entre el mayor y el menor valor de la variable: R = Mx Xi - Mn Xi Para facilitar el manejo matemtico de los intervalos, es preciso considerar un valor concreto de la variable como representante de cada intervalo. Generalmente se toma como tal el valor central del intervalo, y se le denomina marca de clase. .

VARIABLES BIDIMENSIONALES:
Recogen informacin sobre dos caractersticas de la poblacin (por ejemplo:edad y altura de los alumnos de una clase).Las distribuciones unidimensionales son aquellas en las que se estudian al mismo tiempo dos variables de cada elemento de la poblacin: por ejemplo: peso y altura de un grupo de estudiantes; superficie y precio de las viviendas de una ciudad; potencia y velocidad de una gama de coches deportivos. Para representar los datos obtenidos se utiliza una tabla de correlacin:

Distribuciones bidimensionales de frecuencias. Descripcin


numrica y representaciones grficas. Llamaremos frecuencia absoluta bidimensional: al nmero de veces que se presenta conjuntamente el par de valores (xi , yj ), y se representa por nij . Llamaremos frecuencia relativa bidimensional: al cociente entre la frecuencia absoluta bidimensional y el nmero total de datos: N n f ij ij = Llamaremos distribucin bidimensional: al conjunto formado por los pares de valores de los caracteres (xi ,yj ), asociado a sus frecuencias absolutas: (xi , yj , nij), o las relativas. Una forma de disponer los datos es la conocida como tabla de doble entrada: -Si es de caracteres cuantitativos o variables se denomina tabla de correlacin -Si es de caracteres cualitativos o atributos se denomina tabla de contingencia. Representaciones grficas: Las distribuciones bidimensionales se pueden representar grficamente en el espacio de tres dimensiones. En este caso en el eje vertical se representan las frecuencias y en el plano horizontal los valores de las variables X e Y.

Variables pluridimensionales: recogen informacin sobre tres o ms caractersticas (por


ejemplo:edad, altura y peso de los alumnos de una clase).Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:

CONSTANTES Una constante es una variable cuyo valor puede determinar el compilador durante la compilacin y puede aplicar optimizaciones derivadas de ello. Para que esto sea posible se ha de cumplir que el valor

de una constante no pueda cambiar durante la ejecucin, por lo que el compilador informar con un error de todo intento de modificar el valor inicial de una constante. Las constantes se definen como variables normales pero precediendo el nombre de su tipo del modificador const y dndoles siempre un valor inicial al declararlas. Es un valor de tipo permanente, que no puede modificarse, al menos no del contexto o situacin para cual esta.

DISCRETAS:slo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: nmero de hermanos (puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podr ser 3.45). CONTINUAS:pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehculo puede ser 90.4 km/h, 94.57 km/h...etc. Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos: INDIVIDUO: cualquier elemento que porte informacin sobre el fenmeno que se estudia. As, si estudiamos la altura de los nios de una clase, cada alumno es un individuo; si se estudia el precio de la vivienda, cada vivienda es un individuo.Un individuo o unidad estadstica es cada uno de los elementos que componen la poblacin.

POBLACIN: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten informacin sobre el fenmeno que se estudia. Por ejemplo, si se estudia el precio de la vivienda en una ciudad, la poblacin ser el total de las viviendas de dicha ciudad.Es el conjunto de datos de los cuales se ocupa un determinado estudio estadistico. Grupo entero de datos, objetos tales como alturas y pesos de los estudiantes de una universidad. Es la coleccin, o conjunto de datos individuos, objetos o eventos cuyas propiedades sern analizadas. MUESTRA: subconjunto que seleccionado de una poblacin. Por ejemplo, si se estudia el precio de la vivienda de una ciudad, lo normal ser no recoger informacin sobre todas las viviendas de la ciudad,es un conjunto representativo de la poblacin de referencia, el nmero de individuos de una muestra es menor que el de la poblacin.Es una parte tomada de la poblacin, seleccionada de acuerdo con una regla o plan. En estadstica una muestra estadstica (tambin llamada muestra aleatoria o simplemente muestra) es un subconjunto de casos o individuos de una poblacin estadstica. Las muestras se obtienen con la intencin de inferir propiedades de la totalidad de la poblacin, para lo cual deben ser representativas de la misma. Para cumplir esta caracterstica la inclusin de sujetos en la muestra debe seguir una tcnica de muestreo. En tales casos, puede obtenerse una informacin similar a la de un estudio exhaustivo con mayor rapidez y menor coste (vanse las ventajas de la eleccin de una muestra, ms abajo). Por otra parte, en ocasiones, el muestreo puede ser ms exacto que el estudio de toda la poblacin porque el manejo de un menor nmero de datos provoca tambin menos errores en su manipulacin. En cualquier caso, el conjunto de individuos de la muestra son los sujetos realmente estudiados. El nmero de sujetos que componen la muestra suele ser inferior que el de la poblacin, pero suficiente para que la estimacin de los parmetros determinados tenga un nivel de confianza adecuado. Para que el tamao de la muestra sea idneo es preciso recurrir a su clculo.

DATO: Valor de la variable asociada a un elemento de una poblacin o muestra. Este valor puede ser un nmero, una palabra o un smbolo. (Por ejemplo: Juan Posada,ingres a la Universidad a la edad de 23aos, su cabello es ROJIZO mide 1.80 m pesa 83 Kg. Estas cuatro piezas de datos son los valores de las cuatro variables aplicadas a Juan Posada).

Você também pode gostar