Você está na página 1de 10

Estadstica Bsica

La estadstica se puede definir como la ciencia que recopila, organiza, analiza e interpreta la informacin numrica o cualitativa, mejor conocida como datos, de manera que pueda llevar a conclusiones. Describe, analiza y representa un grupo de datos utilizando mtodos numricos y grficos que resumen y presentan la informacin contenida en ellos. Se puede definir como aquel mtodo que contiene la recoleccin, organizacin, presentacin y resumen de una serie de datos. El mencionado resumen puede ser tabular, grfico o numrico. 1. Clasificacin. En atencin a su metodologa, por sus procedimientos y alcances bien definidos, podemos clasificar la estadstica en dos grandes ramas: A. Estadstica descriptiva: Una de las ramas de la Estadstica ms accesible a la mayora de la poblacin es la Descriptiva. Esta se dedica nica y exclusivamente al ordenamiento y tratamiento mecnico de la informacin para su presentacin por medio de tablas y de representaciones grficas, as como de la obtencin de algunos parmetros tiles para la explicacin de la informacin. La estadstica descriptiva analiza, estudia y describe a la totalidad de los individuos de una poblacin, su finalidad es obtener informacin, analizarla, elaborarla y simplificarla lo necesario para que pueda ser interpretada cmoda y rpidamente y, por tanto, pueda utilizarse eficazmente para el fin que se desee. El anlisis que se realiza se limita en s mismo a los datos recolectados y no se puede realizar inferencia o generalizacin alguna acerca de la poblacin de donde provienen esos datos estadsticos. El proceso que sigue la estadstica descriptiva para el estudio de una cierta poblacin consta de los siguientes pasos: 1 Seleccin de caracteres dignos de ser estudiados. 2 Mediante encuesta o medicin, obtencin del valor de cada individuo en los caracteres seleccionados. 3 Elaboracin de tablas de frecuencias, mediante la adecuada clasificacin de los individuos dentro de cada carcter. 4Representacin estadsticos). grfica de los resultados (elaboracin de grficos

5 Obtencin de parmetros estadsticos, nmeros que sintetizan los

aspectos ms relevantes de una distribucin estadstica. B. Estadstica inferencial: Es aquella rama de la estadstica que apoyndose en el clculo de probabilidades y a partir de datos mustrales, efecta estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos. Puede definirse como aquella rama de la estadstica que hace posible la estimacin de una caracterstica de una poblacin o la toma de una decisin referente a una poblacin, fundamentndose slo en los resultados de la muestra. La estadstica Inferencial, por otro lado, se refiere a la rama de la estadstica que trata de los procesos inferenciales, la que a su vez vislumbra la teora de estimacin y prueba de hiptesis. Uno de los primordiales aspectos de la inferencia estadstica es el proceso que radica en utilizar estadsticos mustrales para adquirir conclusiones sobre los verdaderos parmetros de la poblacin. Los requerimientos de los mtodos de la inferencia estadstica se originan de la necesidad del muestreo. Al tornarse muy grande una poblacin, comnmente resulta demasiado costoso, prolongado en el tiempo y complicado obtener informacin de la poblacin completa. Las decisiones con respecto a las caractersticas de la poblacin se deben basar en la informacin contenida en una muestra de esa poblacin. La teora de la probabilidad suministra l vnculo, determinando la probabilidad de que los resultados provenientes de la muestra reflejen los resultados que se obtendran de la poblacin. La fidelidad de cualquier estimacin tiene una importancia enorme. Esta precisin depende en gran parte de la forma de tomar la muestra y de la atencin que se ponga en que esta muestra suministre una imagen fiable de la poblacin, pero casi nunca la muestra representa la poblacin en toda su plenitud, y de ello resultar un error muestral.

2. Finalidad de la estadstica La estadstica es una ciencia o mtodo cientfico que en la actualidad es considerada como un poderoso auxiliar en las investigaciones cientficas, que le permite a sta aprovechar el material cuantitativo.

3. Historia de la estadstica Desde el inicio de la civilizacin han existido formas sencillas de estadstica, puesto que en la antigedad se utilizaban representaciones grficas y otros smbolos en pieles, rocas, palos de madera y paredes de cuevas para contar

el nmero de personas, animales o ciertas cosas que eran de importancia en aquellas civilizaciones. El trmino estadstico es ampliamente percibido y pronunciado a diario desde diversos sectores activos de la sociedad. No obstante, hay una gran diferencia entre el sentido del trmino cuando se utiliza en el lenguaje corriente, generalmente al anteceder una citacin de carcter numrico, y lo que la estadstica significa como ciencia. La razn o razones que motivaron al hombre en un momento de su desarrollo a tomar en cuenta datos con propsitos estadsticos, posiblemente se encuentra si se toma en cuenta que es difcil suponer un organismo social, sea cual fuere la poca, sin la necesidad, casi instintiva, de recoger aquellos hechos que aparecen como actos esenciales de la vida; y as, al ubicarnos en una etapa del desarrollo de la estadstica podemos especular que se convirti en una aritmtica estatal para asistir al gobernante que necesitaba conocer la riqueza y el nmero de los sbditos entre otros, con el objeto de recaudar impuestos o presupuestar la guerra. Desde los comienzos de la civilizacin han existido formas sencillas de estadstica, pues ya se utilizaban representaciones grficas y otros smbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el nmero de personas, animales o cosas. Hacia el ao 3000 a.C. los babilonios usaban pequeas tablillas de arcilla para recopilar datos sobre la produccin agrcola y sobre las especies vendidas o cambiadas mediante trueque.

4. Conceptos bsicos empleados en estadstica. 4.1 Universo: En estadstica es el nombre especfico que recibe particularmente en la investigacin social la operacin dentro de la delimitacin del campo de investigacin que tienen por objeto la determinacin del conjunto de unidades de observacin que van a ser investigadas. Para muchos investigadores los trminos universo y poblacin son sinnimos. En general, el universo es la totalidad de elementos o caractersticas que conforman el mbito de un estudio o investigacin. 4.2 Poblacin: En estadstica el concepto de poblacin va ms all de lo que comnmente se conoce como tal. En trminos estadsticos, poblacin es un conjunto finito o infinito de personas, animales o cosas que presentan caractersticas comunes, sobre los cuales se quiere efectuar un estudio determinado. Las cuales reciben el nombre de Individuos. En otras palabras, la poblacin se define como la totalidad de los valores posibles (mediciones o conteos) de una caracterstica particular de un grupo especificado de individuos (personas, animales o cosas que se desean estudiar en un momento determinado). As, se puede hablar de la poblacin de habitantes de un

pas, de la poblacin de estudiantes universitarios de la zona sur de la comunidad de Murcia, de la poblacin de casas de la Urbanizacin Campos del Ro, el rendimiento acadmico de los estudiantes de la UMU, el nmero de coches marca Kia de la ciudad de Lorca, la estatura de un grupo alumnos del UPCT, la talla, etc. 4.3 Muestra: La muestra es un subconjunto de la poblacin, seleccionado de tal forma, que sea representativo de la poblacin en estudio, obtenindose con el fin de investigar alguna o algunas de las propiedades de la poblacin de la cual procede. En otras palabras es una parte de la poblacin que sirve para representarla. Segn el DRAE, es una parte o porcin extrada de un conjunto por mtodos que permiten considerarla como representativa del mismo. Entonces, una muestra no es ms que una parte de la poblacin que sirve para representarla. La muestra debe obtenerse de la poblacin que se desea estudiar; una muestra debe ser definida sobre la base de la poblacin determinada, y las conclusiones que se obtengan de dicha muestra slo podrn referirse a la poblacin en referencia. 4.4 Muestreo: Es el procedimiento mediante el cual se obtiene una o ms muestras de una poblacin determinada. Un muestreo puede hacerse con o sin reposicin, y la poblacin de partida puede ser infinita o finita. Podemos distinguir tres tipos de muestreo: 4.4.1 Muestreo aleatorio simple Para obtener una muestra, se numeran los elementos de la poblacin y se seleccionan al azar los n elementos que contiene la muestra. 4.4.2 Muestreo aleatorio sistemtico Se elige un individuo al azar y a partir de l, a intervalos constantes, se eligen los dems hasta completar la muestra. Por ejemplo si tenemos una poblacin formada por 100 elementos y queremos extraer una muestra de 25 elementos, en primer lugar debemos establecer el intervalo de seleccin que ser igual a 100/25 = 4. A continuacin elegimos el elemento de arranque, tomando aleatoriamente un nmero entre el 1 y el 4, y a partir de l obtenemos los restantes elementos de la muestra. 2, 6, 10, 14,..., 98 4.4.3 Muestreo aleatorio estratificado Se divide la poblacin en clases o estratos y se escoge, aleatoriamente, un nmero de individuos de cada estrato proporcional al nmero de

componentes de cada estrato. Ejemplo: En una fbrica que consta de 600 trabajadores queremos tomar una muestra de 20. Sabemos que hay 200 trabajadores en la seccin A, 150 en la B, 150 en la C y 100 en la D.

4.5 Los Parmetros: Son cualquiera caracterstica que se pueda medir y cuya medicin se lleve a cabo sobre todos los elementos que integran una poblacin determinada, los mismos suelen representarse con letras griegas. El valor de un parmetro poblacional es un valor fijo en un momento dado. Ejemplo: La media Aritmtica = (mu), La desviacin Tpica = , (Sigma) etctera. 4.6 Dato estadstico: Es un conjunto de valores numricos que tienen relacin significativa entre s. Los mismos pueden ser comparados, analizados e interpretados en una investigacin cualquiera. Se puede afirmar que son las expresiones numricas obtenidas como consecuencia de observar un individuo de la poblacin; por lo tanto, son las caractersticas que se han tomado en cuenta de cualquiera poblacin para una investigacin determinada. 4.7 Frecuencia: La frecuencia es el nmero de veces que se repite (aparece) el mismo dato estadstico en un conjunto de observaciones de una investigacin determinada, las frecuencias se les designan con las letras fi, y por lo general se les llaman frecuencias absolutas. 4.8 Distribucin de Frecuencia: En estadstica existe una relacin con cantidades, nmeros agrupados o no, los cuales poseen entre s caractersticas similares. Existen investigaciones

relacionadas con los precios de los productos de la dieta diaria, la estatura y el peso de un grupo de individuos, los salarios de los empleados, los grados de temperatura del medio ambiente, las calificaciones de los estudiantes, etc., que pueden adquirir diferentes valores gracias a una unidad apropiada, que recibe el nombre de variable. La representacin numrica de las variables se denomina dato estadstico. La distribucin de frecuencia es una disposicin tabular de datos estadsticos, ordenados ascendente o descendentemente, con la frecuencia (fi) de cada dato. Las distribuciones de frecuencias pueden ser para datos no agrupados y para datos agrupados o de intervalos de clase. 4.9 Distribucin de frecuencia para datos no Agrupados: Es aquella distribucin que indica las frecuencias con que aparecen los datos estadsticos, desde el menor de ellos hasta el mayor de ese conjunto sin que se haya hecho ninguna modificacin al tamao de las unidades originales. En estas distribuciones cada dato mantiene su propia identidad despus que la distribucin de frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han sido solamente reagrupados, siguiendo un orden lgico con sus respectivas frecuencias. 4.10 Distribucin de frecuencia de clase o de datos Agrupados: Es aquella distribucin en la que los datos estadsticos se encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase. No existen normas establecidas para determinar cundo es apropiado utilizar datos agrupados o datos no agrupados; sin embargo, se sugiere que cuando el nmero total de datos (N) es igual o superior 50 y adems el rango o recorrido de la serie de datos es mayor de 20, entonces, se utilizar la distribucin de frecuencia para datos agrupados, tambin se utilizar este tipo de distribucin cuando se requiera elaborar grficos lineales como el histograma, el polgono de frecuencia o la ojiva. La razn fundamental para utilizar la distribucin de frecuencia de clases es proporcionar mejor comunicacin acerca del patrn establecido en los datos y facilitar la manipulacin de los mismos. Los datos se agrupan en clases con el fin de sintetizar, resumir, condensar o hacer que la informacin obtenida de una investigacin sea manejable con mayor facilidad.

5. Componentes de una distribucin de frecuencia de clase 5.1.- Rango o Amplitud total (recorrido).- Es el lmite dentro del cual estn comprendidos todos los valores de la serie de datos, en otras palabras, es el nmero de diferentes valores que toma la variable en un estudio o investigacin dada. Es la diferencia entre el valor mximo de una

variable y el valor mnimo que sta toma en una investigacin cualquiera. El rango es el tamao del intervalo en el cual se ubican todos los valores que pueden tomar los diferentes datos de la serie de valores, desde el menor de ellos hasta el valor mayor estando incluidos ambos extremos. El rango de una distribucin de frecuencia se designa con la letra R. 5.2.- Clase o Intervalo de clase.- Son divisiones o categoras en las cuales se agrupan un conjunto de datos ordenados con caractersticas comunes. En otras palabras, son fraccionamientos del rango o recorrido de la serie de valores para reunir los datos que presentan valores comprendidos entre dos limites. Para organizar los valores de la serie de datos hay que determinar un nmero de clases que sea conveniente. En otras palabras, que ese nmero de intervalos no origine un nmero pequeo de clases ni muy grande. Un nmero de clases pequeo puede ocultar la naturaleza natural de los valores y un nmero muy alto puede provocar demasiados detalles como para observar alguna informacin de gran utilidad en la investigacin. Los intervalos de clase pueden ser de tres tipos, segn el tamao que estos presenten en una distribucin de frecuencia: a) Clases de igual tamao ( es el caso ms utilizado ) b) Clases desiguales de tamao c) Clases abiertas ( se ubican en el principio y el final de la distribucin de frecuencias y son necesarias cuando unos pocos datos se alejan mucho de la mayora tanto hacia arriba como hacia abajo evitando as clases intermedias vacas ). 5.3.-Amplitud de Clase, Longitud o Ancho de una Clase La amplitud o longitud de una clase es el nmero de valores o variables que concurren a una clase determinada. La amplitud de clase se designa con las letras Ic. Existen diversos criterios para determinar la amplitud de clases, ante esa diversidad de criterios, se ha considerado que lo ms importante es dar un ancho o longitud de clase a todos los intervalos de tal manera que respondan a la naturaleza de los datos y al objetivo que se persigue y esto se logra con la prctica. 5.4.-Punto medio o Marca de clase El centro de la clase, es el valor de los datos que se ubica en la posicin central de la clase y representa todos los dems valores de esa clase. Este valor se utiliza para el clculo de la media aritmtica. 6.Frecuencia de clase A la frecuencia de clase se le denomina tambin frecuencia absoluta y se le

designa con la letra fi. Es el nmero total de valores de las variables que se encuentran presente en una clase determinada.

7. Frecuencia Relativa La frecuencia relativa es aquella que resulta de dividir cada uno de los fi de las clases de una distribucin de frecuencia de clase entre el nmero total de datos(N) de la serie de valores. Estas frecuencias se designan con las letras fr; si cada fr se multiplica por 100 se obtiene la frecuencia relativa porcentual (fr %).

8. Frecuencias acumuladas Las frecuencias acumuladas de una distribucin de frecuencias son aquellas que se obtienen de las sumas sucesivas de las fi que integran cada una de las clases de una distribucin de frecuencia de clase, esto se logra cuando la acumulacin de las frecuencias se realiza tomando en cuenta la primera clase hasta alcanzar la ultima. Las frecuencias acumuladas se designan con las letras fa. Las frecuencias acumuladas pueden ser menor que (fa< que) y frecuencias acumuladas mayor que (fa>que).

9. Frecuencia acumulada relativa La frecuencia acumulada relativa es aquella que resulta de dividir cada una de las fa de las diferentes clases que integran una distribucin de frecuencia de clase entre el nmero total de datos (N) de la serie de valores, estas frecuencias se designan con las letras far. Si las far se multiplican por 100 se obtienen las frecuencias acumuladas relativas porcentuales y las mismas se designan as: far %.

10. La mediana La mediana (Md) es una medida de posicin que divide a la serie de valores en dos partes iguales, un cincuenta por ciento que es mayor o igual a esta y otro cincuenta por ciento que es menor o igual que ella. Es por lo tanto, un parmetro que est en el medio del ordenamiento o arreglo de los datos organizados, o sea la mediana divide la distribucin de datos en una forma tal que a cada lado de la misma queda un nmero igual de datos. Para encontrar la mediana en una serie de datos no agrupados, lo primero que se hace es ordenar los datos en una forma creciente o decreciente y luego se ubica la posicin que esta ocupa en esa serie de datos; para ello

hay que determinar si la serie de datos es par o impar, luego el nmero que se obtiene indica el lugar o posicin que ocupa la mediana en la serie de valores, o sea la mediana ser el nmero que ocupe la posicin central.

11. La moda La moda es la medida de posicin que indica la magnitud del valor que se presenta con ms frecuencia en una serie de datos; es pues, el valor de la variable que ms se repite en un conjunto de datos. De las medias de posicin la moda es la que se determina con mayor facilidad, ya que se puede obtener por una simple observacin de los datos en estudio, puesto que la moda es el dato que se observa con mayor frecuencia. La moda se designa con las letras Mo.

12. Desviacin tpica o estndar Es la medida de dispersin ms utilizada en las investigaciones por ser la ms estable de todas, ya que para su calculo se utilizan todos los desvos con respecto a la media aritmtica de las observaciones, y adems, se toman en cuenta los signos de esos desvos. Se le designa con la letra castellana S cuando se trabaja con una muestra y con la letra griega minscula (Sigma) cuando se trabaja con una poblacin. Es importante destacar que cuando se hace referencia a la poblacin l nmero de datos se expresa con N y cuando se refiere a la muestra l nmero de datos se expresa con n. La desviacin tpica se define matemticamente en funcin de su objeto de estudio como: Desviacin estndar poblacional:

Deviacin estndar muestral

12.1 Interpretacin de la desviacin estndar La desviacin tpica como medida absoluta de dispersin, es la que mejor nos proporciona la variacin de los datos con respecto a la media aritmtica, su valor se encuentra en relacin directa con la dispersin de los datos, a mayor dispersin de ellos, mayor desviacin tpica, y a menor dispersin, menor desviacin tpica. 13. Varianza Es otra de las variaciones absolutas y la misma se define como el cuadrado de la desviacin tpica; viene expresada con las mismas letras de la desviacin tpica pero elevadas al cuadrado, as S2 y 2. Las formulas para calcular la varianza son las mismas utilizadas por la desviacin tpica, exceptuando las respectivas races, las cuales desaparecen al estar elevados el primer miembro al cuadrado. Matemticamente: Varianza Poblacional:

Varianza muestral:

er tabular, grfico o numrico. El anlisis que se realiza se

Você também pode gostar