Você está na página 1de 4

Actividad p2p Modulo 2.

Estadstica Descriptiva: Medidas de Sntesis "Using Cigarette Data for an Introduction to Multiple Regression", by Lauren Mcintyre in Volume 2, Number 1, of the Journal of Statistics Education. Estudios realizados con anterioridad ponen de manifiesto que incrementos en el contenido de alquitrn y nicotina de los cigarrillos vienen acompaados por incrementos en el monxido de carbono emitido al fumar. Las variables analizadas en el presente estudio se presentan a continuacin: X1 Alquitrn (mg) 4.1 16 29.8 8 4.1 15 8.8 12.4 16.6 14.9 13.7 15.1 7.8 11.4 9 1 17 12.8 15.8 4.5 14.5 7.3 8.6 15.2 12 X2 Nicotina (mg) 0.86 1.06 2.03 0.67 0.4 1.04 0.76 0.95 1.12 1.02 1.01 0.9 0.57 0.78 0.74 0.13 1.26 1.08 0.96 0.42 1.01 0.61 0.69 1.02 0.82 X3 Peso (g) 0.9853 1.0938 1.165 0.928 0.9462 0.8885 1.0267 0.9225 0.9372 0.8858 0.9643 0.9316 0.9705 1.124 0.8517 0.7851 0.9186 1.0395 0.9573 0.9106 1.007 0.9806 0.9693 0.9496 1.1184 Y Monxido (mg) 13.6 16.6 23.5 10.2 5.4 15 9 12.3 16.3 15.4 13 14.4 10 10.2 9.5 1.5 18.5 12.6 17.5 4.9 15.9 8.5 10.6 13.9 14.9

CLASE Alpine Benson&Hedges BullDurham CamelLights Carlton Chesterfield GoldenLights Kent Kool L&M LarkLights Marlboro Merit MultiFilter NewportLights Now OldGold PallMallLight Raleigh SalemUltra Tareyton VERDADERO ViceroyRichLight VirginiaSlims WinstonLights

Tania I. Loredo L.

Pgina 1

Para la realizacin del anlisis estadstico se utilizaron las medidas de tendencia central Media y Mediana, as como medidas de dispersin que muestran la representatividad de cada una de stas. A continuacin tenemos una tabla de frecuencias de las variables, as como la Media de cada una de stas, la desviacin estndar, la varianza y el error tpico.

El tamao de la muestra es de 25, puesto que en el estudio se utilizaron 25 distintas marcas de tabaco. Lo que podemos observar a travs de la tabla anterior es que la variable con mayor variabilidad es el alquitrn, ya que como puede notarse, su coeficiente de variacin es el mayor de todas las variables implicadas en el estudio (ver tabla *) Coeficiente de variacin Alquitran 0.4973206 49.73 * Nicotina 0.4043390 40.43 Peso 0.0904081 9.04 Por otro lado, tambin encontramos que la variable "Peso" es la que tiene la media ms representativa, ya que es la que presenta una menor desviacin estndar. Por ltimo, en la tabla se muestra que la Media ms estable es la de la variable Nicotina, ya que dicha Media es la que presenta menor variabilidad, dicha informacin la corroboramos con lo mostrado en el error tpico que a continuacin se presenta: MEDIA alquitrn 11.816 nicotina peso 0.876 0.970284 ERROR T. 1.17527 0.07084 DESVIACION REPRESENT 5.87634 17.69234 0.354201 1.230201 1.0580055 ESTABILIDAD 12.99127 0.94684 0.9878283

0.0175443 0.0877215

Tania I. Loredo L.

Pgina 2

En el estudio tambin se utiliz la medida de tendencia central Mediana, as como su respectiva medida de dispersin que nos habla de su representatividad: El recorrido intercuartilico. Esto con la finalidad de observar qu posiciones de la distribucin ocupan cada una de las variables. La Mediana es el valor que separa por la mitad las observaciones ordenadas de menor a mayor, de tal forma que el 50% de estas son menores que la mediana y el otro 50% son mayores. Partiendo de dicha informacin podemos notar que la Variable peso es la que presenta menor dispersin en cuanto a sus datos.

A continuacin se presenta una tabla con el recorrido intercuartilico de cada una de las variables: recorrido intercuartilico 5.9000 7.2500 0.3500 0.0963

Q3 monoxido carbono alquitrn nicotina peso de 15.6500 15.1500 1.0300 1.0169

Q1 9.7500 7.9000 0.6800 0.9206

Por otro lado, tambin podemos observar que la Variable Alquitrn es la que presenta una mayor dispersin de sus datos, pues en el recorrido intercuartilico se observan un nmero mayor de outliers. Como se mencion anteriormente, la Variable que presentaba una mayor dispersin, segn la medida Media es el Alquitrn, pues su coeficiente de variacin es el ms alto. Ntese que al analizar la Mediana encontramos que la misma Variable presenta mayor dispersin, pues su recorrido intercuartilico es mayor.

Tania I. Loredo L.

Pgina 3

Box plot (diagramas de caja)

Las conclusiones que podemos extraer de los anteriores box plots son: La variable Alquitrn muestra una asimetra en cuanto a su distribucin. Nicotina menor dispersin que acompaa el valor de la mediana, segn su recorrido intercuartilico. Todas las variables son asimtricas, esto es, que existe una desviacin. Por lo que no se comportan como una normal. Existen los outliers, que en un anlisis de medias generaran sesgos importantes. El alquitrn tiene un outlier por encima de los bigotes de la caja, la nicotina tiene un outlier muy por encima de los bigotes de la caja y un outlier por debajo de los bigotes de la caja y el peso tiene outliers menos distantes por encima y debajo de los bigotes de la caja.

Tania I. Loredo L.

Pgina 4

Você também pode gostar