Você está na página 1de 6
CAPITULO UNO Introduccion y estadistica descriptiva 1.1 Introduccion Para mucha gente, estaditca significa dscripciones numéricas. Eto puede verii- care faclment al escuchar, un domingo cualquiera, a un comentarsta de elevisibn ‘arrar un juego de fol. Sin embargo, en érminos mis precsos, la estaistica es fs aleatorios. En este sentido la cencia dela estadistca tiene, ‘itualmente, un alancelimitado de aplicaciones en un espetro tan amplio de is: ciplinas que van desde las cencias y la ingeniera hasta las leyes y la medicna, ELas- ‘ecto mas importante dela stadia es la obtencion de conclusions basadas eno alos experimentaes, Este proceso se conoce como inferenca etadiica. Si una conclusion dada pertencoe a un indicador econémico importante o a una posible ‘oncentracion peligrosa de cierto contaminant, o bien, sis petendeestablecer una felacio entre fw ineidencia de eéneet pulmonar ye Tuma, es muy comin que Ta ‘conclusion extébasada en la inferenciaextadistca. Para comprender la nauraleza dela inferencia estaditica, es necesario entender las nocons de abla x musta, La poblacin ca colecion dea a pose informacion que caracieriza aun fendmeno. En estadisic, poblacion es un concep- ‘to mucho mas general del que tiene laacepeion comin de eta palabra. En este sentl- 4o, una poblaién es cualquier coleeién ya sea de un nimero finite de ediciones © ‘una colecion grande, vrtualmenteinfnita, de datos acerca de algo de interés. Por otro lado, la muestra es un subconjunto representatvo selecionado de una pobla- dn. La palabra represenativo es la clave de eta idea. Una buena muestra es ucla que refles ls caracteristicas eencales de! mT En etadistica, el objetivo de las ténicas de mucsreo es aseyurar que cada observa- ‘in en Ia pobiaion iene una oportun independiente de ser incuida € {i mesua, Tales proceos de muesueo couducen a una muesraaletora. Las ob- Servacionss de la muestc aleatoria se usan para calcularclerasearactersticas de a muestra denominadasestadisticos, Las estadistcas se usan como base para hacer in {erencias acerca de certascaracersticas de la poblacon, que recben el nombre de 2 Invoduccion yetedisia descptve _pardmetrs. As, muchas veces se analiza la informacion que contiene una muestra ‘leatora con el propOsto principal de hacer inferencias sobre Ia naturaleza de la poblacin de la cua se obtuvo la muestra En extadistca Ia inferencia es inductiva porque se provesta de lo especifco (anvesra) hacia lo general (poblacién). En un procedimiento de esta naturaleza siempre existe la posibilidad de error. Nunca podrd tenerse el 100% de seguridad Sahce uns proposcion que se bate en la inferencia etadstica, Sin embargo, [a que hace que la estadistica sea una cenca(separandola del art de av hace que estadition sea una iencia (rpardndoa del arc de adivinr fa (octuna) ‘uni a cualquier proposicion, existe una media de ls-confiablidad de és, SSones i Snfae ns roca de come Peo re Tabras, para cada inferenciaestadisica se Wentifica la probabilidad de que la infe- Ts problemas eiadisicos se caracerizan por Tos Sgutentes cuaifo Aemenion 1. La poblacion de interés y el proedimiento centifico que se empled para mues- tear la poblacén, 2, La munca y ol andlicie matemitico desu informacién 3, Las infeencias estaisticas que resulten del andlsis de la muestra. 44 La probebilidad de que las inferenias sean correctas Bt enfogu precedente para la iferenca etasica descansa dniamente en Jncvidenca muestra Este es denominado tava del musteo oenfogue cisco des inferencia exadisicay pra la mayor parte de a, seth que se tome en et libro. ‘Sin embargo, tambien se trataré de incorporar ocsionalmente otro punto de vista conocido como nferencla busing, Esta forma de abordar la inerencia stadia ‘za la combinacion dela evidencia muestal con otra informacion, generalmente ‘roporcionada por el investigador det problema. Tal informacién descansa de ma- era fundamental ca a conven 0 grado de ceenci dl investgador con respeto ‘a inceridumbres del problema, antes de que se encentecaponiblelaevidenca imucrral ate grado de creenia puede barr on consieraconcs cm 1s rata os conocidos, ave son producto de invesigeciones previas. E> importante que} Ietorcomprenda que el objetivo de los provedimientosclsico ybayesiana descamsa ‘Siesta dear neridombres Seeds cn ls BOBBIE Para comprenderlaesencia del muesteoaleatoroy de Ta nferenciaestaistica, cs necesario entender come primer punto, la naturaeza de una poblacia ene com texto dela probabilidad y de los modelos probabilistices. Estos temas se examinan ‘con detalle en los capitulos dos a seis. iulo vatard brevermente las esto riptives. A pesar de que és {as sn sei vista ma a se ‘2cventra disponible is pobacin completa y no exbte iceridumbe, 0 cuando ‘Etlenen fs mano grandes conjutos de datos ave pustcno no con ‘Bates aston Snjeto prande ve conldera com mcs efor de ‘Eee plot, Inada descriptive puede itn lejor come a dsrbucton pone ral de valores al dar una evdenlaenpiiay tas caraceristcs dela poblain, a eve tene un aprecable valor puesto que afima certs suposiones que ‘eben formularseen la aplcacin dea inferencia etd, 1.2 Deseripcin fice de fos dats 3 1.2. Descripeién grifiea de los datos ‘Una deseripein informativa de cualquier conjunto de datos esté dada por la fre- cuencia de repeticion u areplo distribucional de las observaciones en el conjunto. Para aprcia To neesario de un resumen de datos, considere el ejemplo dl Servicio ‘de Hacienda Interno (SHI) que se encarga de recibir y proces milones de declara: ciones de ingresos durante todo el ao. Es dudoso que el SHI pueda descubri los patrones ocultos de ingresos e impuests examinando simplemente la informacion, contenida en las decaraciones. Similarmente, el Departamento del Censo no podria, avanzar mucho al analizar los datos de enso, sstos no pudiesenvsualizarse. Para idenifiar los patrones en un conjunto de datos es necesarioagrupar las observa clones en un niimero relativamente pequeno de clases que nose superpongan ene, ‘deta! manera que no exsta ninguna ambiguedad con respect ala clase aque perte- rece una observacion en particular. El numero de obseracionesen una clase recibe nombre de frecuencia de clase, mientras que el cocicne de una Frecuencia de ase {nn repeal nimerocombinaso de seraciones oda a i ne fern le de cde roe cee me soins iit, y Roane ee ee iis superar inferior ch depunto medio dea case. Al grater is Fecuensa raat de sla ont $s conte como Nitograma de recenca rela gdibucion de ecuncl lt ig ExtaGtima es la que puede hacer evident los patrones extents en un conjun- {0 de dats ‘Como istracion, los datos dea tabla 1.1 repesecan las feevencias de unidades vendidas por dia de un determinado producto por una commpafia.E} historama de ‘recuencia relativa se consruyegraicando ene je vertical la fecuenciarelativay én ef ee horizontal las fronterasinferores de cada clase, como se iusraen af sa LL EL nimero de clases que se emplea para clasificar los dats en un conjunto de- pende del total de observaciones en ése. Sil numero de observacions <3 relative: ‘mente pequeo, el nimero de cases a emplear seth cerano a cio, pero general- TABLA 11 Frecuncas para numero de udadesvendidas de eno producto Frecuencia relative 7/100 = 007 ayo = 0.20 “7100 = 005 100 = Dat /100 = 0.1 Bf = O12 00 = 0.06 s/o) = 008 100 4 Invoducion y esaditica descriptive 0.20 os o10 Frecuencia relativa 0.05 ‘wo 90 100110 1201301460150” 160.170 FIGURA 14. Hitogama de tecuecia relative para el nimero de nidades vend ‘mente aunca menor que este valor. Si esse una cantidad sustancal de datos.cl ni ‘mero de clases debe encontarse entre och EiSaaas on nce muy peoete de cnes pose onal btn el et ‘onjunto de datos, mientras que un nimero muy grande puede dejar sin observa clones a algunas de las clases, limitando de esta forma su uso. A manera de lust lon, 5 se reducen las nueve clases aslo tes, en el ejemplo anterior, como se indica nla tabla 1.2, el histograma de frecuencia felatva resultante (Fig. 2) es muy dife- Fete al mosirado en la figura 1. ‘Vas beens préctca es la creacion de clases yuctengan una longitud igual. Esto ‘puede lograrse tomundo la diferenia entre los dos valores exiremos del conjunto de Gatos ydividindola entre el nimero de clases el rerutado serd apronimadamente a loagitud dl intervalo para cada clase. Sin embargo, existen casos donde esa regla ‘no puede ono debe apicarse. Por ejempio, sie tuveraala mano [a lista de impues- ios de SHI pagados por la poblacin en un afo estas cantidades pueden encontarse ‘TABLA 1.2 Frecuencia pra el mero e unidadervendldts de certo producto “Nimero de ideder Frecuencia de ‘adae Frecuencia relative 2 32/100 = 032 Me satan = O34 M satan = O34 100, 1.00 1.2 Desripion erica de as dots '$ 30110 4170 [Namero de unidadesvenidas FIGURA 12 Histogama moificado pra el numero de widads vendita nun imervalo de $0 $1 000000. Aun a pesar de que eeligesen 20 clases para la Gisribucion de frecuencia rlativa, con intervals de igual longitud, cada clase tendeia una cobertura de $80 000. Lo anterior daria origen a una stuaion en la que «asi todas as observacioneseacian en la primera clase. Para casos como éste es pre- {erble selecionar una escala mis pequeta en el exremo incal que la utlizada para el extremo superior Esta elecion aclarar el patron de la dstribucon ‘Los siguientes ejemplos ilstran ests conceptos. jemplo 1.1. De acuerdo con la revista Informes al Consumidoren su nimero de febrero de 1980 as cvotas anuales de 40 compan para un sexuro de $25 000 para hombre de 35 aos de edad son las siguientes: sm 8 Ow 2 8 SSSR 8 9 100100 HOY OY H03 103103 tt Ws 10506 tT tT tot [Esablecer un esquema de agrupamiento para este conjunto de datos y determinar Jas freeuencias relativas, Dado que la diferencia entre los dos valores exremos del conjunto es de silo $09, puede er razonabe agrupar los datos en clases con intervalos de igual longtud. Suplinence que ee deide wir ere cages entonoes el interval de cada lace srk aproximadamente de $5. Para esablcer las Fronteras de cada clas, es necesario ‘consierar la unidad mas ceeana con respect ala cual se miden las observaciones. En ete ejemplo las cuotas se presentan redondeadas al dar mas cercano. Con toda seguridad el importe de las cuotas es conocido hasta centavos, pero soo se presentan entre $81.50 y $82.49, lasses clases con sus respectvasfrontras son (81.586.8), (@6.591.5), (91.595.5, (965-101 3), (1015-106. y (1065-1115). [Exasfronteras tambien se concen como los limites verdaderos debido a que ‘eflejan la unidad mis pequehia que se emplea para tomar las obsevaciones. Dado ‘gv las cvotes » prevntan redondeadae al lar mis cercane, oe puede también lepir los limites de las sis clases como (82-86), (87-91), (92-96), (97-101), (102106) ¥y (07-111), Estos se conocen como ls limites deescritura puesto que rele} el ‘mismo grado de precision que el de as observacionespresentadas, El interval dela clase es la diferencia ett los limites verdaderos de cada case, mientras que los pn- tos medios pueden determinarse al utilizar los limites verdaderoso ls de esritura, En la tabla 1.3 se da un resumen dela informacion pertinente para el agrupamiento e este ejemplo. Deacverdo con lo mencionado al principio de esta sein la cstribucién de fre: cuencia relativa se determina graficando las fecuencias eativas en el ee vertical contra os limites deesrturainferiores para cada una de as clases ene ej horizon- tal, Para este fin se emplean receingulos de igual anchura que represeten las fre- ‘evencias reatvas. En la figura 1.3 se muestra el histograma dl ejemplo 1.1. Notse ‘Gocco mis fail gaficar las (recuencas de cada clase ucla eomenpundicites fe {evencias reativas; en ambos casos la réficasserinidémias. Siexste alguna prefe- ‘enca para usar las fecuencias relatvas, se debe a que la escala vertical tiene un in- terval fijo de cero a uno. EL principal objetivo dela cepresentacin gréfca dels fecusncis relatives 3 smoster el perfil de isrTbucion de ls datos. Fl conocimiento de este prfies itil en ‘arias formas, como sugeran los andisis apropiados que se intentaran mediante la inferencia etadstica, 0 silos datos constituyen una muestra aletora de alguna poblacién os se utlizan con el fin de compara los perfiles de dstribucion de dos 0 sms conjuntos de datos. Enel ejemplo 1-1. es notorio que la dstribucion de cuotas ‘anuaes en las 40 compafias es uniforme a waves de todo el intervalo de valores. ‘Qua caracterizacion grfica itl, de un conjunto de datos, ela disibucin de Gecuencia relative arumulade v oui, La distibucion acumulativa se obtene ara ‘Sando, ei-el je vertical a freceuea elativa acuimualiva de une ease contra el ‘TABLA 13 Agopanintoy frecuencia telativs para el ejnplo 1.1 a0 0 0, 10 1140 = 0.178 1.000

Você também pode gostar