Você está na página 1de 42
‘TOPICOS Dx ESTADISTICA DESCRIPTIVA ¥ PROBABILIDADES __twervtas fi {1800 000;2 340 000) 2 830000) 7 420000) io 990.000) 16 590000) 16 040.000) 5 4a) Halle el promedio de fa demanda diaria do agu. R, 36572727 ) Halle a medians. 2371076923, ©) (Qué porcontyje de la demandia excede la capacidad de la planta? BR. 1S157% . 42. De una muestra de tamafio 3 se sabe que = 183 ola mediana ec 6 a) La med itmstice es7 Dacua _haje concentrazion, Bejadispersin <————» alta concentacién Las medidas de dispersion que se ulizan 1) Recorrido 9 rango 2) Recocrido imtereuerilica yor frecuencia son ‘TOPiCOs De ESTADISTICA DESCAWTIVA Y FROSABILIDADES 4) Desviaciin media 5) Vatianza y desviacion estandar 23.1 Recorrido dea Variable Definiciin 14.- Bl recorrida de una variable estadistica es simp! diferencia entre! su valor méximo y su valor minime, y se denota por R= maz[x} — min{X) EJ uw det rango como medida de dispersién os muy limitada, pues si bie tuna primera idea acerca de la Heterogencidad de les datos, dene el ue slo toma en eventa los valores extremos descuidande el con imiedios. Puede sucsder quo uno de les valores Ex desplazado ¥ no constituye por tnt un valor 1e tecorido seria exgerado y la disprs de valores ex€ aceidentalmente lativo; en este caso el n apateveria distorsionaca, 23.2 Recorrido Imercuartiice Com Ios cuartiles son tres puntos (valores) que ividen un ordenamiento de los datos © una distribucién de frecuencias en 4 grupos aprotimadamente iguales, ‘entonces la medida dada por B= nada amplitad o recorrido intercuartlico incluye los valores centrales Si bien es cierto que este indicador representa vn adelanto respecto del embargo, depende de dos valores de In variable, dejando de lado el resto y, en consecuencia, ta infiuencia de valores extremos pusde, originaralgin tipo de «efor: 1ue.en menor medida, n en cuanto al grado de dispersion 233 Rocorrido Intereuartilico stl IP Ol at bali neath dour = %5=% z tncupada por el 50% de fes valores Qs, 100 MEDIDAS, TENDENCTA CENTRAL ¥ DISPERSION 234 Desviacion Media a Promedio La desviacion media o desviacion promedio es simplemente ta me de los valores absolutos de las desviacienes de todos los valores res unto central, el como la media © la mediana, Formalmente, tenemo definicisn: Sean xy.%2) 1X, valores de Ia vatiable X, con S ful von fey tespectivamente. La desviacién media de X re promedio p es dada por =31 2 donde n= La formula pare In desvi Dy) = BE 1 con reepecto a ka mediana es y(t) = BSAA 5 py(x)= hla —81 son las freevensias celativas. | recorrida y en eueata cada elemento y, adeinés, es le se ve nienos afeetada por la presencia de valores extremos. Por lo tanto, se uss a menuéo en muestras pequefias que incluyen valores extemos. principal deficlencia de I desvincion promedio surge del hecho de que ppromedia Ios valores absolitos de les desviaciones, esto, que no reconnce el 0 de las desviaciones, Esta hace que sea menos convenientemente que la desvieeiin estindar (que se describied en la sigiiente seccié) cuando se requiere una medida de disnensén para ser usads en edleulos posteriores. 10) futst6) [ie:18) | ( 155.2 6} By) =? = 3104 Sean Xp zrmZe valores de lu variable X, son free Far ms fas Fespectivaments 102 MEDIDAS, TENDENCIA CENTRALY Ol Observacién 6 La varianza podlatio poblacional 4, est es, a - Daft — 0? = Teh 0* se define 0 done W-= 5" eseltanate de pablo. Observe La fornuule acterior de la varianza m porque proporciona fa se ha extraide ta al usa cominmeme en estadist eka sjorestimacidn de la varianza poblaci ‘tra, Una formula alternative. para ta _ Shs hei 3) st Observacibn 8. = 0, eneniemos que todos les valores x; coinciden c media ¥, esto es, todas Jas cbservaciones estan concentzadas en un ‘ispersion es minima (nul Definicién 1 define come la La desvinciin estindar 0 tipica de los valores de lu variable X se iz cuadrada positiva dela varianza, y se denota por = 0. La vatianzade una variable.X es siempre pi ‘cero cuando ta Variable X toma el valor constante C, esto es, yes igus arc] = 0. 2. YarlX + C] = Varl Demostracion, Como MIX + C]= MITE CMR HG, sntontes se tiene a, £0) ~ P+ Ey? Wart tj eMule 2 of Melis -%)° a1 CRIETIVA,¥ PROBABILIDADES = varlx] Conforme a es:a propiedad, se dice que ta vari te Ca los valores de In variabi in del origen no altera el valor num 3. Varlex] = c?Var| fanza no se akera al sumar una 10 que es equivalente a que una ela varianza. C= constante §. Var[cx +0) = c?var(x], C y b constantes 5. Sean sy Rs las muds de doy submuesias de tumato my Me ecivamnerte y sein SP 62 los vatonzis Correouticates. La varann usta de camato 1 =n, +715 es daca por: # 1 UST + Me — sf + 4%, - %Y + n(¥, —X,7] donde Xy os lames ponderada te, y Ky Esta propiedad ve puede generalicar para un numero | L de subsmuestas, esto es o Warianza. Este estadigrato representa la fbmucsttas. segundo término de (*) se Usinatntorvaisnza, Este estaderato 2 a resent la variabildad entre ls estrazos. males sobre las demis medidas de dispersisn 7 La dessiacién esamdar es de ia misma naturaleza que ly va de su nage ble X y depende Joe MEDIDAS, TENDENCIA CENTRAL ¥ DISPERSION 4. Para distribuciones simétrices, esilta Brae 8) F168,27%% de los eases estén comprendigos enite ¥—8 y F 4S. ¥-2s y +25, es10 iuados dentro de dos 5.43% de las casos estén comprendidos ent es, aproximadamente 95% dz los casos estén unidades de desvizcisn estindar de le media, +e ©) E199,73% de los casos estén comprendios entre X— 35 y X +38. tx 2.2.52 Métodos abrevindas para el eéleulo de In Varianra y Desvisciin Rstindar A) Primer método abrevindo. lad de reducit al volumen de operaciones en el cilevlo ds la varianza Sp ealdndar, se usan las siguientes féemulas 105 TT a. ~ See 0, ‘TOPICOS DE ESTADISTICA DESCRIPTIVA ¥ PROMABILIDADES ormules respectivas, xe tone 429 jee a 16 Ee cal 1 F $= Ea /D fat — nt = 3 t1003 — 00976] = (35,24) = 2.22 Lucgo, S = VB22 = 1.49, B) Segundo mécode abreviato. 9) el valor mas frecuente de Ta variable X 0 que esté hacia el cemiro de fa distribucién de frecuencias. y sea de x; respecto 4 0, . Enconces se tiene 4 = d +0, Eee og F=0,454 106 MEDIDAS, TENDENCIA CENTRAL ¥ DISPERSION : SED NDP TY fe 0-H ft -= Ste a [ora a] Por tanto, ie uside cuando los datos son agrupados en frecuercias con intervalos de clase de ak e trabajo seleccionado convenientemente entre los puntos de Ios clases y= wansiormadas 4%, = valores originales ce la variable lo Paso. Se calcula ia media aritméticn X usando Ja firmula lavarianza S% + Cu; ~ 0, - Ci 5 Hc - cy SS Ht HY sTICA DESCRIPTIVA ¥ PROBABILIDADES fara ss [> iat —nc| y a “TOPICOS DE ES: MEDIAS, TENDENCIA CENTRAL Y DISPERSION [2 & at cae [5 [on z00— 1s | = [40552 = 11,939 1 oe \ ‘Al usar fa férmuta para calcular In desviacién estindar por el lercer método, se obtiene Ejemplo 33: Daca ta distribueign de frecuencias de 150 personas segin su eda, onl ta desviacion esting 1 Th 1 3B)" = #— n(Uy} = 10 | ana - 150 (2 ee +e 21S wt =o, fa) lad (20: 20) | 130;40) | 140;50) | 150,60) 4 x N? de personas a 40 = 10 TFESS = 11,939 Bjemplo 34: Los pesos en gramos (apreximados hasta 0,01 gremos) de 70 rimidos fabricidos autométicamente por una miquina estén representados en ome able iamies pasos: Primer paso: Sea O;— 45 (marea de clase det frecuencia), Adcmés, PTntervalos Frecuencies acumuladas (K,) a 4 2 = ; [1.828; 1675) 26 the || a fins | fa (1.875:1,728) 49 SO | So] 30] a ca 220 | 2200 2} 2 a 0 o ices leah 69 19 | 400 | 4000 a | 40 3 | 2 | soe | 10coo 50_| 100 — [380 [2200 38 | 2 | a) Calcule la media, ) Caloue Ia desviacién estindar. je de productos entre X— 1.55 y X +155. Segundo paso: la desviacin 77 (marca de clase del intervalo con més alta frecuencia). Ademas sea, ty = A 6 = 005, Para ten: cileulos ordenados, es convenient formar la sigut 18 109 Marea de clase x; Tal ozs) | 1 1S a) 4 |: 6 575) | 3 15 a] ae | oa 628) | 8 16 2 | 6 | 32 | 675) | 14 165 1 | 4] 728) | 23 17 o}|ojo 775) | 12 1,15 1 R 825) | 7 18 2 8 875) | 1 135 3 ° {1.875;1.925) | 0 4 0 [925:4.975) | 1 5 2s TOTAL 0 ms a) F-0,46: en Gal = 1o0sees Lucgo, 5 = [0005864 = 0.07658. 2) Losvalores de —1,55 y ¥+155 son: F-1,55 = 1,6936~ 1,5(007658) = 157875, X 41,58 = 16936 +1,5(0,07658) = 1.90847 Para eal lar el porcentaje de productos que tensn sus pesos enw 1.57873 y 1.80847, se interpola de la siguiente maners pa peoaeeneneely LSTSismn LOS 167s LTS TTS tans 1.825 i ee 8 Sea N = niimero de productns que tienen sus pesos enue ¥ — 1.5.8 y Emionces, eae) 0847 ~ 1.775) ax aers+ ies MEI), gy 0 MEDIDAS, TENDENCIA CENTRAL ¥ DSPERSION Por tanto, el porcentaje de producios que venen-sus pesos enire F— 4,55 y RF1SS es 61 P= Fy™ 100 = 07,143% 23.6 Medidas de Dispersién Relativa Las medidas de dispersién que se han descrito en la seccién anterior Se expresan les de medida, tales como metros, kilos, ete. Se pucin jaar pata compara la varineiin de das distribuciores siempre que las variables se expresen en las mismas unidades de medida y sean aproximedamente. del ‘nisin ramafo promedic. Sin emberge, 4 veces es necesario comparar dos eonjantos de datos expresados on unidades diferentes (tales como to luiesr y mettos ebbicos de kerosene). En estos cases [4g medidas de fen les wnidadles absoluta no son comparables y deben Defnicion 18: La medida celetiva de diapers para la comperacién ex 1éeminos relatives del grado. de coneentracion en yore @ la media de dos distibuciones aistintas. es dada por s me de Variacion: V == ¥ uma eoelicionts de dispersién perque “cosficiente” pero puro indspeadicme de la unidad de met tenefciente de varlacida st expresa como un porcentaje. Obserwiclin 9.- Ex la prtctica so ncost 50% indica alto grado de disp represent hea considerir que el CV. superior a id de la media acieméticn. Es nto mids representativa ovanto menor sea el C.Y. una empresa el sslario medio de los homéres es de S/.4 000 in estindar de Si. 1 500, mientras que et de las mujeres es desvincién estinéar de SI. 1 200. Halle et coeficiente de facion de Ina salarios de Ins hombres y mujeres. : ALaplicar la formula de coeficiette de variacion, se obtiene 1500 _ hombres. 6¥.= == T5 0375 a ‘TOvICOS DE ESTAnISTICA DESCRUDTIVA Y FROBADILIDALES _S_ 1200 Para musleres: CV.= = = 57 = Luego, podemos coneluir que los salarios de mujeres presentan mayor dispersion, relativa que los de los hombres. EI resultado del C.V, en porcentajes es Para hombres: C.V. = 37,596 Para mujeres: C.V.= 40% oa Ejemplo 36: EL C.V, de los ingresos de 200 empleados de la Universidad ‘Nacianal Magor de San Marcos es $79 Después de reajustar, segin ley, todos lon sueldos en Si! 1 100, este C.V. es ahora 50%. Si sueldo minima de S/.7 100. Antes del resjuste habian 35 persenias que tenia sueldo promedio de Si. 4 000 y todos ellos ganaban menos de S 7 100, Determine Ia cantidad de dinero que necesitark mensualmente la Universidad para pagar los sueldos después de hacer cftetives los reaustes. combergo, 1a Universidad Solteton: De acuerdo a os datos del problems, tiene s i ty S057.45-os7F a x 5 _. 950 2 5 =050[¥ + 1100] ¥+ i100 Se Luego, al igualur los valores de S, se obtiene 0.87% = 0,50(K + 1100) = 050% + s50 + F=7 557,14 Por tanta, X = 7857.14 esl salario promedio antes del reajuste Advis, extn_media esté compucsta por la ponderacién de las medias de dos srupor: 35 personas con ingreso medio de Si. 4 O00 9 165 personas con ingreso premedio %, que se obiene de _— _ 35(4000) + 165% rasras =x, = S00) + Lego, (7857,14)(200) = 35(4000) + 165%, 1571 428 = 140 000 + 165%. Entonces, %, = 1571 #28 - 140000 aS 165 Las nuevas medias aritméticas después de los reajusies ron: = 695,32 nz —— MEDIDAS, TENDENCIA CENTRAL ¥ DISPERSION primer grupe de n,= 35 persons tenéré un ingresa promedio de P= $/.7 100, 1) Bl segundo grupo de ra =165 perscnas rendré un ingreso promedio. ce ¥q = $/.8 675,32 + 1100 = S/.9 77532, a) Portanto, a cantidad ¢e dinero que necesitaré la Universidad es 6.D.= 35(7 100) + 165(9 775,32) = $/.1 961427, 2.3.7 Momentos Definieidn 19. Sean 2,2, «1.2% valores de Ia variable X asoctados a las frecueneias absoiutas fy, fa, fy tespectivamente. FEL momento de orden r respecto al pardmetro C es dado por Baio 5 MC) = = n=) fi En particular nos interesa dos casos: A) Momentos respecta af origen, Cuando C = 0, se iene los momentos respecto al origen y se denota por fleet Ss 3) Momentos respecto ala media. En ef cao en gue C=, se dene los momentos respecto a ia media 0 ‘momeatos centrales y se denots por at Bafa -2)_ : 0 fixe 4, Mafilu-¥) _ a % 3 i ‘TOPICOS DL USTADISTICA DESCRIPIIVA ¥ PROBABILIDADES, — ceserse desde el primer dla que comicara a tabla de informaciSn adjunta. rentas reapacto al origen de wentes contrales de orden pri eles, se bace los calcutos en lai mero, sequad y weer orden, ro y tereere, ' jente tabla ft |_ fed [ie | fi=xy 2 a 56785 24 ax 690 so | 270 -16,50 576 80 | 320 025 ~0,001 250 | 1280 950 8973 108 | 648 589 22.244 98 | 686 5.90 staat aya | 128 | 1024 790 123,250 40 [780 [4248 > 85, 9 » Mosments respzeto al oxigen j= ELE ME 4g wy Riel TO ps y m= Momentos respecte la media waEleD Oo y y 14 Eft =F? _ 51 eee MEDIDA, TENDENCIA CENTRAL ¥ DISPERSIN 23.8 Medidas de asimetria lay ocasiones en que es desecble caleviar una medida que muestre la direce! persis proveen inforiuacion donde tienden a ocurri kas variaciones, Las medidas 6m horkzontel de la eurve de frecuencias. Cuando ada o alergada hacia la derecha (ver Fig. 2.8), se mada hacia el lado ree ere Fig 28 Fig 25 23.81 Cocficientes de Asimetria Cuando se dispone de los valores de la media, moda, mediana, cuantiles y desviacion estandar, se debe utitizar Primer coeficiente de Pearson. __ Media=Meda__¥-%_3@-%) “ Desviaciinestindar =S SS Ay Si Ay = 0, fadisiribucion es simettica, Si As > 0. ladistribucion es sesgada hacia fa derecha, Si As <0, ladistripucion es sesgaula hacia el lado izquierdo, Es razonable pensar cue tiene sentido obtener estz coeficiente en dlistribusiones unimodales Segundo eoeficiente de Pearson. ‘TOPICES DE ESTADISTICA DESCRIPTIVA ¥ >RORADILIDADES Generalmente, este cocficiente se use cuando no se puede calcular Ja media y la desviacion estandar, i Si, Ag = 0, la distribuci6n.es simétrica, Si Aly > 0, la dstribucién es sesgada hacia ¢l lado derecho. Si As <0, Ja distribucién es sesgada hacia el lado izquieréo, Il) Coeficiente de Asimetria de Fisher. social por hea! ns? el coefcisnte de wsimetia por les dos procesor de [80:90). | 20] 50;60) | (60:70) | 170;80) a Solueion: Sean R=, _ 75 € 70 0.=78, w= Para caleular ta media, moda, custtiles y desviacion estindar, se construye le siguiente tabla [80:90) [90; 100) “MEDIDAS, TENDENGIA CENTRAL ¥ DISPERSION '] sacl o[) jut ny 25~ 15 aan Proceso: @; = 60 + 28) rn = 6s 50~ 35 R=q-74("—)10=75 a= 80+ (=) 10 = as Ape St Gia Ph _ 05 465-209) _ a a ‘85-65, resultado es igual jo 39: Calcule el sesgo para las asa do alguiler mensual de 200 que estin dadas en la siguiente tabla, Taras de Alquiler | [i80; 190) | (480,230) | f210;240) | (2405270) | ~_Nraedpos 3 8 10 Deas (300; 330) | (330: 360) [290 420), 0 35 0 Jer Proceso: ¥ = 6 yervalo con mis alta frecuencia) y 4-0, 4-315 € 30 x In media, moda y desviacién estindar, se have los cécalos en 1a iene tabla 17 ee ‘TOPICOS DE ESTADISTICA DESCKIPTIVA Y FROBABILIDADES MEDIDAS, TENDENCIA CENTRAL Y DISPERSION [ amervatos ii Fis Z Sol %, “32 | 10 30 [240;270) | 13 Se {270;300) | 33 = 300;330) |, 40 0 | [330:360) | 35 einige 20 a | vf 4 | 12 4g | 300 = Al susttuir fos totates de fas eolumnas en jas formulas respectivas, se obtiene Ha o,rc (EMH) «515+ 50/5) = ses.25 Oey = ams (-2,)30= 175 Aaty+ (5 526 aL) fet 0] ~ 20 55 [0 —200 (35) | ~ canes ge wah 2825-3175 “SO 62a4s = 0,09253 > 0 esgada hacia la deveeha, nde por curlosis el grado de dcformactén vertical de frecuencias. Con podemes tener curvas leplocinticas (Fig. 2.10), mesoctirticas ug reariee 5 Fig. 2.12 or ol yrado de apunianiente elo verti), se mitiza ol eveficients que so lenora por QO Larner) 10; Gy = primer cuertl = teroer cuadtl respondiente a la distribucion de | = 0,263, diremos que la curva cores i .cirtca {tiene igual apuntamionis que la normal 6 campana de va correspondiente a te distribucién de Aecencias es eprocirtica Inplo 40; Se han medido las pulsaciones de un equipo de atlras despues de unit carrera, Los datos odtenidas som mao) 17078) Aikeas | TOPICOS DF ESTADISTICA DESCRITIVA Y PROBABILIDADES ©) Diga qué tipo de apuntamieno earresponde a Is dletribucids, Solucién: Sean 0, = 87,5 (marca de clase del intervalo de masalta frecuencia) =o, x =875 wet $= = 10175, entonces [80:88 os la etaseaue contione « Q, ah 3 — 32,25, entonces[90;95) eset mtevaloque-comtienea 03 SOM = 381), entonces (95; 100) es elinterval Fap= 381, entonces (95; 100) es el itervalo que contiene a Pip 10n Jpg” 23 entonces (75; 80) es el tater nea Po op 7 25 entonces (75,80) iervalo que contienea i Luego, para tener todos los eilcules ondonados se vonstruye la siguiente tabla Fe Mae aoe [oe 3 fe [3 : ns |a 7) ws o| as fo ios fi2t ms ft ssCcne de guy too | | ms [2 | 6 | @ | oases [as cateae ry, Tome Te] Lispatsse] MEDIDAS, TENDENCIA CENTRAL Y DISPERSION ERE mea ae + s 1,285 Por tanto, Ja curva de fecuensias es sexgada hacia la Ixquienda ente deasimetta de Fisher es EfGe-TP_ 919555 _ geen cg AW nS ABET 28S En foci, la dstribucisn de recuoncas presenta ssimetia a izaverda ©) Los cuartils y los percendiles son pees) =50+( 5= 09385 or tento, el coeficiente de cuntosis es QB-G 93,85 - 83,39 8) Al sustituir los totaies de las columnas en las fermlas respectivas, se abtiene ees cole = lug t Neu soo G2e)s- oe) ae Fea)? Luego, el primer eveficiente ce asimesria le Pearson ce 120 IY sat nena=s i -n(@)]-28 = = = 0.2597 < 0263 © = WPag =P) BOTS 777) Luego, la curva de frecuencias es suavemente leplocirtica, TTOPICOS DE ESTADISTICA DESCRIPTIVA ¥PRORA EJERCICIOS panes _ MEDIDAS, TENDENCIA CENTRAL Y DISPERSION bb) os focos de eudl de les empresas tienen mayor unitermidad? Un fabricante de cajas de carton fabrica tes pos de cajas. Se’ prucba la resistencia de caja tomando una muestra de 100 cajas y se derermina la presion evesaria para romper caca caje. Los resultados de la prucha se muesiran a ccontimuacién: Tpedecae L« B Presion media de rupture 150__| 200 jacion estander de fas presiones de mupura | 40 [50 a) {Que tipo de caja presenta la menor variati6n absolute en la presign de uptura? RA Qué lipg de cee presenta fs mayor variacion 8) Determine el 8) Caleule el cou b iva en la presin do RA ‘Una publicidad sobre: presenta a siguionts distibucign de ki ‘dos por gilon de gasolita, segin reportes de los propietarios de coos 155,60) | (60:65) | (65:70) el ys ussa6) [foam | 2319 eat ea tas) | 9:20 | to:2n | tea | BO a) Determine la varianza por al método sbreviaéo, RAS jente de variacién? RM ine 14 ilémetros por galén con uno de los camiones, cién estindar se encuemra por debajo de ls 82 kilbmetres por gain’ Internacional ha perfeccionsdo un producto de consumo ssrrollo, A la luz de considersciones No es simét proveedores, En su proy probado ambas muesteas als duracton de su vida GU, obtenlendo Tos siguientes resultados ‘Mucsiras de thoes de lz jet fabricar su producto en los Empresa A a j es, Para hacer frente a los eritrios de inversion de la comps 1700: 500) To 3 1900; 1 100) 6 2 hogares con ingresos anuales de $400 6 mis. Un asistene de investigacin de {1100;1 300) | 26 2 mmereados reciettemente cortralado tiene como primer trabajo rovolecar datos {1.300;1 500) 8 3 es en cinco paises para determina cudles de ellos, si cs que los hay, TOTAL 60 Real mmplen Jos requisites minimos antes enunciados. Les que saisfagan estos istos setdn luego sometiéas & un amplio andlisis para determinar si es ible introducir en elles ol prodacto, La investigacion nical revela los datos 8) {Los focos de qué empresa tienen el mayor promedio en la ducacién de su vida uti? 3 ‘ _ | ~TOPICOS DE RSTADISTICA DESCRIPTIVA ¥ PROBABIL IDADES ques dana contin a MEDIDAS, TENDENCLA CENTRAL V DISPERSION {iQue pais o qué palses se deberin recomendar pata ado? {Por qué?” 4 El departamento de Arequips esta dividida en dos zonas ganaderas. Zona 1; Tiene 82 explotaciones ganaceras won un promedio de 820 enbozas de Pals_|_ Media | Mediana [Moda | Varianea [_N°de hopares sganado y una desviaci6n tipica de 3/2 cabeza a | $500 | $137 | $125 | seas ¥ 000 000 Zopa I; Tiene 38 explotaciones wanaderas con un promedio de 870 cabezas y B | ass 139 a7 | 2704 3.500 000 una devviaci6n tipica de 2V5 cabeza c | 403 an 398 100 2-700 000 2), Caloule al promedio decabezas de ganado por expoiacién ganadera para e D | ats 390 360 400 2.000 006 departamento de Are: RR. aproximadarnente 836 BE | faz 410 18 34 1-900 000 jo In dorviecidn tfpica para el total de la explotacién ganadera del mento de Are R.73,749 &, Pais C, pues un promedio de 1 350 000 hogares tienen un ingress anual de $ 402 por fo menos. Los paises A, By E también son posible, aunque en na empresa done los sslavios tlenen una media de Si. 10 000 y una menor grad, iacidn estindor do S/, 2 000, ato solicita que cada salario x: s¢ t en 3 modiante la siguiente felcidn: y; = 35x + 10. iia que se dedicu 1 la reparacién dle aparewos e¥éerioos para un sid tratando de determina dénde Gebe skuar una agencia de servicio y su ota ue camionets de servicio. El terttono que-debe atender se encuentra a fo larga de una autopisia recta ¢ incluye 9 ciulades del mismo tamailo aproximadamence, El gerente decide ul {contundo a patti del extrema norte del tertorio Incalizacion mas adecuada pare la estacion de servivio y la flora-de camionetes aloes parialnerte i ptcién rebjando lor slate propuesoe 20%, 1 cil ex arepndo, 80 pido elelor ts radia cae de servicio. Asi, he decidido poner Ja sucursal en la ciudad F. ya que ln media [section] [7 Seeeibn 8 = es 225/9= 25. E Pee | i a 1 Sma Ea 8 as 0} 32 2) Caleuke Ia desviaci6n media en relacisn con fa media aritiética 1 0 N° dealamnos ena} } Qué le dice esta cifra al gorente acerce de In distancia que teberin viajar te secciin C= 60 J sus camianeias de servicio? £) Antes de que el gerente haya decidide lx ubicacin, un asistente le sugiere que tal vez ln mediana seria mejor que fa medis, De acuerdo con est asistemte sugiee que escoja In ciudad E (ciudad cenral). Cai desviacién media en relacion con la mediaua. 44) Comparando el resultado de ¢) con fa respucsia de a), determine en cual ce las ciudades debe situarse ia sucursal.y explique por qué. ®) {Cree usted que existe algura ubicacion mejor? Explique su respuesta, c|profexor de la seecan A sostene que la suya & mejor 3 correcta afirmacién del profesor? 2Por qué? ‘R. Es corrects bb) ZEn cual de las secciones fas notss son més homogéneas? R,En la seociénC el J Una distribucién de frecucneies sobre notas de estudiantes de Célewlo 1 las frecuencias reativas hs y fig borrosas. $i se sabe que la media fue |, determine la varianza y te desviacibn tipica de la distribucién, 125 ‘TOPICON ne ESTADISTICA DESCRIPEIVA'Y PROBABILIDADES WT de exudiantes Ne ees Frecuencias Relativas 105,25) or - 125,45) oD 145,65) (65,85) 0.16, (85,105) {[105, 12,5) 00 (125, 145) 0.0 [45 omas ° 12, Una muesia de 130 ahimnos se subdivide en doa eubgrupos A y B. El profesor del subarupe A enconted una media de tipica de 3, mientras que ef profesor dal subgrupe 5 eg pero se olvids cateular |x varianza eorrespondicie, Et coor cen el grupo B hay 70 estudiantes y la varianza puede determinar le varianza del subgrupo B cu R Si = 4.265 13.80 da a un estudianee ve Estudistica a siguicme tabla de distribucién de ficcucicias que ios Sobre Ia temperatura en giados centigrados informes inconclusos dejasts por erro estudiante, ifcaciones de 14 con una desviacion 4 [oe fay Informs Pia Foo | a certs ; 3 wero deca ips 3 lores | 2 RS = 8,653 V.Dod i siete ctu de foes cle la vats esc tea nd tithe ain st Tas aah (SRST SRE | Ta) TT Poet da [ ae fo Toa {sel med Dicebre ae 206 promi de rei i preci 10 actfculos de primera necesicad (p: leche, etc.) fue de $ soles con una 126 MEDIDA, TENDE? 1A CENTRAL Y DISPERSION ica le un sol, mientras que al promedio de precios de otras seis uta nezesidadl (vestidos, recreacién, etc.) tuna desviacién estindarde Si. 15. En el mes de Enero de 2007 bubo un incremento en los precios, equivilente al 3: 4Cual es la nueva media y Is desvincisn de bos articulos de primera y segunda iecesidad juntos? Aieniis, se sabe que ty = hy y Ty = Fy. Deermine a media, desviacion vipicn imediana y 17 Fo una empress los suektos flactran enice'5 090 y 20 000 soles measuates, con A promedio de 12 009 soles y una desviacién estandar de | 200soles. Se lizan cuatro propuestas de aumente: Sexunda propvest Tercera propuesta: ‘Cuisrm propuesta: S/.2 100 para todos os empleades, ale las propuestas le convienea Ia empresa? de las propuestas les conviene 2 los empleados, si lo que desean es disminuir fz discrepeneia entre el saiario minimo y el maximo? La sezunda propuesta, rues tiene la menor varianza, Row II So inn elegido 150 productos para analizar sus pesos en gramos. Los ‘osultados est& clasifiendos cn la siguiente tabl (2,282.32) ‘Ademis, se sabe que I media 2128 nnéticn es igual a 2.14 ya medians ig ia y el poligeno de frezuencias Rox= 2s, y= 21.2517 eel valor de la esviacion estandar K. 0.073 medianas y grandes empresas, disiribuciones de las venias (en miles GRANDES — it declate | Frecuene | 250 (50:60) 0 J la media, mediaua, moda y desviacién estindar-de fa toralidad de las sampresns TER ak comin cue pee Uifersies se cee) tie Ge biel incandescent y se ha obtenid la siguentedistibucioa de fecuencios de Su sida en bons. -MEDIDAS, TENDENCTA CENTRAL ¥ DISPERSION Trewenelss Vide (en horas) eae ‘anos de 100 9 {100;200) 15 40 “ 26 B 2 0 6 9 (600 y mis 5 8 TOTAL 16 7 La vide mediy de las Kémparas que duran més de 600 horas fue de 700 para la marca A y de 650 para la marca B, i) {Qué puede decirse acerca de la asimetria de estas di A. Ambas marcas son ligeramente sesgaalas imarce A le Ins tes primers momentos con respecio al origen y con tespecto 2 dy media Se clasifiean los sueldos anualés (en miles de soles) de los empleados de das empresas, obteniéndose ls siguientes disribueianes: | Nimera de Suelos | Ndmero de | empleados fenmiesde oes) | empleados ww [30 i 30 (165;175) 30 (170,100) | 20 (175: 185) 20 iat TOTAL 10 | soles) de los ‘npleados de las empresas juntas. “2 Dados los sueldos de 40 personas que se clasifican en una tabla de freeuencias 3 RA = 10143 y 5? = 425,06 b) 2Cuintas personas ganan un sueldo comprendio entre 63 y 114? R. SA personas Zl ‘TOPICOS DE EsTabisTICA DESC! ‘YPROBABIUIDADES MEDIDAS, TENDENCLA CENTRAL, ¥ DIS@EESION. ribucibn, la mediana y la 0 chos valores de le media y In device enti peg aeat eae quc pute verse en fa tabla? Justiigue slaramente su respuesta, Saar aee a QW be edad media de los cendicates a un determinado curso de segunda mseeaceciss __|_Fresvenvie fipecinlizacién fue baja, del orden de 22 sfos. Como este curso fue ae ficado piva atender personas de iodas las edades, se decidis hace A a a campatia fue 6 no eficiente,s2 bi 132 30 + 138 95 a4 a5 150 oo [Frame Poreeniaie | 156 2 a a8 Het ee R 24 TOTAL i 200 YD 2 3 16 R.No son admisibles diches valores. 1 4 30 700 regle: Sila diferencia ¥ — 25 es ia ba sido efectiva, , Cuil es areojan una cade 2V70. Se construye In nueva variable ¥ om: (y= 2), Ge ~ 2)4, (t= 2)? +, aa -2)' no vale F? RS fos para todos los 120 cn la varlanea? Justifque su respuesta, R Sty, ba cuemas de crédito que mancja cl almacén. La distribucion de fecuencias se presents on le tabla y fue construida # partir de una muestra de 2 = 100 cuentas slecsionnlas al azar de los archivos de extlito del almacin 29.84 ty oXgq un muestra cays distribucion de frecuencias es simétria, Wd TOPICOS Dz ESTADISTICA DESCRIPTIVA ¥ [ROSADILIDADES Balanoe dela cuena Frecuencia [e:20) ye Ia (20,40) WRere ois [40;60) 40, [60;80) 2 - B TOTAL ‘Caleule Ia media y la deaviacign estdnidar = 52,60, 5 = 22,68 sdamente qué porcemaje de las cuentas de erédite tienen un salda) menor que 30 soles? R 16% ‘Aproximadamente qué porcentaje de fas 10 000 cuentas de erécito tienen un saldo mayor que 98 soles? e R25% c) 28. Eo una distribucién de frecuencias se mukiplica los valores de la variable por § ¥ Se obtiene una'media aritmética de 60. Si se suman 7 a los valotes de I variable, se obt nedia cuadrética de 30, Calcule bs media cuadréi Indisteibucién original, R 20,761 30.Las siguientes datos represertan el indice de volumen fisica do la producciSn rmanufacturera del sector fab periodo 1977-1982, aes INDICEDE VOLUNEN Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre 1212 | 1216 24,7 146 Foente: Ministerio de Industria, Turismo © 1. Direcelon Estadistion y Registro irecclon de 132 MDDS, TINTENCIA CENTKAL.¥DISRERSION le la media y la mediana de} indice del volumen fisico en el pertado: 932, D) Halle la proy in de cbservaciones que caen en el intervalo [f¥-155:¥+155]. lizando intervalos de clase [104; 108), [108; 112), etc.; construys una inde frecuencia para ls dates del indice de voluinen fsico en el periodo 1977-1982 ama yun paligona de Recueacias para eros toa cin ct i did appanage on compare Biss arses ous ns sypomical Fees (2 Gul scl intrvolo de sluo-do In moda i unio de fiecucncins?. 2th sesende a Ie ieguetda 0 a In ianza. y su desviaciOn esténdst. {Chime se compara esta varlanaa celine ices del_volumen fico fueran fo dnico que aos interesara, representaran estos datos una poblacion 0 tina muestra? jSerian fn media, Ti mediana, fa varianza y ls desviacibn estandar parimetros o esiadigrafos? nen fsico fueran s6lo una porcién ée los datos que nos. interesan, jrepresentarian estos datos una poblacién 0 una ‘huesira? jSerian la media, la mediana, la varianzay la desviacién estindar, pardetios o estadiorafos? 11 Elsslario medio mensual pagado a los empleados de la Universidad de Lima 6 de S/ 8000. Los salarios medios mensuales pagadas a ios hombres y foujeres de la universidad son S/. 8400 y SI. 7500, respectivamente Dererninar el parcentaje de hambres y mujeres que trabajan en la idad de Lima R.A4% de mujeres y 56% do hombres V2 Se clasificé la inversion de un grupo de compatias pettoleras en una tabla de InversiGn es de 200 millones de soles, gue 5 oS de 10 millones de soles y que las frecuencias Jos intervalos som: 2, 10, 13, 9, 8 $y 3. Con wa ) La media y la median ) Desviacién estindar 33. En una encuesta se obtuvo | Punije fi hy VARIABLE ESTADISTICA fh BIDIMENSIONAL MINTRODUCCION 90 Ad Determine la media y la RH = 57, S? = 261,573 inales por 10 de 600. Adenids, si se sumu 15 a los valores. 5 Muevns dc obscrvar en una perscna su peso 9 al wos valorss que puodan adoptar eatca caracteres en estudio formantn Wo de pares, que denoraremos por (X:¥) ¥ lamaremos vaviable estalaticn ica correspondiente a los valorsé originales urando la 2 2S dimensional (7; ¥) pueds ropresentar a areae 6623 8. B}. La educackin y seglin de procedencis 38. Sean xj... Valores observados de la variable x con fresuencias 280 y Ja altura de una persona, respectivemente, tro cunt vo. Bj: La profesion y is edad de ura persona. Jas componentes de [a yarable bidimensiona) (X;¥) son earacieres jede a su ver clasificarse en: rae Y discret. Ej: Nonjoro de admisiones y ital dorame un mes. ae ¥ continua B): Pesoyy altura de una persona. : . Si > fa? = 519900, n=) f= 200 y GV) =0,20; fi socficiente de variacion de ¥ = 70 43%. R F=50, F220, 5, = 90, CV,(1)= 03368 0 de médicns en Definiciin ins 4 ‘TCPICOS DEESTADISTICA DESCKIPTIVA ¥ PROBABILIDADES Ke eRe YE Woe wsYe Una diseibucion bidimensional de trecuencias es un arreglo de los valor observados (23:91), (EaiYedron» (Ye) de lt variable bidimensional (X;¥) o sus rospectvas fresuencias en una tabla de doble entrada dela forma: YARIADLEE ESTADISCA BIDIMENSIONAL | Distribuciones Marginales blo que representa aja variable X y sus frecuenclas marginales se denomina Jbvcién. marginal de la variable X, ysimilarmente la que representa «x lube ¥ y sus frecuencias marginales recibe ct nombre de disribuei6n marginal ivaciable ¥ TABLAS os del abl de dable entrada 3.1 som Vanesa poet |e) Yan a % Teet DisibtnwaraaTdeX_] Distibucion marginal de In| A fey bare NOY) x ta he fin Fhe ki 3 1 1 2 : Zoran efecar st ebiines aa phase : * x a, are we fi % Fis fastens fies ete ip ‘Total L a oa books Pe Fellas jos variables urado de insincsion (X) y readin de procedencla ( pete tinpleacos del Ministerio de Agriculeara, Los datos se muestran en Ta tabla 3.2 fig = atimero de veces que aparece repetido el par (x;:9))y y se lame frecuencia absoluta del par (x.y), V €= Lived = 1, ‘TABLA 3.2 Diswibuciin conjunta de las frecuencias de las variables grado de instraccicn (X) y egian de procedencia (Y) n= fy = total i rl > tal de pares con primera components 2, (i =1....K). se Pl Primaria) Secunda [Gop mal lama frecuencia margin te fours oe iarginal del vaior x, [oes | 40) 0 a | y= fiy= total de pares-con se ay 5 50 = fy = sot de sgunda componente 3) (F © Lense), yse Sei 30 15 30 Towa ws | 200 lama frecuencia marginel del valor, Fuente: Datos hipatéticos. Cada elemento del cuerpo de la tabla representa la frecuencis observada de tas as de X © ¥. Asf; observamos que 40 empleados con «son de la costa, 30 empleades con secundaria completa son de n= YY fy =ndmero ald pares cservades primaria compl le costa, ete 136 137 tte 7 ‘TOPICOS DE ESTADISTICA DESCRIPTIVA ¥ PROBABILIDADES 1Las tolaos de las fas nos dan fa distibucion marginal de ta variable X (grado db {nsttuccion) y los totales de las coluinas mos dan la dstribucidn marginal de la variable ¥ (regién de procedencia). TCA BIDIMENSIONAL usin conjunta de las proporciones (en porcentajes) con relacién Js variables prado de instruccién (X) y egién de procedencia (¥’), Observactin 2 En muchas situaciones en vez de trabajar con las freeuenci X | Primaria i 7 absolutas, podemos construir tablas con las frecuencias relativas (proporciones y Complete pa oe como se him en el caso unidimensional. Sin embargo, acui existen tre 20% | posibilidades de expresar la proporeién de elementos en cada celda. 17.5% 30% 158% 256 1) Con relacisn al total general, yse Hams frecuencia relative. Asi, 1a frecuencia 32.5% 100% telativa correspondiente al par (xy,i9)),4=,0b3 ) = 1 3.2) es dada por: fy Agu podemos sfirmar que fy x 100 = 22% 100= 20% dé los enpleados eo de Agricutua son de Ts cone apen grate de insruccén acomplia, mientas que hy 100= 225100 = 178% de os pes ie irs 5 eno rd Gast pare orgs, wt Boers Grin & (es fe y cia ox eo hy = VER miki sa Ymve r Las frecuencias relativas marginales do las verial respectivamente, por: cs ¥ ¢ ¥ son dadas| 1a de Ins variables X ¥. Asi, 45% (poroantaje marginal) de Jo de Agricultura son de la cosia, 30% de ls slerm y Get = Lend (frecuencia relativa marginal del vator-x) ) Hjempto 3 La distribucién de las proporciones de los datos de la tabla 3:2.c0n Yelocidn al coral de cada eolurane est dada en fa tabla 3.4 Tabla 34 Distribucisn conjunta de las proporciones (en porcentaje) con relacion allos totales de cada columna de las variables Xe ¥ de la tabla.3.2. SNF [Bias] Seco [spear | Teal Costa, 381% 57.1% 45% Sierra 33,3% 286% 30% De acusrdo con el objetivo de cada investigactOn, una de estas proportiones sera E Seive nee nee ae lis convene parser sada, Tota | — 10 Toon | 100 Ejemplo 2- La distribucion conjunta de las proporciones (frecuencias relativas) de tos datas de la tabla 3.2 con relacién al total ée las observaciones in = 200) esta daca en fa tabla 3.3, ‘Asl, podemos decit que a 100 = 44 x 100 = 38.1% de los empleados del Ministerio de ia completa son de lacoste, Wicsw0 = 22 e100 =333% dea dena y 4x 100= 22 100 = 206% to ta 138 139 “TOPICOS DE FSTADISTICA DESCRIFTIVA Y PROBABILIDADES ribuciones sirve para comparar la distibucion de la pracedencia lues conforme a su grado de instriceidn. En forma andlogs, posemas ‘onstuir la distribucién eonjunta de las proporciones can relacidn al total de cada fia, La consiruccicn de esta tabla se deja al lector. 3.2.2 Propicdades de tas Frecuencias Seu et niimero total de pares observados de la varieble bidimensional (X:¥}) (vor (abla 3.1), Se destacan las prapiedades siguientes: ad Eek ine jas ebsolutas es igual al nlmera de pares observados, ‘recnencias relatives es igual a la unidad, &8 dein, Dam hthtothen AD Ga hthtuthen =D tie, fi 2348 eye 140 is marginales de X'e Y son “fee .respeotivamente. Las medias y varianzas ya Deshi, & a Tahy-) a= 0 ge ‘ 1) vaio dstinos de avaiable oe respecivament, La exveriaza SE Be fie -¥) * See = Cavite) = Rach Sy istinos deta Observactin = Sean Cima) (te Yo) wen dios Variable, (GY) con frecuencias. absolute fryeFinevfie « Entonces la formula abreviada de la covarianza es: oats cope LY fia av iat covarianza,s¢ tiene Demostracién. Alaplicar la definicion de Sy = tovtk = 2)" 9 ful) - at Sy fear, ~T)- THAD) ist v 41 ee TOFICOS DE ESTATISTICA DESCRIPTIVA Y PRODABILIDADES m 35 sao < xy »: fi 7 Sus nk 1 fattest aa ae r D3 tno XS nF a ‘ | Sueryy — XV nit + =| Porta 4 Ser = Col ¥1 Bs ny, -¥F Ejempio 4 En una eneuesta cealizada en una poblaciin se ebuuvo ia sit informecién lacién al niimero de habitantes () y dor 142 ‘VARIARLE ESTADISTICA BIDIMENSIONAL tui una tabla bidimensione. ‘marginales Determine las frecuencias acumuladas. 4d) Enoventre las medias y varianzas marginals. €) Halle a covarianza. [e r [2] a | 4 | tontescny sebismes 5 t 3 3 z T ee auiliet s t o o 0 a i T = ules [3 6) Larabla de fovecneios acuriadan 05 ui 1 2 3 4 Vetta z 3 8 ieee peer fer ae SY f= Vat rg (ni eth pee (me 3 cg 4) Para hacer fos ciiculos ordenados de las medias y varianzas marginale, €3 convenente consti ia siguiente tabla: 143 Sixt = 976 gy Eder fim _ 208 ie eee S Sale. P= 2 ify 2 - VerlX] = 83 => ee a net = FplP76~ 506,16)4] = 226 Verlv] = Sf = - 1 z at =n] = St = 50(1,68)7] = 062 ©) Alemplear Ia formula abreviads de la coverianzs, se tiene te ivy zy 393 Sy = Covbtr =< SY) fyaiyy ~ FF =e — (4.15)00.68) = 08712 3.3 DISTRIBUCIONES CONDICIONADAS: ‘Sea (X;¥) ima variable estadistica bidimensional, tal que el caricter ¥ presenta k ‘modalidades y el cardcter ¥ © mod iidades mutuemence excluyentes, esto 2s, ote poe dimensional 144 VARIABLE ESTADISTICA BIDIMENSIONAL 4.5 Tabla de contingencia pare las variables ¥ + Y. ‘Total (Free. marginal) fy ‘Pefinicton 4.- Iya distibusida de le variable ¥ condicionnda a que In vor ‘Wgmeel valor fo x, f= 1, .», 4) esta dada en la tabla 3.6. TAMLAS.6 Diswibucidn de la variable ¥ condicionada aX = 4. Valores de ¥ HM | Totals | Wrenuenci absous dey punt, [of fe Ue Roe ofa) ote { fen Frecue eter oe He ed ea ae a7 ee 8 ‘Anilogomente, Is distrbucion de Ja variable X condisionada’a que la varinble-Y tome! valor fijo yy G= 1, .,¢) esta dada cn fa abla 3.7. TABLA 3.7 Disribucign de la variable X condicionada a ¥ = yy ‘odes (ee Se Freunca dean eX renter Lede se ce 8 faye ee ee ea fg fs conicoaaY ny, | SB eae Ess had i us rOnICos DF ESTABIstICA DE: Ejemplo 5.- Fn el depertamento de lea se obserys producetén durante algunos aflos, obteniéndose la sig eas 30 40, a ary [ ee mena Tao, : cele [yao st Ta0 aa Te 260— i508 SOI 2 EC 7 aa i i Aynde Feel previo en soles ¥ es lncamiad en miles de lta, Al eansiderr i 1B o » uss y vasiole aygupadal eclse de amplita corsa se pie: iy DEN epee sion de Y condiciouada 2 X=45 (arwa de case del trcer le condicionadaa Y = 150 { mde? eondicionadals X= 45 al 10) a | 0 | 1@ | 200 | tom 0. 1s datos cor i . - * 4) Et rngo de os datos sonespondines al vate X 8 8 = 60 ~ 30 = 30 Te ae ee ane VARIABLE ESTADISTICA DIDMENSIONAT. ‘) Ladisteibucién de X condicionada a¥ = 150es 34M Uno de Los principales ob} escribir ta asociacton 2 conocer el grado de dependencia que ste cairo ollas (36; 43) [iz aBy | Por ejexy ida) de Lina, a informacidn edicion pertenese nos permite estimar eon mejor precisién os: ‘epenclencia exisionte entre las dos variables: rena fr 34.1 Independencia de ¥: Supongs que a disvibucién conjunta de lav iable Y con medalidades ¥,. Ryka te Yl tab: predecit mejor el resultado de una de cllas en base « la acurrencia de la otra. IDA DE PEPENDENCIA ENTRE DOS VARIABLES NOMINALES clin conjunta ext esto ee, queremos de mode que podamas aque vive en a, (3) yl clase social (7), Je X con modalidades cesta dada en la siguiente TABLA 38 Tablade contingencis pera las variables X © ¥. ES | B % Ye Toul my |fa te fy te he m | fa he fa fon mu | ta fa fy fie [ew TOFICOS DE ESTADISTICA DESCRIPTIVA Y PROBABILIDADES Definicidn 5.- Se dice que lns variables X ¢ Y son indepenti sien latabla de contingencia k x e se verifica la igualdad: (io asoviadas), (en porcentajes) de aumnos segin sexo (X) y camera escogida (7). heK fy = ZF (pais trek ¥ P= tye) ] * | ak Mastulino | Femenino Toval ieeen corse varnblex Xe-Y son depeadeoive nesses om 3% BO " F 40% a 406 Kjomplo 6. Verifque si exite © m0 depentorcinexte el sexo y In cara ao aaa Te frofesional escogida por 400 alimnos de Ezosomia y Adminisracién de eae ae Universidad de Lima. Los datos se dan en fa tabla 3.9. TABLA 3.9. Distribuctén con) escogida (Y), personas prefieren Economia y 40% Administracion, Sino bi fare tas ‘Observando a dependencia 2 Ae ls Oy err esperariamos las mismas proporciones para cada sexo. * 3s prororciones estin muy prOximmas a ls 60% prefieren Maseuline 41% Agministracion Tor tan, se conclave que les variables sexo y carrera profesional tienden a ser Independiontes Pars deseubrir ¢) geada de depandencia entre dos variables, es necesario cu a-en un Gnico nimero. De un mado general, In cuantificacion del grado Solucién. Se tiene Ue dependcneia de dos variables es dada por lor Iamadss edeficiemes. de fuX fx _ 240x280 yociscion 0 corcelacicn peeLaatOv he ten muchas medidas que cuantifican lu deperdencia ente variables jominales. Agul se presents solamente una de cllas, thamneda coeficiente de Bei Ue ei af, Gintingencia, debido « Kar) Pearson. Para esto, Karl Pearson intieduce un a be i ‘esadigrafo que denora por 2 (Chi-cuadrado) yes dado par 160280 Tag = U2 111 fy: (uy Ti Axfe _ 160x120 © 400 = 46449 = fo Fstos resultados parecen indicat que hay independencia entre ias dos variables. debemes co ir 1as proporeiones segtin as fils o columnas ara asi poder hacer las comparaciones. Fyundo fos totales de Jas i ibuci6n resultanne est en la tabla 3.10, donde 0); representa les ‘Fecuencias observades (fj) y exy sepresenta las rps (20, 148 ‘TOPICOS DE ESTADISTICA DESCRIPTIVA Y PROBAPILIDADES Es ficil ver que las des variables son independientes si x? = 0 y dependences si 2 es bastante mayor que cero. Cuanio mayor sea el valor de 2, mayor seré el VARIABLE ESTADISTICA BIDIMENSIONAL DeeL) 2 Ey 2 ~72? = 112)? | (80-48)? (200~ 168)? | (40-72)? | (0-112)? ert et peat. ake Lnvogo, e valor de Ces te Coeficiente es siempre win mimeco 50,79 les son indepenientes ertonce = len Jouve > a0 0386 y lo mismo sucede con ¢. : \ [El éximo valor que puede tomar € en este caso es También se demuestra que el méxime valor que roma C es éado por | a Monde t es el minim cnr ct ndmero dé coluninas y el momero de fas de la tal fot. [22 _ oper econtingencis. £ z Observacién 4- Tl uso det cstadigraly 7? en tablas de Kexe esta sujet, por Fagoneé te6riens, a las sig 1. Para emptoar correctamente el estadierafo y?, 80% se fas free menos el caso de Independencia, o (patatodo t= 1, 5 que 5 y ninguno menor que que tenga una frecuencia esperada menor que cinco, antes de caleular x* debcmos agrupar dos 0 mas modalidades contiguas en una sola hasta fograr ta condicién anterior. Bjemplo 7 ¥ profesional escagi sexo y carrera 400 alumnos de Ingenieria Industrial y Ciencias de ta idad de Lima. La distrbucién conjunca de estas onjunta de tas variables sexo (X) y carrera profesional escogita (¥). ¥ Rete nc = Sai eee Sse oe . 6 Total 280 120 40054 Solucién: De acuerdo ala tabla 3. valor de y* es 150 acre (X)y fall Bntonces 0,336 (32,696) indice un alto grado de dependencia entre las das variables ibucién conjurta de las variables: grado ce instruct imiento de menores de 5 affos (¥). ti ries del De 1a aos Yr hata Tao de | PO) a | 28TH | edad inclusive | ) 3 20 ae iz [aus 167 [016 942 oan Fuente: Datos hipotétisos Soluecién: Fn este cass el valor del esradigrato 4? es ist 24 sory (629 -470.3" S078 (16? —142,8)* Tag + = 75.24 Asiel valor de Cs = 0,180 75aa1 2 2a8 fb soepan one clo cont bt wiving det [SS PE = 08 ol tiene que el grado de asociacién es débil extre } grado de insiruecidn de la riadre yee! fallecimienso infan 3.8 DIAGRAMA DE DISPERSION je de las axdenadas (eje ¥) los de esta forma cada par ( {odo |= 1,...n , est represen punto del plano X x ¥ (Fig. 31) diagrama de dispersion representa ty naturaleza (forma) de aque existe alguna. Fig 34 1527 ‘YARIADLE ESTADISTICA BIDIMENSIONAL, hemp! i Ja tabla 3.13 se presenta fn informacién obtenida sobre el nGmero ih os de Scrvicios (X)y el miners dc clientes (7) de $ agentes de una compalin de seguros. JABLA 3.13 Nimero de clientes (¢) por nimero de aftos de servicio (x) de S agentes de una compaita de seguros. Agente Riios de saivicio (R)_| Names de chonies (7) + 38 6 66 7 4 8 0 19 82 35 350) rc fince ol dingrama de diepersién de estos datos, Soluslon; Grefleande al conjusto. de pares Jodonados (X31) de la tla 3.12, tenemos ia figura 32 ee (iervando ta posicion de Witema conesiano (ig. 3.2 fecigie una depencensia les fe ¥, pus vernos en el conjuntc medida que aumente el tempo de ‘uamenta st nimero de ere Ok Fig. 32 duos. fueron sometides @ una prucba sobre él i extrarjero ¥ en seguida se tomo 2l tieripo empleado Hemplo 10- Ocho onocimiento de un or eaia uno de esd on ing is varinbles en estudio son sbrevide on la prueba (mas 19 190 puntos) minutos) necesario para aprender a operar satisfactoriamente tna, maquina, ‘Los tos se dan en Je tabla3.14. ‘TO#ICOS DE ESTADISTICA DESCRIPTIVA Y PROBABILIDADES TABLA 3.14 _Tndividuo x aces a 1 30 3 | 2 57 378 3 66 365 4 5 ai 5 7” 37 6 81 301 a 85 385 8 9s as | Trace ol diagtama de dispenin de estos datos, parce ordened n previamente son el fin de predecir cuales sera los Vi wes de la otta, Bn este caso, tenemos icon Lacoirelicisn es un métods empltado para dererminar el grado ‘ ire 105 variables que se estuéias, pars asl determinar en qu ciribe o explica de uno forma adecuada la Del diagrama de dispersidn conchuimas que ppatece que no hay ninggin tipo de dependencia esto es, el conocimi resultado de la prucba ne ayuela a prodecir el tiempo empleado en aprender a operar ta méquina, eo 71 ao 00 1% fia as seinacidn, grdfica de lus dow ives ayuda bastante a entender el.comporiamien ‘cuanto a Ta existencia o no de Indepenstencia, conjunto de: 3.6 NOCIONES DE CORRELACION Y REGRESION LINEAL Cuando observames dos caracieres X e Y en un individun, se nos presente el problems de determinar ta existencia de algon tipo de relaeisn enire ellos. Fl analisis de esta relacién presenta dos aspectos diferentes, Unes veces nuestro interés est en conocer rmedir hasta qué punto fos sambios en uma pe las dos v estan asociadss y explicarse por los cambios que ceurren en la otra. Ba tal caso tenemos un problema de correlacién y a medida us Io cuantifica a el llamado cocficiente de correlacti(r). Otras veces, cuando estamos seguros que existe un alto grado de asociacion cemire las dos variables, sea porque lo conocemics por experiencia © porque asi to 158 cin 0 postin Ciena ls varies 8 Pe ee po amie, es. pa ues vas dX ‘corresponden mayeres valores de Y. } Goiretncisn iaversa o negativa, Cuando Senos conor, no, yrs yes oes wales de ws de Xe ¥ son en de X corresponden menofes spersibn de la fig. 34 ta) se observa que tas dos ala fig. 3.4 (6) ‘y finan en i 1 presemtan, précticarierte,correlacin. TOMCOS DE ESTADISTICA DESCRIPTIVA ¥ PROBAMILIDADES: 3.6.2 Cleulo del Coeficiente de Correlacién El coeficiente de comelacién es un mimero abstract que indica e gritlo de ‘ye deine dei siauiznts modo: asociacién entre las varia coeficiente de correlacién muestral entre las variables X e ¥ es dado por Ser SEs fle- Oi - 1), SS Aetna fees foi donde Sp = covir) = BaD) Spe dss [a Se pmieha que el coe! y esto es, -isret te de correlacién es un mimsro comprendido entre —1 Valores positives indican que tas dos varigbles aumentan 0 disminuyen al do ble quiere decir que hay una perfecta les, en ci sentido de que por cada unidad que ble, Ja otra cambia siempre igual niimero de 9 encrlan todos sobre una yguna asosiaeton enire fas dos variables o de |. Sin embargo, valores de r+ 00 iguales a ta mer Jugar, aunque no laya ninguna asociacién. ‘anidad son mas bien te ene dos caracteristicas, Ins varia correlacion aparente. Kn segunda no es de esperar que r sea exaclamente igual a 1, a causa de los errores que se conten al hacer las cbservaciones, 156 ‘VARIABLE ESTADISTICA BIDIMENSIONAL ia correlncién queda caracterizada por el coeficiente de comelacion que varia-en el inteevalo [—1 ota Observactén S- Una férmula equivalente para correlacion es jones y ademés mejorar 12 Rjemplo 11. La tabla sigtiente presenta 1a informacién obtenida sobre 20 feealares de cexo femenino. » cada una de las cuales se les tomé-su peso v alturat aia | 22 | 226 | 246 | 248 | 252 us ran | 23 | t24 ara |2ne| 2s | 28 | 316 12a Tali eleioct stealth ‘esents le informacion en un diagrama de disp cl soeficiente de cerrelacién entre X e Y. n de fos datos se muestra en la fig. 3.5. 187 TOPICOS DEESTADISTICA DESCRITIVA Y PROABILIDADES Fig. 35 bb) Para obtener el coeticiente de “tabla: correlacién hacemos los eélculos en ta si jente ivi | fess AT 12321 A6t60 eae 0, sdemnasiada imporsancia a dichos hallazgos. 50'S 7 = 0,30, sem por lo general dificites de interpretar, no debigneose dar ‘Yanust ESTADIETICA IDMENSIONAL la forma del coefciee de corelcién se obtene nS fine ~ Of) — Shad ed for — Shi) 20(62678,6) — (511)(2436) (2003 2289.64) — (511) }(20297794) — (2436)7) 8776 0096,136 =4087 ferpretacion der). En el ejemplo que sos sirvio para et mnie de correlacion enconiramos que 1 = 0,87, Ete valor no arse como se hace corrientemente, en el sentido de que 87% de las jones en el peso, Para una interpretacién mis correcta debe tomarse r?. En miestto ejemplo, i6n ayuda & comprender por oué cosficientes de correlacin r tales que inerpreiar las asoclaciones.encontradas entre dos variables, siguientes principios: dismineya al mismo tiempo que otra, no quiere decir que los cambios en une sion determinadas por b otra, es decir, dos variables pueden aparece: jonadas por casualided y no porque exista una relacisn de dependencia ratveellas Las asociaciones ercontradas no deben splicarse indebidamente a valores qué texcedan los limites de las series extudiadas. Sabemos «que la estanira aumenta con la edad, pero eso able es vilido hasta el final de la edad de crecimiento y 2 fa estalura de un adulto de 60 atios, en base a la se har tcniendo en eventa el syor sea el tamafo de la ‘TOPICS DE ESTADISTICA DESCRIPTIVA ¥ PROBABILIDADES viduos e¢ neeesatio agrupar Los de clase, con Ja fi embargo siguen sienda muy labo: squivocusiones cuando se varsce de prictica 36.3 Regresion En la secci6n anterior negativa) cotré las vari perfects, to es mos visto que una correlacién perfect (pos s Ae Y sélo existe si hay una relacién funcional lor de X, se puede prod Cuanda esto sucede, se dice que Xe Y estén rl smadela matematicn, esto 5, ¥ = f(x) ludos () ¥ tas das (F) Je une muestra de caudrades, se observa que Cuando se congce el valor de X se gonoce con exact dl valor de ¥, pues estén igalos por fa expresion yar xxactamente el valor de ¥ wados por una Funeion a En la prictica, esta situciin de enconiar un modelo macematico que rela las dos varinbles X Yes una abstaecién, Lo que steeds es que al ratar ‘explicar los valores de Ia variable ¥ como comespondisntes: « les valeres de X a twavés de un modelo matemitice, el investigedor vevifiea que entre el valor 1 valor previsio dado en ol modslo f= F(X) bay usa diferencia, joe =¥—P . Esto es debido, en part, al hecho de que es muy ‘ener un conocimiento completo del ienomene en estudio, de meda que sea posible ineluir en el modelo todas aqucllas variates que pueden explicar las aleraciones en la variable Y. Por otto do, lus observasioes que s hacen sobre ¥ stdin suetas a ertores de medicién, Por todo esto, a nivel de la investigacién emplrica podemas formulae wn mo ipo ¥=fU+e donde ¢ 25 llamada paite aleatoria del modslo o perwibaciéa estocdstica del rodelo, esto es, ¢ representa la suma total de los efeios de factores descanocidos que tienen algu Y. ASH, se tiene a siguiente definicién: Jos otros fluencia no significativa con respecto a Definicién 9. Regresién es un método que se emplea para encontrar una funcién que se ajusta a une nube de puntes © dingrama de dispersién, con la finalidad o& poder obtener una “prediccién® aproximada de tna de las variables a partir de la otra, As. la resresi6n dela variable ¥ eh X es dada por ¥=FQ) 160 VARIABLE ESTADISTICA BIDMENSIONAL ‘optima de entre todas fas funciones que he \juston a Ta aube de purtos, esto es, la que mejor encaje sobre los puntos cet ‘hgrama de dispersion, por to cual tilizaremas el métoda dé minimos cuadrados. NMO3.1 Regresién 1 Simple egresion de ¥ en X es una funcié linet, entonces se tiene ate Monde yf sonconstentes Wh modelo (+) s denomina regress inile de ¥ en X. Geometicas jcrsecciin de la rosta de reneesion con al (je Yi yf denota su cocficientes «yf son Uwados coefcientes de Y=a+sXre 5032 Método de Regresion Lineal mos Cundrades para estimar los Coeficientes de Pra obtener la recta de regresin de ¥ en X, esto &5, P =0+ Bx Np debe estimar los pardmetros a y fen base.a los datas observados empleand el respectivamente, de modo que le corresponde el valor obsorvade 94, ore valor ajusiads J; , que s ‘spouddeen Ja recta como fancidn (fig. 3.7}, esto es, «+B Sen; Ja desvincién (dinate) err of valor observady yun valor ajsted Dig. 3-8), enoes, =I 161 TOMICOS DE ESTADISTICA DESCRIPTIVA ¥ PROBABILIDADES. EL méledo de minimos evadrades para la oblencién de los coe! @ yf son determinados de mode que sea inirimna le expresién seo =5 fet = ¥ 101 -3)'= 3 gia & ct tt VARIABLE ESTADISTICA BIDIMENSIONAL oj de medias muestales, se tione bhi sine AF _ Sr “Se 1 ln recta de regresién de ¥en X es ae 4 (a =m f - 0X Dhat nk Fig. 37 Al derivar esta funsién SCD con respecte ace y fe igualar a cero, a8 tions 4 oa =2) 0. a pxy(-1)=0 asep oe =23 f-0- Bx)(-x) = 0 al usar las propiedades de sumatorias , resulta DY feu Sin «que son ecutaciones normales para la recta de minimos cuadrados. ‘Al resolver este sistema de ecuaciones para ay fi, se obtiene 162 (Reeta de regresiin de X en ¥) Si se tom como variable iarecia de regeesion deX en ¥ es sracion 8. lene X en lugar de independ easy Nizar el método de minimos evadrados, por un proceso exactamente igual se ebtiene, veh amet 2 En una encveata efecniada en una poblacién, se cbtuvo ‘aol nimers de babitantes (X) yal nomero de dosr ra de 50 vivlendas, Los daios se dan en Ja taba 3,15 ‘TOPICOS DE ESTADISTICA DESCRIPTIVA Y PROBABILIDADES, TABLA 3.15 Namero de habitanies (X) que viven en casas dormitorios ¥. mies (e)_[_Domnitorias fy.) | Frevuenoas(f)_] Waa, = 416, 2 T 6 | 3 1 i | i 393 — 349,44 | 4 1 to | fe (876 — 065 20VT72— 141 TE 6 1 | 1 | 3 2 4 i 3 | = 088 $ 2 9 | Rote valor ae les variables existe una correlaciéa positiva, de 6 2 2 | moto que aumenta el abinero de habiamies, aumenta el numero s 3 1 de domiccros. Sin embargo, como 7? = 0,555 pademes docir que bay una 6 3 2 | orrel i 8 3 1 L 8 4 2 ) Los cnencientes de 1 etimades de la recta P= a+ PX son 303 -349,44 2” 976 068,20 42) Halle el coeficiente de correlacién entre Xe ¥. ) Enouente la recta de regresién minima cuditica de Y en X. ‘Solucion = 0393 @=% ~ AF — 1,60 ~ 0293)(4,16) = 0045 a) Peta obtener el coef lasiguiente tabla. de correlacvn enire X ¢ ¥, se hace los edleulos en Lingo, la esta de represion es 7 = 0,015 40,3937 ee A | tim | roe tot Bjemplo 13- se han esuelato las cacaciones de doseeno summa en doe = = z z la] y Probabilidad y Estadistica, Se obtuvieron los siguientes: 3 1 7 7 a ; i Balto | a Mee oy yltie- 2h, eee 6 i ele ae [os " 3 2 2 | 8 | a6 | 16 denis. se sabe que el cocfciemte de contac de ambas variables es v = 0:90 a 2 20 | 10 | a | 20 Sep 5 2 45 | is | 225 | 36 ignatuca de Celeulo 1, Zou nola se puede 6 2 12 4 R 8 ignatura de Probabilidad y Estadistica? 4 3 pay eiges] fede decir que aquellos alamnos que obtavieron mayor éalificacion en 6 3 2 | 6& | sz | as ‘mismos que cbluvieron mayor calificccién en Probabilidad 8 3 8 3 a] 9 y Estadistica? § 4 1s | a | 8 | 2 6) {Cuil es In ecuncion dein recin de regrosiin de sabre Y? Total 208 84 Ci 164 ‘TOPICOS DE ESTADISTICA DESCRIPTIVA ¥ PROBABILIDADES LVARLALE FSTADISTICA BIDIMENSIONAL Sol : 1 8) Para predecis un valor de la variable ¥ conceiende el valor de la variable Xe see aS) ee rcosario obtener la ecuacién de la recta de regresion de ¥ en X, eso es, am 0 3 Pay px 4 1 2 Como se sabe, el coeficiente de correlaciin esti dado por 1 a : Sy 1 oie Sar = 7 SxS = (0.90) 2IGS) = 27 Solueidn Para tenes todos los ci te constuir la siguiente tabla ‘ocficiente de regresion f de la roctade regresion es Porous lado, el coeficiente ede 5 f ic & ‘or oto lado, el coeficiente de comelacion @ de nnest Sh er 3 7 ee a8 @=¥— 6X = 15 — (0,60)03) = 616 ' 7 mg 1275.75 Lego, fa ecu a de regesién es 7 z #0 1280) Y= 616 + 060K [oa [oe [mete | Shim = 7s [Sra = 205075 | btuyo una not 14 en Cileulo 1, em Probabilidad y jet obtende’ una nota de ¥ 6,16 + (0,68)(14) = 15,68 ¥) Como os datos estin correlacionados can un cocticiente de r= 0,9 podemos decit que x metide que aumestan lhe noias eo Cateulo aumenvan tambign las nolas en Probabiidad y Estadistiea (¥). Lucgé corel que lox Alaplicar las formulas, se obtiene 285 = 3366, 7= aa on i” mismos que obtienen mayor calificacién en Probabilidad y Fstadistica. ©) Lazecia de reuresion de X en Yes ae 4-¥-o-#) zoe Paes ss "y= st = £[)) ha? — nk! = yg l209975 — 16¢13,60)4 = 349 i 1 2 = 38 = 21) fof - nF] qglote~ 1605,79)'] = 844 oo Se LEAS Sey = Covlesel =2 9) fiw, FP = SE — a3.60)(6.05 Lucgo, 2-13-22 9-19) 120-1 = 750 - 3) = 1.20 ~ 15) = ~0,13875 se tiene aft US oes P Sy5y (1B41)E592) Ejemplo 14- Determine el coeficiente de cortelacién entre X fingreso) © ¥ (201 partir de la tabla de infocmacién dada, También halle lt esuacion de {a recta de regresion de ¥ en X si es posible. Luega, podemos soneluir quem hay ninguna asociacién entre las variables, 166 i6T ‘TOPICOS DE ESTADISTICA DESCRIPTIVA Y PROBARE.IDALES EJERCICIOS \VARIABLE ESTADISTICA BIDIMENSIONAL F Unondo lo sigviene tabla 3.16, responds: rstigacion sobre rotacidn eh: mano de obra, para una mm j IAMLA 3:16. Ioformacidn sobre estado personas fucron obseevadas des variables: nimero de empleos en lo q Wjohcsulacio fexpeesade en fruccin del salaio minieno), edad (medida en ufos y dos atos (X) y salarin mis reciente, en mimero de salarios mirimos (¥), jy reidn de procedencia de 36 empieados dela Universidad de Lima. resultados fueron: Wie | Salaio Tal “ tajos_| (Ss ming 7 eof aa 5 1 2 i 3 2 © 3 1 1 2aoSeunl.| = z 3 Bie Semd | 2 : 3 u o 2 bs 3 1 4 2 1 : 18 2 i » 2 YeoSeusé. |= 20 ee Tio Seaund, | - Superior | 6 a} Usando Ja medians ch aioseent. | 2 para cada una de las io Seems, | 2 es clasificaciores. osevat | b) {EI nmero de empleos influye en el salaro del ee 4 Mo Secind. | 2 R 4 a RB Total Super | - daosecind | 1 | 17(85%)_ | _20..00%) Sweror | 3 630%) | 20 00%) sooerot | 172%) BGI) | _40{100%) re es | ») Si. 168 a) Consiruya le cistrbuciin de frecuencia conjunta para ls vam neacion y regién de procede sel porcentaje de empleados con 2ao de secundaria? 4 Calcule la distribuciéa de fas proporciones del gravo de education 538 las reyiones de procedencia. 1) Basado en’el resultada de ( {a opin de procodencia y el nivel de esicecién del empleade? 9 _ Enel estudio de cierte comunidad se ver In siguiente: I. La proporci6n de individuos sotteros es Ue 0:4 F {a proporeién de individuos que reciben hasta 10 salarios V. La proporeién de fos salieroa es de 033. @) Construya ta distribueion conjunta de salarial, las respectivas disteibuciones marginsles bb) gUd. dia que existe relacin ene las dos variables consideradas? aE ‘es cl porventaje de aquéllos que tienen 2do de secundaria y sont Be acc caro asain ‘correlacion entre X e¥. ‘datos y represente Ia recta en uns grifica de ta Sule el eaeticiente de {dlica Ud. que exist una dependencia et ent tabla se presenta ls gastos de publicidad (como poreentales Jos beneficios de operscién netas (como porcentsje de r estimacidn de la eficioncia de wna méquina de 10 aos? Hepresonte los datos ea un diagram de disper Halle el coeficiente decovreiacion nme x eY. Hue in ecuecidn de la recta que mer seas a estos datos y mpresemne Jy foots en et grafico de la parte a). F Pronoitigue ef benetcio neto de una tlenda a foyer euyos gastos fe Ra) Salaris Jjotas obtenidas por 10 alunos en Ested <10 | 10,20) | 220 Total R.3.5% ica Aplicada Ly Caloule I son aie a9 709 oa 098 931 021 060 0,20 050 030) 1 i | bb) No, pues x7 = 4.67, Se hace un estudio para determinar ta rela ‘ripo de maquinas en uta fibrcay ls eficcncias de 1s mismas, 05 datos #e dan en la siguiente tabla. 170 fe una mucsira aicaneria de 200 babitantes de lela covarianza y el eoeficiente de corre yecuasticn. Jeulo I de un alumno que heya obtenide judad para analizar alia Fl resultady fue el siguiente: VARIASLE EST: coeficiente de correl Lind Compara de Seguros anatiz6 ta 11000 hombres rs in sido 200 los elementos extraidos de la poblacion, se que obtuvieron en la ¥ una puntuacién inferior a 52 ida de X pata Y = 55. ar ia distribucién condicionada de Y pera X = 42. cenaro de geavedad Baja | Toa 380 +800 n0 1200 los dos factores? Dé una medida evantificadors Ud, cambiaria su conchusiée? Justifique su respuesta RP =5394,220 - 430, 13 ‘TOPICOs DERSTADIS -\ DESCRIPTIVA Y PEOBABILIDADES 12,Sean des variables Xe ¥, de las que se consce Sy=15, r= 3. Civ = cook de vriachbn de ¥ = 0,15,¥ = 18007 = 200. Hille lavarianza de X + ¥. Sugeroncia: Var|X + ¥] = VarlX] + Varl¥] + 2¢ou1Xi¥] R, 1295575 13. En una muestra de 5 obreros de uns empresa fusron observadas dos variables: atts de experien ejecucién de una down a siguiente table: x To a sancres Y 7 t 7 ioe] ~ a) {usando un criterio esadistico, dria Ud. qu: la variable puede ser sada para explicar la varieion de ¥? by Ud. puede justificar la respuesia dada en a)? 14, cedido el contenido de oxigeno ¥ on miligramos/litro del Lago Titicace auna profundidad de X metros, obteniéndose los siguientes datos; YS [es >» [||] yobs bse bse) so) ae | ap on joto de estudiar la reacién entre las variables consumo de energla ‘ideariea (©) y vokumen de produceiSn en las empresas industriales (¥), se oid una muestra de 40 empresas, pora las cusles se calcularon los sigaientes valores: Bx - 20a , Ey =3072. Yop = 9896, Lxo1= 3213 Lx} = 2216 1) Determine las rctas de regresisn ¥ en X y de X en ¥. RY = 1.461% —00114 )) Determine el coeFcente de coreacn eines R10 598 1), Daa siguiente dsirbcion biaimensona FT sas | tsa | sas | sa RY = -0107% + 3.578 R. 0,88 ‘) Para una profundidad comprendida entre 75 y 80 motos, ;qué comenide de ‘oxigeno se podria predecir? 0 ene 029 y 0,78 inaeidn de ts capacidad de prod fen detcrminadas regiones ¢s un proceso ffeil y sativa, sc puede cstimar la capacidad de. prosuccién a través de la seleccion de una u ora variable de medida ms facil y que este Iinealmente relacionada con ells, Suponga que fueron observados los valores pare las variables: capacidad de: produccian mstalada, potencis instzlada y area consruida, En base a un 174 Figisy ied v iat long, ©) 1Qvg medida es mas tepresentatival d) {Qué porcentaje de pares (X;¥) tienen ¥ inferior a 357 Wn obtenciin de cienasaeaciones metiicas a atas temperatures se suele basar en fas. yas de ter ‘de ruptura. En muchos casos, la deformacién rendida oe inaceptable y, para asegurar una duraciOn de cierto nimero de ‘es ngcesario mantener la tension aplicada por debajo del valor que ‘Produciria ruptura en el mismo némero de horas. Un experimento con dicha vivacidu foc Lcvade a eabo a 700°C y os dats que se presenian en fa siguiente {bla se obtuvieron relacionande Ia tensién aplicada con el tiempo de ruptura. 195 Tensibnf WA Tmt) [Tiempo deraptaraT 8 2 1 31 © 205 50 1324 una tension f = 65 MN Jt. ino de tos vendedores 19,Se ha roniad um grupo de matrimonios (eon hijs) y se fs ha pregunta Treen qué edad tuvieron su primer hijo. La informacién se da en la siguiente i (X = edad det marido, ¥ = edad de la uj ¥ (17:19) | (19:21) | (21523) concepte del gerene de ventas en cuanto al currfculum del candidato 1) fi parte 2p astgue ps Al denotar por X Liotle la corselacion entre X y Xp, {Esta medida esti de acuerdo eon la Fegpuesta que Ud, dip anteriormente? valores de 3 variables: 2 una praeta aprepiada para vendedares silos de experiencies en ventas de Is compatia ahora resuelve ampli pide su coluboracién para responder algunas preguntas. Para hace un ato atras fpoca fueron observados para cada + 3 {plormaciones adicionales sobre dos variables: x ys i yolumen medio menstal de venta en miles de soles [20;25) 4 6 ‘Zora de la capital para el cual el vendedor fue designate. (25:28) s te ; Lu Tab'a de reultidos es In siguiente: a} {Cuintos matrimonios fueron encuestados? fendedor | Tépruet F Cee 8} ae Nendedor | Temes) | experiencia) | det gecenie) | Y OMS) nada de X dado ¥ ~ 22. - ice fem 4) Enoucnts ia recta de regresion de X sobre cS t ra 7 2) Halle areca de regesién de ¥ sobre X, i 32 : ca 20.Se lanza simultineamente tna moneda de im sol y una moneda de un délar. =| Buena I cada lanzamiento se anoto el resultado obtenido, cuyos datos estan en Jat ped t Bueno 29 adjunta, = ‘Buene, 27 ae 3H Sol f Na 3 cara Sali “otal @ z Bie [a Detar y Pala z Malo 3 Ga a z 7% 3 6 3 ala 2 Selo 38 6 sh if 70 z ial zi “Tol i 48 70 5 1 z Sew | 16 176 siguientes: Mis especificament, ef im recior le pide que responda es sic ‘TOPIODS DE ESTADISTICA DESCRIFTIVA ¥ PROBADILIDADES a) Hage un histograma de la variable V en walos de clase de ‘S!. 10000, teaiendo por limite inferior de la primera clase el valor d Paar ‘Si. 15000. 575! 11), (-5; 15). fb) Encuentre Ia media y ta varienza de la variable V, Suponga que se Sense ts eer vendedor sea considerado excepcional si su yolumen de ventas eo (8). veces la dewviacién estindar superior a ta media. genoral. jC W Y= 192-148 ; R= -3167—09My ; FY) =(-3;-38) YPodewos afirmar que al sumeniar X esperamos que cieminuyn ¥2, Razone Si respuesta y complete cor les valores que esperamos Ia erdenada y In cuyo volumen de venas see { “iicivade los ponjor 73 )y (1-8) dlstrbucion, Cul es et yolumen bh (7=2518) y (-2.947;-5) lira pa no oer ars condivionada dela variable X dado Y= 11 y cate Los vendedores argumentan al director que este criteria no es justo, hay zonas de venas privilegiadas, A quien éaria U de las 3 variables observadss en fa adm ie bn observado que pam predecir ta cemanda (consume) de combust ‘importante para juzgar un futuro candidato al empleo? ‘piri calefuecion, resuta ser mas preciso el prondstico a largo pl es ol grado de dependencia entre c] concepto del yor “Jiyiperaturm y cl uso de fa relacién temperatura-consumo cue al Vendedor ue desipnado? 10d rctamente terarda analizango ts ventas de combus 0 de ventas mensuales de 2 ‘de Ventas anuncié, que 22 Daas dos variables X eY, sea hecho siguiente cambio de variable ee ere He Gs ees ES ee xo y-16 - fe eae Mam Tacs] me | v8 [2 | 9 28 | ms | 0 y se ha obtenido para las variables transformadas las medias, varianzas y romedio de = covarianza, que se indican a continuacion: ee, ee ‘disionns (X) Faia, 2 EAR (en ados An13, f= — 64 hese) Bais, sp = 2a BP {Presentan los datos suficiente evidencia de que las ventas de combustible jn relacionadas linealmente con ta temperatura? RS, I) Encuentre la resta de minimos cusdrados para estos datos. RP = 83,074— 1,1857 1) Grafique los puntos y la recta como una verificacion de sus clculos, Covia;8] = -0016 Cileute fas medias, varianzas y covarianza de las muestras R.R=275 , S}= 256, P= 241, 57 = 5625 , cov Sugerenci : Un fase de un estadin snciotigico y econdmico a gran escala esta devicada a a) CovlX + 6:¥ +0] = CoulX: lj felcidn entre el nivel de instruccisn y la rent. Como parte de este trabajo, b) Covlax; bY] = ab Covlx:¥1 dor recopila datos sobre la renta media (en miles de soles) para una esta aleatoria ée ocho ciudades y el porcentae de familias en ls chudades fie poseen af menos un automévil 178 vOrICOs DE ESTADI :NDESCRIPTIVA ¥ Tagreio medio) | 7 | a8 ios [|e ite an ayafiee de ° porsemiaje de faritias que poseen al wenos un automdvil en ciudad en 8, es se arte iagrama de dispersion. recta de ininimos suadrados a estos dates y ropresente en el ls paris al que la fenta media es S!, ‘una flema que vende per carteo y bastante costosos paca hogares y oficinas. Opere arunciando un articulo, ya sea en revistas selecoionadas © bien en un programa de dicecta, Supony que la ad ygase que la respuesta de las Yencas varia mucha por cn de artieulos se vende con frecuencia un ya sea agotamiento de articulos, 0 bien inventarios excesivos de plazo de dos semanas. Asi pus, ‘oportunemente las ventas defi nnedida sus problemas de inventariv. Cor semanas para prediceiin pre semana de recil des recibir el 90 por ciemo ée una campana dada, seria scisa de las ventas totates hechas asia el final de la bir pedios. Las ventas de la primera semana y las vernas tales ‘campanas de Is firma se indican en fa table siguiente ANALISIS COMBINATORIO 1 INTRODUCCION 1) oie capitulo se desarrollen las nociones basicas de la teoria matemética que il ls diferentes técnieas de-conteo, conocia como andlisis PRINCIPLOS BASICOS DEL PROCESO DE CONTAR: Veorewa t- (Principio de muttiplieacida) Sea $= {as,.., dy} un con Wom elementos y T = (4,,...b,} um conjunt de n elem janees el Liwnneto se pares (ay;bq) que pueden ser formados tornando un elemento de $ 'y in clemena de T es mn Disho de oro modo, si una decision se puede tomar de m maneras, y una vex {onida una de ellas una segueda decision 2s tomadt den meneras, ensonses et ‘uimero de maneras de tomar embas decisiones es iguala m7. 3) Truce un diagrama de dispersién. b) Objenga ef coeficiente de correlacién muesiral, A. 0.99788 ¢) Halle la recta de m{nimos cuadrados de tas venias tolales respecto de las veutas de la primera semana, RY=-617+5,112K 4) Basindose en lo encontrado en les parte a) haste ©), ¢qué pode pensarse de lat totales? izacién de las ventas de la primera semana para predccir alas 130

Você também pode gostar