Você está na página 1de 16

TALLER No.

EJERICICIOS DE ESTADSTICA, CORRELACIN Y


PROBABILIDAD

JUAN DANIEL RUEDA GALVIS

UNIVERSIDAD INDUSTRIAL DE SANTANDER


FACULTAD DE INGENIERIAS FISICOQUMICAS
ESCUELA DE INGENIERIA DE PETROLEOS
ESTADSTICA APLICADA
BUCARAMANGA
2017
Ejercicio Datos No Agrupados
El campo El Palomo cuenta hasta el momento con 10 pozos perforados y
completados, en los cuales se han utilizado diferentes cantidades de empaques de
produccin, de acuerdo a la cantidad de formaciones productoras en cada pozo. En
la siguiente distribucin se muestran las cantidades de empaques utilizados por
pozo:

Pozo Frecuencia
Palomo-1 1
Palomo-2 4
Palomo-3 3
Palomo-4 5
Palomo-5 3
Palomo-6 2
Palomo-7 4
Palomo-8 3
Palomo-9 5
Palomo-10 1

Se quieren conocer los siguientes parmetros estadsticos asociados al nmero de


empaques:
a) Distribucin de frecuencias
b) Tendencia central
SOLUCIN:
a) La distribucin de frecuencias se encuentra en la siguiente tabla:

F. F. Relativa
Pozo Frecuencia Acumulada F. Relativa %
0.03225806 3.22580645
Palomo-1 1 1 5 2
0.12903225 12.9032258
Palomo-2 4 5 8 1
0.09677419 9.67741935
Palomo-3 3 8 4 5
0.16129032 16.1290322
Palomo-4 5 13 3 6
0.09677419 9.67741935
Palomo-5 3 16 4 5
0.06451612 6.45161290
Palomo-6 2 18 9 3
0.12903225 12.9032258
Palomo-7 4 22 8 1
0.09677419 9.67741935
Palomo-8 3 25 4 5
0.16129032 16.1290322
Palomo-9 5 30 3 6
Palomo- 0.03225806 3.22580645
10 1 31 5 2

b) Para los valores de tendencia central:

Media=(1+ 4+ 3+5+3+2+ 4+3+5+ 1)/ 10

Media=3.1

n 10
Mediana= = =5
2 2

Mediana= 3 (Valor ledo de la tabla anterior en la posicin n=5)

Moda=Lamoda es igual a 3 , pues es el valor de empaques que ms se repite(3 veces)

Ejercicio Datos Agrupados


La empresa prestadora de servicios petroleros Oil & Gas Co. Corri el registro
Gamma Ray (el cual mide la radioactividad Gamma de las rocas) como una ayuda
para identificar formaciones de lutitas en el pozo Boreal-1 del campo La Aurora. En
la siguiente distribucin de frecuencias se muestra la cantidad de unidades API
(medida de radioactividad), registrada para cada intervalo de profundidad:

Profundidad Unidades
[Ft] API
5500-5549 65
5550-5599 75
5600-5649 80
5650-5699 150
5700-5749 180
5750-5799 165
5800-5849 100
5850-5899 65
Se requiere conocer los siguientes parmetros estadsticos:
a) Distribucin de frecuencias y el Lri y Lrs del sexto intervalo
b) Tendencia central
c) Posicin: P45, D6, y el Q3
d) Medidas de dispersin
e) Medida de concentracin (ndice de GINI)
f) Forma de la distribucin (Coeficiente de Curtosis)

SOLUCIN:
a) La distribucin de frecuencias se muestra en la siguiente tabla:

F.
Profundidad Frecuencia( Marca de Acumulada F. Relativa
[Ft] fi) clase (xi) (Fi) F. Relativa %
0.07386363 7.38636363
5500-5549 65 5524.5 65 6 6
0.08522727 8.52272727
5550-5599 75 5574.5 140 3 3
0.09090909 9.09090909
5600-5649 80 5624.5 220 1 1
0.17045454 17.0454545
5650-5699 150 5674.5 370 5 5
0.20454545 20.4545454
5700-5749 180 5724.5 550 5 5
5750-5799 165 5774.5 715 0.1875 18.75
0.11363636 11.3636363
5800-5849 100 5824.5 815 4 6
0.07386363 7.38636363
5850-5899 65 5874.5 880 6 6

5749+ 5750
Lri=
2

Lri= 5749.5
5799+5780
Lrs=
2

Lrs=5799.5

b) Valores de tendencia central:

Marca de clase
Profundidad [Ft] Frecuencia (fi) (xi) fi*xi
5500-5549 65 5524.5 359092.5
5550-5599 75 5574.5 418087.5
5600-5649 80 5624.5 449960
5650-5699 150 5674.5 851175
5700-5749 180 5724.5 1030410
5750-5799 165 5774.5 952792.5
5800-5849 100 5824.5 582450
5850-5899 65 5874.5 381842.5
880 5025810

Media:

(FiXi ) 5025810
Media= = =5711.1477 ft
Fi 880

Mediana:

n
lim +( f ( acumu . ante. ) )
2
Mediana= C
Fm

n 880
= =440
2 2

5699+5700
lim =5699.5
2

F ( acumu . ante . ) =370


C=50

Fm=180

(440370)
Mediana=5699.5+ 50=5718.9444 ft
180

Moda:

Intervalo de mayor frecuencia=57005749

Marca de clase intervalo de mayor frecuencia=5724.5

Moda=5724.5 ft

c) Medidas de posicin:

P45:
880
x=45 =396
100

El valor 396 se encuentra en el intervalo 5700-5749, por tanto:


Lri=5699.5

F ( acumu . ant . )=370

C=50

Fp=180

( 396370 )
P 45=5699.5+ 50=5700.2222 ft
180
Esto quiere decir que el 45% de las unidades API registradas se encuentran a una
profundidad igual o inferior que 5700.2222 ft.

D6:
El 6to decil equivale al percentil 60 o al 60%:

880
X =60 =528
100

El valor 528 se encuentra en el intervalo 5700-5749, por tanto, usando los mismos
valores del punto anterior, ya que el P45 se encuentra en este mismo intervalo, se
tiene:

( 528370 )
D 6=5699.5+ 50=5743.3889 ft
180

Esto quiere decir que el 60% de las unidades API registradas se encuentran a una
profundidad igual o inferior que 5743.3889 ft.

Q3:

El tercer cuartil equivale al percentil 75, o al 75%:


880
X =75 =660
100

El valor 660 se encuentra en el intervalo 5750-5799, por tanto:


Lr i=5749.5

F ( acumu . ant . )=550

C=50

Fp=165

( 660550 )
Q3=5749.5+ 50=5782.8333 ft
165
Esto quiere decir que el 75% de las unidades API registradas se encuentran a una
profundidad igual o inferior que 5782.8333 ft.

d) Medidas de dispersin:

Desviacin Media:

Para el clculo de la desviacin media, se construye la siguiente tabla:

Profundidad Frecuencia Marca de


[Ft] (fi) clase (xi) |xi-Media| fi*|xi-Media|
5500-5549 65 5524.5 186.647727 12132.10227
5550-5599 75 5574.5 136.647727 10248.57955
5600-5649 80 5624.5 86.6477273 6931.818182
5650-5699 150 5674.5 36.6477273 5497.159091
5700-5749 180 5724.5 13.3522727 2403.409091
5750-5799 165 5774.5 63.3522727 10453.125
5800-5849 100 5824.5 113.352273 11335.22727
5850-5899 65 5874.5 163.352273 10617.89773
880 69619.31818

La desviacin media se calcula utilizando la frmula:

( Fi|XiMedia|)
DM=
n

Donde:
Media=5711.1477

n=880

69619.31818
DM= =79.1129
880

Esto quiere decir que los valores de profundidad se desvan, en promedio, 79.1129
puntos con respecto a la media.
Desviacin tpica

Para hallar la desviacin tpica se realizaron los siguientes clculos:

Profundidad Frecuencia Marca de fi|xi-Media|


[Ft] (fi) clase (xi) |Xi-Media| |xi-Media|^2 ^2
5500-5549 65 5524.5 186.647727 34837.3741 2264429.32
5550-5599 75 5574.5 136.647727 18672.60137 1400445.1
5600-5649 80 5624.5 86.6477273 7507.828642 600626.291
5650-5699 150 5674.5 36.6477273 1343.055914 201458.387
5700-5749 180 5724.5 13.3522727 178.283187 32090.9737
5750-5799 165 5774.5 63.3522727 4013.51046 662229.226
5800-5849 100 5824.5 113.352273 12848.73773 1284873.77
5850-5899 65 5874.5 163.352273 26683.96501 1734457.73
880 8180610.8

Y se utiliza la siguiente ecuacin:

S=
( Fi| XiMedia| )
n

Donde:
Media=5711.1477

n=880

S=
8180610.8
880
=96.4165

Esto quiere decir que los valores de profundidad estn a 96.4165 puntos con
respecto al promedio.

Varianza:

El valor de la varianza en este caso es conocido al elevar al cuadrado el valor de la


desviacin tpica ya calculada, puesto que la frmula para hallar la varianza es la
siguiente:

2
2
S=
(Fi|XiMedia| )
n

Por lo tanto:
2 2
S =96.4165 =9296.1415

Coeficiente de variacin:

El coeficiente de variacin se define como el cociente entre la desviacin tpica


de una muestra y su media, por lo cual, ya conociendo estos valores, se procede
a hacer el clculo as:

96.4165
CV = =0.01688=1.688
5711.1477

e) Medidas de concentracin (ndice de GINI):

Marca
de
Profundid Frecuencia F.Acum clase( qi=Ui/U
ad [Ft] (fi) u. (Fi) Xi) fi*Xi Ui n pi=(Fi/n) pi-qi
5500- 5524. 35909 35909 0.07144 0.07386 0.00241
5549 65 65 5 2.5 2.5 97 36 4
5550- 5574. 41808 77718 0.15463 0.15909 0.00445
5599 75 140 5 7.5 0 78 09 31
5600- 5624. 44996 12271 0.24416 0.00583
5649 80 220 5 0 40 76 0.25 24
5650- 5674. 85117 20783 0.41352 0.42045 0.00692
5699 150 370 5 5 15 84 45 62
5700- 5724. 10304 31087 0.61855 0.00644
5749 180 550 5 10 25 2 0.625 8
5750- 5774. 95279 40615 0.80813 0.00436
5799 165 715 5 2.5 18 19 0.8125 81
5800- 5824. 58245 46439 0.92402 0.92613 0.00211
5849 100 815 5 0 68 37 64 27
5850- 65 880 5874. 38184 50258 1 1 0
5899 5 2.5 10
4.26704 0.03255
880 55 44

I G=
( piqi )
pi

0.0325544
I G= =0.0076293=0.76293
4.2670455

Segn el resultado, hay una mala concentracin en los valores de medicin del
registro, pues el ndice de GINI se encuentra cercano a 1.
f) Forma de la distribucin (Coeficiente de Curtosis):

Los clculos registrados en la siguiente tabla son necesarios para conocer el


coeficiente de Curtosis:

Profundidad Marca de ((xi-


[Ft] Frecuencia(fi) clase(Xi) ((xi-Media)^4)*fi Media)^2)*fi
5500-5549 65 5524.5 78886771204 2264429.32
5550-5599 75 5574.5 26149953141 2330628769
5600-5649 80 5624.5 4509399273 2530800020
5650-5699 150 5674.5 270569878.3 4829992538
5700-5749 180 5724.5 5721281.057 5898582045
5750-5799 165 5774.5 2657863925 5501900291
5800-5849 100 5824.5 16509006132 3392480025
5850-5899 65 5874.5 46282209246 2243133766
880 1.75271E+11 2.673E+10
(xiMedia)
1 2 2
( xiMedia ) fi
n


1
( 4fi)
n

g 2=

1
2.673E+10 2
880


1
1.75271E+11
880
g 2=

g 2= -2.9999

Como g2 < 0, se concluye que la distribucin es platicrtica, es decir, que existe


una mayor dispersin entre los valores de unidades API, con respecto a los valores
centrales.

Ejercicio de correlacin
En la siguiente distribucin se clasifica cierta cantidad de yacimientos petroleros en
Colombia de acuerdo a su presin [Psi] y temperatura [F] inicial:

Presin(y)/Temper
atura(x) 150 200 250
1500 8 7 1
2500 3 6 7
3500 5 4 3

Se requiere:
a) Calcular la covarianza
b) Obtener e interpretar el coeficiente de correlacin lineal
c) Evaluacin de la recta de regresin de la presin sobre la temperatura

SOLUCIN:
a) Covarianza
Para iniciar con los clculos se debe convertir la tabla sencilla en una tabla doble, y
posteriormente realizar las operaciones necesarias:

fi*xi^
xi yi fi fi*xi fi*yi xi^2 yi^2 2 fi*yi^2 fi*xi*yi
225000 18000 1800000 180000
150 1500 8 1200 12000 22500 0 0 0 0
625000 1875000 112500
150 2500 3 450 7500 22500 0 67500 0 0
122500 11250 6125000 262500
150 3500 5 750 17500 22500 00 0 0 0
225000 28000 1575000 210000
200 1500 7 1400 10500 40000 0 0 0 0
625000 24000 3750000 300000
200 2500 6 1200 15000 40000 0 0 0 0
122500 16000 4900000 280000
200 3500 4 800 14000 40000 00 0 0 0
225000
250 1500 1 250 1500 62500 0 62500 2250000 375000
625000 43750 4375000 437500
250 2500 7 1750 17500 62500 0 0 0 0
122500 18750 3675000 262500
250 3500 3 750 10500 62500 00 0 0 0
10600 17275 2830000 208250
44 8550 0 00 00 00

xy=
(fixiyi) MediaXMediaY
fi

MediaX=
(fixi) = 8550 =194.3182
fi 44

MediaY =
(fi yi) = 106000 =2409.091
fi 44
20825000
xy= 194.31822409.091=5165.2279
44

b) Coeficiente de correlacin lineal:

x=
(fix i2 ) Media X 2
fi

x=
1727500
44
194.31822=38.753

y=
(fiy i2) Media Y 2
fi

y=
283000000
44
2409.0912=792.527

xy 5165.2279
r= = =0.168
y x 38.753792.527

La correlacin entre los valores de temperatura y presin para los yacimientos


resulta ser directa y dbil, pues el valor del coeficiente se aproxima a 0.

c) Recta de regresin presin sobre temperatura

xy
Y MediaY = (X MediaX)
x2
5165.2279
Y 2409.091= 2
( X 194.3182 )
38.753

Y =3.439 X +1740.759

Ejercicio de probabilidad condicionada

En el campo El Loro, donde se produce aceite negro, se perforaron cierta cantidad


de pozos utilizando taladros movibles. Se estima que, al seleccionar un pozo, la
probabilidad de que este haya sido perforado con un taladro movible es de 0.35
(suceso A).
A su vez se estima que la probabilidad de que al seleccionar un pozo en este se
hayan utilizado nicamente brocas ticnicas es de 0.6 (suceso B), y que la
probabilidad de que un pozo haya sido perforado con un taladro movible utilizando
brocas ticnicas es de 0.15 ( A B).

Calcular la probabilidad de que en un pozo se hayan utilizado nicamente brocas


ticnicas si este se perforo con un taladro movible.

SOLUCIN:

P ( A )=0.35

P ( B ) =0.6

P ( A B ) =0.15

P ( BA )= P P(( A B
A)
) 0.15
=
0.35
=0.4286

Luego la probabilidad es 0.4286, y es inferior que la probabilidad a priori (0.6).

Ejercicio probabilidad total y probabilidad de Bayes:


La empresa COLPETROL S.A opera el campo La Juliana ubicado en el departamento
del Meta. Dicho campo recibe tubulares de perforacin (Dril pipe) provenientes de 3
distintas empresas: Steel Co., la cual aporta el 50% de los tubulares, Aceros de
Colombia, que aporta el 35% de los tubulares y la empresa Tuberas Prez, que
aporta el restante 15% de los tubulares.
Se sabe que de los tubulares provenientes de la empresa Steel Co., un 2% presenta
daos en sus roscas, los provenientes de la empresa Aceros de Colombia un 1.5%, y
los provenientes de la empresa Tuberas Prez un 0.8%.
Si todos los tubulares se reciben el mismo da, se quiere conocer:
a) Qu probabilidad hay de que al escoger un tubular al azar, este presente
daos en sus roscas?
b) Si se escoge un tubular que presente daos en sus roscas, Qu probabilidad
existe de que provenga de la empresa Aceros de Colombia?

SOLUCIN:
a) Para este caso se aplica el teorema de probabilidad total:

P ( Daos ) =0.50.02+ 0.350.015+ 0.150.008

P ( Daos ) =0.01645=1.645

Esto quiere decir que la probabilidad de seleccionar un tubular y que este presente
daos en sus roscas es del 1.645%.

b) Aqu se debe utilizar el teorema de Bayes:

0.50.02
P ( SteelCo . )=
0.50.02+ 0.350.015+ 0.150.008

P ( SteelCo . )=0.6079=60.79

Si al seleccionar un tubular con daos en sus roscas, la probabilidad de que este


pertenezca a la empresa Steel Co. Es del 60.79%.

Você também pode gostar