Você está na página 1de 47

Curso Superior de Tecnologias em Petrleo e Gs Estatstica:

Estudo dos mtodos para coletar, organizar, apresentar e analisar dados. Estatstica Descritiva:

Constitui-se num conjunto de tcnicas que so usadas para organizar e apresentar dados de forma conveniente e comunicativa. A estatstica descritiva pode ser definida como mtodos que envolvem a coleta, apresentao e a caracterizao de um conjunto de dados de modo a descrever apropriadamente as vrias caractersticas deste conjunto. Por que um tcnico da rea de petrleo precisa conhecer estatstica: Os tcnicos da rea de petrleo precisam saber como apresentar e descrever informaes de forma adequada. Precisam saber como tirar concluses a partir de grandes populaes com base somente nas informaes obtidas de amostras. Precisam de informaes para melhorar os processos. Precisam saber como obter previses do comportamento de reservatrios de petrleo a partir de variveis de interesses. A necessidade de dados: Porque precisamos coletar dados? Oferecer o insumo necessrio a um estudo de reservatrio. Avaliar o desempenho de um processo de produo ou servio. Assessorar na formulao de aes num processo de deciso. Satisfazer nossa curiosidade.
1

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

Exemplos: O engenheiro deseja monitorar regularmente a produo dos poos de um Campo de petrleo para descobrir quais os equipamentos que apresentam falhas no processo de produo, e com que frequncia. O analista de mercado procura caractersticas que possam distinguir um produto do produto dos seus concorrentes. O produtor farmacutico precisa determinar se um novo medicamento mais eficaz do que aquele que atualmente est sendo usado.

O que so dados? Informaes numricas necessrias para ajudar a tomar decises mais bem fundamentadas. Para que uma anlise estatstica seja til no processo de deciso, os dados de entrada devem ser apropriados. Portanto, a coleta de dados extremamente importante. Dados distorcidos, ambguos ou com erros podem levar a concluses distorcidas ou deficientes.

Tabelas Estatsticas: A tabela estatstica deve ser uma forma objetiva de se demonstrar o comportamento de variveis, representao simples que possibilite ao leitor a compreenso do fenmeno sem muito esforo. Deve apresentar a seguinte estrutura: Cabealho: deve conter as respostas para as seguintes questes: - o que est representado - onde ocorreu - quando ocorreu

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

Corpo: colunas e subcolunas onde sero registrados os dados numricos e informaes. Rodap : observaes pertinentes tabela e registro e identificao da fonte dos dados. Conforme critrio de agrupamento as tabelas podem representar diversas sries:

1. Srie cronolgica: dados so observados segundo a poca de ocorrncia. Produo de Petrleo no Brasil - 2007 - 2011 Produo (em milhes de barris Ano
de leo equivalente (boe))

2007 547,5 2008 584,0 2009 657,0 2010 766,5 2011 803,0 Fonte: ANP (Relatrio anual de Janeiro de 2012)

2. Srie Geogrfica: dados so observados segundo a localidade de ocorrncia. Consumo de Gasolina no Brasil em 2011 Consumo (em milhes de litros) Regio Norte 77.495 Nordeste 107.783 Sudeste 281.207 Sul 153.661 Centro-Oeste 115.776 Fonte: ANP (Relatrio anual de Janeiro de 2012)

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

3. Srie especfica: dados agrupados segundo a modalidade de ocorrncia. Matrcula do Ensino de 3 Grau Brasil 2009 rea de ensino Matrculas Cincias 32.109 biolgicas Cincias Exatas e 65.979 Tecnolgicas Cincias 148.842 Humanas Fonte: Servio de Estatstica do Ministrio de Educao e Cultura

4. Distribuio de frequncias: dados agrupados com suas respectivas frequncias absolutas.

N de acidentes por dia na rodovia X - Janeiro de 2009 N de Acidentes por dia N de dias 0 10 1 7 2 4 3 5 4 3 5 2 Fonte: DNIT Altura dos alunos em uma sala de aula em maro 2010 Altura (m) N Alunos 1,50 | 1,60 5 1,60 | 1,70 15 1,70 | 1,80 17 1,80 | 1,90 3 Fonte: Secretaria da Faculdade DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer
4

5. Grficos: Tem por finalidade representar os dados obtidos, permitindo chegar-se a concluses sobre a evoluo do fenmeno ou sobre como se relacionam os valores da srie. A escolha do grfico apropriado fica a critrio do analista, devendo sempre levar em conta os elementos simplicidade, clareza e veracidade.

Exemplos: 1. Grfico em colunas:

Fonte: BP Statistical Review of World Energy junho 2005.

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

2.

Grfico em barras:

3.

Grfico em setores ou pizza, grfico de barras ou colunas e um cartograma:

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

4.

Grfico polar:

Fonte: ANP

5.

Grfico em curvas:

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

Organizando Dados Numricos:

Dados brutos: Conjunto de dados numricos obtidos aps um levantamento sobre a idade dos funcionrios de uma empresa X. Ex.: 24, 23, 22, 28, 35, 21, 23, 33, 34, 24, 21, 25, 36, 26, 22, 30, 32, 25, 26, 33, 34, 21, 31, 25, 31, 26, 25, 35, 33, 31. Rol: o arranjo dos dados brutos em ordem crescente ou decrescente. Ex.: 21, 21, 21, 22, 22, 23, 23, 24, 25, 25, 25, 25, 26, 26, 26, 28, 30, 31, 31, 31, 32, 33, 33, 33, 34, 34, 34, 35, 35, 36. Disposio ordenada: Dados brutos em ordem de classificao do menor para o maior (crescente). Disposio ramo e folha: Outra forma de organizar e apresentar as informaes numricas. Tem como vantagens mostrar a informao numrica de uma forma mais compacta e enfatizar os aspectos importantes dos dados.

Exemplo: Notas de testes de estatstica aplicados em 20 alunos (dados brutos): 69 84 52 93 61 74 79 65 88 63 57 64 67 72 74 55 82 61 68 77

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

Os algarismos de dezenas ficam alinhados verticalmente com os algarismos das unidades apresentados ao lado.

Ramo Folha
5 6 7 8 9 275 91534718 49247 482 3 5 257 11345789 24479 248 3

Ordenando as folhas temos

6 7 8 9

A partir desta disposio podemos verificar que a maioria dos dados se encontra na casa dos 60. Existiram repeties de nota (61; 74)

Dados Brutos: 24, 23, 22, 28, 35, 21, 23, 33, 34, 24, 21, 25, 36, 26, 22, 30, 32, 25, 26, 33, 34, 21, 31, 25, 31, 26, 25, 35, 33, 31. Rol: 21, 21, 21, 22, 22, 23, 23, 24, 25, 25, 25, 25, 26, 26, 26, 28, 30, 31, 31, 31, 32, 33, 33, 33, 34, 34, 34, 35, 35, 36.

Amplitude total ou "Range" (R): a diferena entre o maior e o menor valor observado. no exemplo: 36 - 21 = 15 DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer
9

Frequncia absoluta (Fi): o nmero de vezes que o elemento aparece na amostra ou o nmero de elementos pertencentes a uma classe. Ex.: F(21) = 3 Distribuio de frequncia: o arranjo dos valores e suas respectivas frequncias, ou uma tabela resumida na qual os dados so organizados em grupos de classes ou categorias convenientemente estabelecidas e numericamente ordenadas. Ao construir uma tabela de distribuio de frequncia deve-se levar em considerao: A seleo apropriada do nmero de classes. A obteno de um intervalo de classe e amplitude apropriadas. Estabelecimento de limites para cada grupo de classe, evitando assim uma sobreposio. Exemplo:
Xi 21 22 23 24 25 26 28 30 31 32 33 34 35 36 Fi 3 2 2 1 4 3 1 1 3 1 3 3 2 1 30
Classe 21 | 24 | 27 | 30 | 33 | 36 | 24 27 30 33 36 39 Fi Fi 7 8 1 5 8 1 30

Onde: Xi = varivel Fi = n n = tamanho da amostra

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

10

Nmero de Classe (K): Um nmero maior de informao requer um maior nmero de classes, porm, em geral a distribuio de frequncia deve possuir ao menos 5 classes e no mais do que 15. Se no existir um nmero de classes suficientes ou se forem demasiadas, pouca informao ser obtida. Podemos utilizar a seguinte regra para a determinao do nmero de classes: K = 5 para n < 25 e K n para n > 25 Ou
Sturges: K = 1 + 3,22 Log n Onde: n = tamanho da amostra

Amplitude das Classes (h): h=RK Onde: h = amplitude de classe R = amplitude total ou Range K = nmero de classes Exemplo: R = 15 K = 30 = 5,48 5 h =3

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

11

Limite das Classes: Limite superior e inferior - so os valores extremos das classes. Existem vrias maneiras de expressar tais limites: a) 10 | b) 10 | c) 10 d) 10 | 12; compreende todos os valores entre 10 inclusive e 12 inclusive. 12; compreende todos os valores entre 10 inclusive e 12 exclusive. 12; compreende todos os valores entre 10 exclusive e 12 exclusive. | 12; compreende todos os valores entre 10 exclusive e 12 inclusive.

Exemplo: 10 | | 12 limite inferior 10 limite superior 12

Pontos Mdios das Classes (Xi): Mdia aritmtica entre o limite superior e o limite inferior da classe. (exemplo:10 | | 12) Xi = 10 + 12 = 11 2 Xi = 11

Frequncia Absoluta Acumulada (Fac): a soma das frequncias dos valores inferiores ou iguais ao valor dado. Exemplo: Xi 0 1 2 Fi 3 5 2 10 Fac 3 8 10

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

12

Frequncia Relativa (fi): A frequncia relativa de um valor e dada por: fi = Fi n ou seja, a porcentagem daquele valor na amostra. Exemplo: Xi 1 2 3 Fi 5 7 2 14
5 7

fi

/14 /14 2 /14


1

fi % 36% 50% 14% 100%

Histograma a representao grfica de uma distribuio de frequncia por meio de retngulos justapostos. Polgono de Frequncia a representao grfica de uma distribuio de frequncia por meio de um polgono.

Histograma

Polgono de Frequncia Acumulada

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

13

Algumas definies: Populao ou universo (N): Conjunto completo de observaes reais ou potenciais sobre as quais se fazem inferncias. o conjunto de indivduos ou objetos que apresentam pelo menos uma caracterstica em comum. Amostra (n): Subconjunto da populao selecionado de acordo com um mtodo de amostragem. Exemplo: O diretor de uma faculdade deseja conduzir uma pesquisa para saber a opinio dos estudantes sobre a segurana dentro do Campus. Populao: Todos os estudantes matriculados. Amostra: Apenas os estudantes selecionados aleatoriamente para participar da pesquisa. Variveis Discretas e Contnuas: Uma varivel representada por um smbolo como X, Y, H, que pode assumir qualquer um de um conjunto de valores que lhe so atribudos. Uma varivel discreta quando assume valor em pontos da reta real, valores inteiros. Quando a varivel pode assumir teoricamente qualquer valor em certo intervalo da reta real, ser uma varivel contnua. Exemplo: O nmero N de crianas em uma famlia pode assumir qualquer um dos valores 0, 1, 2, 3, mas no pode ser 2,5 nem 3,842 uma varivel discreta. O peso P de um indivduo pode ser qualquer valor entre 50 kg e 90 kg. Pode pesar 62,3kg; 50,572kg; 70,585kg; uma varivel contnua.

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

14

Medidas de Posies: So medidas que possibilitam representar um conjunto de dados relativos observao de forma resumida. Tais medidas possibilitam comparaes de sries de dados entre si. So tambm chamadas de medidas de tendncia central, pois, representam os fenmenos pelos seus valores mdios, em torno dos quais tendem a concentrarem-se os dados. Mdia Aritmtica ou Mdia ( X ) - dados no agrupados: X =x n Amostra Ex.: mdia dos valores 3, 7, 8, 10, 11 X = x = 3+7+8+10+11 n 5 X = 7,8

=x
N Populao

Mdia Aritmtica ( X ) - dados agrupados: Quando os dados estiverem agrupados numa distribuio de frequncia, usaremos a mdia dos valores ponderados pelas respectivas frequncias. X = x i Fi n Exemplo:
Xi 1 2 3 4 Fi 1 3 5 1

Determinar a mdia

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

15

Elaborao da Tabela: Xi 1 2 3 4 Fi 1 3 5 1 10 XiFi 1 6 15 4 26 X = X i Fi = 26 = n 10

X = 2,6

Lembre-se que Fi = n Mdia Geral( MGE): Sejam X1, X2, X3, , Xk as mdias de k sries e n1, n2, n13, , nk os nmeros de termos das sries.

MGE = n1X1 + n2X2 + nkXk n 1 + n2 + n k


Exemplo: Sejam as sries: a) 4, 5, 6, 7, 8 em que b) 1, 2, 3 c) 9, 10, 11, 12, 13

n1 = 5 e Xa = 6 n2 = 3 e Xb = 2 n3 = 5 e Xc = 11

Ento a mdia geral ser: 5 6 + 3 2 + 5 11 5+3+5 MGE = 7

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

16

Mdia Aritmtica Ponderada: Associando-se os nmeros X1, X2, Xk, a certos fatores de ponderao (pesos) w1, w2, wk, ento:

X = w1X1 + w2X2 + wkXk = wX

w 1 + w2 + w k
Exemplo:

Se o exame final em um curso tem peso 3 e as provas correntes peso 1, e um estudante tem grau 85 no exame e 70 e 90 nas provas, seu grau mdio : X = (1) (70) + (1) (90) + (3) (85) = 415 1+1+3 5

X = 83

Mdia Harmnica (Mh): Sejam X1, X2, X3, Xn valores de x, associados s frequncias absolutas. Mh = __ n__ F1 + F2 + Fn X1 X2 Xn

se F1 , F2 , Fn = 1, temos: Mh = n . 1+ 1 + 1 1 X1 X2 X3 Xn

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

17

Exemplo: Calcular a mdia harmnica para 2, 5, 8: Mh =


1

3 . 1 /2 + /5 + /8
1

Mh = 3,64

Mediana: ( X ) A mediana de um conjunto de nmeros organizados em ordem de grandeza (em um rol), o valor que divide a amostra ou populao em duas partes iguais. 0 | 50% | ~ X 100% |

Se n for mpar, a mediana ser o elemento central ( de ordem n + 1 ) 2 Exemplo: 31 36 53 63 67 mediana = 53 n + 1 = 5 + 1 = 3 (3 elemento) 2 2

Se n for par a mediana ser a mdia dos elementos centrais. Exemplo: 31 36 53 63 67 75

n/2 e n/2 + 1 = 6/2 e 6/2 + 1 = est entre o 3 e o 4 elemento mediana = 53 + 63 = 58 2 DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer
18

No caso de uma distribuio: Xi 1 2 3 4 Fi 1 3 5 2 11 Fac 1 4 9 11


n = 11, mpar, logo X ser o elemento de ordem n + 1, ou seja, 11 + 1 = 6 elemento. 2 2 Para identific-lo abre-se a coluna do Fac. X=3

contm o 6 elemento

Xi 82 85 87 89 90

Fi 5 10 15 8 4 42

Fac 5 15 30 38 42

21 e 22 elementos

n = 42, par, logo X ser a mdia entre os elementos de ordem n/2 e n/2 + 1 = 42/2 e 42/2 + 1 = 21 e 22 Abre-se a coluna do Fac.

21 elemento corresponde a 87. 22 elemento corresponde a 87. Ento X = 87 + 87 2

X = 87

Clculo da Mediana Para Dados Agrupados:

X = Lmd + ( n/2 - f) . h Fmd

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

19

Onde:

LMd = limite inferior da classe Md


n = tamanho da amostra ou nmero de elementos f = soma das frequncias anteriores classe Md h = amplitude da classe Md FMd = frequncia da classe Md

Exemplo: Dada a distribuio amostral, calcular a mediana: Classes 35 | 45 | 55 | 65 | 75 | 85 | Fi 5 12 18 14 6 3 58 Fac 5 17 35 49 55 58

45 55 65 75 85 95

29 elemento (classe Md)

Neste caso calcularemos a ordem n/2 sem se preocupar se n par ou mpar. n/2 = 58/2 = 29 elemento Aplica-se a frmula:

X = Lmd + ( n/2 - f) . h Fmd


Onde:

LMd 55;
58

n = 58; f = 17; h = 10;

FMd = 18

X = 55 + ( /2 - 17) 10 18

~
X = 61,67

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

20

Aplicabilidade: Podemos utilizar a mediana para definir o meio de um conjunto de objetos, propriedades ou qualidades que possam de alguma forma serem ordenados. Exemplo: Podemos ordenar um certo nmero de tarefas de acordo com o seu grau de dificuldade e definir a tarefa do meio (ou mediana) como a que apresenta um grau mdio de dificuldade. Quartis: Os quartis dividem um conjunto de dados em quatro partes iguais. Assim:

O% 25% 50% 75% 100% |-----------------|----------------|-----------------|----------------| Q1 Q2 Q3 Q1 = 1 quartil; faz com que 25% das observaes sejam menores e 75% maiores. Q2 = 2 quartil; coincide com a mediana, 50% das observaes so menores e 50% so maiores. Q3 = 3 quartil; faz com que 75% das observaes sejam menores e 25% maiores.

Determinao dos Quartis: Q1 = Valor correspondente observao ordenada n/4 Q2 = Valor correspondente observao ordenada n/2 Q3 = Valor correspondente observao ordenada 3n/4

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

21

Clculo dos quartis para variveis contnuas: Q1 = LQ1 + (n/4 - f) h 1 quartil

FQ1
Q3 = LQ3 + (3n/4 - f) h

3 quartil

FQ3
Exemplo: Dada a distribuio, determinar os quartis (Q1 e Q3) e mediana (Q2) Classes 7| 17 17 | 27 27 | 37 37 | 47 47 | 57 Q1 = ? Fi 6 15 20 10 5 56 Fac 6 21 41 51 56

Q1 (14 elemento) Q2 (mediana 28 elemento) Q3 (42 elemento)

X=?

Q3 = ?

n 56 = = 14 elem. 4 4
Para Q1 temos:

n 56 = = 28 elem. 2 2

3n 3 * 56 = = 42 elem. 4 4

LQ1 = 17
n = 56 f = 6 h = 10 FQ1 = 15

Q1 = 17 + (56/4 - 6) 10 15 Q1 = 22,33

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

22

Para X (Q2) temos:

LMd = 27
n = 56 f = 21 h = 10 FMd = 20 Para Q3 temos:

Q2 = 27 + (56/2 - 21) 10 20 Q2 = 30,50

LQ3 = 37
n = 56 f = 41 h = 10 FQ3 = 10

Q3 = 37 + (3 56/4 - 41) 10 10 Q3 = 38

|--------------------|-------------------------------|---------------------|-------------------- | 7 22,33 30,5 38 57 25% elemento 50% elemento 75% elemento

Decis: So valores que dividem a srie em 10 partes iguais. 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% |-------|--------|--------|-------|--------|---------|--------|--------|-------| | D1 D2 D3 D9 DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer
23

Frmula Geral: Di = i n 10 i = 1, 2, 3, 4, 5, 6, 7, 8, 9

No caso de variveis contnuas: Calcula-se i.n 10 Identifica-se a classe Di pela Fac. Aplica-se a frmula: Di = LDi + (in/10 - f) h FDi

Percentis: So medidas que dividem a amostra em 100 partes iguais. 0% 1% 2% 50% 98% 99% 100% |----------|--------|--------------------------|-----------------------------|------|- -----| P1 P2 P50 P98 P99 O calculo do percentil dado por: Calcula-se i .n onde i = 1,2 99 100 Pela Fac identifica-se a classe Pi

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

24

Aplica-se a frmula: Pi = LPi + (in/100 - f) h

FPi
Exemplo: Determinar o 4 decil e o 72 percentil da seguintes distribuio: Classes 4| 9 9| 14 14 | 19 19 | 24 Clculo D4: i n = 4 40 = 16 elemento 10 10 Para D4: Fi 8 12 17 3 40 Fac 8 20 37 40

classe D4 classe P72

Clculo P72: i n = 72 40 = 28,8 elemento 100 100 Para P72:

LD4 = 9
f = 8 h =5 FD4= 12 D4 = 9 + (4 D4 = 12,33

LP72 = 14
f = 20 h =5 FP72 = 17

. 40/ - 8) 5 10
12

P72 = 14 + (72 40/100 - 20) 5 17 P72 = 16,59


25

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

Moda: o valor mais frequente da distribuio. Para distribuies simples (sem agrupamento de classes) a moda encontrada pela simples observao do elemento que apresenta a maior frequncia. Xi 243 245 248 251 307 Fi 7 17 23 20 8 Neste caso, a moda ser 248 (nmero que aparece com maior frequncia). Para dados agrupados em classes utilizaremos a frmula de Czuber: Mo = L + 1 1 + 2

Onde: = Limite inferior da classe modal 1 = Diferena entre a frequncia da classe modal e da classe anterior 2 = Diferena entre a frequncia da classe modal e da classe posterior h = Amplitude da classe

Frmula de Pearson: ~

~ Mo 3X 2X

No caso em que as amplitudes de classe no so iguais, preciso calcular a densidade de classe: Fi h para se identificar a classe modal.

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

26

Exemplo: Determinar a moda para a distribuio: Classes 0| 1 1| 2 2| 3 3| 4 4| 5 Fi 3 10 17 8 5 43 Processo: - Indica-se a classe modal 2 | - Aplica-se a frmula: 3 (3 classe)

L=2
1 = 7 2 = 9 h=1

Mo = 2 + 7 1 7+9 Mo = 2,44

Medidas de Disperso: So medidas estatsticas utilizadas para avaliar o grau de variabilidade ou disperso dos valores em torno da mdia. Servem para medir a representatividade da mdia. Em um hospital onde se mede a pulsao de cada paciente 3 vezes ao dia, o paciente A acusou as taxas de 72, 76, 74 e o paciente B acusou 72, 91, 59. A taxa mdia de ambos 74, porm existe uma diferena na variabilidade. Enquanto a pulsao de A estvel (72, 76, 74) a de B apresenta grande flutuao.

Sejam as sries: a) 20, 20, 20 b) 15, 10, 20, 25, 30 Ambas possuem mdia 20. Na srie a no se tem disperso enquanto os valores da srie b apresentam disperses em torno da mdia 20.Assim, a mdia muito mais representativa para a srie a do que para a srie b.

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

27

As medidas de disperso proporcionam um conhecimento mais completo do fenmeno a ser analisado, permitindo estabelecer comparaes entre fenmenos da mesma natureza e mostrando at que ponto os valores se distribuem acima ou abaixo da tendncia central. Amplitude total: a diferena entre o maior e o menor valor da srie. R = Xmx Xmin No exemplo dos pacientes, para o paciente A a amplitude da srie : Range = 76 72 Range = 4, e para o paciente B: Range = 91 59 Range = 32. Observao: A utilizao da amplitude total muito limitada, pois como depende apenas dos valores extremos, instvel, no sendo afetada pela disperso dos outros valores. Exemplo: Conj. 1: 5 Conj. 2: 5 Conj. 3: 5

20 20 20 20 5 5 5 20 7 9 12 15

20 20 17

20 20 20 20 18 20

Todos tm amplitude R = 20 5 = 15 mais a disperso completamente diferente em cada caso. Desvio Mdio: Serve para analisar os desvios em torno da mdia. Dm = | Xi X | Fi n Dm = | Xi | N Dm = | Xi X | n

( para dados no agrupados) DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer
28

Varincia e Desvio Padro: Duas maneiras geralmente utilizadas de variao que efetivamente levam em conta o modo como todos os valores nos dados esto distribudos so a varincia e o desvio padro. Essas medidas avaliam o modo como os dados flutuam em torno da mdia, isto , como as observaes maiores flutuam acima dela e as menores se distribuem abaixo dela. Xi Fi ( Xi Fi) N == N Xi Fi ( Xi Fi) n S S== n-1 = 2 Varincia populacional

Varincia amostral

Desvio Padro Populacional

S=

Desvio Padro Amostral

Exemplo: Calcular o desvio mdio, a varincia e o desvio padro da seguinte distribuio amostral: Xi Fi 5 7 8 9 2 3 5 4 11 2

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

29

a) Calculo do desvio mdio:


__

Xi 5 7 8 9 11

Fi 2 3 5 4 2 16

XiFi 10 21 40 36 22 129

|Xi X| . Fi 6,12 3,18 0,30 3,76 5,88 19,24

Xi Fi 50 147 320 324 242 1.083

1) Acha-se o valor da mdia X = Xi Fi n X = 129 X = 8,06 16 2) Dm = | Xi X | Fi n Dm = 19,24 16 3) Calcula a coluna Xi Fi

Dm = 1,20

b) Calculo da varincia: XiFi - ( XiFi) n S = n1 1083 - (129) 16 S2 = 16 1 S = 2,86 S = 1,69


30

c) Calculo do Desvio Padro: S=

S =

2,86

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

Resumindo: A distribuio possui mdia 8,06 e seu grau de concentrao de 1,20 medido pelo desvio mdio e de 1,69 medido pelo desvio padro.

Coeficiente de Variao: Mede a disperso dos dados em relao mdia. CV =

100

ou

CV = S X

100

Onde: = Desvio padro populacional = Mdia populacional S = Desvio padro amostral X = Mdia amostral Obs.: O coeficiente de variao expresso em porcentagens. Exemplo: Numa empresa o salrio mdio dos homens R$ 4.000,00 com desvio padro de R$ 1.500,00 e o das mulheres em mdia R$ 3.000,00 com desvio padro de R$ 1.200,00. Para os homens: CV = = 1.500 100 = 37,5% 4.000 Para as mulheres: CV = = 1.200 100 = 40% 3.000

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

31

Podemos concluir que os salrios das mulheres apresentam maior disperso do que os salrios dos homens.

Medidas de Assimetria: Denomina-se assimetria o grau de afastamento de uma distribuio da unidade de simetria. Em uma distribuio simtrica tem-se igualdade dos valores da mdia, mediana e moda.

~ X = X = Mo Em uma distribuio assimtrica positiva ou assimtrica direita, temos: ~ Mo < X < X ~ X

Mo X Em uma distribuio assimtrica negativa ou assimtrica esquerda, temos: ~ X < X < Mo ~ X

X Mo

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

32

Frmulas para clculo do coeficiente de assimetria:

1 Coeficiente de Pearson:

AS = Mo populacional

ou

AS = X - Mo S amostral

2 Coeficiente de Pearson: ~ AS = Q1 + Q3 2X Q3 Q1 Se AS = 0 AS > 0 AS < 0 distribuio simtrica assimtrica positiva ( direita) assimtrica negativa ( esquerda)

Exemplo: Dada a distribuio amostral, calcular os dois coeficientes de Pearson.

Salrio (1.000.00) Empregados

30 | 80

50

50 | 50

100

100 | 30

150

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

33

Calcula-se a mdia, moda, desvio padro, 1 quartil, 3 quartil, mediana.


Fi 80 50 30 160 Xi 40 75 125 XiFi 3.200 3.750 3.750 10.700 Fac 80 130 160 *Fi h 4 1 0,6 XiFi 128.000 281.250 468.750 878.000

Classes 30 | 50 50 | 100
100 | 150

X = Xi Fi = 10.700 n 160 ~ X = L Md + (n/2 - f ) FMd n = 160 = 80 2 2

X = 66,88 mdia

h = Onde:

L Md = 30 ;~ n = 160 ;
FMd = 80 ~ X = 30 + (160/2 0) 80

f = 0 ; h = 20

20

1 Quartil e 3 Quartil: Q1 = ? Q1 = n 4 Q1 = 40 Q3 = ? Q3 = 3n 4 Q3 = 120

~
X = 50

mediana

Q1 = L Q1 + (n/4 - f) h FQ1 L Q1 = 30 f = 0 Q1 = 30 + (160/4 0) 20 80 h = 20 FQ1 = 80 Q1 = 40 n = 160

Q3 = L Q3 + (3n/4 - f) h FQ3 L Q3 = 50 f = 80 Q3 = 50 + (3 160/4 80) 50 50 h = 50 FQ3 = 50 Q3 = 90 n = 160

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

34

Moda: Mo = L + 1 1 + 2 L = 30 1 = 4 2 = 3 h = 20
*Quando a amplitude das classes diferente, calcular Fi h para identificar a classe modal.

h Mo = 30 + 4 20 4+3

Mo = 41,43

Xi Fi ( Xi Fi) n S = n1

878.000 (10,700) 160 160 1 S = 1.021,62 S = 31,96

1 Coef.: AS = X Mo AS = 66,88 41,43 S 31,96

AS = 0,80

~ 2 Coef.: AS = Q1 + Q3 2X Q3 Q1

AS = 40 + 90 2 (50) 90 40

AS = 0,60

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

35

Medidas de Curtose: Denomina-se curtose, o grau de achatamento da distribuio. Distribuio nem chata nem delgada: mesocrtica.

Distribuio delgada: leptocrtica

Distribuio achatada: platicrtica

Para medir o grau de curtose utiliza-se o coeficiente: K= Q3 Q1 2(P90 P10)

Onde: Q3 = 3 quartil Q1 = 1 quartil P90 = 90 percentil P10 = 10 percentil


- Se K = 0,236 a curva correspondente distribuio de frequncia mesocrtica. - Se K > 0,236 platicrtica. - Se K < 0,236 leptocrtica.

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

36

Exemplo: Dizer que tipo de curva corresponde distribuio amostral: Classes 3| 8 8| 13 13 | 18 18 | 23 Fi 5 15 20 10 50 Fac 5 20 40 50

P10 Q1 Q3 P90

Q1 = n = 50 = 12,5 elemento 4 4 Q1 = L Q1 + (n/4 - f) FQ1

8 + (50/4 5) 15

Q1 =10,50

Q3 = 3n = 37,5 elemento 4 Q3 = L Q3 + (3n/4 - f) FQ3

13 + (3 50/4 20) 5 20

Q3 = 17,38

P90 = i n = 90 50 = 45 elemento 100 100 Pi = L Pi + (in/100 - f ) FPi

= 18 + (45 40 ) . 5 10

P90 = 20,50

P10 = i n = 10 50 = 5 elemento 100 100 Pi = L Pi + (in/100 - f ) FPi K = Q3 Q1 2(P90 P10)

= 3 + (5 0 ) . 5 5

P10 = 8 K = 0,28

K = 17,38 10,50 2 (20,50 8)

K > 0,263 portanto a curva correspondente platicrtica. DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer
37

h=RK

R = Xmx Xmin

Sturges: K = 1 + 3,22 log n n = tam. da amostra

K = 5 para n < 25 e K n para n > 25 Xi = lim. Inf. + lim. Sup. 2 X =x n fi = Fi n X = x i Fi n

=x
N

MGE = n1X1+ n2X2+ nkXk n1 + n2 + nk


Mh = n F1 + F2 + Fn X1 X2 Xn

X = w1X1 + w2X2 + wkXk = wX w1 + w2 + wk w X = lmd+ ( /2 - f) . h


n

Q1 = n/4

Q2 = n/2 Q3 = 3n/4

Fmd

Di = i n 10

Pi = i n 100

Q1 = l Q1 + (n/4 - f) h

FQ1
Di = l Di + (in/10 - f ) h FDi

Q3 = l Q3+ (3n/4 - f) h FQ3 Pi = l Pi + (in/100 - f) h FPi


Pearson:

Czuber:

Mo = l + 1 h 1 + 2 Dm = | Xi X | Fi n

~ Mo 3X 2X

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

38

Xi Fi ( Xi Fi) N == N = CV =

Xi Fi ( Xi Fi) S = n n-1 S = S

Desvio Padro Pop. 100 ou CV = S X

Desvio Padro Amostral

100

1 Coeficiente de Pearson: AS = Mo populacional K= Q3 Q1 2(P90 P10) AS = X - Mo S amostral

2 Coeficiente de Pearson: ~ AS = Q1 + Q3 2X Q3 Q1

- Se K = 0,236 mesocrtica. - Se K > 0,236 platicrtica. - Se K < 0,236 leptocrtica.

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

39

LISTA DE EXERCCIOS N 1

1) Temos a seguir distancia em metros entre poos produtores e injetores numa malha aproximadamente regular de um Campo de Petrleo da Bacia do Recncavo. Construir uma disposio ramo-folha. 172 182 177 174 166 158 170 178 163 161 191 167 171 201 166 172 2) Os pesos dos tubos de revestimentos de poos de petrleo variam de 168 a 266 quilogramas. Indique os limites de 11 classes em que esses pesos podem ser agrupados. 3) Temos a seguir as notas obtidas por 40 estudantes em um teste de estatstica. Agrupe essas notas em uma distribuio com as classes (intervalos fechados dos dois lados): 20 a 29, 30 a 39, 40 a 49, 50 a 59, 60 a 69, 70 a 79, 80 a 89 e 90 a 99. Calcule a frequncia absoluta e relativa de cada classe. 75 89 66 52 90 68 83 94 77 60 38 47 87 65 97 49 65 72 73 81 63 77 91 88 74 37 85 76 74 63 69 72 31 87 76 58 63 70 72 65 4) Uma auditoria feita em 60 Relatrios de Teste de Formao revelou os seguintes nmeros de erros no preenchimento dos Formulrios de TFR. 0 0 2 1 4 1 0 1 3 2 2 0 1 1 1 4 0 3 1 5 1 1 0 2 0 0 1 1 4 3 0 1 0 2 1 4 3 1 0 0 5 1 2 0 3 0 2 1 1 3 1 4 3 0 2 0 1 1 0 1 Construa uma distribuio que mostre quantos formulrios continham 0,1,2,3,4 ou 5 erros. 5) Montar uma serie cronolgica para representar os valores das exportaes de etanol, fornecidas pelo Instituto do Acar e do lcool nos anos de 1975 a 1981 em dlares . Valores em ordem cronolgica de 1975 a 1981: U$ 60.193, U$ 80.114, U$ 81.826, U$ 106.879, U$ 112.064, U$ 126.740, U$ 149.548. 6) Dado o rol de 50 notas, agrupar os elementos em classes (k = 7) e calcular a frequncia absoluta, frequncia relativa, frequncia acumulada e ponto mdio de cada classe. 33 35 35 39 41 41 42 45 47 48 50 52 53 54 55 55 57 59 60 60 61 64 65 65 65 66 66 66 67 68 69 71 73 73 74 74 76 77 77 78 80 81 84 85 85 88 89 91 94 97

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

40

7) Dadas as estaturas de 140 alunos, conseguiu-se a distribuio abaixo. Calcular a media. Resp. 164,93 Estaturas 145 150 150 155 155 160 160 165 165 170 170 175 175 180 180 185 Alunos 2 10 27 38 27 21 8 7

8) Dada a distribuio, determine a media. Classes 68 72 72 76 76 80 80 84 FAC 8 20 35 40

Resp. 78,16

9) Dada a amostra: 28 33 27 30 31 30 33 30 33 29 27 33 31 27 31 28 27 29 31 24 31 33 30 32 30 33 27 33 31 33 23 29 30 24 28 34 30 30 18 17 18 15 16 17 17 18 19 19 20 29 a) Agrupar os elementos em classe (inicie pelo15) use h = 5 (limite inferior fechado e superior aberto). b) Construir a tabela de distribuio de frequncia c) Calcular a mdia. Resp. 27,5

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

41

10) Suponha que voc dispe de informaes completas sobre as despesas de viagem dos Engenheiros de uma empresa durante o ano de 2010. De um exemplo de cada situao em que esses dados podem ser considerados como: a) Uma populao b) Uma amostra 11) Em um posto de controle rodovirio, 12 motoristas multados por excesso de velocidade estavam dirigindo a 8, 11, 14, 6, 8, 10, 20, 11, 13, 18, 9 e 15 quilmetros por hora acima do limite de velocidade de 80 km/h. c) Em media, quantos quilmetros por hora esses motoristas estavam excedendo o limite? d) Se um motorista que excedia o limite em menos de 15 quilmetros por hora foi multado em R$ 160 e os outros foram multados em R$ 288, determine a media das multas que esses motoristas tiveram que pagar. 12) Um empregado perdeu uma das dez notas de compras efetuadas naquele dia. O valor mdio de todas as 10 notas era de R$ 7,20 e as 9 notas restantes tinham os valores de R$4,80 , R$7,10 , R$7,90 , R$9,55 , R$4,45 , R$5,72 , R$7,54 , R$8,34 e R$9,70. Qual o valor da nota perdida? 13) Os salrios mdios anuais dos professores em 3 cidades so : R$3.830,00 , R$4.450,00 ; R$4.100,00. Havendo 720, 660 e 520 professores nessas cidades, calcular o salrio mdio dos professores das 3 cidades. Resp: R$ 4.119,26 14) Determine a posio mediana para: a) n = 25 b) n = 32 c) n = 37

d) n = 64

15) Em 15 dias, uma bomba de um posto de gasolina da Avenida Paralela abastece: 40, 52, 55, 38, 40, 48, 56, 56, 60, 37, 58, 63, 46, 50, 61 carros. Determine a mediana.

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

42

16) Em 20 paginas de um relatrio, uma secretria cometeu os seguintes nmeros de erros: 0, 0, 1, 2, 0, 3, 1, 0, 0, 0, 0, 1, 0, 0, 4, 1, 0, 0, 2,1. a) Determine a media b) Determine a mediana c) Quantos dos 20 valores superam a media d) Quantos esto abaixo dela e) Quantos superam a mediana f) Quantos esto abaixo dela 17) Para a distribuio abaixo, determine a moda pelos dois processos. (Czuber e Pearson). Classes 7 10 10 13 13 16 16 19 19 22 Fi 6 10 15 10 5

18) Para a distribuio, calcule: a) D6, P65, Q1 Classes 4 6 6 8 8 10 10 12 b) D2, P43, Q3. Classes 20 30 30 40 40 50 50 60 60 70 FAC 3 8 18 22 24
43

Fi 4 11 15 5

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

19) Abaixo esto dadas as notas de 50 alunos: 60 85 33 52 65 77 84 65 74 57 71 35 81 50 35 64 74 47 54 68 80 61 41 91 55 73 59 53 77 45 41 55 78 48 69 85 67 39 60 76 94 98 66 66 73 42 65 94 88 89 Pede-se: a) Determinar a amplitude total da amostra Resp. 65 b) N. de classes pela frmula de Sturges Resp. 7 c) Amplitude das classes Resp. 10 d) Quais as classes (inicie pelo 30) e) Frequncia absoluta das classes f) Frequncia relativa g) Pontos mdios das classes h) Frequncia acumulada i) Mdia Resp. 65,60 j) Moda pelos dois processos (Czuber e Pearson) Resp. 66 k) Mediana Resp. 65,83 l) 1 e 3 quartis Resp. 53,13 e 78,33 m) 7 decil e 55 percentil Resp. 75,56 e 67,92 20) Dada a amostra: 2,3,4,5,7,10,12 a) Qual a amplitude total Resp. 10 b) Determine o desvio mdio Resp. 3,02 c) Calcule a varincia e o desvio padro Resp. 13,81 e 3,72 21) Para a srie 5,5,5,6,6,6,6,7,7,7,7,7,7,8,8,8,9,9 : a) Construir a distribuio de frequncia b) Calcular a amplitude total. Resp. 4 c) Determinar a desvio mdio. Resp. 0,98 d) Calcular a varincia populacional. Resp. 1,47 e) Calcular o desvio padro populacional. Resp. 1,21 f) Calcular o coeficiente de variao populacional. Resp. 18%

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

44

LISTA DE EXERCCIOS N 2
1) Determine a mdia aritmtica das seguintes sries: a) 3, 4, 1, 3, 6, 5, 6 b) 7, 8, 8, 10, 12 c) 3,2; 4,0; 0,75; 5,0; 2,13; 4,75 d) 70, 75, 76, 80, 82, 83, 90 2) A mdia mnima para aprovao em determinada disciplina 5,0. Se um estudante obtm as notas 7,5; 8,0; 3,5; 6,0; 2,5; 2,0; 5,5; 4,0 nos trabalhos mensais da disciplina em questo, pergunta-se se ele foi ou no aprovado. 3) Calcule para cada uma das distribuies abaixo sua respectiva mdia: a) Xi 3 4 7 8 12 Fi 2 5 8 4 3 b) Xi 10 11 12 13 Fi 5 8 10 6

c)

Xi 2 3 4 5 6

FAC 3 9 19 25 28

d)

Xi 85 87 88 89 90

Fi 5 1 10 3 5

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

45

4)Turmas que possuem determinada disciplina em comum apresentam nesta disciplina: Turma A: (40 alunos): mdia 6,5 Turma C: (35 alunos): mdia 4,0 Determine a mdia geral. Turma B: (35 alunos): mdia 6,0 Turma D: (20 alunos): mdia 7,5

5) Encontre a mdia harmnica: a) 5, 7, 12, 15 b) Xi 2 3 4 5 6

Fi 3 4 6 5 2

6)Tem-se R$ 2.000,00 disponveis mensalmente para a compra de determinado artigo que custou, nos meses de junho, julho e agosto respectivamente, R$ 200,00; R$ 500,00 e R$ 700,00. Qual foi o custo mdio do artigo para esse perodo? (calcular atravs da mdia harmnica).

7) Para cada srie determine a mediana: a) 1, 3, 3, 4, 5, 6, 6 b) 1, 3, 3, 4, 6, 8, 8, 9 c) 12, 7, 10, 8, 8 d) 82, 86, 88, 84, 91, 93 8) Dada a srie: 1,2; 1,4; 1,5; 1,8; 2,0. Calcular a mdia e o desvio padro populacional.

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

46

9) Abaixo a amostra de 60 rendas (em mil reais / ms) de Engenheiros de Petrleo de Empresas Operadoras e Prestadoras de Servios que atuam no Recncavo Baiano: 10 7 8 5 4 3 2 9 3 15 1 13 14 4 3 6 10 11 12 13 14 2 15 5 2 1 3 8 10 11 13 14 8 9 5 3 2 3 3 4 5 6 7 8 9 1 12 13 9 6 6 8 4 10 15 16 4 4 14 16

a) Agrupar os elementos em classes, sendo K = 6 e h = 3 b) Calcular a mediana c) Determinar o 3 quartil d) Calcular o 4 decil e) Calcular o 47 percentil f) Determinar o 1 quartil g) Calcular o desvio mdio h) Determinar a varincia i) Determinar o desvio-padro j) Qual o valor do coeficiente de variao? k) A distribuio simtrica? l) A distribuio mesocrtica? m) Determine o 7 decil e o 80 percentil.

DISCIPLINA: Probabilidade e Estatstica Apostila 1 Prof: Antonio Kronbauer

47