Escolar Documentos
Profissional Documentos
Cultura Documentos
2
Estatstica Descritiva
A Estatstica Descritiva pode ser definida como os mtodos estatsticos que envolvem a coleta,
a apresentao e a caracterizao de um conjunto de dados de modo a descrever
apropriadamente as vrias caractersticas estatsticas deste conjunto. Embora os mtodos
estatsticos descritivos sejam importantes para a apresentao e a caracterizao de dados, foi
o desenvolvimento de mtodos estatsticos de inferncia, como um produto da teoria de
probabilidade, que levou ampla aplicao da estatstica em todos os campos de pesquisa
atuais. Assim, pode-se definir a Inferncia Estatstica como os mtodos estatsticos que
tornam possvel a estimativa de uma caracterstica estatstica de uma populao ou a tomada
de uma deciso referente populao com base somente em resultados de amostras.
Para tornar mais clara esta definio, outras definies so necessrias, tais como:
Populao ou Universo - totalidade dos itens, objetos ou valores considerados;
Amostra - a parte representativa da populao selecionada para anlise.
Por que se precisa coletar dados? Quatro razes principais podem ser apresentadas:
Satisfazer curiosidade;
Avaliar o desempenho de uma mudana na execuo de um servio;
Oferecer dados necessrios a um estudo;
Assessorar a tomada de deciso mediante certos riscos inerentes.
4
Captulo 2 Estatstica Descritiva
Solo
Areia
Silte
Argila
Demais Solos
Figura 2.1 Populao e amostra, onde o Solo a Populao e Areia, Argila etc. so Amostras.
Enfim, dados podem ser entendidos como a informao numrica necessria no auxlio de
tomadas de decises mais bem-fundamentadas em determinada situao.
2.1.1 Amostragem
5
Mtodos Estatsticos e Probabilsticos em Geotecnia
Numa amostra aleatria simples, cada elemento ou item possui a mesma chance de seleo de
cada um dos outros elementos da populao, e a seleo de um elemento em particular no
afeta as chances de qualquer outro ser escolhido. Alm disso, uma amostra aleatria simples
tambm pode ser explicitada como aquela na qual cada possvel amostra extrada possui a
mesma chance de seleo de qualquer outra amostra que poderia ser extrada, ou seja, os
elementos da populao tm probabilidades idnticas de serem escolhidos em extraes
subsequentes.
Dois mtodos bsicos podem ser utilizados para selecionar a amostra aleatria simples: a
amostra pode ser obtida com reposio ou sem reposio dos elementos da populao. O
mtodo aplicado deve ser claramente estabelecido, uma vez que vrias formas utilizadas
6
Captulo 2 Estatstica Descritiva
Outra forma prtica de obteno de nmeros aleatrios tambm o emprego do Excel, o qual
possui duas funes geradoras de nmeros aleatrios, so elas:
ALEATRIO() Esta funo retornar um nmero aleatrio, no inteiro, maior ou igual
a 0 (zero) e menor que 1;
RANDBETWEEN(inferior;superior) Retornar um nmero aleatrio, tambm no
inteiro, entre um limite numrico especificado.
A Tabela 2.1 apresenta algumas formas de utilizao destas duas funes. Finalmente,
ressalta-se o emprego da tecla F9, a qual aciona o reclculo do arquivo ativo do Excel, ou
seja, sempre que se for acionada a tecla F9, ou pressionada a tecla Enter, novos nmeros
aleatrios sero gerados.
7
Mtodos Estatsticos e Probabilsticos em Geotecnia
2,0 2,1 2,1 2,2 2,2 2,3 2,5 2,5 2,0 2,1
2,3 2,3 2,5 2,5 2,7 2,8 1,3 1,3 1,5 1,6
1,9 1,9 2,0 2,0 2,2 2,1 1,9 2,3 2,2 2,1
Soluo:
Primeiramente enumera-se de 01 a 30 as clulas de uma tabela, as quais representaro
respectivamente cada valor apresentado no exemplo. Deve-se tomar o cuidado para que cada
valor possua a mesma probabilidade de ser sorteado, com j descrito anteriormente.
01 02 03 04 05 06 07 08 09 10 11 12 13 14 15
16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Partindo da TNA fornecida, obtm-se cinco nmeros no superiores a 30. Ento a amostra
ser:
TNA 26 15 03 07 06
8
Captulo 2 Estatstica Descritiva
Como a maioria das populaes tem estratos bem definidos, esta forma de amostragem uma
das mais utilizadas e apresenta algumas vantagens em relao s demais:
Os dados so geralmente mais homogneos dentro da cada estrato do que na populao
como um todo;
O custo de coleta e anlise dos dados frequentemente menor do que na aleatria
simples;
Pode-se obter estimativas separadas dos parmetros populacionais para cada estrato sem
selecionar outra amostra e, portanto, sem custo adicional.
Assim:
N N1 N2 . . NL
(2.1)
n
f (2.2)
N
9
Mtodos Estatsticos e Probabilsticos em Geotecnia
Geossinttico E Geossinttico F
1,9 1,6 1,7 1,8 1,7 1,8 6,1 4,1 6,7 5,4 4,3 6,4 6,2 5,1
5,9 5,8 5,9 6,5 3,9 5,5 4,2 3,4
4,3 4,4 3,6 4,3 4,8 6,8 5,2 4,8
Soluo:
Inicialmente enumera-se de 01 a 06 as clulas da tabela do Geossinttico E, assim com de
01 a 24 as clulas da tabela do Geossinttico F, como mostrado a seguir.
Geossinttico E Geossinttico F
01 02 03 04 05 06 01 02 03 04 05 06 07 08
09 10 11 12 13 14 15 16
17 18 19 20 21 22 23 24
n 8
f ..f . .f 0, 27
N 30
10
Captulo 2 Estatstica Descritiva
Estrato (geossinttico) E F
Leitura na TNA 03 01 20 03 18 17 24 12
Permeabilidades (10-3 cm/s) 1,7 1,9 4,3 6,7 4,4 4,3 4,8 6,5
onde:
K um nmero inteiro escolhido arbitrariamente entre 1 e n;
r o nmero inteiro mais prximo da frao N/n;
N o nmero de elementos da populao;
n o nmero de elementos da amostra.
11
Mtodos Estatsticos e Probabilsticos em Geotecnia
Soluo:
O inteiro mais prximo da frao :
N 100
r ..r ..r 8,33. .r 8
n 12
Como K um inteiro escolhido aleatoriamente entre 1 e 12, foi ento escolhido K=7. Logo os
caminhes a serem selecionados para o controle tecnolgico sero:
07, 15, 23, 31, 39, 47, 55, 63, 71, 79, 87 e 95
Uma amostra por conglomerado uma amostra simples na qual cada unidade da amostragem
um grupo, ou conglomerado de elementos. Para este tipo de amostragem, a populao
dividida em conglomerados, sendo que cada elemento da populao pertena a um e somente
um conglomerado.
12
Captulo 2 Estatstica Descritiva
aleatrias simples de grupo, e todos os itens dentro dos grupos (conglomerados) selecionados
faro parte da amostra.
Exemplo 2.4 Para estimar o rendimento familiar em uma grande cidade (Figura 2.2), como
deve ser realizada a escolha da amostra.
Soluo:
Os possveis mtodos de amostragem:
Amostragem aleatria simples: Invivel, pois pressupe uma listagem de todas as
famlias da cidade, o que praticamente impossvel de ser obtida;
Amostragem estratificada: Invivel, j que aqui tambm necessria uma listagem dos
elementos por estrato;
Amostragem por conglomerado: A melhor escolha.
13
Mtodos Estatsticos e Probabilsticos em Geotecnia
O sistema de referncia pode ser constitudo por todos os quarteires da cidade, onde cada
quarteiro um conglomerado. Assim, extrai-se uma amostra aleatria simples dos
quarteires da cidade e dos selecionados pesquisa-se a renda familiar em todas as casas.
medida que o nmero de dados coletados cresce, faz-se necessrio condensar ainda mais os
dados em tabelas-resumo adequadas de forma que seu manuseio, visualizao e compreenso
sejam simplificados. Assim, necessrio organizar os dados em grupos de classe de acordo
com as divises do intervalo de observaes estabelecidas de modo conveniente. Tal
organizao de dados em forma de tabela chamada de distribuio de frequncia. Uma
distribuio de frequncia uma tabela resumida na qual os dados so organizados em grupos
de classe ou categorias convenientemente estabelecidas e numericamente ordenados.
14
Captulo 2 Estatstica Descritiva
Uma forma de determinar um nmero razovel de classes (k) consiste na Lei de Sturges:
15
Mtodos Estatsticos e Probabilsticos em Geotecnia
k 1 log 2 n
ou (2.5)
log n
k 1
log 2
Ao desenvolver a tabela de distribuio de frequncia cada classe deve ter um tamanho igual
s demais, definida da seguinte maneira:
Amplitude
Tamanho..da..classe. . (2.6)
N ..de..classe
Existem diversas maneiras de expressar os limites das classes, dentre elas as seguintes:
10 12: Compreende todos os valores entre 10 e 12;
10 12: Compreende todos os valores de 10 a 12, excluindo o valor 12;
10 12: Compreende todos os valores de 10 a 12, excluindo o valor 10.
A prtica mais usual que o limite inferior de uma classe seja fechado, ou seja, inclua o valor
igual, e o limite superior seja aberto, ou seja, menor que o valor explicitado.
16
Captulo 2 Estatstica Descritiva
Soluo:
Os dados brutos devem ser ordenados em ordem crescente:
1,75 1,77 1,78 1,79 1,79 1,80 1,83 1,85 1,87 1,87 1,87 1,88 1,89 1,89 1,89
1,91 1,91 1,91 1,91 1,92 1,92 1,92 1,92 1,93 1,93 1,93 1,94 1,95 1,96 1,96
Trata-se de 30 valores de massa especfica seca, sendo o menor igual a 1,75 e o maior 1,96.
Assim, a amplitude de 0,21.
log 30
k 1 log 2 30..k 1 ..k 5,90
log 2
A partir deste valor adotou-se o nmero de classes igual a cinco, que poderia ter sido seis,
pois a Lei de Sturges apenas um indicativo do nmero de classes. Dividindo-se a amplitude
calculada (0,21) pelo nmero de classes adotado (5), determina-se o valor de 0,042, que
corresponde ao tamanho de cada classe. Contudo, optou-se por trabalhar com o valor de 0,05.
Assim, a tabela de frequncia dos valores de massa especfica do rejeito dada por:
17
Mtodos Estatsticos e Probabilsticos em Geotecnia
Classe xi ni fi Ni Fi
1,75 1,80 1,775 06 0,20 06 0,20
1,80 1,85 1,825 02 0,07 08 0,27
1,85 1,90 1,875 07 0,23 15 0,50
1,90 1,95 1,925 13 0,43 28 0,93
1,95 2,00 1,975 02 0,07 30 1,00
Observao: Neste caso, optou-se por definir as classes a partir do limite inferior (menor valor
observado) da amostra. Como o nmero e a amplitude das classes so arbitrados, isto pode
desbalancear uma das classes dos extremos. Para evitar este desbalanceamento, devem-se
definir as classes a partir do valor da mdia da amostra em direo aos extremos inferior e
superior.
Para utilizar a opo Histograma pela ferramenta Anlise de Dados, os limites de classes
superiores dos intervalos de classe devem ser inseridos na planilha que contm os dados a
serem analisados. Para criar o histograma e o grfico de frequncias acumuladas, precisa-se
desenvolver as seguintes etapas:
Selecione na guia Ferramentas o comando Anlise de Dados, o qual abrir uma
janela de rotinas de nome Ferramentas de Anlise, como apresentado na Figura 2.4.
Nesta janela, selecione a rotina Histograma confirmando a seleo com um clique no
boto OK. Se Anlise de Dados no for uma opo na sua guia Ferramentas, o
componente Anlise de Dados do Excel provavelmente no est instalado corretamente.
18
Captulo 2 Estatstica Descritiva
19
Mtodos Estatsticos e Probabilsticos em Geotecnia
Na Figura 2.6, um eixo vertical diferente includo para cada grfico, uma vez que os dois
grficos esto sobrepostos. O eixo vertical do lado esquerdo do grfico fornece as frequncias
para o histograma, enquanto o eixo vertical direita oferece percentagens para o polgono de
percentagem acumulada. Observe que este grfico contm dois erros, ou seja, existem lacunas
20
Captulo 2 Estatstica Descritiva
entres as barras verticais que correspondem aos intervalos de classe, e existe uma classe
adicional, denominada Mais pelo Excel. Para corrigir o espaamento entre classes
necessria a realizao dos seguintes passos:
D um duplo clique sobre uma barra vertical do grfico para aparecer a caixa de dilogo
Formatar Sequncia de Dados, planilha Opes;
Na caixa de edio Largura do Espaamento, modifique o valor para zero e clique no
boto OK. O histograma agora possui as barras verticais contnuas.
Aps as correes, o grfico resultante tem agora o nmero apropriado de classes, ou seja,
cinco, conforme visto na Figura 2.7.
21
Mtodos Estatsticos e Probabilsticos em Geotecnia
60
50
40
30
20
10
0
0 45 115 180 260 300
1 11 21 31 41
Progressivas (m)
Figura 2.8 Variao do ngulo de atrito ao longo das progressivas do tnel TACF (Hidalgo,
2002).
22
Captulo 2 Estatstica Descritiva
2.2.5.2 Histograma
14
12
10
Freqncia
8
de
Observaes 6
0
1,75 1,80 1,85 1,90 1,95 2,00
23
Mtodos Estatsticos e Probabilsticos em Geotecnia
14
12
10
Freqncia
8
de
Observaes 6
0
1,75 1,80 1,85 1,90 1,95 2,00
2.2.5.5 Ogiva
24
Captulo 2 Estatstica Descritiva
porcentagens (%) de frequncia de cada classe das massas especficas secas do Exemplo 2.5,
conforme mostrado na Figura 2.13.
14
12
10
Freqncia
8
de
Observaes 6
0
1,75 1,80 1,85 1,90 1,95 2,00
100
14
90
12 80
70
10
Freqncia 60 Freqncia
8
de 50 Acumulada
Observaes 6 40 (%)
30
4
20
2
10
0
1,75 1,80 1,85 1,90 1,95 2,00
25
Mtodos Estatsticos e Probabilsticos em Geotecnia
1
2
5 16,70 %
6,70 %
10 %
26,60 %
40 %
3
Figura 2.13 Grfico de setores mostrando a frequncia relativa das classes do Exemplo 2.5.
Em qualquer anlise e/ou interpretao dos dados coletados, vrias medidas descritivas
representando as propriedades de tendncia central, disperso e forma podem ser utilizadas
para extrair e resumir as principais caractersticas deste conjunto de dados. Se essas medidas
descritivas resumidas forem calculadas por meio de uma amostra de dados, elas sero
chamadas de estatsticas; caso sejam calculadas por meio de toda uma populao de dados,
elas sero chamadas de parmetros.
Para Levine et al. (1998), a maioria dos dados apresenta uma diferente tendncia de se
agrupar ou concentrar em torno de um ponto central. Desta forma, para um conjunto de dados
em particular, geralmente se torna possvel selecionar um valor tpico ou mdio para
descrever todo o conjunto. Tal valor descrito tpico uma medida de localizao ou tendncia
central. A seguir, sero apresentados trs tipos de medidas de tendncia central, que so a
mdia aritmtica, a mediana e a moda.
26
Captulo 2 Estatstica Descritiva
X1 X 2 X3 . . X n
X (2.7)
n
ou simplesmente:
X i
X. . i 1
(2.8)
n
Uma variao desta expresso a mdia ponderada, que utilizada quando os nmeros que se
quer sintetizar tm graus de importncia diferenciados. A mdia ponderada dos nmeros
X1 , .X2 , .X3 , ....,.Xn , com pesos p1 , .p2 , .p3 , . ., pn , definida como:
X1p1 X 2 p2 X3p3 . . X n pn
Xp n
p
i 1
i
(2.9)
2.3.1.2 Mediana
A mediana o valor do meio de uma sequncia ordenada de dados. Caso no existam valores
repetidos, metade das observaes ser menor e metade ser maior do que a mediana. A
mediana no afetada por qualquer observao extrema em um conjunto de dados. Assim,
sempre que uma observao extrema estiver presente, apropriado utilizar a mediana em vez
27
Mtodos Estatsticos e Probabilsticos em Geotecnia
da mdia aritmtica para descrever a tendncia do conjunto de dados. Segundo Ang & Tang
(1975), a mediana representa o limite em que 50% dos dados se encontram acima e abaixo da
mesma, ou seja, os dados apresentam iguais chances de ocorrncia.
n 1
Me . . (2.10)
2
28
Captulo 2 Estatstica Descritiva
Soluo:
Para o primeiro conjunto a disposio ordenada dos dados :
Observaes ordenadas 1 2 3 4 5 6
Para estes dados o ponto de posicionamento 3,5. Portanto, a mediana obtida calculando a
mdia entre a terceira e a quarta observaes ordenadas, ou seja, um valor de 8,3 cm.
Observaes ordenadas 1 2 3 4 5 6 7
Neste caso ao calcular a mediana, ignora-se o fato de que valores repetidos podem estar
presentes nos dados. Para este conjunto de tamanho mpar, o ponto de posicionamento da
mediana a quarta observao. Deste modo, a mediana ser o valor 22,6 cm, o valor do meio
do conjunto ordenado, embora a terceira observao tambm seja 22,6 cm.
29
Mtodos Estatsticos e Probabilsticos em Geotecnia
Exemplo 2.7 Suponha que se queria sintetizar em um nico nmero os salrios das pessoas
que trabalham numa determinada obra (engenheiros, encarregados, estagirios, operrios etc.).
Soluo:
Para esta sntese so encontrados os seguintes nmeros (em ordem crescente).
A mdia aritmtica destes valores corresponde a 564,29. Esse o valor que representa
razoavelmente aquele conjunto de observaes.
A mdia seria 878,57. Neste caso, j no se pode dizer que a mdia sintetiza adequadamente o
conjunto, pois apenas um valor maior do que ela. Verifica-se em ambos os casos que a
mediana a mesma, ou seja, 500 confirmando assim, a sensibilidade da mdia aos valores
extremos.
Convm, ento, observar que em alguns casos preferencial utilizar a mediana como medida
sintetizadora, como por exemplo, na situao em que o histograma do conjunto de valores
assimtrico, isto , quando h predominncia de valores elevados em uma das caudas.
2.3.1.3 Moda
30
Captulo 2 Estatstica Descritiva
Exemplo 2.8 Para o conjunto a seguir deseja-se conhecer a mdia, a mediana e a moda.
2 4 5 5 5 6 6 7 8 9
Soluo:
De acordo com as definies anteriores, tem-se que:
Mdia X = 5,7
Mediana Me = 5,5
Moda Mo = 5
Um conjunto de dados poder ser classificado como amodal, ou seja, quando esse apresentar
todos os seus elementos com igual nmero de ocorrncia. Da mesma forma, o conjunto
poder ser bimotal, trimodal etc., isso quando dois ou mais elementos apresentarem o mesmo
nmero de ocorrncia.
31
Mtodos Estatsticos e Probabilsticos em Geotecnia
Tabela 2.3 Exemplo hipottico de comparao da disperso de dados de uma mesma rea.
Desvio
Equipe Pesos Especficos (kN/m) Mdia Varincia
Padro
I 15,0 15,4 15,8 16,2 16,6 17,0 16,0 0,56 0,75
II 15,8 15,8 15,8 16,2 16,2 16,2 16,0 0,05 0,22
A seguir, sero apresentados dois tipos de medidas de variao: a varincia e o desvio padro.
A varincia e o desvio padro medem a disperso mdia em torno da mdia amostral, ou seja,
como as observaes flutuam em torno da mdia amostral.
2.3.2.1 Varincia
A varincia amostral aproximadamente a mdia das diferenas ao quadrado entre cada uma
das observaes de um conjunto de dados e a mdia aritmtica do conjunto. Assim sendo,
para uma amostra contendo n observaes X1 , .X2 , .X3 , ....,.Xn , a varincia amostral pode ser
escrita como pela equao a seguir:
X X . . X2 X . . . . Xn X
2 2 2
2 1
s (2.11)
n 1
(X i X) 2
s2 i 1
(2.12)
n 1
32
Captulo 2 Estatstica Descritiva
O desvio padro amostral s a raiz quadrada da soma das diferenas ao quadrado em torno da
mdia aritmtica dividida pelo tamanho da amostra menos 1, ou seja, a raiz quadrada da
varincia amostral, definido por:
(X i X) 2
s i 1
(2.13)
n 1
Para Levine et al. (1998), de modo distinto das medidas anteriores, o coeficiente de variao
a medida relativa da variao. Ele expresso como uma percentagem em vez de utilizar
termos de unidades dos dados especficos. Assim, o coeficiente de variao mede e d ideia
da disperso dos dados em relao mdia aritmtica conforme expresso a seguir:
s
CV 100% (2.14)
X
onde:
CV Coeficiente de variao;
s Desvio padro amostral;
X Mdia aritmtica.
33
Mtodos Estatsticos e Probabilsticos em Geotecnia
34
Captulo 2 Estatstica Descritiva
35