Você está na página 1de 32

Captulo

2
Estatstica Descritiva
A Estatstica Descritiva pode ser definida como os mtodos estatsticos que envolvem a coleta,
a apresentao e a caracterizao de um conjunto de dados de modo a descrever
apropriadamente as vrias caractersticas estatsticas deste conjunto. Embora os mtodos
estatsticos descritivos sejam importantes para a apresentao e a caracterizao de dados, foi
o desenvolvimento de mtodos estatsticos de inferncia, como um produto da teoria de
probabilidade, que levou ampla aplicao da estatstica em todos os campos de pesquisa
atuais. Assim, pode-se definir a Inferncia Estatstica como os mtodos estatsticos que
tornam possvel a estimativa de uma caracterstica estatstica de uma populao ou a tomada
de uma deciso referente populao com base somente em resultados de amostras.

Para tornar mais clara esta definio, outras definies so necessrias, tais como:
Populao ou Universo - totalidade dos itens, objetos ou valores considerados;
Amostra - a parte representativa da populao selecionada para anlise.

A Figura 2.1 apresenta de forma grfica e simplificada a definio de populao e amostra. O


universo Solo representa todos os elementos que tenham pelo menos uma caracterstica em
comum, ou seja, so tipos de solos existentes na natureza, assim como as amostras Areia,
Argila, Silte e Demais solos representam parte da populao que possuem propriedades
prprias, contudo fazendo parte de uma mesma populao.

2.1 COLETA DE DADOS

Por que se precisa coletar dados? Quatro razes principais podem ser apresentadas:
Satisfazer curiosidade;
Avaliar o desempenho de uma mudana na execuo de um servio;
Oferecer dados necessrios a um estudo;
Assessorar a tomada de deciso mediante certos riscos inerentes.

4
Captulo 2 Estatstica Descritiva

Solo
Areia
Silte
Argila

Demais Solos

Figura 2.1 Populao e amostra, onde o Solo a Populao e Areia, Argila etc. so Amostras.

Exemplos destes tpicos so:


O executor de um aterro precisa determinar se a melhoria do solo com o emprego da cal
mais eficiente do que o processo de produo atualmente em uso;
O engenheiro deseja monitorar regularmente um processo para descobrir se a qualidade
do servio oferecido est de acordo com os padres da empresa;
O analista de mercado procura caractersticas que possam distinguir o produto de sua
empresa do produto de seus concorrentes;
O potencial investidor de um metr deseja determinar qual a real probabilidade de falha
(ruptura) do projeto, a fim de mensurar os possveis prejuzos econmicos.

Enfim, dados podem ser entendidos como a informao numrica necessria no auxlio de
tomadas de decises mais bem-fundamentadas em determinada situao.

2.1.1 Amostragem

Existem duas alternativas para obter informaes sobre uma populao:


Censo - as informaes so coletadas junto a todos os elementos da populao;
Amostragem - as informaes so coletadas junto a um subconjunto representativo da
populao, denominado de amostra.

5
Mtodos Estatsticos e Probabilsticos em Geotecnia

Na realizao de qualquer estudo quase nunca possvel examinar todos os elementos da


populao de interesse. Caso fosse possvel o acesso a todos os elementos da populao, isto
no significaria maior preciso nos resultados, pois os erros de coleta e manuseio de grande
nmero de dados so maiores do que as imprecises devido generalizao das concluses de
uma amostra bem selecionada. Um levantamento amostral visa definir a populao de
interesse e selecionar as caractersticas a serem pesquisadas.

A tcnica de amostragem amplamente utilizada pelas seguintes razes:


Se a populao for muito grande ou infinita, a realizao de um censo se torna impossvel
ou proibitivo em termos de tempo e custo;
Em situaes onde a obteno de informaes for feita a partir de testes destrutivos dos
elementos analisados, o uso da amostragem se torna imprescindvel.

Os quatro tipos de amostragem geralmente mais utilizados so a amostragem aleatria


simples, a amostragem estratificada, a amostragem sistemtica e a amostragem por
conglomerado.

2.1.1 Amostragem Aleatria Simples

Numa amostra aleatria simples, cada elemento ou item possui a mesma chance de seleo de
cada um dos outros elementos da populao, e a seleo de um elemento em particular no
afeta as chances de qualquer outro ser escolhido. Alm disso, uma amostra aleatria simples
tambm pode ser explicitada como aquela na qual cada possvel amostra extrada possui a
mesma chance de seleo de qualquer outra amostra que poderia ser extrada, ou seja, os
elementos da populao tm probabilidades idnticas de serem escolhidos em extraes
subsequentes.

Dois mtodos bsicos podem ser utilizados para selecionar a amostra aleatria simples: a
amostra pode ser obtida com reposio ou sem reposio dos elementos da populao. O
mtodo aplicado deve ser claramente estabelecido, uma vez que vrias formas utilizadas

6
Captulo 2 Estatstica Descritiva

posteriormente com o propsito de inferncia estatstica so dependentes dos mtodos de


seleo. Uma importante aliada na seleo da amostra aleatria simples a tabela de nmeros
aleatrios (TNA), a qual se encontra disponvel no fim deste captulo e que tambm pode ser
obtida na maioria dos livros de estatsticas.

Outra forma prtica de obteno de nmeros aleatrios tambm o emprego do Excel, o qual
possui duas funes geradoras de nmeros aleatrios, so elas:
ALEATRIO() Esta funo retornar um nmero aleatrio, no inteiro, maior ou igual
a 0 (zero) e menor que 1;
RANDBETWEEN(inferior;superior) Retornar um nmero aleatrio, tambm no
inteiro, entre um limite numrico especificado.

Contudo, existe a possibilidade da funo RandBetween(inferior;superior) no estar


disponvel para ser utilizada, o que ser percebido quando ela retornar como resultado a
seguinte mensagem: #NOME?. Desde modo, necessrio disponibilizar esta funo a partir
da instalao do suplemento Ferramentas de Anlise VBA, seguindo os seguintes passos:
Inicie o programa Excel e clique em Ferramentas e depois em Suplementos;
Marque a opo Ferramentas de Anlise VBA, confirmando com a tecla OK.

A Tabela 2.1 apresenta algumas formas de utilizao destas duas funes. Finalmente,
ressalta-se o emprego da tecla F9, a qual aciona o reclculo do arquivo ativo do Excel, ou
seja, sempre que se for acionada a tecla F9, ou pressionada a tecla Enter, novos nmeros
aleatrios sero gerados.

Tabela 2.1 Funes de gerao de nmeros aleatrios.


Frmula Descrio
=ALEATRIO() Gera um nmero aleatrio entre 0 e 1
=ALEATRIO()*100 Gera um nmero aleatrio entre 0 e 100
=RANDBETWEEN(1;100) Gera um nmero aleatrio entre 1 e 100
=RANDBETWEEN(-1;1) Gera um nmero aleatrio entre -1 e 1

7
Mtodos Estatsticos e Probabilsticos em Geotecnia

Exemplo 2.1 As espessuras de 30 amostras de geotxtil coletadas de uma mesma manta so


apresentadas abaixo.

2,0 2,1 2,1 2,2 2,2 2,3 2,5 2,5 2,0 2,1
2,3 2,3 2,5 2,5 2,7 2,8 1,3 1,3 1,5 1,6
1,9 1,9 2,0 2,0 2,2 2,1 1,9 2,3 2,2 2,1

Extrair, sem reposio, uma amostra aleatria de cinco elementos.

Soluo:
Primeiramente enumera-se de 01 a 30 as clulas de uma tabela, as quais representaro
respectivamente cada valor apresentado no exemplo. Deve-se tomar o cuidado para que cada
valor possua a mesma probabilidade de ser sorteado, com j descrito anteriormente.

01 02 03 04 05 06 07 08 09 10 11 12 13 14 15
16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

Partindo da TNA fornecida, obtm-se cinco nmeros no superiores a 30. Ento a amostra
ser:
TNA 26 15 03 07 06

Amostras 2,1 2,7 2,1 2,5 2,3

2.1.2 Amostragem Estratificada

Quando os elementos de uma populao esto divididos em grupos de elementos, chamados


estratos, de forma que todo elemento da populao pertena a um e somente um estrato,
mais fcil e eficiente escolher uma amostra aleatria simples dentro de cada um dos estratos.

8
Captulo 2 Estatstica Descritiva

Como a maioria das populaes tem estratos bem definidos, esta forma de amostragem uma
das mais utilizadas e apresenta algumas vantagens em relao s demais:
Os dados so geralmente mais homogneos dentro da cada estrato do que na populao
como um todo;
O custo de coleta e anlise dos dados frequentemente menor do que na aleatria
simples;
Pode-se obter estimativas separadas dos parmetros populacionais para cada estrato sem
selecionar outra amostra e, portanto, sem custo adicional.

comum utilizar a amostragem estratificada proporcional, que consiste em selecionar os


elementos da amostra entre os vrios estratos, em nmero proporcional ao tamanho de cada
um dos estratos, considerando que:
N o nmero de elementos da populao;
L o nmero de estratos;
Ni o nmero de elementos do estrato i;
n o tamanho da amostra a ser selecionada.

Assim:

N N1 N2 . . NL
(2.1)

Calcula-se a frao da amostra dada por:

n
f (2.2)
N

O nmero de elementos a serem sorteados em cada estrato :

N1f , .N2f ,. ., Nk f (2.3)

9
Mtodos Estatsticos e Probabilsticos em Geotecnia

Exemplo 2.2 Na restaurao de um pavimento flexvel, foram utilizados dois tipos de


geossintticos como material de reforo: E e F. Em uma anlise de permeabilidade dos
materiais foram consideradas 30 amostras da manta, representadas abaixo pelos valores das
permeabilidades (x10-3 cm/s) de cada uma. Extrair, sem reposio, uma amostra de oito
elementos.

Geossinttico E Geossinttico F
1,9 1,6 1,7 1,8 1,7 1,8 6,1 4,1 6,7 5,4 4,3 6,4 6,2 5,1
5,9 5,8 5,9 6,5 3,9 5,5 4,2 3,4
4,3 4,4 3,6 4,3 4,8 6,8 5,2 4,8

Soluo:
Inicialmente enumera-se de 01 a 06 as clulas da tabela do Geossinttico E, assim com de
01 a 24 as clulas da tabela do Geossinttico F, como mostrado a seguir.

Geossinttico E Geossinttico F
01 02 03 04 05 06 01 02 03 04 05 06 07 08
09 10 11 12 13 14 15 16
17 18 19 20 21 22 23 24

A frao da amostra dada por:

n 8
f ..f . .f 0, 27
N 30

De cada estrato, sero sorteadas, respectivamente, n1 e n2 unidades:

n1 f .N1..n1 0, 27. 6 ..n1 1, 62. .n1 2

10
Captulo 2 Estatstica Descritiva

n 2 f .N2 ..n 2 0, 27. 24 ..n 2 6, 48. .n 2 6

Lendo os algarismos da TNA, inferiores a 06 para o Geossinttico E e a 24 para o


Geossinttico F, obtm-se o seguinte resultado:

Estrato (geossinttico) E F
Leitura na TNA 03 01 20 03 18 17 24 12
Permeabilidades (10-3 cm/s) 1,7 1,9 4,3 6,7 4,4 4,3 4,8 6,5

2.1.3 Amostragem Sistemtica

A amostragem sistemtica ocorre quando os elementos de uma populao esto ordenados e a


retirada feita de forma peridica. Uma amostra sistemtica de tamanho n constituda dos
seguintes elementos:

K, .K.+.r, .K.+.2r, ...., .K.+.ir (2.4)

onde:
K um nmero inteiro escolhido arbitrariamente entre 1 e n;
r o nmero inteiro mais prximo da frao N/n;
N o nmero de elementos da populao;
n o nmero de elementos da amostra.

Se o tamanho da populao desconhecido, no se pode determinar exatamente o valor de r.


Neste caso, escolhe-se intuitivamente um valor razovel para r. As vezes a amostragem
sistemtica preferida amostragem aleatria simples, devido a facilidade de sua execuo e
estando ela menos sujeita a erros, como tambm por proporcionar mais informaes com
menor custo.

11
Mtodos Estatsticos e Probabilsticos em Geotecnia

Exemplo 2.3 Um dos ensaios realizados durante a concretagem de estruturas em concreto


armado, para seu controle tecnolgico, chama-se Slump test. Na concretagem de um
viaduto ferrovirio o controle tecnolgico foi realizado por uma amostragem sistemtica.
Assim, de uma populao de 100 caminhes betoneira arbitrou-se por uma amostra de doze
elementos. Deste modo, determine os caminhes a serem selecionados para a realizao do
controle tecnolgico do concreto.

Soluo:
O inteiro mais prximo da frao :

N 100
r ..r ..r 8,33. .r 8
n 12

Como K um inteiro escolhido aleatoriamente entre 1 e 12, foi ento escolhido K=7. Logo os
caminhes a serem selecionados para o controle tecnolgico sero:

07, 15, 23, 31, 39, 47, 55, 63, 71, 79, 87 e 95

2.1.4 Amostragem por Conglomerado

Uma amostra por conglomerado uma amostra simples na qual cada unidade da amostragem
um grupo, ou conglomerado de elementos. Para este tipo de amostragem, a populao
dividida em conglomerados, sendo que cada elemento da populao pertena a um e somente
um conglomerado.

A utilizao deste processo requer que os elementos do conglomerado tenham caractersticas


similares. Como regra geral, o nmero de elementos deve ser pequeno em relao ao tamanho
da populao, e o nmero de conglomerados, razoavelmente grande. Exige-se ainda, que a
populao esteja dividida em grupos do mesmo modo como feito na amostragem
estratificada, sendo que nesta, seleciona-se uma amostra aleatria simples dentro de cada
grupo (estrato), enquanto que na amostragem por conglomerado selecionam-se amostras

12
Captulo 2 Estatstica Descritiva

aleatrias simples de grupo, e todos os itens dentro dos grupos (conglomerados) selecionados
faro parte da amostra.

A amostragem por conglomerado recomendada quando:


No se tem um sistema de referncia listando todos os elementos da populao;
A obteno da listagem dispendiosa;
O custo da obteno de informaes cresce com o aumento da distncia entre os
elementos.

Exemplo 2.4 Para estimar o rendimento familiar em uma grande cidade (Figura 2.2), como
deve ser realizada a escolha da amostra.

Soluo:
Os possveis mtodos de amostragem:
Amostragem aleatria simples: Invivel, pois pressupe uma listagem de todas as
famlias da cidade, o que praticamente impossvel de ser obtida;
Amostragem estratificada: Invivel, j que aqui tambm necessria uma listagem dos
elementos por estrato;
Amostragem por conglomerado: A melhor escolha.

Figura 2.2 Mapa da cidade.

13
Mtodos Estatsticos e Probabilsticos em Geotecnia

O sistema de referncia pode ser constitudo por todos os quarteires da cidade, onde cada
quarteiro um conglomerado. Assim, extrai-se uma amostra aleatria simples dos
quarteires da cidade e dos selecionados pesquisa-se a renda familiar em todas as casas.

2.2 APRESENTAO DOS DADOS COLETADOS

medida que o nmero de dados coletados cresce, faz-se necessrio condensar ainda mais os
dados em tabelas-resumo adequadas de forma que seu manuseio, visualizao e compreenso
sejam simplificados. Assim, necessrio organizar os dados em grupos de classe de acordo
com as divises do intervalo de observaes estabelecidas de modo conveniente. Tal
organizao de dados em forma de tabela chamada de distribuio de frequncia. Uma
distribuio de frequncia uma tabela resumida na qual os dados so organizados em grupos
de classe ou categorias convenientemente estabelecidas e numericamente ordenados.

Quando as observaes so agrupadas ou condensadas em tabelas de distribuio de


frequncia, o processo de anlise e interpretao dos dados se torna mais fcil de manejar e
mais significativo. Nesta forma resumida, as principais caractersticas dos dados podem ser
aproximadas, compensando deste modo o fato de que, quando os dados esto demasiadamente
agrupados, as informaes iniciais pertinentes a observaes individuais, que se encontravam
anteriormente disponveis, so perdidas ao longo do processo de agrupamento ou
condensao.

Ao construir a tabela de distribuio de frequncia (Tabela 2.2), deve-se atentar para:


A seleo do nmero apropriado de grupos de classes para a tabela;
A obteno de um intervalo de classe e amplitude para cada grupo de classe;
O estabelecimento de limites para cada grupo de classe a fim de evitar uma sobreposio.

Tabela 2.2 Quadro de distribuio de frequncia.


Classe xi ni fi Ni Fi

14
Captulo 2 Estatstica Descritiva

Na Tabela 2.2 as colunas so:


Classe a identificao do nmero da classe;
xi o ponto mdio de i-sima classe, ou seja, a mdia dos pontos extremos da classe;
ni a quantidade de observaes, ou freqncia, da i-sima classe (suposta concentrada
no respectivo ponto mdio);
fi a frequncia relativa da classe, dada por ni / n;
n o nmero total de observaes;
Ni a frequncia acumulada at a i-sima classe e indica a quantidade de observaes
inferiores ao limite superior da classe;
Fi a frequncia relativa acumulada, dada por Ni / n.

2.2.1 Nmero de Classes

O nmero de classes a ser utilizado depende principalmente do nmero de observaes.


Quando o volume de dados muito grande, o processo de ordenao torna-se extremamente
trabalhoso, e sua listagem, mesmo que organizada, ser de pouca utilidade. Nestes casos o
processo pode ser simplificado agrupando os dados em certo nmero de classes. O
agrupamento por classes deve obedecer a algumas normas:
As classes devem abranger todas as observaes;
O extremo superior de uma classe o extremo inferior da classe subsequente;
Cada valor deve ser enquadrado em apenas uma classe;
A quantidade de classes no deve ser superior a 25 nem inferior a 5.

Uma forma de determinar um nmero razovel de classes (k) consiste na Lei de Sturges:

15
Mtodos Estatsticos e Probabilsticos em Geotecnia

k 1 log 2 n

ou (2.5)

log n
k 1
log 2

onde n o nmero total de observaes.

2.2.2 Tamanho das Classes

Ao desenvolver a tabela de distribuio de frequncia cada classe deve ter um tamanho igual
s demais, definida da seguinte maneira:

Amplitude
Tamanho..da..classe. . (2.6)
N ..de..classe

onde a amplitude a diferena entre os valores mximo e mnimo observados.

Por uma questo de convenincia e facilidade de leitura, o tamanho de cada classe


costumeiramente arredondado.

2.2.3 Limite das Classes

Existem diversas maneiras de expressar os limites das classes, dentre elas as seguintes:
10 12: Compreende todos os valores entre 10 e 12;
10 12: Compreende todos os valores de 10 a 12, excluindo o valor 12;
10 12: Compreende todos os valores de 10 a 12, excluindo o valor 10.

A prtica mais usual que o limite inferior de uma classe seja fechado, ou seja, inclua o valor
igual, e o limite superior seja aberto, ou seja, menor que o valor explicitado.

16
Captulo 2 Estatstica Descritiva

Exemplo 2.5 A partir de campanhas de ensaio de campo foram determinadas as massas


especficas secas de um aterro hidrulico, constitudo por rejeito de minrio de ferro. Pede-se,
obter a tabela completa de distribuio de frequncia.

Massas especficas secas (g/cm3)


1,77 1,75 1,78 1,79 1,91 1,96 1,79 1,93 1,96 1,89 1,89 1,91 1,80 1,83 1,85
1,87 1,88 1,87 1,87 1,91 1,92 1,92 1,92 1,92 1,93 1,93 1,94 1,89 1,91 1,95

Soluo:
Os dados brutos devem ser ordenados em ordem crescente:

1,75 1,77 1,78 1,79 1,79 1,80 1,83 1,85 1,87 1,87 1,87 1,88 1,89 1,89 1,89
1,91 1,91 1,91 1,91 1,92 1,92 1,92 1,92 1,93 1,93 1,93 1,94 1,95 1,96 1,96

Trata-se de 30 valores de massa especfica seca, sendo o menor igual a 1,75 e o maior 1,96.
Assim, a amplitude de 0,21.

Pela Lei de Sturges tem-se que o nmero de classes :

log 30
k 1 log 2 30..k 1 ..k 5,90
log 2

A partir deste valor adotou-se o nmero de classes igual a cinco, que poderia ter sido seis,
pois a Lei de Sturges apenas um indicativo do nmero de classes. Dividindo-se a amplitude
calculada (0,21) pelo nmero de classes adotado (5), determina-se o valor de 0,042, que
corresponde ao tamanho de cada classe. Contudo, optou-se por trabalhar com o valor de 0,05.
Assim, a tabela de frequncia dos valores de massa especfica do rejeito dada por:

17
Mtodos Estatsticos e Probabilsticos em Geotecnia

Classe xi ni fi Ni Fi
1,75 1,80 1,775 06 0,20 06 0,20
1,80 1,85 1,825 02 0,07 08 0,27
1,85 1,90 1,875 07 0,23 15 0,50
1,90 1,95 1,925 13 0,43 28 0,93
1,95 2,00 1,975 02 0,07 30 1,00

Observao: Neste caso, optou-se por definir as classes a partir do limite inferior (menor valor
observado) da amostra. Como o nmero e a amplitude das classes so arbitrados, isto pode
desbalancear uma das classes dos extremos. Para evitar este desbalanceamento, devem-se
definir as classes a partir do valor da mdia da amostra em direo aos extremos inferior e
superior.

2.2.4 Utilizando o Excel

Na obteno da distribuio de frequncia relativa, da distribuio de frequncia acumulada e


do histograma dos dados do Exemplo 2.5 apresentados na Figura 2.3, ser utilizada a rotina
Histograma da ferramenta Anlise de Dados.

Para utilizar a opo Histograma pela ferramenta Anlise de Dados, os limites de classes
superiores dos intervalos de classe devem ser inseridos na planilha que contm os dados a
serem analisados. Para criar o histograma e o grfico de frequncias acumuladas, precisa-se
desenvolver as seguintes etapas:
Selecione na guia Ferramentas o comando Anlise de Dados, o qual abrir uma
janela de rotinas de nome Ferramentas de Anlise, como apresentado na Figura 2.4.
Nesta janela, selecione a rotina Histograma confirmando a seleo com um clique no
boto OK. Se Anlise de Dados no for uma opo na sua guia Ferramentas, o
componente Anlise de Dados do Excel provavelmente no est instalado corretamente.

18
Captulo 2 Estatstica Descritiva

Na rea de Entrada da caixa de dilogo Histograma (Figura 2.5), insira o intervalo


Dados!$A$2:$C$11 na caixa de edio Intervalo de Entrada. Insira o intervalo
Dados!$E$2:$E$6 caixa de edio Intervalo do Bloco;
Na rea de Opes de Sada da caixa de dilogo Histograma (Figura 2.5), clique na
opo Nova Planilha e insira o nome Histograma na caixa de edio direita deste
boto. Selecione as caixas de verificao Porcentagem Cumulativa e Resultado do
Grfico e deixe a caixa de verificao Pareto fora de seleo. Clique no boto OK.

Figura 2.3 Dados e classes do Exemplo 2.5.

Figura 2.4 Caixa de dilogo Anlise de Dados.

19
Mtodos Estatsticos e Probabilsticos em Geotecnia

Figura 2.5 Caixa de dilogo Histograma.

O Excel ir gerar ambas as distribuies de frequncia e de percentagem acumulada e


sobrepor o polgono de percentagem acumulada ao histograma, como observado na
Figura 2.6. Se fosse desejado somente um histograma, a caixa de verificao Porcentagem
Cumulativa no seria selecionada na terceira etapa.

Figura 2.6 Histograma e distribuio de percentagem acumulada do Exemplo 2.5.

Na Figura 2.6, um eixo vertical diferente includo para cada grfico, uma vez que os dois
grficos esto sobrepostos. O eixo vertical do lado esquerdo do grfico fornece as frequncias
para o histograma, enquanto o eixo vertical direita oferece percentagens para o polgono de
percentagem acumulada. Observe que este grfico contm dois erros, ou seja, existem lacunas

20
Captulo 2 Estatstica Descritiva

entres as barras verticais que correspondem aos intervalos de classe, e existe uma classe
adicional, denominada Mais pelo Excel. Para corrigir o espaamento entre classes
necessria a realizao dos seguintes passos:
D um duplo clique sobre uma barra vertical do grfico para aparecer a caixa de dilogo
Formatar Sequncia de Dados, planilha Opes;
Na caixa de edio Largura do Espaamento, modifique o valor para zero e clique no
boto OK. O histograma agora possui as barras verticais contnuas.

J para remover a classe adicional, precisa-se fazer o seguinte:


Primeiro selecione uma clula fora do grfico. A seguir, clique em uma das barras
verticais exibidas no histograma. Um segundo conjunto de pontos de dados aparece
sobreposto s barras verticais junto com uma frmula que comea com a palavra
Sequncia na caixa de edio acima das planilhas de trabalho, na barra de frmulas;
Na barra de frmulas, modifique a clula final de $B$8 para $B$7 e tecle Enter;
Em seguida, clique em um dos pontos de dados do grfico Percentagens Acumuladas.
Modifique a clula final na barra de frmulas de $C$8 para $C$7 e tecle Enter.

Aps as correes, o grfico resultante tem agora o nmero apropriado de classes, ou seja,
cinco, conforme visto na Figura 2.7.

2.2.5 Representao Grfica dos Dados Coletados

Os dados coletados podem ser representados de diversas formas, utilizando frequncia


absoluta ou relativa, simples ou acumulada.

2.2.5.1 Grfico de Hastes ou Bastes

O grfico de hastes muito utilizado na representao grfica de dados no agrupados em


classes, o que ocorre normalmente com dados discretos. Diz-se, neste caso, que no h perda

21
Mtodos Estatsticos e Probabilsticos em Geotecnia

de informao, pois os valores da varivel aparecem individualmente como constam da


amostra. A Figura 2.8 apresenta um exemplo desta representao.

Figura 2.7 Histograma e distribuio de percentagem acumulada do Exemplo 2.5 corrigidos.

60

50

40

30

20

10

0
0 45 115 180 260 300
1 11 21 31 41
Progressivas (m)

Figura 2.8 Variao do ngulo de atrito ao longo das progressivas do tnel TACF (Hidalgo,
2002).

22
Captulo 2 Estatstica Descritiva

2.2.5.2 Histograma

Histogramas so grficos de barras verticais nos quais as barras retangulares so construdas


nos limites de cada classe, como exemplificado acima. Ao desenhar histogramas, a varivel
aleatria ou o fenmeno de interesse exibido no eixo horizontal; j no eixo vertical
disposto o nmero, a proporo ou o percentual de observaes por intervalo de classe
dependendo do histograma em questo: histograma de frequncia (Figuras 2.7 e 2.9),
histograma de frequncia relativa ou histograma de percentagem.

14

12

10
Freqncia
8
de
Observaes 6

0
1,75 1,80 1,85 1,90 1,95 2,00

Massas Especficas Secas


(g/cm)
Figura 2.9 Histograma dos dados referentes ao Exemplo 2.5.

2.2.5.3 Polgono de Frequncia

O polgono de frequncia utilizado na representao da distribuio de frequncia, resultante


da unio dos pontos correspondentes s frequncias das diversas classes, onde estas so
centradas nos pontos mdios das classes como apresentado na Figura 2.10. Para obter as
intersees do polgono com o eixo, cria-se em cada extremo do histograma uma classe
virtual de mesmo tamanho das outras, mas com frequncia nula.

23
Mtodos Estatsticos e Probabilsticos em Geotecnia

14

12

10
Freqncia
8
de
Observaes 6

0
1,75 1,80 1,85 1,90 1,95 2,00

Massas Especficas Secas


(g/cm)
Figura 2.10 Polgono de frequncia do Exemplo 2.5.

2.2.5.4 Curva de Frequncia

A curva de frequncia resultado da representao mais suavizada do polgono de frequncia,


como observado na Figura 2.11.

2.2.5.5 Ogiva

A Ogiva o grfico representativo da distribuio acumulada de frequncias, a qual consta de


uma poligonal ascendente (Figura 2.12). Convm ressaltar que a frequncia acumulada
relacionada ao limite da primeira classe sempre zero.

2.2.5.6 Grfico de Setores

O grfico de setores aplicvel quando as categorias bsicas so quantificveis. Toma-se um


crculo que se divide em setores com reas proporcionais s frequncias das diversas
categorias. Uma ilustrao deste tipo de grfico pode ser dada a partir do clculo das

24
Captulo 2 Estatstica Descritiva

porcentagens (%) de frequncia de cada classe das massas especficas secas do Exemplo 2.5,
conforme mostrado na Figura 2.13.

14

12

10
Freqncia
8
de
Observaes 6

0
1,75 1,80 1,85 1,90 1,95 2,00

Massas Especficas Secas


(g/cm)
Figura 2.11 Curva de frequncia do Exemplo 2.5.

100
14
90
12 80

70
10
Freqncia 60 Freqncia
8
de 50 Acumulada
Observaes 6 40 (%)
30
4
20
2
10

0
1,75 1,80 1,85 1,90 1,95 2,00

Massas Especficas Secas


(g/cm)
Figura 2.12 Ogiva de frequncia do Exemplo 2.5.

25
Mtodos Estatsticos e Probabilsticos em Geotecnia

1
2
5 16,70 %
6,70 %
10 %

26,60 %

40 %
3

Figura 2.13 Grfico de setores mostrando a frequncia relativa das classes do Exemplo 2.5.

2.3 FUNDAMENTOS ESTATSTICOS

Em qualquer anlise e/ou interpretao dos dados coletados, vrias medidas descritivas
representando as propriedades de tendncia central, disperso e forma podem ser utilizadas
para extrair e resumir as principais caractersticas deste conjunto de dados. Se essas medidas
descritivas resumidas forem calculadas por meio de uma amostra de dados, elas sero
chamadas de estatsticas; caso sejam calculadas por meio de toda uma populao de dados,
elas sero chamadas de parmetros.

2.3.1 Medidas de Tendncia Central

Para Levine et al. (1998), a maioria dos dados apresenta uma diferente tendncia de se
agrupar ou concentrar em torno de um ponto central. Desta forma, para um conjunto de dados
em particular, geralmente se torna possvel selecionar um valor tpico ou mdio para
descrever todo o conjunto. Tal valor descrito tpico uma medida de localizao ou tendncia
central. A seguir, sero apresentados trs tipos de medidas de tendncia central, que so a
mdia aritmtica, a mediana e a moda.

26
Captulo 2 Estatstica Descritiva

2.3.1.1 Mdia Aritmtica

A mdia aritmtica, tambm conhecida simplesmente por mdia , em geral, o tipo de


tendncia central mais utilizado. calculada somando todas as observaes de um conjunto
de dados e dividindo o total pelo nmero de elementos envolvidos. Desse modo, para uma
amostra contendo um conjunto de n observaes X1 , .X2 , .X3 , ....,.Xn , a mdia aritmtica pode
ser escrita por:

X1 X 2 X3 . . X n
X (2.7)
n

ou simplesmente:

X i
X. . i 1
(2.8)
n

Uma variao desta expresso a mdia ponderada, que utilizada quando os nmeros que se
quer sintetizar tm graus de importncia diferenciados. A mdia ponderada dos nmeros
X1 , .X2 , .X3 , ....,.Xn , com pesos p1 , .p2 , .p3 , . ., pn , definida como:

X1p1 X 2 p2 X3p3 . . X n pn
Xp n

p
i 1
i
(2.9)

2.3.1.2 Mediana

A mediana o valor do meio de uma sequncia ordenada de dados. Caso no existam valores
repetidos, metade das observaes ser menor e metade ser maior do que a mediana. A
mediana no afetada por qualquer observao extrema em um conjunto de dados. Assim,
sempre que uma observao extrema estiver presente, apropriado utilizar a mediana em vez

27
Mtodos Estatsticos e Probabilsticos em Geotecnia

da mdia aritmtica para descrever a tendncia do conjunto de dados. Segundo Ang & Tang
(1975), a mediana representa o limite em que 50% dos dados se encontram acima e abaixo da
mesma, ou seja, os dados apresentam iguais chances de ocorrncia.

Para o clculo da mediana por meio de um conjunto de dados coletados, precisa-se,


inicialmente, posicionar os dados em uma disposio ordenada. Ento, para encontrar na
disposio ordenada o lugar que representa o valor da mediana, utiliza-se a frmula do ponto
de posicionamento apresentada pela seguinte equao:

n 1
Me . . (2.10)
2

onde n o nmero de dados ordenados.

As regras a seguir auxiliam o clculo da mediana:


Se o tamanho da amostra for um nmero mpar, a mediana representada pelo valor
n 1
correspondente ao ponto , aps o ordenamento;
2
Se o tamanho da amostra for um nmero par, a mediana representada pelo valor mdio
correspondente as duas observaes centrais.

Exemplo 2.6 Do ensaio de Slump test realizado na concretagem de um pontilho, o


laboratorista decidiu obter as medianas de dois conjuntos de dados (em centmetros).

O primeiro conjunto de seis pontos obtidos da meso-estrutura :

10,3 4,9 8,9 11,7 6,3 7,7

O segundo conjunto com sete pontos definidos da superestrutura :

28
Captulo 2 Estatstica Descritiva

24,1 22,6 27,0 19,8 21,5 23,7 22,6

Soluo:
Para o primeiro conjunto a disposio ordenada dos dados :

4,9 6,3 7,7 8,9 10,3 11,7

Observaes ordenadas 1 2 3 4 5 6

Para estes dados o ponto de posicionamento 3,5. Portanto, a mediana obtida calculando a
mdia entre a terceira e a quarta observaes ordenadas, ou seja, um valor de 8,3 cm.

Para o segundo conjunto a disposio ordenada :

19,8 21,5 22,6 22,6 23,7 24,1 27,0

Observaes ordenadas 1 2 3 4 5 6 7

Neste caso ao calcular a mediana, ignora-se o fato de que valores repetidos podem estar
presentes nos dados. Para este conjunto de tamanho mpar, o ponto de posicionamento da
mediana a quarta observao. Deste modo, a mediana ser o valor 22,6 cm, o valor do meio
do conjunto ordenado, embora a terceira observao tambm seja 22,6 cm.

Em resumo, o clculo do valor da mediana afetado pelo nmero de observaes e no pela


magnitude de qualquer valor extremo, como demonstrado no exemplo a seguir. Qualquer
observao selecionada aleatoriamente, tanto pode exceder a mediana como pode ser
excedida por ela.

29
Mtodos Estatsticos e Probabilsticos em Geotecnia

Exemplo 2.7 Suponha que se queria sintetizar em um nico nmero os salrios das pessoas
que trabalham numa determinada obra (engenheiros, encarregados, estagirios, operrios etc.).

Soluo:
Para esta sntese so encontrados os seguintes nmeros (em ordem crescente).

200 300 400 500 700 850 1000

A mdia aritmtica destes valores corresponde a 564,29. Esse o valor que representa
razoavelmente aquele conjunto de observaes.

Se, entretanto o conjunto de dados fosse:

200 300 400 500 700 850 3200

A mdia seria 878,57. Neste caso, j no se pode dizer que a mdia sintetiza adequadamente o
conjunto, pois apenas um valor maior do que ela. Verifica-se em ambos os casos que a
mediana a mesma, ou seja, 500 confirmando assim, a sensibilidade da mdia aos valores
extremos.

Convm, ento, observar que em alguns casos preferencial utilizar a mediana como medida
sintetizadora, como por exemplo, na situao em que o histograma do conjunto de valores
assimtrico, isto , quando h predominncia de valores elevados em uma das caudas.

2.3.1.3 Moda

s vezes, ao resumir ou descrever um conjunto de dados, a moda utilizada como uma


medida de tendncia central. A moda o valor que aparece mais frequentemente em um
conjunto de dados. Pode ser obtida atravs de uma disposio ordenada.

30
Captulo 2 Estatstica Descritiva

Diferentemente da mdia aritmtica, a moda no afetada pela ocorrncia de quaisquer


valores extremos. No entanto, a moda utilizada somente para fins descritivos uma vez que
ela mais varivel, de amostra para amostra, do que outras medidas de tendncia central.

Exemplo 2.8 Para o conjunto a seguir deseja-se conhecer a mdia, a mediana e a moda.

2 4 5 5 5 6 6 7 8 9

Soluo:
De acordo com as definies anteriores, tem-se que:
Mdia X = 5,7
Mediana Me = 5,5
Moda Mo = 5

Um conjunto de dados poder ser classificado como amodal, ou seja, quando esse apresentar
todos os seus elementos com igual nmero de ocorrncia. Da mesma forma, o conjunto
poder ser bimotal, trimodal etc., isso quando dois ou mais elementos apresentarem o mesmo
nmero de ocorrncia.

2.3.2 Medidas de Variao

Medida de variao a quantidade de disperso ou espalhamento dos dados. Dois conjuntos


podem divergir tanto na tendncia central como na variao; ou, conforme o exemplo
hipottico da Tabela 2.3, dois conjuntos de dados, de uma mesma rea, apresentados por duas
equipes de sondagem podem ter as mesmas mdias, porm divergir bastante em termos de
variao. O conjunto de dados apresentado pela equipe II muito menos varivel do que o
apresentado pela equipe I.

31
Mtodos Estatsticos e Probabilsticos em Geotecnia

Tabela 2.3 Exemplo hipottico de comparao da disperso de dados de uma mesma rea.
Desvio
Equipe Pesos Especficos (kN/m) Mdia Varincia
Padro
I 15,0 15,4 15,8 16,2 16,6 17,0 16,0 0,56 0,75
II 15,8 15,8 15,8 16,2 16,2 16,2 16,0 0,05 0,22

A seguir, sero apresentados dois tipos de medidas de variao: a varincia e o desvio padro.
A varincia e o desvio padro medem a disperso mdia em torno da mdia amostral, ou seja,
como as observaes flutuam em torno da mdia amostral.

2.3.2.1 Varincia

A varincia amostral aproximadamente a mdia das diferenas ao quadrado entre cada uma
das observaes de um conjunto de dados e a mdia aritmtica do conjunto. Assim sendo,
para uma amostra contendo n observaes X1 , .X2 , .X3 , ....,.Xn , a varincia amostral pode ser
escrita como pela equao a seguir:

X X . . X2 X . . . . Xn X
2 2 2


2 1
s (2.11)
n 1

onde s2 a varincia, X a mdia amostral e n o nmero de elementos da amostra.

Escrevendo a Equao 2.11 de forma reduzida tem-se que:

(X i X) 2
s2 i 1
(2.12)
n 1

32
Captulo 2 Estatstica Descritiva

2.3.2.2 Desvio Padro

O desvio padro amostral s a raiz quadrada da soma das diferenas ao quadrado em torno da
mdia aritmtica dividida pelo tamanho da amostra menos 1, ou seja, a raiz quadrada da
varincia amostral, definido por:

(X i X) 2
s i 1
(2.13)
n 1

2.3.2.3 Coeficiente de Variao

Para Levine et al. (1998), de modo distinto das medidas anteriores, o coeficiente de variao
a medida relativa da variao. Ele expresso como uma percentagem em vez de utilizar
termos de unidades dos dados especficos. Assim, o coeficiente de variao mede e d ideia
da disperso dos dados em relao mdia aritmtica conforme expresso a seguir:

s
CV 100% (2.14)
X

onde:
CV Coeficiente de variao;
s Desvio padro amostral;
X Mdia aritmtica.

O coeficiente de variao tem sido encontrado como um parmetro caracterstico da varivel


estatstica, ou seja, a mdia e o desvio padro de uma varivel podem se alterar, mas a razo
entre eles, o coeficiente de variao, um valor bem mais constante, conforme mostra a
Tabela 2.4.

33
Mtodos Estatsticos e Probabilsticos em Geotecnia

Tabela 2.4 Valores tpicos do coeficiente de variao de algumas propriedades geotcnicas.


Parmetro Coeficiente de Variao
Peso especfico 03 (02 a 08)
Coeso 40 (20 a 80)
ngulo efetivo de resistncia 10 (04 a 20)
Coeso no-drenada 30 (20 a 50)

2.3.2.4 Medidas de Forma

Uma terceira propriedade importante em um conjunto de dados a sua forma, ou seja, a


maneira como os dados esto distribudos. A distribuio dos dados pode ser simtrica ou
assimtrica. Para descrever a forma, precisa-se somente comparar a mdia aritmtica e a
mediana. Se essas duas medidas forem iguais, pode-se afirmar, de modo geral, que os dados
so simtricos. Por outro lado, se a mdia aritmtica exceder a mediana, os dados podem ser
descritos, de maneira geral, como positivos ou assimtricos direita. Se a mediana for maior
que a mdia aritmtica, estes dados podem ser chamados, de maneira geral, de negativos ou
assimtricos esquerda.

34
Captulo 2 Estatstica Descritiva

Tabela de Nmeros Aleatrios.


Coluna
00000 00001 11111 11112 22222 22223 33333 33334 44444
Linha
12345 67890 12345 67890 12345 67890 12345 67890 12345
01 47957 71397 17885 75706 34092 48324 14169 77308 63929
02 33031 73216 83571 72839 74135 02943 26051 70023 25753
03 22628 47017 84015 35349 84691 79596 34164 47336 09055
04 51053 60083 03120 65985 59856 74446 58470 63392 99130
05 17546 80745 18582 23449 17773 75491 28006 74174 92207
06 45399 92896 58875 38915 12030 68633 68692 47108 71637
07 92460 68303 26479 80771 78066 13809 48326 34559 30722
08 80279 45710 39297 57986 04935 92283 38382 79966 67503
09 49477 73725 78790 21191 39856 51856 02889 94775 16075
10 40670 96603 64796 91451 70595 34841 02125 96890 86652
11 66668 31620 40475 56533 51138 89556 14190 66265 31355
12 34712 92853 97247 96759 27459 41391 58336 23056 12636
13 68953 89160 03234 57018 90656 32590 41351 08667 17379
14 73637 32079 36015 78150 23628 77446 14882 69920 29564
15 47501 58204 65740 41874 81175 31550 92649 84326 51070
16 42218 50577 80503 67422 92317 33700 02770 76405 24514
17 33561 95205 2736 11229 53649 66900 27344 45189 38837
18 78629 61191 56047 50375 14950 25994 99776 20627 06180
19 49005 37626 98993 58454 35774 10417 27765 4806 26757
20 23867 26901 72467 51761 90136 00903 59075 85005 68665
21 27069 44609 32076 31016 31504 21862 36829 60270 39928
22 44142 26730 05885 83095 34656 07047 52946 61697 74405
23 57077 02742 03877 64604 42474 66716 46731 45232 37259
24 43805 50394 83120 26052 65553 18902 23836 27848 06802
25 61204 11062 88523 83786 05626 37489 80879 43810 21089
26 89023 10138 06281 91496 68920 40010 15550 12370 42438
27 43806 23075 20670 76865 50326 71187 88621 69337 64244
28 41853 95562 30004 35944 26892 53640 33889 02047 51265
29 10042 88340 68961 43381 28461 22523 27268 10081 52009
30 83528 75548 72330 55681 80901 84254 19108 73505 86452
31 05189 18723 94450 92666 66120 41986 11905 47234 82611
32 92827 56172 29063 99114 67251 72196 28953 78597 75161
.. .. .. .. .. .. .. .. .. ..
. . . . . . . . . .

35