Assis A. 2002. Métodos Estadísticos y Probabilísticos en Geotecnia2 PDF

Universidade de Brasília
Faculdade de Tecnologia
Dept. Engenharia Civil & Ambiental
Prog. de Pós-Graduaçõa em Geotecnia
MÉTODOS ESTATÍSTICOS
E PROBABILÍSTICOS
EM GEOTECNIA
Prof. André P. Assis, Ph.D
APOSTILA: Publicação G.AP-002/01

Assis, A.P., Espósito, T.J., Gardoni, M.G. & Silva, P.D.E.A.
BRASÍLIA / DF, 2002

Departamento de Engenharia Civil e Ambiental / FT
Programa de Pós-Graduação em Geotecnia
ÍNDICE
Página
1 – INTRODUÇÃO............................................................................................................... 1.1
2 – ESTATÍSTICA DESCRITIVA ....................................................................................... 2.1

2.1 – CONCEITO.................................................................................................................. 2.1
2.2 – POPULAÇÃO E AMOSTRA ...................................................................................... 2.1
2.3 – AGRUPAMENTOS DE DADOS E DISTRIBUIÇÃO DE FREQÜÊNCIA ............... 2.1
2.4 – VARIÁVEIS E GRÁFICOS ........................................................................................ 2.4
2.4.1 – GRÁFICO DE HASTES OU BASTÕES ................................................................. 2.4
2.4.2 – HISTOGRAMA ........................................................................................................ 2.5
2.4.3 – POLÍGONO DE FREQÜÊNCIA .............................................................................. 2.6
2.4.4 – CURVA DE FREQÜÊNCIA .................................................................................... 2.6
2.4.5 – OGIVA ...................................................................................................................... 2.6
2.4.6 – GRÁFICO DE SETORES......................................................................................... 2.7
2.5 – MEDIDAS DE TENDÊNCIA CENTRAL .................................................................. 2.8
2.5.1 – MÉDIA ARITMÉTICA ............................................................................................ 2.8
2.5.2 – MÉDIA PONDERADA ............................................................................................ 2.8
2.5.3 – MEDIANA ................................................................................................................ 2.9
2.5.4 – MODA....................................................................................................................... 2.9
2.5.5 – COMPARAÇÃO ENTRE MÉDIA E MEDIANA.................................................... 2.9
2.6 – MEDIDAS DE DISPERSÃO OU VARIABILIDADE................................................ 2.10
2.7 – EXEMPLO DE APLICAÇÃO DE ESTATÍSTICA DESCRITIVA ............................ 2.11
3 – PROBABILIDADE ......................................................................................................... 3.1

3.1 – ESPAÇO AMOSTRAL E EVENTOS ......................................................................... 3.1
3.2 – CÁLCULO DE PROBABILIDADE ............................................................................ 3.2
3.3 – AXIOMAS DA PROBABILIDADE............................................................................ 3.3
3.4 – PROBABILIDADE CONDICIONAL E INDEPENDÊNCIA ..................................... 3.5
3.5 – VARIÁVEIS ALEATÓRIAS....................................................................................... 3.7
4 - DISTRIBUIÇÃO DE PROBABILIDADE ...................................................................... 4.1

4.1 - DISTRIBUIÇÃO DE PROBABILIDADE DISCRETA ............................................... 4.1
4.2 - DISTRIBUIÇÃO DE PROBABILIDADE CONTÍNUA.............................................. 4.1
4.3 - EXPECTÂNCIA OU VALOR ESPERADO................................................................ 4.2
4.4 – MOMENTOS ............................................................................................................... 4.3
4.5 - PRINCIPAIS DISTRIBUIÇÕES DE PROBABILIDADE DISCRETAS .................... 4.4
4.5.1 - DISTRIBUIÇÃO BINOMIAL................................................................................... 4.4
4.5.2 - DISTRIBUIÇÃO DE POISSON................................................................................ 4.6
4.5.3 - DISTRIBUIÇÃO HIPERGEOMÉTRICA ................................................................. 4.8
4.6 - PRINCIPAIS DISTRIBUIÇÕES CONTÍNUAS .......................................................... 4.9
4.6.1 - DISTRIBUIÇÃO NORMAL ..................................................................................... 4.9
4.6.2 – DISTRIBUIÇÃO UNIFORME DE PROBABILIDADE .......................................... 4.14
4.6.3 - DISTRIBUIÇÃO EXPONENCIAL........................................................................... 4.16
4.6.4 – DISTRIBUIÇÃO LOGNORMAL............................................................................. 4.17
Métodos Estatísticos e Probabilísticos em Geotecnia - Índice

i
4.6.5 – OUTRAS DISTRIBUIÇÕES CONTINUAS ............................................................ 4.19

4.6.5.1 - DISTRIBUIÇÃO QUI QUADRADO..................................................................... 4.19
4.6.5.2 – DISTRIBUIÇÃO DE FICHER (F)......................................................................... 4.19
4.6.5.3 – DISTRIBUIÇÃO t DE STUDENT ........................................................................ 4.20
5 - AMOSTRAGEM E ESTIMAÇÃO ................................................................................. 5.1

5.1 – AMOSTRAGEM ......................................................................................................... 5.1
5.1.1 - TIPOS DE AMOSTRAGEM..................................................................................... 5.1
5.1.1.1 – AMOSTRAGEM ALEATÓRIA SIMPLES .......................................................... 5.1
5.1.1.2 – AMOSTRAGEM ESTRATIFICADA ................................................................... 5.2
5.1.1.3 – AMOSTRAGEM POR CONGLOMERADO........................................................ 5.4
5.1.2 - DISTRIBUIÇÕES AMOSTRAIS.............................................................................. 5.5
5.1.2.1 – DISTRIBUIÇÃO AMOSTRAL DA MÉDIA ........................................................ 5.5
5.1.2.2 – DISTRIBUIÇÃO AMOSTRAL DA VARIÂNCIA ............................................... 5.6
5.1.3 – PRINCIPAIS ESTÁGIOS DE UMA PESQUISA POR AMOSTRAGEM .............. 5.7
5.2 – ESTIMAÇÃO............................................................................................................... 5.8
5.2.1 - ESTIMATIVA POR PONTO .................................................................................... 5.8
5.2.2 - ESTIMAÇÃO DA MÉDIA E DA VARIÂNCIA DE UMA POPULAÇÃO
NORMAL.............................................................................................................................. 5.10
5.2.2.1 - ESTIMAÇÃO DA MÉDIA..................................................................................... 5.10
5.2.2.2 - ESTIMAÇÃO DA VARIÂNCIA ........................................................................... 5.11
5.2.3 - TEOREMA CENTRAL DO LIMITE........................................................................ 5.11
5.2.4 - ESTIMATIVA INTERVALAR ................................................................................. 5.12
5.2.5 - INTERVALOS DE CONFIANÇA PARA A MÉDIA............................................... 5.13
5.2.5.1 – POPULAÇÃO NORMAL COM DESVIO PADRÃO CONHECIDO .................. 5.13
5.2.5.2 – POPULAÇÃO NORMAL COM DESVIO PADRÃO DESCONHECIDO........... 5.14
5.2.5.3 – POPULAÇÃO NÃO-NORMAL, GRANDES AMOSTRAS ................................ 5.16
5.2.6 – ERRO DE ESTIMAÇÃO.......................................................................................... 5.17
5.2.7 - DETERMINAÇÃO DO TAMANHO DA AMOSTRA ............................................ 5.18
6 - TESTES DE HIPÓTESES ............................................................................................... 6.1

6.1 - INTRODUÇÃO ............................................................................................................ 6.1
6.2 – HIPÓTESE NULA E ALTERNATIVA....................................................................... 6.1
6.3 – ESTÁGIOS DE UM TESTE DE HIPÓTESE.............................................................. 6.4
6.4 – TESTE DE HOIPÓTESE SOBRE A MÉDIA DE UMA DISTRIBUIÇÃO NORMAL
QUANDO O DESVIO-PADRÃO É CONHECIDO............................................................. 6.4
6.5 – TESTE DE HOIPÓTESE SOBRE A MÉDIA DE UMA DISTRIBUIÇÃO NORMAL
QUANDO O DESVIO-PADRÃO É DESCONHECIDO ..................................................... 6.6
6.6 – TESTE DE HIPÓTESE DE AS MÉDIAS DE DUAS DISTRIBUIÇÕES NORMAIS
SEREM IGUAIS QUANDO AMBOS OS DESVIOS-PADRÃO SÃO CONHECIDOS .... 6.8
6.7 – TESTE DE HIPÓTESE DE AS MÉDIAS DE DUAS DISTRIBUIÇÕES NORMAIS
SEREM IGUAIS QUANDO AMBOS OS DESVIOS-PADRÃO SÃO DESCONHECIDOS
MAS IGUAIS........................................................................................................................ 6.10
6.8 – TESTES DE HIPÓTESE NÃO PARAMÉTRICOS .................................................... 6.13
6.8.1- TESTE DE ADEQUAÇÃO DO AJUSTAMENTO E TESTES DE ADERÊNCIA .. 6.13
6.8.2- TABELAS DE CONVERGÊNCIA – TESTE DE INDEPENDÊNCIA E TESTE DE
HOMOGENEIDADE............................................................................................................ 6.17
6.8.2.1- TESTES DE INDEPENDÊNCIA E TESTE DE HOMOGENEIDADE ................. 6.18
Métodos Estatísticos e Probabilísticos em Geotecnia - Índice ii

7 - ANÁLISE DE VARIÂNCIA ........................................................................................... 7.1

7.1 - ANOVA SIMPLES (FATOR ÚNICO)......................................................................... 7.2
7.2 – ANOVA COM DOIS FATORES (FATOR DUPLO) ................................................. 7.8
8 - REGRESSÃO E CORRELAÇÃO................................................................................... 8.1

8.1 - REGRESSÃO LINEAR SIMPLES .............................................................................. 8.1
8.1.1 – DIAGRAMA DE DISPERSÃO ................................................................................ 8.1
8.1.2 – RETA DOS MÍNIMOS QUADRADOS................................................................... 8.2
8.1.3 – PRECISÃO DA RETA DE REGRESSÃO............................................................... 8.3
8.1.4 – REGRESSÕES LINEARES POR TRANSFORMAÇÃO ........................................ 8.5
8.2 - REGRESSÃO LINEAR MÚLTIPLA........................................................................... 8.8
8.2.1 - ESTIMAÇÃO DOS PARÂMETROS ....................................................................... 8.9
8.2.2 - ESTUDOS DAS VARIAÇÕES................................................................................. 8.12
8.2.3 - COEFICIENTE DE DETERMINAÇÃO MÚLTIPLA.............................................. 8.14
8.2.4 - REGRESSÃO POLINOMIAL................................................................................... 8.14
8.3 – CORRELAÇÃO........................................................................................................... 8.16
8.3.1 – TEORIA DA CORRELAÇÃO.................................................................................. 8.16
8.3.1.1 – CORRELAÇÃO LINEAR ..................................................................................... 8.16
8.3.2 - MEDIDAS DE CORRELAÇÃO ............................................................................... 8.17
8.3.3 - AJUSTAMENTO LINEAR PELO MÉTODO DOS MÍNIMOS QUADRADOS (LINHA
DE REGRESSÃO)................................................................................................................ 8.17
8.3.4 - ERRO PADRÃO DA ESTIMATIVA ....................................................................... 8.19
8.3.5 - VARIAÇÃO EXPLICADA E NÃO-EXPLICADA .................................................. 8.19
8.3.6 - COEFICIENTE DE CORRELAÇÃO........................................................................ 8.20
8.3.7 - COVARIÂNCIA E CORRELAÇÃO ........................................................................ 8.22
8.4 – INTERPRETAÇÃO DOS COEFICIENTES ............................................................... 8.23
8.4.1 – INTERVALO DE CONFIANÇA PARA OS PARÂMETROS A E B ..................... 8.23
8.4.1 – INTERVALO DE PREVISÃO PARA UMA OBSERVAÇÃO FUTURA .............. 8.24
8.5 – TEORIA AMOSTRAL DA CORRELAÇÃO.............................................................. 8.25
8.5.1 – TESTE DE HIPÓTESE............................................................................................. 8.25
8.5.2 – DIFERENÇA ENTRE COEFICIENTES DE CORRELAÇÃO................................ 8.27
8.6 – CORRELAÇÃO E CAUSALIDADE .......................................................................... 8.28
8.7 – TESTE DE CORRELACIONAMENTO ..................................................................... 8.28
8.8 – CORRELAÇÃO MÚLTIPLA...................................................................................... 8.29
8.9 – CORRELAÇÃO PARCIAL......................................................................................... 8.30
9 - MÉTODOS PROBABILÍSTICOS................................................................................... 9.1

9.1 - MÉTODO DE MONTE CARLO ................................................................................. 9.1
9.2 - SÉRIE DE TAYLOR .................................................................................................... 9.7
9.2.1 - SÉRIE DE TAYLOR MULTIDIMENSIONAL ........................................................ 9.9
9.2.2 - EQUAÇÃO VETORIAL ........................................................................................... 9.12
9.3 - MÉTODO DO ÍNDICE DE CONFIABILIDADE........................................................ 9.13
9.4 - MÉTODO DE ROSENBLUETH ................................................................................. 9.21
10 - ESTATÍSTICA APLICADA ......................................................................................... 10.1

10.1 – COMPARAÇÃO ENTRE MÉTODOS PROBABILÍSTICOS APLICADOS À
ESTABILIDADE DE TALUDES......................................................................................... 10.1
Métodos Estatísticos e Probabilísticos em Geotecnia - Índice iii

10.1.1 - INTRODUÇÃO ....................................................................................................... 10.1

10.1.2 – CASOS ESTUDADOS ........................................................................................... 10.2
10.1.3 – METODOLOGIA DE CÁLCULO.......................................................................... 10.3
10.1.4 – APRESENTAÇÃO DOS RESULTADOS ............................................................. 10.5
10.1.5 - CONCLUSÕES ....................................................................................................... 10.11
10.2 – CONTROLE GEOTÉCNICO DE UM ATERRO HIDRÁULICO............................ 10.11
10.2.1 – GERAÇÃO DOS PARÂMETROS UTILIZADOS NAS ANÁLISES ................... 10.12
10.2.2 – ANÁLISE DA ESTABILIDADE DA BARRAGEM ............................................. 10.14
10.2.3 – ANÁLISE DETERMINÍSTICA.............................................................................. 10.16
10.2.4 – ANÁLISE PROBABILÍSTICA............................................................................... 10.16
10.3 - CONTROLE ESTATÍSTICO APLICADO A PAVIMENTAÇÃO ........................... 10.22
10.3.1 - VARIABILIDADE DOS MATERIAIS E ENSAIOS.............................................. 10.22
10.3.2 - AMOSTRAGEM ALEATÓRIA PARA CONTROLE DE OBRAS DE
PAVIMENTAÇÃO ............................................................................................................... 10.23
10.3.3 – ESTABELECIMENTO DA ROTINA PARA O CONTROLE ESTATÍSTICO DE
QUALIDADE DAS OBRAS DE PAVIMENTAÇÃO ......................................................... 10.24
Métodos Estatísticos e Probabilísticos em Geotecnia - Índice iv

1 - INTRODUÇÃO
A palavra Estatística é comumente associada à idéia de conjunto de dados. Ultimamente, a

Estatística vem se transformando num poderoso instrumento em todas as ciências que
estudam fenômenos ligados às leis do acaso. O estudo estatístico se torna fundamental na
análise de dados provenientes de quaisquer processos onde exista variabilidade.
A Estatística usualmente é dividida em três grandes áreas:
• Amostragem e Planejamento de Experimentos (mecanismo de coleta de dados);

• Estatística Descritiva (organização, apresentação e sintetização de dados);
• Estatística Inferencial (conjunto de métodos para a tomada de decisões nas situações onde
existam incertezas).
A Estatística desempenha um papel fundamental na pesquisa científica, especialmente no que

diz respeito ao planejamento da experiência, à observação dos dados e à análise e
interpretação dos resultados obtidos. Atualmente tem ampla aplicação em todos os ramos das
ciências.
Em Engenharia Civil, principalmente na área de Geotecnia, já há bastante tempo, tem sido

reconhecido que carregamentos e parâmetros podem sofrer variações em torno de seus valores
adotados, o que leva a uma inevitável convivência com riscos de rupturas de obras
geotécnicas. Exemplo disto é o Método Observacional, proposto por Peck em 1969, que prevê
a mudança do projeto de acordo com as ocorrências durante a construção, quando o
comportamento destas estruturas se torna crítico. No entanto quando não é possível aguardar
até a construção para tais decisões, o projeto deve assumir desde o início um certo risco, o que
tem sido feito muito mais de forma arbitrária, incorporando um certo adicional no chamado
fator de segurança (FS).
Os métodos estatísticos e probabilísticos aparecem então com uma alternativa sistemática de

incorporar a variabilidade de parâmetros e carregamentos no projeto e então calcular o risco
de ruptura ou a confiabilidade destas estruturas. No entanto, o uso de métodos probabilísticos
na engenharia não tem sido tão grande quanto se poderia imaginar a princípio. Talvez isto
possa ser atribuído à falta ou deficiência de conhecimento de conceitos estatísticos e
probabilísticos pela grande maioria dos engenheiros e também à dificuldade de incorporar os
conceitos de confiabilidade nas normas e práticas de engenharia, como por exemplo já é o
conceito de FS.
Na engenharia geotécnica, por exemplo, na análise de estabilidade de um talude, a aplicação

de métodos probabilísticos pode ser significativa na medida que os parâmetros geotécnicos de
projeto se enquadram dentro de uma variabilidade e esta pode ser incorporada nestes métodos
para fins de calcular a confiabilidade do talude, em adição ao já consagrado FS. Assim pode-
se trabalhar com os parâmetros geotécnicos dentro de metodologias lógicas e sistemáticas,
onde é considerada a variação de cada parâmetro através de sua representação por uma
Métodos Estatísticos e Probabilísticos em Geotecnia – Capítulo 1 1.1

distribuição estatística. Desta forma os resultados das análises passam a refletir a variabilidade
dos parâmetros geotécnicos, conduzindo a métodos probabilísticos de projeto e suas
respectivas análises de confiabilidade. Análises de confiabilidade são de suma importância,
pois permitem a escolha adequada do valor de FS de projeto em função dos riscos de ruptura
de cada tipo de estrutura geotécnica.

2. ESTATÍSTICA DESCRITIVA
2.1. CONCEITO
A Estatística Descritiva é a parte da Estatística que procura descrever e analisar um certo

grupo de observações, normalmente denominado de amostra, procurando expressar estas
observações através de medidas e formas de representação (tabelas, gráficos, curvas etc.).
2.2. POPULAÇÃO E AMOSTRA
Denomina-se População ou Universo Estatístico, o maior conjunto tomado como referência na

observação de um fenômeno. Uma população pode ser finita ou infinita. Por exemplo, a
população constituída pelos ensaios de cisalhamento direto com areias num determinado
laboratório em um dia qualquer é finita, enquanto a população constituída por todas as
possíveis vazões de um rio é infinita. Pode-se dizer que população é qualquer conjunto que
reuna todos os elementos que tenham pelo menos uma característica comum. Denomina-se
amostra qualquer subconjunto não vazio de uma população, excetuando-se a própria
população. É, portanto, uma parte da população (Figura 2.1).
POPULAÇÃO
AMOSTRA
A
AMOSTRA
AMOSTRA
C
B
Figura 2.1 - População e amostra
2.3. AGRUPAMENTOS DE DADOS E DISTRIBUIÇÃO DE FREQÜÊNCIA
Os dados estatísticos coletados são agrupados de forma que seu manuseio, visualização e
compreensão sejam simplificados. A princípio tem-se os dados não submetidos a qualquer
tipo de tratamento, ou seja, dados brutos. Inicia-se o agrupamento com uma ordenação destes
dados, seja em ordem crescente ou decrescente e, a seguir estima-se a amplitude, ou seja, a
diferença entre o maior e o menor valor existente.

Porém, quando o volume de dados é muito grande, o processo de ordenação torna-se

extremamente trabalhoso, e sua listagem, mesmo que organizada, será de pouca utilidade.
Nestes casos o processo pode ser simplificado agrupando os dados em um certo número de
classes. O agrupamento por classes deve obedecer a algumas normas:
• As classes devem abranger todas as observações;

• O extremo superior de uma classe é o extremo inferior da classe subseqüente;
• Cada valor deve-se enquadrar em apenas uma classe;
• A quantidade de classes não deve ser superior a 25 nem inferior a 5.
Uma forma de determinar um número razoável de classes (k), consiste em aplicar a lei de
Sturges:
 log n 
k = 1 + log 2 n = 1+   (2.1)
 log 2 
Onde n é o número total de observações.
A partir das classes são construídas as distribuições de freqüência para uma melhor
visualização e aproveitamento dos dados. O número de vezes que um valor aparece no
domínio de uma classe é denominado freqüência. Além da freqüência especificamente, outros
valores são de extrema importância na composição de uma distribuição completa de
freqüência. Um quadro completo de distribuição de freqüência é composto pelas seguintes
colunas, sendo n a quantidade total de observações:
Classe xi ni fi Ni Fi
Onde:
xi é o ponto médio de i-ésima classe, ou seja, é a média dos pontos extremos da classe;
ni é a quantidade de observações, ou freqüência, da i-ésima classe (que se supõem
concentradas no respectivo ponto médio);
fi é a freqüência relativa da classe (ni / n);

n é a quantidade total de observações;
Ni é a freqüência acumulada até a i-ésima classe e indica a quantidade de observações
inferiores ao limite superior da classe;
Fi é a freqüência relativa acumulada (Ni / n).

Exemplo 2.1:
• A partir de campanhas de ensaio de campo foram determinadas as massas específicas
secas de um aterro hidráulico constituído por rejeito de minério de ferro. Os valores se
encontram na sua forma bruta dispostos abaixo. Obter o quadro de distribuição de
freqüência completo.
Massas específicas secas (g/cm3):

1,77 1,75 1,78 1,79 1,91 1,96 1,79 1,93 1,96 1,89 1,89 1,91 1,80 1,83 1,85
1,87 1,88 1,87 1,87 1,91 1,92 1,92 1,92 1,92 1,93 1,93 1,94 1,89 1,91 1,95
Solução:
Os dados brutos devem ser ordenados (neste exemplo será em ordem crescente):
1,75 1,77 1,78 1,79 1,79 1,80 1,83 1,85 1,87 1,87 1,87 1,88 1,89 1,89 1,89
1,91 1,91 1,91 1,91 1,92 1,92 1,92 1,92 1,93 1,93 1,93 1,94 1,95 1,96 1,96
Trata-se de 30 valores de massa específica seca, sendo o menor igual a 1,75 e o maior 1,96,
logo a amplitude é 0,21 (diferença entre 1,96 e 1,75).
Pela Lei de Sturges tem-se: k = 1+ log230 = 5,90.
A partir deste valor adotou-se o número de classes igual a 5 (poderia ter sido 6, pois a Lei de
Sturges é apenas um indicativo do número de classes).
Dividindo-se a amplitude 0,21 por 5 (o número de classes) tem-se 0,042 que corresponderia
ao tamanho de cada classe. Optou-se trabalhar com o valor adotado de 0,05.
Quadro Completo de Distribuição de Freqüência (n = 30).
1,75 - 1,80 1,775 05 0,16 5 0,16
1,80 - 1,85 1,825 02 0,07 7 0,23
1,85 - 1,90 1,875 08 0,27 15 0,50
1,90 - 1,95 1,925 12 0,40 27 0,90
1,95 - 2,00 1,975 03 0,10 30 1,00
Observação: Neste caso optou-se por definir as classes a partir do limite inferior (menor valor
observado) da amostra. Como o número e a amplitude das classes são arbitrados, isto pode

desbalancear uma das classes dos extremos. Para evitar este desbalanceamento, deve-se
definir as classes a partir do valor da média da amostra em direção aos extremos inferior e
superior.
2.4. VARIÁVEIS E GRÁFICOS
A análise dos dados estatísticos levantados na observação de um fenômeno pode ser feita
separando-os em variáveis e atributos, sendo:
• Variáveis: quando os dados têm expressão quantitativa estando, portanto, estreitamente

relacionados a uma mensuração. Podem ser discretas ou contínuas. As variáveis discretas,
também denominadas individualizadas, são aquelas que podem ser contadas. As variáveis
contínuas são aquelas que se apresentam dentro de intervalos de observação (medidas) do
fenômeno.
• Atributos: quando os dados têm expressão qualitativa, não trazendo em si a idéia de

mensuração. Podem utilizar valores numéricos que lhes são atribuídos visando um
trabalho estatístico. Quando se tem uma grande quantidade de dados provenientes de um
levantamento realizado como suporte para uma tomada de decisão, torna-se necessário que
esses dados sejam organizados de forma adequada. É feita, então, a preparação,
apresentação e a análise gráfica dos dados obtidos através das distribuições de freqüências
e dos histogramas.
A seguir são ilustrados os tipos de gráficos usualmente utilizados.
2.4.1. Gráfico de Hastes ou Bastões
Este é muito utilizado na representação gráfica de dados não agrupados em classes, o que
ocorre normalmente com dados discretos. Diz-se, neste caso, que não há perda de informação,
pois os valores da variável aparecem individualmente como constam da amostra.
Tabela 2.1. Dados relativos a acidentes de tráfego por dia.

xi (dias) ni (acidentes)
0 10
1 20
2 30
3 20
4 10
5 10

ni
30
20
10
1 2 3 4 5
xi
2.4.2. Histograma
O histograma é muito utilizado na representação gráfica de dados agrupados em classes, o que

ocorre normalmente com dados contínuos. Um histograma é um conjunto de retângulos com
base sobre um eixo dividido de acordo com os tamanhos de classe, centros nos pontos médios
das classes e áreas proporcionais às freqüências. Pode ser construído relacionando as classes
com a freqüência absoluta ou relativa. A representação do contorno do histograma denomina-
se Poligonal Característica.
Tabela 2.2 - Dados referentes a valores de coesão efetiva (kPa) de uma areia
Classes ni
02 – 04 3
04 – 06 5
06 – 08 8
08 – 10 4
10 – 12 2
ni
0
2 4 6 8 10 12 Classes

2.4.3. Polígono de Freqüências
O polígono de freqüência é também utilizado para representar a distribuição de freqüência, o

qual é obtido pela união dos pontos correspondentes às freqüências das diversas classes,
centradas nos pontos médios. Para obter as interseções do polígono com o eixo, cria-se em
cada extremo do histograma uma classe com freqüência nula.
fi
0
2 4 6 8 10 12 Classes
2.4.4. Curva de Freqüências
A partir do polígono de freqüências pode-se representar contornos mais suaves utilizando

curvas para representar a curva de freqüências.
fi
2.4.5. Ogiva
É o gráfico representativo de uma distribuição acumulada de freqüências. Consta de uma

poligonal ascendente. No eixo horizontal colocam-se as extremidades de classe e no eixo
vertical as freqüências acumuladas (Tabela 2.3). Convém ressaltar que a freqüência
acumulada relacionada ao limite inferior da primeira classe é sempre zero.
Tabela 2.3. Dados relativos a massa específica seca (Exemplo 2.1)

1,75 - 1,80 1,775 05 0,16 5 0,16
1,80 - 1,85 1,825 02 0,07 7 0,23
1,85 - 1,90 1,875 08 0,27 15 0,50
1,90 - 1,95 1,925 12 0,40 27 0,90
1,95 - 2,00 1,975 03 0,10 30 1,00
14 100 %
Distribuição de frequência
12
Frequência acumulada 80 %
10
8 60 %
ni Fi
6 40 %
4
20 %
2
0 0%
75 25 75 25 75
1,7 1,8 1 ,8 1 ,9 1 ,9
xi
2.4.6. Gráfico em Setores
É aplicável quando as categorias básicas são quantificáveis. Toma-se um círculo (360º) que se
divide em setores com áreas proporcionais às freqüências das diversas categorias. Uma
ilustração deste tipo de gráfico pode ser dada a partir do cálculo das % de freqüência de cada
classe das massas específicas secas do Exemplo 2.1 (Tabela 2.4).
Tabela 2.4 - Porcentagem de freqüências das massas específicas secas

Classe ni % ni
1 5 16,70
2 2 6,70
3 8 26,60
4 12 40,00
5 3 10,00

1
2
5 16,70 %
6,70 %
10 %
26,60 %
40 %
3
2.5. MEDIDAS DE TENDÊNCIA CENTRAL
Para transmitir o comportamento de uma amostra grande, não é conveniente a representação

do fenômeno através de uma tabela ou enumeração individual de valores, mas sim representar
o conjunto de observações por uma forma mais sintética, ou seja, uma medida de tendência
central. As medidas de Tendência Central mais utilizadas são apresentadas a seguir.
2.5.1. Média Aritmética ( X )
É a medida mais utilizada e é representada pela relação:
x + x + ... + xn ∑x i
X= 1 2 = i =1
(2.2)
n n
2.5.2. Média Ponderada ( X p )
É utilizada quando os números que se quer sintetizar têm graus de importância diferenciados.
A média aritmética ponderada dos números x1 , x2 , ..., xn , com pesos p1 , p2 ,..., pn
representada por X p , é definida como:
Xp =
( x1 p1 + x2 p2 + ... + xn p n )
n
(2.3)
∑p
i =1
i

2.5.3. Mediana (Me)
Define-se como Mediana de um conjunto de “n” observações, X1, X2,..., Xn o valor do "meio"
do conjunto, quando os dados estão dispostos em ordem crescente. Quando "n" é ímpar, este
valor é único; se "n" é par, a mediana é a média aritmética simples dos dois valores centrais.
2.5.4. Moda (Mo)
É uma medida de tendência central que se caracteriza pelo valor mais freqüente (maior
freqüência absoluta simples).
Exemplo 2.2:
• Para o conjunto X1 = {2, 4, 5, 5, 5, 6, 6, 7, 8, 9}, temos: ü a moda – Mo = 5
ü a média – X = 5,70
ü a mediana – Me = 5,50
A moda pode não existir ou ser mais de uma.
Exemplo 2.3:
• X2 = {2, 2, 3, 3, 4, 4}, é um conjunto amodal;
• X3 = {1, 2, 2, 3, 4, 5, 5, 6}, é um conjunto bimodal, onde as modas são Mo = 2 e Mo = 5.
2.5.5. Comparação entre Média e Mediana
A média é muito sensível a valores extremos de um conjunto de observações, enquanto a

mediana não sofre muito com a presença de alguns valores muito altos ou muito baixos. Pode-
se demonstrar este fato através do exemplo que se segue.
Suponha-se que se queira sintetizar em um único número os salários das pessoas que
trabalham numa determinada obra (engenheiros, mestres, pedreiros, ajudantes, estagiários
etc.). São encontrados os seguintes números (em ordem crescente):
200 300 400 500 700 850 1000
A média aritmética destes valores corresponde a 564,30. Este é um valor que representa
razoavelmente aquele conjunto de observações. Se, entretanto o conjunto de dados fosse o
seguinte:

200 300 400 500 700 850 3200
A média seria 878,60. Neste caso, já não se pode dizer que a média sintetiza adequadamente o
conjunto, pois apenas um valor é maior do que ela.
Verifica-se que a mediana em ambos os casos é a mesma, 500, confirmando assim a

sensibilidade da média em relação aos valores extremos.
Convém, então, observar que em alguns casos é preferível utilizar a mediana como medida
sintetizadora, como por exemplo na situação em que o histograma do conjunto de valores é
assimétrico, isto é, quando há predominância de valores elevados em uma das caudas.
2.6. MEDIDAS DE DISPERSÃO OU VARIABILIDADE
A representação de uma distribuição somente através de sua média não permite uma
conclusão correta a respeito da mesma, visto que uma mesma média possa possuir extremos
diferenciados. Assim, para a representação adequada de um fenômeno é necessário associar
uma medida de dispersão a sua média, que irá expressar com que grau as observações
individuais diferem do valor médio representativo da população.
As medidas de dispersão mais utilizadas são a variância (s2) e o desvio padrão (s), sendo:
n 2
∑ ( x − x)
i
s = 2 i =1
(2.4)
n −1
s = s2 (2.5)
Exemplo 2.4:
• Amostras retiradas do campo experimental a uma mesma profundidade apresentaram
diferentes teores de umidade: 10,30%; 4,90%; 8,90%; 11,70%; 6,30% e 7,70%. Obtenha a
média( X ), a variância (s2) e o desvio padrão (s).
Solução:
ü a média – X = 8,30%
ü a variância – s2 = 6,36%
ü a desvio padrão – s = 2,52%
 n 
Uma vez que nas Eqs. 2.4 e 2.5 estamos elevando ao quadrado as diferenças  ∑ ( X i − X )2  ,
 i =1 
2
a variância ou o desvio padrão nunca podem ser negativos. A única ocasião em que s e s

podem ser zero é quando não existe variação nos dados, ou seja, quando cada observação na
amostra é exatamente a mesma ( X = X 1 , X 2 ,..., X n ) .
2.7 - EXEMPLO DE APLICAÇÃO DA ESTATÍSTICA DESCRITIVA
Na avaliação objetiva e sistemática das condições de superfície de um pavimento com vistas à

restauração, o DNER propôs alguns procedimentos. Entre estes procedimentos encontra-se o
PRO-08/78, que tem por objetivo calcular o Índice de Gravidade Global (IGG), que expressa
uma qualificação geral do estado de um pavimento, em função da incidência de defeitos no
mesmo. O conhecimento do IGG é muito útil para a tomada de decisões quanto às
intervenções de restauração / manutenções necessárias. O valor encontrado para o IGG
classifica o pavimento da seguinte forma:
IGG 0 a 20 20 a 80 80 a 150 150 a 500

Conceito Bom Regular Mau Péssimo
A metodologia deste procedimento consta dos seguintes passos:
• Implantação de estações afastadas de 20 m;
• Cada estação deverá constar de uma superfície de avaliação correspondente a 15% da área
total do pavimento;
• O operador deverá anotar em uma ficha de campo a presença de cada tipo de falha,
seguindo a codificação normalizada pelo DNER, como também a flecha nas trilhas de
roda externa e interna, expressa em milímetros;
• Em escritório são, então, processados os dados de campo, ou seja, determinadas as

freqüências absolutas e relativas de ocorrência dos defeitos anotados, assim como a média
aritmética e a variância das flechas nas trilhas de roda;
• Segundo a metodologia do DNER atribui-se a cada evento (defeito ou parâmetro

estatístico das flechas) um peso ou fator de ponderação, que expressa a maior ou menor
importância relativa em termos de serventia. Por exemplo, as trincas capilares com
abertura de 1 mm (classificadas como classe 1), que têm pequena influência na serventia,
recebem um fator de ponderação baixo (0,2), enquanto que panelas e corrugações
(ondulações transversais), que exercem forte influência, recebem um fator de ponderação
elevado (1,0);
• O produto da freqüência relativa de cada defeito, como também da média e da variância

das flechas, pelo correspondente fator de ponderação resulta no Índice de Gravidade
Individual (IGI) de cada evento que vem a ser a fração do IGG (Índice de Gravidade
Global) afetada pelo evento. A somatória de todos os valores de IGI representa o valor do
IGG a ser atribuído ao segmento.

A partir do valor encontrado para IGG é possível fazer uma primeira avaliação do pavimento.
Com certeza outras avaliações são necessárias para um projeto final de restauração, no entanto
apenas com este procedimento pode-se verificar o quanto a Estatística Descritiva é capaz de
fornecer subsídios para uma pesquisa aplicada ao amplo universo da Geotecnia. Os métodos
de classificação geomecânica de maciços rochosos são outros exemplos muito similares deste
tipo de aplicação da Estatística Descritiva.

3 - PROBABILIDADE
3.1 - ESPAÇO AMOSTRAL E EVENTOS
Mesmo para os especialistas de cada área de atuação, é muito difícil prever com certeza uma
inferência sobre a população (universo estatístico) a partir de informações obtidas em
amostras. Raramente uma amostra representará exatamente o universo estatístico de onde ela
foi coletada, ou seja, haverá sempre uma incerteza. O conceito de probabilidade é fundamental
para os estudos de situações onde os resultados são variáveis, mesmo quando mantidas
inalteradas as condições de sua realização. Nestes estudos não se pode afirmar de antemão
qual resultado particular ocorrerá, porém existem condições para descrever o conjunto de
todos os resultados possíveis.
Alguns conceitos são importantes:
• Experimento aleatório: processo de coleta de dados relativos a um fenômeno que acusa

variabilidade em seus resultados, ou seja, não é possível prever seu resultado mesmo
conhecendo o conjunto de todos os resultados possíveis (espaço amostral).
• Espaço Amostral (S): conjunto de todos os resultados possíveis de um experimento

aleatório. Cada um dos resultados do espaço amostral é chamado de ponto amostral.
Quando o espaço amostral engloba um número finito ou infinito numerável de eventos,
este é chamado de espaço amostral discreto; e se por outro lado consiste de todos os
números reais de um determinado intervalo, é um espaço amostral contínuo.
• Evento (E): um evento é qualquer subconjunto de um espaço amostral. Quando constituído

de um único elemento ou ponto amostral, é denominado evento simples ou elementar. O
Complemento de um Evento (~E ou E ) é o subconjunto formado pelos elementos do
espaço amostral que não foram incluídos no evento.
Podem-se estabelecer algumas operações entre dois ou mais eventos, pertencentes ao mesmo
espaço amostral:
• A operação de união entre eventos gera um novo evento contendo todos os elementos
existentes nos eventos que foram unidos. Se a união entre eventos formar o próprio espaço
amostral, estes são chamados de eventos coletivamente exaustivos, ou seja, um dos
eventos deve necessariamente ocorrer.
• A operação de interseção de eventos gera um novo evento contendo somente os elementos

comuns aos eventos estudados. Se a interseção entre eventos for um conjunto vazio, estes
são chamados de eventos mutuamente excludentes, ou seja, ambos os eventos não podem
ocorrer ao mesmo tempo.

Por exemplo, em uma população amostral oriunda de investigações geotécnicas, existem

amostras saturadas e amostras não-saturadas, estes são eventos mutuamente excludentes e
coletivamente exaustivos. Já que nenhuma delas é “ambas” (elas são mutuamente
excludentes) e todas são necessariamente uma ou outra (eles são coletivamente exaustivos).
Aplicando estas operações a um evento e seu complemento, tem-se que:
• A união de um evento e seu complemento (A ∪ ~A) é o próprio espaço amostral (eventos

coletivamente exaustivos).
• A interseção de um evento e seu complemento (A ∩ ~A) é um conjunto vazio (eventos

mutuamente excludentes).
3.2. - CÁLCULO DA PROBABILIDADE
Definido o espaço amostral S e um certo evento A, a probabilidade do evento P(A) é dada

por:
n (A) (3.1)
P (A) =
n (S)
onde:
P(A) – probabilidade de ocorrer o evento A
n(A) – número de elementos do evento A
n(S) – número de elementos do espaço amostral S
A probabilidade do evento A, representada por P(A), é um número entre 0 e 1 que mede as

chances de ocorrer o evento A quando realizado um experimento aleatório. Quando o valor da
probabilidade for igual a zero, deve-se interpretar que este evento nunca ocorre, e quando
igual a 1, esse sempre ocorre.
A probabilidade de um evento pode ser calculada de forma relativa ou teórica. A

probabilidade relativa de um evento é dada pela repetição sucessiva do experimento e
verificando a razão entre o número de vezes que o evento ocorreu e o número total de
repetições do experimento. Já a probabilidade teórica de um evento pode ser calculada quando
o espaço amostral é totalmente definido e seus respectivos eventos são mutuamente
excludentes e igualmente prováveis. Neste caso, a medida que o número de experimentos
aumenta, a probabilidade relativa de um evento tende a sua probabilidade teórica. Por
exemplo, a probabilidade teórica de obter cara no lançamento de uma moeda é 1/2 e de obter
um certo número (de 1 a 6) no lançamento de um dado é 1/6.

Exemplo 3.1 – Numa análise paramétrica de estabilidade de taludes com resultados do fator
de segurança para a poropressão variando de 0,1 a 0,4 (Tabela 3.1), qual a
probabilidade do fator de segurança (FS) ser menor do que 1,5?
Tabela 3.1 - Resultados de FS com ru variando de 0,1 a 0,4

ru FS
0,1 1,871
0,2 1,727
0,3 1,585
0,4 1,436
Solução:
Neste caso o espaço amostral tem quatro elementos (4 valores de FS):
S = {1,871; 1,727; 1,585; 1,436}
O evento A com valores de FS menores do que 1,50 tem apenas um elemento (1 valor de FS):
A = {FS < 1,5} = {1,436}
Logo a probabilidade de ocorrência do evento A é dada por:
P(A) = n(A) / n(S) = 1/4 = 25%
3.3 - AXIOMAS DA PROBABILIDADE
A Probabilidade pode ser definida como o número associado a um acontecimento e que goza
de certas propriedades chamadas axiomas do cálculo das probabilidades. Representando por P
a função de probabilidade tem-se as seguintes definições:
• P(A) - a probabilidade de ocorrer o evento A.

• P(A ∪ B) - a probabilidade de ocorrência do evento A ou B ou ambos: P(A) + P(B).
• P(A ∩ B) - a probabilidade da ocorrência simultânea dos eventos A e B: P(A) x P(B).
Os axiomas da probabilidade são:

• Para cada evento A: 0 ≤ P(A) ≤ 1
• P(R) = 1 (probabilidade de um evento certo)
• P(φ) = 0 (probabilidade de um evento impossível)
• Se A e B são dois eventos mutuamente excludentes (eventos são mutuamente excludentes
se a realização de um excluir a realização do outro), então P(A ∪ B) = P(A) + P(B)

• Se A é complemento do evento A, então P( A ) = 1 - P(A)
• Se A e B são dois eventos quaisquer, então P(A ∪ B) = P(A) + P(B) - P(A ∩ B)
Exemplo 3.2 – Uma análise probabilística e paramétrica de estabilidade de taludes, para as

variáveis geotécnicas (coesão e ângulo de atrito) nos pontos de estimativa
máximos e mínimos, e com a poropressão variando de 0,1 a 0,4 , forneceu os
seguintes valores de fator de segurança (FS) que se encontram na Tabela 3.2:
Tabela 3.2 - Valores para o FS da análise probabilística e paramétrica de estabilidade

ru FS
0,1 2,019
PARÂMETROS
0,2 1,857
MÁXIMOS 0,3 1,697
0,4 1,538
0,1 1,734
PARÂMETROS
0,2 1,608
MÍNIMOS 0,3 1,475
0,4 1,251
Qual a probabilidade de ocorrer: A = {FS ≥ 1,80} ou B = {FS ≤ 1,70} ?
Solução:
Pela Tabela 3.2, os eventos A e B correspondem a:
A = {1,857; 2,019}
B = {1,697; 1,608; 1,475; 1,538; 1,251}
Os eventos são mutuamente exclusivos, logo as respectivas probabilidades são:

P(A) = n(A) / n(S) = 2/8 = 1/4 = 25,0%
P(B) = n(B) / n(S) = 5/8 = 62,5%
P(A ∪ B) = P(A) + P(B) = 1/4 + 5/8 = 7/8 = 87,5%
Exemplo 3.3 – Calcular a probabilidade de ocorrência dos seguintes eventos, retirando

aleatoriamente uma carta de um baralho completo (52 cartas):
• ou rei ou espada
• simultaneamente rei e espada
Solução:
Num baralho dentre as 52 cartas, existem 4 cartas rei e 13 cartas espada. Representando por R
o evento de obter cartas rei e por E o de obter cartas espada, a probabilidade de ocorrência do
primeiro evento é:

P(R ∪ E) = P(R) + P(E) - P(R ∩ E) = 4/52 + 13/52 - 1/52 = 16/52
Este cálculo se justifica por serem os eventos R e E quaisquer e não mutuamente excludentes,
pois podem ocorrer simultaneamente. Já a probabilidade de ocorrência do segundo evento é:
P(R ∩ E) = 1/52
Exemplo 3.4 – Uma gaveta contém 50 parafusos e 150 porcas. Metade dos parafusos e das
porcas está enferrujada. Se uma peça for escolhida ao acaso, qual a
probabilidade de que seja um parafuso ou uma peça enferrujada?
Solução:
Representando por A o evento de escolher um parafuso, por B o de uma porca e por C o de

uma peça enferrujada, tem-se as seguintes probabilidades de ocorrência:
P(A) = 50/200 = 1/4

P(B) = 150/200 = 3/4
P(C) = 1/2
A probabilidade de ser parafuso ou peça enferrujada é dada por:
P(A ∪ C) = P(A) + P(C) - P(A ∩ C)
A probabilidade de ser um parafuso enferrujado é:
P(A ∩ C) = 25/200 = 1/8
Assim:
P(A ∪ C) = P(A) + P(C) - P(A ∩ C) = 1/4 + 1/2 - 1/8 = 5/8 = 62,5%
3.4 - PROBABILIDADE CONDICIONAL E INDEPENDÊNCIA
Sejam A e B dois eventos associados a um experimento qualquer. Define-se por P(B/A) a

probabilidade condicional do evento B, ou seja, a probabilidade de ocorrência de B dado que
o evento A já ocorreu. A probabilidade condicional é definida por:
• P (B/A) = P(A ∩ B) / P(A) desde que P(A) ≥ 0
A mais importante conseqüência da definição de probabilidade condicional é obtida pela

equação abaixo, denominada Teorema da Multiplicação:

• P(A ∩ B) = P(A) P(B/A) = P(B/A) P(A)
Convém ressaltar que existem, entretanto, situações nas quais saber que o evento B ocorreu
nada influencia na ocorrência da A. Isto pode ser exemplificado através do seguinte caso: um
dado não-viciado é jogado duas vezes. Definindo A: {o primeiro lançamento mostra um
número par} e B: {o segundo lançamento mostra um 5 ou 6}, intuitivamente pode-se ver que
os eventos A e B são completamente não-relacionados. O evento A não interfere sobre B, os
quais são chamados de eventos independentes.
Deste modo, desde que P(A) > 0 e P(B) > 0 e que P(A) = P(A/B) , P(B) = P(B/A) , tem-se
que:
• P(A ∩ B) = P(A) P(B/A) = P(A) P(B)
Pode-se, então, definir que A e B serão eventos independentes se, e somente se:
• P(A ∩ B) = P(A) P(B)
Exemplo 3.5 – Extraem-se sucessivamente, sem reposição, duas cartas de um baralho

comum, ou, o que é o mesmo, extraem-se simultaneamente duas cartas do
baralho. Determinar a probabilidade de ambas serem "ás".
Solução:
Antes da primeira extração, há quatro “ases” em 52 cartas. O evento A, “ás” na primeira

extração, tem probabilidade de P(A) = 4/52 = 1/13.
Já na segunda extração, nosso espaço amostral se modificou, ou se restringiu, porque a

primeira carta extraída não foi reposta. Restam 51 cartas, e entre elas apenas três “ases”.
Chamando B o evento “ás” na segunda extração, tem-se P(B/A) = 3/51
Então: P(A ∩ B) = P(A) P(B/A) = (4/52) (3/51) = 1/221
Neste caso os eventos não são independentes. A probabilidade do segundo evento depende do
resultado do primeiro.
Exemplo 3.6 - Considere o Exemplo 3.5, porém com reposição da primeira carta extraída.
Solução:
Aqui o espaço amostral se mantém inalterado após a primeira extração, como também
inalterada permanece a probabilidade de extração de um “ás” : 4/52.
Então: P(B/A) = P(B) = 1/13

P(A ∩ B) = P(A) P(B) = (1/13) (1/13) = 1/169

Para uma melhor visualização das propriedades de cálculos das probabilidades, apresenta-se o
seguinte resumo:
DOIS EVENTOS A e B
MUTUAMENTE EXCLUDENTES NÃO MUTUAMENTE EXCLUDENTES

P(A ∩ B) = 0 P(A ∪ B) = P(A) + P(B) - P(A ∩ B)
P(A ∪ B) = P(A) + P(B)
INDEPENDENTES DEPENDENTES
P(A ∩ B) = P(A) P(B) P(A ∩ B) = P(A) P(B/A)
3.5 - VARIÁVEIS ALEATÓRIAS
Muitos experimentos produzem resultados não-numéricos. Antes de analisá-los, é conveniente

transformar seus resultados em números, o que é feito através da variável aleatória, que na
realidade corresponde a uma regra de associação de um valor numérico a cada ponto do
espaço amostral.
Para entender uma variável aleatória é necessário associar a cada valor a sua probabilidade,
obtendo o que se chama uma distribuição de probabilidades, que fica caracterizada pelos
valores da variável aleatória e pela regra, ou função, que associa a cada valor sua
probabilidade. Esta função, chamada função de probabilidade, é representada por f(x).
Para estudar e tomar decisões em situações onde está presente a incerteza, deve-se identificar
a variável aleatória de interesse e obter sua distribuição de probabilidade, obtendo, a partir daí,
os elementos necessários para a tomada de decisão.
Convém ressaltar que associada a toda variável aleatória se encontra uma distribuição de
probabilidade que lhe fornece características próprias. Ao conhecer a função de probabilidade
de uma variável X, pode-se determinar a sua probabilidade de ocorrência. As distribuições de
probabilidade se encontram especificadas no Capítulo 4 desta apostila.

4 - DISTRIBUIÇÃO DE PROBABILIDADE
4.1 - DISTRIBUIÇÃO DE PROBABILIDADE DISCRETA
Se uma variável X pode assumir um conjunto discreto de valores X1, X2, X3,..., Xk, com
probabilidade P1, P2, P3,..., Pk, respectivamente, sendo que P1+P2+P3+...+Pk = 1, diz-se que
está definida uma probabilidade discreta de X. A função P(X) que assume os valores P1, P2,
P3,..., Pk, respectivamente para X = X1, X2, X3,... Xk, é denominada função de probabilidade
ou freqüência de X. Como X pode assumir certos valores com dadas probabilidades, ele é
freqüentemente denominado variável aleatória discreta.
Exemplo 4.1: Em duas realizações de um mesmo ensaio, onde o resultado é do tipo

verdadeiro ou falso, X é o número de resultados do tipo verdadeiro do
seguinte espaço amostral:
E = {VV, VF, FV, FF}, a cada evento simples pode-se associar um número, conforme abaixo:
Evento VV VF FV FF
X 2 1 1 0
Então, a distribuição de probabilidade é:
X 2 1 0
P(X) ¼ ½ ¼
4.2 - DISTRIBUIÇÃO DE PROBABILIDADE CONTÍNUA
As distribuições discretas de probabilidade tratam de situações em que o espaço amostral

contém um número finito, ou infinito, porém contável de pontos. Se o espaço amostral contém
um número infinito não contável de pontos, tem-se que trabalhar com distribuições contínuas
de probabilidade. Considere que uma variável aleatória possa assumir todos os valores de um
dado intervalo (p.ex. mensurações de altura, temperatura, precipitação pluviométrica etc.).
Embora na prática, tais mensurações sejam registradas com aproximação de inteiro, ou
décimo, ou centésimo etc., conforme o caso, a natureza destas variáveis aleatórias é
essencialmente contínua.
A distribuição de uma variável aleatória contínua pode ser encarada como um refinamento de
uma distribuição discreta. Inicia-se o trabalho como se as mensurações tivessem sido feitas em

uma escala bastante grosseira. A medida que se aumenta a precisão das medidas, pode-se
trabalhar com um número cada vez maior de classes até que, no limite, tem-se uma curva
contínua. É a função da densidade de probabilidade, usualmente designada por ƒ(x).
As principais propriedades da função da densidade de probabilidade são:

• A área total sob a função de densidade é 1;
• P(a ≤ X ≤ b) = área sob a curva de densidade entre os pontos a e b;
• ƒ(X) ≥ 0
• P(X = x0) = 0
Vale comentar a última propriedade. Numa distribuição contínua, só faz sentido falar da
probabilidade de uma variável aleatória X, caso esta esteja em um intervalo. A probabilidade
de ela se reduzir a um ponto é rigorosamente zero. Intuitivamente, basta considerar a segunda
propriedade e, em seguida, fazer a e b coincidirem. Tem-se um retângulo de base zero e,
conseqüentemente, de área zero.
Na prática, isto pode parecer contraditório. Por exemplo, então a probabilidade da massa
específica seca de um solo ser exatamente 1,75 g/cm3 é zero? É impossível existir um solo
com essa massa específica seca? Deve-se admitir que a precisão dos instrumentos de medida é
limitada e conseqüentemente 1,75 se não distingue de qualquer outro valor no intervalo, como
por exemplo [1,745; 1,755] ou [1,7495; 1,7505]. O que interessa é, na realidade, a
probabilidade da variável aleatória estar num intervalo, por menor que este seja, e então a
probabilidade correspondente já não mais será igual a zero.
Em conseqüência disso, e ao contrário do que ocorre com as variáveis aleatórias discretas, é

indiferente considerar, ou não, os extremos quando for especificado um intervalo de uma
variável aleatória contínua:
P( a < X < b) = P(a ≤ X < b) = P(a < X ≤ b) = P(a ≤ X ≤ b).
4.3 - EXPECTÂNCIA OU VALOR ESPERADO
Muitas vezes, se torna necessária a representação de uma distribuição de probabilidade por

uma quantidade típica. No caso da amostra, pode ser a média x ou a mediana Me. Para os
casos de distribuições de probabilidade, esta quantidade típica é a expectância ou o valor
esperado e corresponde à média µ da distribuição de probabilidade. Caso X seja discreto, o
valor esperado de X pode ser definido como:

E ( X ) = µ = ∑ xi pi (4.1)
i
Caso X seja contínuo, o valor esperado de X é dado por:
+∞
E( X ) = µ = ∫ xf ( x ) dx (4.2)
−∞
E(X) é lido como valor esperado ou expectância de X e considerado como a média µ da

população ou universo. Exemplificando com a distribuição discreta correspondente ao
lançamento de dois dados, o valor esperado dos resultados será:
E(X) = 2(1/36) + 3(2/36) + 4(3/36) + ... + 12(1/36) = 7
Para a distribuição contínua, por exemplo, supondo que na determinação da dureza de um aço
particular, a medida de Rockwell (da dureza) varia uniformemente entre 50 e 70. A função de
densidade pode ser representado da seguinte forma:
1
 para 50 ≤ x ≤ 70
ƒ(X)  20
0 para 50 > x > 70
Então o valor esperado será:
=∞
E ( X ) = ∫ xf ( x)dx =
1 70
20 ∫50
xdx = 60
−∞
4.4 - MOMENTOS
Na Mecânica Clássica, os momentos são conhecidos como propriedades físicas associadas à

massa dos corpos. O primeiro momento, em relação à origem, é o centro de gravidade e o
segundo, em relação ao centro de gravidade, é o momento de inércia. Similarmente, em
distribuições de probabilidade, os momentos são igualmente importantes e servem para
caracterizar uma determinada distribuição de probabilidade.
O primeiro momento, em relação à origem, é o valor esperado E(X) ou a média µ da

distribuição. Assim, para variáveis aleatórias discretas, o primeiro momento corresponde à Eq.
4.1, enquanto que para variáveis contínuas à Eq. 4.2. O segundo momento, em relação à
média, é a variância V(X) ou σ2. Assim, se X for discreto:
V(X) = σ2 = E(X - µ)2 = ∑ ( xi − µ) p i

2
(4.3)
i
Se X for contínuo:
+∞
V(X) = σ2 = E(X - µ)2 = ∫−∞ ( x − µ) f ( x) dx
2
(4.4)

Retornando ao exemplo do lançamento de dois dados, a correspondente distribuição de

probabilidade possui como segundo momento:
V(X) = E(X - µ)2 = E(X)2 - µ2 = ∑ x2pi − µ2 (4.5)

i
V(X) = [(2)2(1/36) + (3)2(2/36) + ... + (12)2(1/36)]-(7)2 = 54,83 - 49 = 5,83
Exemplificando para a distribuição contínua correspondente à medida de dureza, tem-se:
V(X) = E(X - µ)2 = E(X)2 - µ2 = ∫−∞ x f ( x) dx − µ2

+∞ 2
(4.6)
1 70 2
V(X) = ∫ x dx − (60) = 3600,333 − 3600 = 33,33
2
20 50
Generalizando para X discreto, o momento de ordem j é representado por:
E ( X − µ ) = ∑ (x i − µ ) p i
j j
(4.7)
i
Generalizando para X contínuo, o momento de ordem j é representado por:
E(X − µ ) = ∫ (x − µ ) j f (x )dx
j +∞
(4.8)
−∞
4.5 - PRINCIPAIS DISTRIBUIÇÕES DE PROBABILIDADE DISCRETAS
4.5.1 - Distribuição Binomial
Se p é a probabilidade de um evento acontecer em uma tentativa única (denominada

probabilidade de um sucesso) e q=1-p é a probabilidade de que o evento não ocorra em
qualquer tentativa única (denominada probabilidade de insucesso), então a probabilidade da
ocorrência de x sucessos e n-x insucessos, numa dada ordem, é, pelo princípio fundamental da
contagem, px.qn-x.
Mas como só interessa o número de sucessos e insucessos, e não a ordem em que ocorrem, há
 n
  disposições possíveis daquelas ocorrências. Donde, finalmente obtém-se a função de
 x
probabilidade de X:
 n n!
ƒ(X) = p (X = x) =   p x q n - x = px qn - x (4.9)
 
x x! (n - x)!
Onde x = 0, 1, 2, ..., n
 n
A distribuição (4.9) é denominada Binomial ou de Bernoulli, visto que os coeficientes  
 x
n
são os termos do desenvolvimento binomial das potências de (a + b) . Isto é:

(a + b)n = an + nC1 an-1 b + nC2 an-2 b2 + ... + bn
Onde nC1, nC2, ... são denominados coeficientes binomiais.
Exemplo 4.2: Suponha um conjunto de 10 amostras de solo que se caracterizam pelo

comportamento do tipo laterítico ou não laterítico. Determinar a probabilidade de acertar “por
palpite” ao menos 6 tipos de comportamento nas 10 amostras.
Solução: Neste caso, a probabilidade de acertar (sucesso) é igual à probabilidade de falha:
P(V) = P(F) = 0,5.
A probabilidade de acertar ao menos seis tipos de solo é a soma das probabilidades de acertar
6, 7, 8, 9 ou 10 tipo de solo:
10
10   
10 10
P = ∑   (0,5) (0,5) = ∑   (0,5) =
x 10− x 10
x =6  x  x =6  x 
10 10  10  10  10  10 

= (0,5)   +   +   +   +   =
 6   7   8   9  10 
= 0,000977 [210 + 120 + 45 + 10 + 1] = 0,3771
O cálculo das probabilidades binomiais vai-se tornando cada vez mais trabalhoso na medida
em que n cresce. Não é possível calcular diretamente tais probabilidades, mesmo com o
auxílio de calculadoras. Felizmente, para tais casos e certos valores de p, existem tabelas de
probabilidades binomiais bastante extensas que fornecem diretamente o valor da
probabilidade desejada. E no caso de p não constar da tábua, pode-se usar, com boa
aproximação, a distribuição (contínua) normal, ou de Gauss, que será estudada no Item 4.6.1.
Existem tabelas que dão as probabilidades P(X = X0) e P(X ≤ X0) para diversos valores de n e
os principais valores de p. São, respectivamente, as tabelas de probabilidades simples e
acumuladas. O uso apenas da tabela de probabilidades acumuladas é suficiente, pois para um
dado valor x0:
P(X = x0) = P(X ≤ x0) - P(X ≤ x0 - 1)
O Exemplo 4.2 também pode ser solucionado através da tabela de probabilidades binomiais
acumuladas, considerando que P(X ≥ 6) = 1 - P(X ≤ 5). Na interseção da linha n = 10, x = 5,
com a coluna p = 0,5, lê-se o valor 0,623, que é a probabilidade P(X ≤ 5). Logo, a
probabilidade procurada é P = 1 - 0,623 = 0,377.
Exemplo 4.3: Suponha que numa série de ensaios de limite de liquidez (LL), 5% dos ensaios
precisem ser refeitos, sendo que a qualidade de um ensaio é independente da qualidade dos

outros. Determinar as probabilidades de 0, 1, 2, ..., 9, 10 ensaios serem recusados numa série

aleatória de 10 ensaios.
Solução: A probabilidade de um ensaio ser recusado é 0,05, logo a probabilidade de um

ensaio ser aceito é 0,95. Pela tábua de probabilidades binomiais acumuladas (com 4
decimais):
P(0) = 0,599
P(1) = P(X ≤ 1) - P(0) = 0,9139 - 0,599 = 0,315
P(2) = P(X ≤ 2) - P(X ≤ 1) = 0,9885 - 0,9139 = 0,074
P(3) = P(X ≤ 3) - P(X ≤ 2) = 0,9990 - 0,9885 = 0,011
P(4) = P(X ≤ 4) - P(X ≤ 3) = 0,9999 - 0,9990 = 0,001
P(5) = P(6) = ... = P(10) ≅ 0.
Não há impossibilidade de ocorrência de 6, 7, ..., 10 ensaios serem recusados, mas as

probabilidades de tais eventos são por demais pequenas, exigindo um grande número de
decimais para serem expressas. Daí considera-se equivalentes a zero.
Se x é uma variável aleatória com distribuição de Bernoulli, então a Média e a Variância são:
E(x) = np (4.10)
V(x) = npq (4.11)
4.5.2 - Distribuição de Poisson
A distribuição discreta de Poisson, apresenta a seguinte função de distribuição de

probabilidade:
λx e -λ
p( x) = (4.12)
x!
Onde x = 1, 2, ...
Existem tabelas de valores da distribuição de Poisson simples e acumuladas. A tabela

acumulada dá para diversos valores do parâmetro λ, as probabilidades de ocorrência de até x0
eventos:
x = x0
e - λ . λx
ƒ(x) = P(x ≤ x0) = ∑
x =0 x!
(4.13)
Da mesma forma que na distribuição binomial, a probabilidade de ocorrência de uma variável

aleatória de Poisson tomar um certo valor x0 é igual à probabilidade de um valor x ≤ (x0 - 1).
Se x é uma variável aleatória com distribuição de Poisson e parâmetro λ, então a Média e a

Variância são:
E(x) = λ (4.14)

V(x) = λ (4.15)
A distribuição de Poisson tem grande número de aplicações porque pode ser vista como uma
aproximação da distribuição binomial com parâmetros n e p, quando n é grande e p é
pequeno, de modo que np que é igual a λ seja de tamanho moderado.
Exemplo 4.4: Considere um experimento binomial com n = 200, p = 0,04, em que se pede a
probabilidade de, no máximo, cinco sucessos.
Solução: Tem-se que:

x = 5 200

P( X ≤ 5) = ∑   (0,04)x (0,96)5− x
x = 0 x 
Tal probabilidade ultrapassa de muito o âmbito das tabelas binomiais usuais, em vista do
elevado valor de n (200). Como o cálculo direto é impraticável, pode-se usar a aproximação
de Poisson:
n = 200 p = 0,04 λ = np = 8
P(X ≤ 5) = 0,191, valor obtido da tabela de probabilidades acumuladas de Poisson, na

interseção da coluna 8 com o valor x0 = 5.
Exemplo 4.5: A probabilidade de uma estrutura romper é estimada como sendo 0,001. Se
1000 estruturas iguais estão sendo construídas, qual a probabilidade de que 2 rompam?
Solução: Pela distribuição binomial:
1000 
  (0,001)2 (0,999)998 = 0,1842
 2 
Pela distribuição de Poisson:
λ = 1000 (0,001) = 1
12 e -1
ƒ(2) = = 0,1839
2!
Exemplo 4.6: Qual a probabilidade de existirem 2 ou menos rupturas nas 1000 estruturas do
exemplo 4.5.
Solução:
2
12 e -1 2,5
ƒ(2) = ∑ = = 0,92
x i =0 xi ! e

As vezes a distribuição de Poisson é chamada distribuição dos eventos raros. É preciso,

entretanto, não interpretar erroneamente a expressão evento raro. Ela não significa que o
evento ocorra vez por outra, e sim que o número de ocorrências é pequeno em relação ao
número de provas. Em outras palavras, um evento raro é aquele que apresenta pequena
probabilidade de ocorrência.
4.5.3 - Distribuição Hipergeométrica
No estudo da distribuição binomial, verificou-se que a probabilidade de sucesso se mantém

constante em todas as provas do experimento. A binomial corresponde, pois, ao esquema de
extrações com reposição.
Considerando agora o exemplo de determinar a probabilidade de obter exatamente três cartas

vermelhas em cinco extrações de um baralho comum, sem reposição. Como a carta extraída
não volta ao baralho, a probabilidade de aparecer carta vermelha se modifica de uma para
outra extração. Para isto, basta notar que extrair cinco cartas de um baralho, uma após outra,
sem reposição, equivale a extrair aleatoriamente as cinco cartas de uma só vez. Então, se um
baralho comum tem 26 cartas vermelhas e 26 cartas pretas, a presença de três cartas vermelhas
 26 
em cinco extrações exige que as outras duas cartas extraídas sejam pretas. Ora, há  
3
 26 
maneiras de extrair três cartas vermelhas e   maneiras de extrair duas cartas pretas de um
2
 26   26 
baralho comum. Essas possibilidades dão um total de   .   casos favoráveis (princípio
3 2
fundamental da contagem). Por outro lado, pode-se extrair cinco cartas de um baralho de 52
 52 
cartas de   maneiras distintas (casos possíveis). Então, a probabilidade procurada é
5
 26   26 
   
P =     = 0,3251
3 2
 52 
 
5
Na distribuição hipergeométrica entretanto, interessa a probabilidade de x obter x sucessos

dentre k itens considerados como sucesso, e n-x falhas dentre N-k itens considerados como
falhas.
No exemplo acima, pode-se considerar (arbitrariamente) vermelha como sucesso e preta como
falha, numa população de tamanho N:
• N = 52 • n=5
• k = 26 • x=3
• N - k = 26 • n-x=2

Se X é o número de sucessos em uma amostra de tamanho n extraída de uma população com

N itens, dos quais k são considerados sucesso e N-k falhas, a distribuição de X é dada por:
k  N-k 
   
x  n-x 
(4.16)
 N
 
 n 
Os cálculos diretos em geral são longos. Mas quando n é pequeno em relação a N, não há
diferença prática entre extração sem reposição e extração com reposição. Então, a distribuição
hipergeométrica pode ser satisfatoriamente aproximada pela binomial com:
k N-k
p= e q=
N N
Se x é uma variável aleatória com distribuição hipergeométrica, então a média e a variância

são dadas por:
E(x) = np (4.17)
var(x) = npq (N - n/ N - 1) (4.18)
As distribuições binomial, de Poisson e hipergeométrica são sem dúvida as mais importantes.

Existem, entretanto, várias outras que, em contexto mais restrito, têm também importância,
como por exemplo: as distribuições geométricas, de Pascal e multinomial.
4.6 - PRINCIPAIS DISTRIBUIÇÕES CONTÍNUAS
4.6.1 - Distribuição Normal
Um dos mais importantes exemplos de uma distribuição contínua de probabilidade é a

distribuição ou a curva normal, ou distribuição de Gauss (Fig. 4.1), definida pela equação:
( x - µ )2
1 2σ 2
ƒ(x) = e (4.19)
σ 2π
onde µ é a média e σ o desvio padrão.
As principais características da distribuição normal são:
• A média da distribuição é µ;
• O desvio padrão é σ;
• A moda ocorre em x = µ;
• A curva é simétrica em relação a um eixo vertical passando por x = µ;

• A curva tem inflexões nos pontos x = µ ± σ; é côncava para baixo se µ-σ < x < µ+σ e
côncava para cima em caso contrário;
• A curva normal é assintótica ao eixo horizontal em ambas as direções;
• A área total sob a curva normal e acima do eixo horizontal é 1 (o eixo horizontal é o eixo
dos valores da variável aleatória X).
Figura 4.1 - Curva normal típica
A área total limitada pela curva de Gauss e pelo eixo dos x é igual a 1; portanto, a área sob a
curva, compreendida entre as duas coordenadas x = a e x = b, em que a<b, representa a
probabilidade de x estar situado entre a e b, conforme a Figura 4.2.
Figura 4.2 - Probabilidade de x estar entre a e b
O cálculo direto de probabilidades envolvendo a distribuição normal exige recursos do cálculo

infinitesimal e, mesmo considerando a forma simplificada da função de densidade, não é um
processo elementar. Por isso, elas foram tabeladas, permitindo obter diretamente o valor da
probabilidade desejada. Verifica-se que a função de densidade normal depende de dois
parâmetros, µ e σ, de modo que se as probabilidades fossem tabeladas diretamente a partir
dessa função, seriam necessárias tabelas de dupla entrada. Recorre-se, por isso, a uma
mudança de variável, transformando a variável aleatória X na variável aleatória Z assim
definida:

X-µ
Z= (4.20)
σ
Esta nova variável chama-se variável normal padronizada, ou reduzida. Sua média é 0 e seu
desvio padrão, 1. Mediante tal transformação, basta uma única tabela (da variável normal
reduzida). A Fig. 4.3 ilustra esta transformação.
Essa transformação não altera a forma da distribuição; apenas refere-se a uma nova escala. A
tabela da distribuição normal fornece a probabilidade de Z tomar um valor não superior a z0:
P(Z ≤ Z0). Costuma-se denotar esta probabilidade por φ (Z0). Tal probabilidade é a área
hachurada na Figura 4.4.
Figura 4.3 - A variável aleatória normal X e a variável aleatória reduzida Z correspondente
Figura 4.4 - Probabilidade P(Z ≤ Z0)
Exemplo 4.7: Determinar a área sob a curva normal padronizada à esquerda de 1,72.
Solução: Consultando a tabela, vê-se que z = 1,72 corresponde à área (probabilidade) de

0,9573, ou seja, 95,73% da área sob a curva e acima do eixo da variável aleatória reduzida
estão à esquerda de Z = 1,72. Isto significa que a probabilidade de Z ser menor que 1,72 é
0,9573, P(Z ≤ 1,72) = 0,9573.

Exemplo 4.8: Determinar a probabilidade de a variável aleatória padronizada Z estar entre z0

= 0,70 e z1 = 1,35 (Figura 4.2).
Solução: A área (probabilidade) é a diferença entre a área à esquerda de 1,35 e a área à

esquerda de 0,70:
P(0,70 ≤ Z ≤ 1,35) = P(Z ≤ 1,35) - P(Z ≤ 0,70) = 0,9115 - 0,7580 = 0,1535 = 15,35%.
Exemplo 4.9: Determinar a probabilidade de a variável aleatória reduzida Z tomar valores

maiores que 1,80 (Figura 4.5).
Figura 4.5 - Ilustração do Exemplo 4.5
Solução: A área total é 1, logo a área à direita (acima) de 1,80 é igual 1 menos a área à
esquerda (abaixo) de 1,80:
P(Z ≥ 1,80) = 1 - P(Z ≤ 1,80) = 1 - 0,9641 = 0,0359 = 3,59%.
Os problemas reais dificilmente se apresentam já na forma reduzida, sendo portanto

normalmente formulados em termos da variável normal original X, com média µ e desvio
padrão σ: N (µ; σ). É preciso então, padronizar ou reduzir a variável aleatória normal X,
X-µ
transformando-a na variável aleatória Z = .
σ
Exemplo 4.10: O Índice de Suporte Califórnia (ISC) de um subleito segue uma distribuição
normal com média 12 e desvio padrão 1. Qual a probabilidade de encontrar um valor de ISC
superior a 15?
Solução:
15 - 12
⇒ Z= =3
1
P(x > 15) = P(Z > 3) = 1 - P(Z < 3) = 1- 0,99865 = 0,00135 = 0,135%.
Exemplo 4.11: Uma distribuição normal tem média µ = 62,4. Determinar o desvio padrão σ
se 0,33 da área sob a curva estão à direita de 79,2 (Figura 4.6).

Solução: Se 0,33 da área estão à direita, então 0,67 estão à esquerda de 79,2. Deve-se
procurar na tabela o valor z ao qual corresponde a área 0,67. Tal valor é z = 0,44. Então:
79,2 - 62,4 79,2 - 62,4

0,44 = ⇒σ = = 38,18 .
σ 0,44
Quando n é grande e p não está muito próximo nem de 0 nem de 1, a distribuição normal
constitui boa aproximação da binomial, o que permite tratar uma variável aleatória binomial
b(n; p) como uma variável aleatória normal. Como na distribuição binomial a média é np e o
desvio padrão é npq , sendo n o número de provas, p a probabilidade de sucesso e q = 1-p a
probabilidade de insucesso, padroniza-se X da seguinte maneira:
X - np  a - np b - np 
Z= P (a ≤ X ≤ b) = P  ≤ Z≤ (4.21)
npq  npq npq 
O cálculo binomial direto exigiria:
n
∑ x  x  p x
qn- x (4.22)
 
Para n grande, o cálculo direto é praticamente impossível.
Exemplo 4.14: Considere uma variável aleatória X com n = 15, p = 0,4 e calcule P(7 ≤ X ≤
10) pela aproximação normal.
Solução:
µ = np = 6
σ= npq = (15) (0,4) (0,6) = 1,9

7-6 10 - 6 
 = P(0,53 ≤ Z ≤ 2,11) =
x -6
Z= P ≤Z≤
1,9  1,9 1,9 
= P(Z ≤ 2,11) - P(Z ≤ 0,53) = 0,9826 - 0,7019 = 0,28.
O cálculo binomial direto, com auxílio das tabelas binomiais, dá P = 0,38. A aproximação
normal dá resultado bastante diferente do resultado exato, não só porque n é pequeno, mas,
principalmente, porque é necessário introduzir uma correção quando se pretende aproximar
uma distribuição discreta por uma distribuição contínua. Tal correção, chamada correção de
continuidade, consiste em subtrair 0,5 do valor inferior e somar 0,5 ao valor superior. Então:
 6,5 - 6 10,5 - 6 
P(7 ≤ X ≤ 10) = P ≤ Z≤ =
 1,9 1,9 
= P(0,26 ≤ Z ≤ 2,37 ) = P(Z ≤ 2,37 ) - P(Z ≤ 0,26) =
= 0,9911 - 0,6026 = 0,39.
Este novo valor da aproximação constitui uma excelente aproximação do valor exato. Para
justificar a correção de continuidade, basta atentar para a Figura 4.7. A porção da curva
normal que corresponde aos retângulos 7, 8, 9, 10 da distribuição discreta (binomial) na
realidade se estende de x = 6,5 a x = 10,5.
Figura 4.7 - Justificativa da correção de continuidade
4.6.2 - Distribuição Uniforme de Probabilidade
A mais simples distribuição de probabilidade de uma variável aleatória X contínua é a

distribuição uniforme. Sua função de densidade de probabilidade é da forma (Fig. 4.8):

1
ƒ(x) = , para α < x < β sendo 0 < α < β < ∞
β −α
= 0, em caso contrário.
Figura 4.8 - Distribuição Uniforme
A área hachurada sob a curva da distribuição uniforme é 1. Embora trata-se de uma

distribuição contínua, os problemas por ela tratados podem, em geral, ser resolvidos pela
geometria elementar, por simples comparação de áreas.
Exemplo 4.13 - Devido à presença de quantidades variáveis de impureza, o ponto de fusão de

certa substância pode ser considerado uma variável aleatória contínua distribuída
uniformemente no intervalo [100; 125]. Qual a probabilidade de a substância fundir-se entre
110 e 115?
Solução:
α = 100 β = 125 β - α = 25
[1]
ƒ(x) = , 100 ≤ x ≤ 125
25
= 0 em caso contrário.
A probabilidade procurada é a relação da área do retângulo hachurado para a área do retângulo

total (que é 1):

5 1
p= = = 20%
25 5
A distribuição uniforme, embora apresentada como contínua, pode também abranger casos
discretos. Suponha que uma variável aleatória X que tome os valores x1, x2, ..., xk com igual
probabilidade. Então X tem distribuição uniforme discreta e sua função de densidade de
probabilidade é dada por:
1
ƒ(x) = , x = x1, x2, ..., xk
k
A média e variância da distribuição uniforme são:
• Caso discreto
k k
1
µ = ∑ xi ƒ(x i ) = ∑x i
i =1 k i =1
1
σ = ∑ x i -
2 2
(∑ xi ) 
2

k k 
 
• Caso contínuo
µ=
α +β
σ2 =
(β - α )2 (4.22)
2 12
4.6.3 - Distribuição Exponencial
Uma variável aleatória X tem distribuição exponencial se sua função de densidade de

probabilidade é da forma:
ƒ(x) = λe-λx, para x > 0 e λ > 0 (4.23)
Onde λ é o parâmetro da distribuição exponencial (Figura 4.10).
A média e a variância da distribuição exponencial são:
1 1
µ= σ2 = (4.24)
λ λ2

Figura 4.10 - Distribuições exponenciais para diferentes valores de λ
A determinação de probabilidades para a distribuição exponencial envolve o cálculo de áreas

sob a curva de densidade, problema que exige recursos do cálculo integral. Pode-se mostrar
que, se T tem distribuição exponencial com parâmetro λ:
P(T > t) = e-λt (4.25)
P(T < t) = 1 - e-λt (4.26)
4.6.4 - Distribuição Lognormal
Uma variável aleatória X tem distribuição lognormal quando seu logaritmo tem densidade
normal de probabilidade. Ou seja, se X é lognormal, ln X é N(α; β). Sua densidade de
probabilidade é dada por:
 1 2
exp  2 (lnx - α ) , x > 0, β > 0,
1
ƒ(x) =
x ⋅ β 2π  2β 
-∞ <α < ∞
A distribuição lognormal é um modelo muito utilizado em situações onde a variável de

interesse apresenta assimetria à esquerda ou para variáveis que fisicamente não possuem
valores inferiores a zero.
Figura 4.11 - Distribuições lognormais

Se X tem distribuição lognormal, então:
 β2 

E ( X ) = exp α +  (4.27)
 2 
Var(X) = exp (2α + β2) [exp(β2) - 1] (4.28)
Mediana: eα
A moda ocorre em x = exp (α - β2)
Para calcular probabilidades na distribuição lognormal com parâmetros α e β, reduz-se o

cálculo ao uso da tabela normal da seguinte forma:
P(a < X < b) = P(ln a < ln X < ln b) =
 ln a - α ln X - α ln b - α 
P < < =
 β β β 
 ln b - α   ln a - α 
φ   - φ  
 β   β 
onde φ é a função normal acumulada.
Exemplo 4.14 - Para determinar a altura adequada dos controles (volante etc.) de um veículo,
mediram-se as alturas de um conjunto típico de operadores. Constatou-se que essas alturas
têm distribuição lognormal com parâmetros α = 5,11 e β = 1. Qual a percentagem de
operadores com altura inferior a 164 cm?
Solução:
P(X < 164) = P(ln X < ln 164) =
 ln X - 5,11 ln 164 - 5,11 

P < 
 1 1 
 ln 164 - 5,11 
=φ   = φ (- 0,010) = 0,496
 1 
Alguns parâmetros do solo têm distribuições que se aproximam de normal ou lognormal.

Estes parâmetros são: densidade (seca e úmida), índices de vazios, teor de umidade, grau de
saturação, limite de liquidez, limite de plasticidade, índice de plasticidade, coeficiente de
consolidação, ângulo de atrito. Outros parâmetros, freqüentemente não se aproximam muito

bem da distribuição normal, como por exemplo: índice de compressibilidade, permeabilidade

e coesão.
4.6.5 - Outras Distribuições Contínuas
4.6.5.1 - Distribuição de Qui Quadrado
Ns 2 ( x1 − x ) + ( x 2 − x ) + L + (x N − x )
2 2 2
χ2 = = , (4.29)
σ2 σ2
onde χ2 é a letra grega qui e χ2 lido como qui quadrado.
Considerando-se amostras de tamanho N retiradas de uma população normal, com o desvio σ,

e se, para cada amostra, for calculado o valor de χ2, pode-se obter uma distribuição amostral
desses valores. Essa distribuição, denominada de qui quadrado, e dada por:
( )(
1 1
υ −2 ) - χ2
ƒ(χ2) = Y0 χ 2 2 e 2 (4.30)
Onde:
υ = N - 1 é o número de graus de liberdade;
Y0 é uma constante dependente de υ, de modo que a área total subtendida pela curva seja
igual a 1.
As distribuições qui quadrado, correspondentes a vários valores de υ, estão apresentadas na

Figura 4.12.
Figura 4.12 - Distribuição Qui Quadrados
4.6.5.2 - Distribuição de Ficher (F)
A distribuição de Ficher pode ser definida da seguinte maneira: se χ21 e χ22 forem variáveis
aleatórias independentes, que seguem uma distribuição Qui Quadrado com υ1 e υ2 graus de
liberdade, respectivamente, então, a variável aleatória:

χ 12 / υ1
Fα ; υ1 ; υ 2 = 2 (4.31)
χ 2 /υ 2
A Figura 4.13 apresenta uma distribuição F com υ1 e υ2 graus de liberdade.
Figura 4.13 - Representação gráfica de uma distribuição de Ficher para diversos valores de υ1
e υ2
A probabilidade de F ser igual ou maior que uma determinada constante é dada por:
∞
(
P F ≥ Fα ;υ1 ;υ 2 = ) ∫ f ( F )dF = α (4.32)
Fα ;υ1 ;υ 2
Os valores da distribuição de F para a Eq. 4.32 encontram-se nas tabelas anexas para valores
de α de 0,10, 0,05, 0,025, 0,01, 0,005 e 0,001. As tabelas também podem ser usadas para
valores de α igual a 0,90, 0,95, 0,975, 0,99, 0,995 e 0,999 desde que seja feito a seguinte
transformação de variável.
1
Fα ;υ1 ;υ 2 =
F1−α ;υ1 ;υ 2
Por exemplo, se υ1 = 6 e υ2 = 8, da Tabela tem-se que:
F0,05; 6; 8 = 3,50
1 1
F0,05; 6; 8 = = = 0,241
F0,05; 6; 8 = 3,50 4,15
4.6.5.3 - Distribuição t de Student
Supondo-se a existência de uma variável aleatória normalmente distribuída X, com média

nula e variância unitária. Supondo também a existência de outra variável aleatória,
independente de X, que segue uma Distribuição Qui Quadrado com y graus de liberdade. A
distribuição de probabilidade que associa estas duas variáveis aleatórias possui a seguinte
função densidade:

(4.32)
Onde:
Y0 é uma constante que depende de υ
υ=N-1
N é o tamanho da amostra
Para valores de -∞ < t < ∞.
Alguns fenômenos físicos podem ser aproximados a uma distribuição t, mas raramente isso é
feito devido à dificuldade de trabalhar com essa distribuição. Sua principal aplicação é
auxiliar na tomada de decisão em relação à média de uma Distribuição Normal quando sua
variância é desconhecida. Assim, se X for uma variável aleatória normalmente distribuída
com média nula e variância unitária e χ2 for uma variável aleatória correspondente a uma
Distribuição Qui Quadrado com υ graus de liberdade, então a variável aleatória
x υ
= tα ;υ (4.33)
x2
segue uma distribuição t com υ graus de liberdade. A curva representativa desta distribuição é
simétrica em torno de t = 0 e varia conforme o valor de υ.
Os parâmetros desta distribuição são:
E(t) = 0 para υ>1

(4.34)
V(t) = υ/(υ - 2) para υ>2
Os valores da Distribuição t se encontram tabelados na tabela anexa para valores de t ≥ 0

(metade da direita) e valores de α ≤ 0,50. Como a distribuição é simétrica, valores de α > 0,50
podem ser obtidos da mesma tabela, fazendo tα; υ = t1-α; υ. Na tabela anexa pode-se encontrar
os valores de
∞
P(t ≥ tα ;υ ) = ∫ f (t )dt = α
tα ;υ

Para ilustrar, supõe-se que t siga uma Distribuição d Student com υ = 5 graus de liberdade e
quer-se determinar o valor de tα; υ tal que
P(t ≥ tα; υ ) = α = 0,05
Assim, da tabela anexa, para α = 0,05 e υ = 5, tem-se que:
tα; υ ≥ t0,05; 5 = 2,015
donde P(t ≥ 2,015) = 0,05
Da mesma maneira, para P(t ≥ t0,60; 5) = 0,60, tem-se que:
t0,6; 5 = t0,4; 5 - 0,267,
ou seja,
P(t ≥ t0,60; 5) = P(t ≥ -0,267) = 0,60
Para valores de υ > 30, a Distribuição Normal pode ser utilizada como aproximação da
Distribuição Student.

5 – AMOSTRAGEM E ESTIMAÇÃO
5.1 – AMOSTRAGEM
Existem duas alternativas para obter informações sobre uma população ou universo
estatístico:
• Censo: as informações são coletadas junto a todos os elementos da população ou universo;

• Amostragem: as informações são coletadas junto a um subconjunto da população ou
universo, denominado amostra.
Define-se então Amostragem como a seleção e escolha dos elementos de uma população ou
universo para constituir uma amostra.
A População de Interesse ou População-Alvo é aquela sobre a qual são feitas inferências

baseadas na amostra. Após caracterizada a população-alvo, o próximo passo é escolher as
características a serem medidas. Deve-se evitar escolher muitas características pois a
qualidade da mensuração pode diminuir.
Na realização de qualquer estudo quase nunca é possível examinar todos os elementos da

população de interesse. Caso fosse possível o acesso a todos os elementos da população, isto
não significaria maior precisão nos resultados, pois os erros de coleta e manuseio de grande
número de dados são maiores do que as imprecisões devido à generalização das conclusões de
uma amostra bem selecionada. Um levantamento amostral visa definir a população de
interesse e selecionar as características a serem pesquisadas.
A técnica de amostragem é amplamente utilizada pelas seguintes razões:
• Se a população é muito grande ou infinita, a realização de um censo torna-se impossível ou

proibitivo em termos de tempo e custo;
• Em situações, onde a obtenção de informações é feita a partir de testes destrutivos dos
elementos analisados, o uso da amostragem se torna imprescindível.
5.1.1 -Tipos de Amostragem
As amostras estatísticas são aquelas cujo processo de escolha é aleatório, ou seja elas têm a
mesma probabilidade de serem escolhidas, garantindo que toda a variabilidade presente na
população estará refletida na amostra. Outra característica da escolha aleatória é que o
conhecimento de um elemento qualquer não indica valores de outros elementos. Os métodos
mais comuns de amostragem são: Amostragem Aleatória Simples, Amostragem por
Conglomerado, Amostragem Estratificada e Amostragem Sistemática.
5.1.1.1 - Amostragem Aleatória Simples
Uma amostra aleatória simples de tamanho "n", extraída de uma população finita com "N"
elementos, é uma amostra selecionada de tal forma que cada amostra possível de tamanho "n"
tenha a mesma probabilidade de ser escolhida.. A retirada dos "n" elementos que compõe a
Métodos Estatísticos e Probabilísticos em Geotecnia - Capítulo 5 5.1

amostra pode ser feita simultaneamente ou um a um, garantindo que os elementos

remanescentes têm probabilidades idênticas de serem escolhidos na próxima retirada.
No caso da amostra ser escolhida elemento a elemento, a população é numerada de 1 a N, e

escolhe-se, através da Tabela de Números Aleatórios, "n" números compreendidos entre 1 e
N.
Exemplo 5.1 – As espessuras (mm) de 30 amostras de geotêxtil coletadas de uma mesma

manta são apresentadas. Extrair, sem reposição, uma amostra aleatória de
tamanho n = 5. Calcular também a expectância (µ ) e a média ( x ) da amostra
aleatória.
Amostras 1 2 3 4 5 6 7 8 9 10
Espessura 2,0 2,1 2,1 2,2 2,2 2,3 2,5 2,5 2,0 2,1
Amostras 11 12 13 14 15 16 17 18 19 20
Espessura 2,3 2,3 2,5 2,5 2,7 2,8 1,3 1,3 1,5 1,6
Amostras 21 22 23 24 25 26 27 28 29 30
Espessura 1,9 1,9 2,0 2,0 2,2 2,1 1,9 2,3 2,2 2,1
Solução:
Partindo de uma Tabela de Números Aleatórios (TNA), obtemos cinco números não
superiores a 30. Então a amostra será:
Leitura na TNA 26 15 03 07 06
Espessura 2,1 2,7 2,1 2,5 2,3
A expectância: µ = 2,11
A média da amostra: x = 2,34
5.1.1.2 - Amostra Estratificada
Quando os elementos de uma população estão divididos em grupos de elementos, chamados

estratos, de forma que todo elemento da população pertença a um e somente um estrato, é
mais fácil e eficiente escolher uma amostra aleatória simples dentro de cada um dos estratos.
Como a maioria das populações tem estratos bem definidos, esta forma de amostragem é uma
das mais utilizadas e apresenta algumas vantagens em relação às demais:
• Os dados são geralmente mais homogêneos dentro de cada estrato do que na população
como um todo;
• O custo de coleta e análise dos dados é freqüentemente menor do que na aleatória simples;
• Pode-se obter estimativas separadas dos parâmetros populacionais para cada estrato sem
selecionar outra amostra e, portanto, sem custo adicional.

É comum utilizar a amostragem estratificada proporcional, que consiste em selecionar os

elementos da amostra entre os vários estratos, em número proporcional ao tamanho de cada
um dos estratos. Considerando que:
N – é o número de elementos da população;

L – é o número de estratos;
Ni – é o número de elementos do estrato i;
n – é o tamanho da amostra a ser selecionada.
Assim:
N = N1 + N2 + ... + NL (5.1)
Calcula-se a fração da amostra dada por:
n
f= (5.2)
N
O número de elementos a serem sorteados em cada estrato é:
N1f, N2f, ..., Nkf (5.3)
Exemplo 5.2 – Na restauração de um pavimento flexível, foram utilizados dois tipos de

geossintéticos como material de reforço: E e F. Em uma análise de
permeabilidade dos materiais foram consideradas 30 amostras da manta,
representadas abaixo pelos valores das permeabilidades de cada uma.
Extrair, sem reposição, uma amostra estratificada proporcional de tamanho n
= 8.
GEOSSINTÉTICO - E
Amostras 1 2 3 4 5 6
-3
Permeabilidade (10 cm/s) 1,9 1,6 1,7 1,8 1,7 1,8
GEOSSINTÉTICO - F
Amostras 1 2 3 4 5 6 7 8
-3
Permeabilidade (10 cm/s) 6,1 4,1 6,7 5,4 4,3 6,4 6,2 5,1
Amostras 9 10 11 12 13 14 15 16
-3
Amostras 17 18 19 20 21 22 23 24
-3
Solução:
A fração da amostra é dada por:

f = 8/30 = 0,27
De cada estrato, serão sorteadas respectivamente n1 e n2 unidades:

n1 = (0,27)(6) = 1,62 ≅ 2
n2 = (0,27)(24) = 6,48 ≅ 6
Lendo os dois últimos algarismos a partir do início da quarta coluna da TNA, inferiores a 6
para o geossintético E e 24 para o geossintético F, obtem-se o seguinte resultado:
Estrato E F
Leitura na TNA 03 01 20 03 18 17 24 12
Permeabilidades(10-3 cm/s) 1,7 1,9 4,3 6,7 4,4 4,3 4,8 6,5
5.1.1.3 - Amostragem por Conglomerado
Uma amostra por Conglomerado é uma amostra simples na qual cada unidade da amostragem
é um grupo, ou conglomerado de elementos. Para este tipo de amostragem, a população é
dividida em conglomerados, sendo que cada elemento da população pertença a um e somente
um conglomerado.
A utilização deste processo requer que os elementos do conglomerado tenham características

similares. Como regra geral, o número de elementos deve ser pequeno em relação ao tamanho
da população, e o número de conglomerados, razoavelmente grande. Exige-se ainda, que a
população esteja dividida em grupos do mesmo modo como é feito na amostragem
estratificada, sendo que nesta, seleciona-se uma amostra aleatória simples dentro de cada
grupo (estrato), enquanto que na amostragem por conglomerado selecionam-se amostras
aleatórias simples de grupo, e todos os itens dentro dos grupos (conglomerados) selecionados
farão parte da amostra.
A amostragem por conglomerado é recomendada quando:
• Não se tem um sistema de referência listando todos os elementos da população;

• A obtenção da listagem é dispendiosa;
• O custo da obtenção de informações cresce com o aumento da distância entre os elementos.
Exemplo 5.3 – Para estimar o rendimento familiar em uma grande cidade, como deve ser
escolhida a amostra.
Solução:
A amostragem aleatória simples é inviável. pois pressupõe uma listagem de todas as famílias
da cidade, o que é praticamente impossível de obter. A alternativa da amostragem estratificada
é também inviável, já que aqui também é necessária uma listagem dos elementos por estrato.
A melhor escolha é a amostragem por conglomerado. O sistema de referência pode ser
constituído por todos os quarteirões da cidade. Cada quarteirão é um conglomerado. Extrai-se
uma amostra aleatória simples dos quarteirões da cidade e neles pesquisa-se a renda familiar
em todas as casas.

5.1.1.4 - Amostragem Sistemática
A amostragem sistemática ocorre quando os elementos de uma população estão ordenados e a

retirada é feita de forma periódica. Uma amostra sistemática de tamanho "n" é constituída dos
elementos de ordem K, K+r, K+2r, ..., onde "K" é um inteiro escolhido arbitrariamente entre 1
e "n" e "r" é o inteiro mais próximo da fração N/n. Por exemplo, uma população tem 100
elementos e a amostra tem tamanho 6. "K" é um inteiro escolhido aleatoriamente entre 1 e 6 e
r = 100/6 = 16,6 ≅ 17. Se "K" = 3, a amostra será composta pelos seguintes elementos: 3, 20,
37, 54, 71 e 88.
Se o tamanho da população é desconhecido, não pode-se determinar exatamente o valor de

"r". Neste caso, escolhe-se intuitivamente um valor razoável para "r".
Às vezes a amostragem sistemática é preferida à amostragem aleatória simples, porque é mais

fácil de executar, estando menos sujeita a erros, proporcionando mais informações com menor
custo.
Exemplo 5.4 – Escolha a técnica adequada para extrair uma amostra de 50 compradores de
uma loja.
Solução:
A amostragem aleatória simples não pode ser empregada neste caso, pois não se pode
determinar quais resultados serão incluídos na amostra, uma vez que não se conhece o
tamanho N da população, até que todos os compradores tenham ido à loja. Assim, pode-se
usar a amostragem sistemática (p.ex., 1 em cada 20 compradores) até obter a amostra do
tamanho desejado.
5.1.2 - Distribuições Amostrais
Distribuição amostral é a distribuição de freqüências das médias amostrais e das variâncias.
5.1.2.1 - Distribuição Amostral da Média ( X )
A média amostral ( X ) é utilizada para fazer inferências sobre a média da população (µ)
quando esta não é conhecida. A distribuição amostral de X é a distribuição de probabilidade
para todos os valores possíveis da média amostral.
→ Valor esperado de X : E( X ) = µ
Quanto a forma da distribuição amostral X tem-se que:
• Na seleção de amostras aleatórias simples de tamanho "n", obtidas a partir de uma

população com média µ e desvio padrão σ, a distribuição amostral de X aproxima-se de
uma distribuição normal a medida que o tamanho da amostra cresce.

• Assim, a distribuição amostral de X pode ser aproximada por uma distribuição de

probabilidade normal, sempre que o tamanho da amostra for grande. Esta condição de
tamanho grande da amostra pode ser considerada satisfeita sempre que n ≥ 30.
• Quando a população a partir da qual se está extraindo a amostra tem distribuição normal, a
distribuição amostral de X é uma distribuição normal, para qualquer valor de "n".
5.1.2.2 - Distribuição Amostral da Variância
Quando uma variância da população (σ2 ) é desconhecida, a variância amostral (s2 ) é utilizada
para fazer inferências sobre a variância da população, a qual é dada por:
s 2
=
∑( X − X )2
i
(5.4)
n −1
onde:
Xi – é o valor de cada elemento de uma amostra

X – é a média amostral
n – é o tamanho da amostra
Para populações normalmente distribuídas, esta distribuição é denominada distribuição qui-

quadrado, através da qual é possível estimar e testar hipóteses sobre a variância populacional.
Exemplo 5.5 – Seja uma população formada por 5 bolas numeradas com os números 2, 4, 6,
8, 10 colocadas dentro de uma caixa da qual retira-se amostras. O grupo das 5
bolas representam uma população cuja média é µx = 6. Calcular o valor
esperado das médias amostrais X referentes as amostras de tamanho n = 2
retiradas da população.
Solução:
As cinco bolas têm a mesma probabilidade de serem escolhidos, logo a probabilidade de cada
uma é 20%. A distribuição de freqüências relativas da população é uma distribuição discreta e
uniforme cuja média é igual a 6. Como as bolas retornam para a caixa após cada amostragem,
esta se denomina amostragem com reposição. A seguir extrai-se todas as possíveis amostras
de tamanho 2 e calcula-se o valor de suas médias:
Amostras 2,4 2,6 2,8 2,10 4,6 4,8 4,10 6,8 6,10 8,10
Média X 3 4 5 6 5 6 7 7 8 9
Como os resultados apresentados acima são todos igualmente prováveis, estabelece-se a

distribuição de freqüência da médias amostrais:
Média X 3 4 5 6 7 8 9
ρ( X ) 0,1 0,1 0,2 0,2 0,2 0,1 0,1

O valor esperado das médias amostrais X é calculado à partir das distribuições de freqüências
das médias amostrais:
E( X ) = 3 × 0,1 + 4 × 0,1 + 5 × 0,2 + 6 × 0,2 + 7 × 0,2 + 8 × 0,1 + 9 × 0,1 = 6
Conclui-se que o valor esperado das médias amostrais coincide com o valor da média da
população.
5.1.3 - Principais Estágios de uma Pesquisa por Amostragem
Para adquirir a prática de pesquisas por amostragem, é fundamental conhecer características

específicas da área, ou seja é necessário um estudo detalhado sobre as características
específicas da população-alvo. Os principais estágios de uma pesquisa por amostragem
agrupam-se em 11 tópicos:
Estágio Etapa Decrição

Objetivos da É necessário a definição clara dos objetivos da pesquisa,
1º
pesquisa principalmente se esta for complexa.
A população a ser submetida à amostragem deve coincidir com a
população da qual se deseja obter informações (população alvo).
População a
Quando por motivos práticos ou de conveniência, a população sob
2º ser submetida
a amostragem é mais restrita do que a população alvo, deve-se
a amostragem
observar se as conclusões retiradas da amostra se aplicam à
população sob amostragem.
Todos os dados coletados devem ser relevantes para a finalidade da
Dados a serem
3º pesquisa, pois uma coleta muito extensa reduz a qualidade dos
coletados
dados sejam eles os mais importantes ou os secundárias.
Os resultados da amostragem estão sujeitos a imprecisões já que o
Grau de estudo é feito em apenas uma parte da população e também devido
4º precisão aos erros de mensuração. Para minimizar esta incerteza usa-se
desejado como recurso aumentar o tamanho da amostra ou utilizar
instrumentos mais precisos.
Há mais de uma escolha do aparato de mensuração e da forma de
Métodos de abordar a população. É necessário construir arquivos de dados
5º
mensuração adequados, procurando visualizar a estrutura das tabelas finais de
resumo, que serão usadas para tirar conclusões.
Antes de selecionar a amostra, a população deve ser dividida em
partes, chamadas unidades de amostragem, ou simplesmente
unidades. Estas unidades devem abranger toda a população, sem
Sistema de
6º qualquer superposição, ou seja, cada elemento da população deve
referência
pertencer a uma, e somente uma unidade. A construção desta lista
de unidades de amostragem, chamada Sistema de Referência, é, em
geral, um dos principais problemas práticos.

Estágio Etapa Decrição

Existem variados planos para escolha da amostra. Para cada plano
Escolha da
7º considerado, pode-se fazer estimativas do tamanho da amostra com
amostra
base no conhecimento do grau de precisão desejado.
Deve-se testar a coleta de dados e o método de trabalho no campo
de atividade, em escala reduzida, pois isto resulta em melhoria
8º Pré-teste
podendo inclusive revelar problemas que seriam sérios em escala
maior.
Organização
É de grande valia um processo de verificação preliminar da
9º do trabalho de
qualidade dos resultados.
campo
Primeiramente verifica-se o levantamento completo que levará aos
Resumo e
cálculos, visando corrigir os erros ou eliminar dados errôneos, que
10º análise dos
conduzem às estimativas errôneas. Pode haver diferentes métodos
dados
de estimação para os mesmos dados.
Quanto mais amostras inicialmente sobre uma população, mais fácil
Informação se torna planejar uma amostra que dê estimativas precisas.
obtida para Qualquer amostra é potencialmente um guia para futuras
11º
futuras amostragens melhoradas, já que ela poderá fornecer dados sobre as
pesquisas médias, os desvios padrão e a natureza da variabilidade das
mensurações principais e o custo da obtenção dos dados.
5.2 - ESTIMAÇÃO
Estimação é o processo que consiste no uso de dados da amostra (dados amostrais) para
estimar valores de parâmetros populacionais desconhecidos, tais como média, desvio padrão
etc. Quando é de interesse o conhecimento de determinado parâmetro de uma população,
extrai-se uma amostra dessa população e através do estudo de seus elementos, estima-se o
parâmetro populacional. Os tipos clássicos de estimação onde utiliza-se dados estatísticos da
amostra como estimadores dos parâmetros populacionais são: estimação pontual e intervalar.
5.2.1 - Estimativa por ponto
É a representação de um parâmetro populacional por uma única estimativa (um valor).

Qualquer variável aleatória pode ser usada na estimativa. Assim, a mediana amostral, o
primeiro valor, o menor ou maior valor da amostra podem ser considerados como
estimadores.
O parâmetro populacional de interesse é usualmente designado por θ. Para estimá-lo, extrai-se

uma amostra de tamanho "n" da população (isto é, n elementos X1, X2, ...,Xn ) e procura-se
construir uma função estatística desses valores, que seu valor calculado com base nos dados
amostrais, reflita tão próximo quanto possível, o valor do parâmetro populacional. O tipo de
estatística destinada a estimar o parâmetro populacional θ, é chamado um estimador de θ.
Existem muitos estimadores para um mesmo parâmetro de uma população, sendo preciso
distingui-los uns dos outros por algumas propriedades como não-tendenciosidade e variância

mínima. A não-tendenciosidade significa que o valor médio da estimativa deverá ser próximo
do verdadeiro valor do parâmetro. Diz-se que uma estimativa é não-tendenciosa de θ se:
∧
E(θ ) = θ (5.5)
∧
A não-tendenciosidade implica que os diversos valores de θ se distribuam em torno do
verdadeiro valor θ sem ocasionar subestimação ou sobrestimação sistemática de θ como
ilustrado na Figura 5.1.
θ
θ θ
θ θ θ
Não-Tendencioso Tendencioso Tendencioso
Figura 5.1 - Tipos de estimativas
∧ ∧
Quando os dois estimadores θ 1 e θ 2 não-tendenciosos de θ acusarem dispersões diferentes
em torno do verdadeiro valor de θ, escolhe-se aquele que tenha menor variância. Este
estimador é denominado estimador não-tendencioso de variância mínima de θ. Uma medida
de variabilidade da distribuição de um estimador de θ é dada por seu desvio-padrão, chamado
∧ ∧
aqui de erro-padrão de θ : EP(θ ). A Figura 5.2 ilustra dois estimadores de θ, não-
tendenciosos, mas com erros-padrão diferentes.
Exemplo 5.6 – Numa pesquisa deseja-se estimar a produção média de um processo físico-
químico com base nas observações da produção de três realizações X1, X2,
X3 de um experimento. Os dois estimadores da média, são:
( X + X2 + X3 )
θˆ 1 = 1 (média amostral)
3
( X + 2X 2 + X3 )
θˆ 2 = 1 (média ponderada)
4
Solução:
Analisando a não-tendenciosidade:
∧
E(θ 1) = 1/3[E(X1) + E(X2) + E(X3)] = 1/3 [µ+µ+µ] = µ
∧
E(θ 2) = 1/4[E(X1) + 2E(X2) + E(X3)] = 1/4[µ+2µ+µ] = µ
Logo, ambos são não-tendenciosos. Analisando a variabilidade:

∧
Var(θ 1) = (1/3)2 [Var(X1) + Var(X2) + Var(X3)] = 1/9 (3σ2) = σ2/3

∧
Var(θ 2) = (1/4)2 [Var(X1) + 4Var(X2) + Var(X3)] = 1/16 (6σ2) = 3σ2/8
∧ ∧ ∧ ∧ ∧
Como 1/3 < 3/8, Var(θ 1) < Var(θ 2), conseqüentemente EP(θ 1) < EP(θ 2). Logo, θ 1 é melhor
∧
estimador do que θ 2.
θ1
θ2
Figura 5.2 - Estimadores não-tendenciosos de θ
5.2.2 - Estimação da Média e da Variância de uma População Normal
A distribuição normal que é um modelo estatístico para um grande número de fenômenos, tem
como parâmetros a média µ e a variância σ2, os quais devem ser estimados.
5.2.2.1 - Estimação da Média
Designando por µ a média populacional e por σ2 a variância populacional, sabe-se que o

melhor estimador da média populacional é a média amostral, designada por:
1
X= ( X + X 2 +.....+ X n ) (5.6)
n 1
Em uma amostra aleatória, as variáveis X1, X2,..., Xn são independentes, logo cada uma delas
tem a mesma distribuição da população. Então:
E(Xi) = µ
Var(Xi) = σ2 sendo i = 1, 2, ... , n
onde n é o tamanho da amostra.
A média e a variância da variável aleatória X, são dadas por:
1 1
E( X ) = E ( X 1 + X 2 + ... + X n ) = [ E ( X 1 ) + E ( X 2 ) + ... + E ( X n )] =
n n
(5.7)
1 nµ
E ( X ) = [ µ + µ + ... + µ ] = =µ
n n

1 1
Var( X ) = 2
Var( X1 + X 2 + ... + X n ) = 2 [Var( X1 ) +Var( X 2 ) + ... +Var( X n )] =
n n
(5.8)
1 nσ σ 2
2
Var( X ) = 2 (σ 2 + σ 2 + ... + σ 2 ) = 2 =
n n n
O resultado da Equação 5.7 mostra que X é um estimador não-tendencioso da média

populacional µ. O resultado da Equação 5.8 mostra quanto maior o valor de n menor a
variância de X.
5.2.2.2 - Estimação da Variância
A variância populacional σ2 é estimada por (Equação 5.4):
s2 =
∑( X i − X )2
n −1
O denominador deve ser (n-1) para que s2 seja um estimador não-tendencioso de σ2. O valor n
no denominador, mesmo sendo um estimador razoável, faria com que se perdesse a
característica de não-tendenciosidade. Os estimadores X e s2, são as melhores opções para
estimar os parâmetros µ e σ2 de uma distribuição normal.
Exemplo 5.7 – De uma população normal se extrai uma amostra cujos valores são: 1,1; 0,9;
0,3; -0,2; -3,1; 1,5; -2,7; 0,5; -1,5; 2,1. Obtenha as estimativas para µ, σ2.
Solução:
Estimativa de µ:
X = 1/10[1,1+0,9+0,3-0,2-3,1+1,5-2,7+0,5-1,5+2,1] = -0,11
Estimativa de σ2:
s2 = 1/9[(1,1+0,11)2 + (0,9+0,11)2 + (0,3+0,11)2 + (-0,2+0,11)2 + (-3,1+0,11)2 + ...

(1,5+0,11)2 + (-2,7+0,11)2 + (0,5+0,11)2 + (-1,5+0,11)2 + (2,1+0,11)2] = 3,12
s = 1,77
5.2.3 - Teorema Central do Limite
• Quando a população é normal N (µ, σ) a média amostral X de amostras de tamanho n têm

σ
distribuição também normal, com média µ e desvio padrão .
n

• Para uma população não normal com média µ e desvio padrão σ, a distribuição da média
amostral X para grandes amostras (n > 30) é aproximadamente normal com média µ e
σ
desvio padrão , que constitui o Teorema Central do Limite, ou seja:
n
X−µ
≅ N (0,1) (5.9)
σ/ n
5.2.4 - Estimativa Intervalar
Sabe-se que uma estimativa por ponto tem pouca possibilidade de representar exatamente o
parâmetro desconhecido, então utiliza-se a estimativa através de um intervalo. A estimação
intervalar é aquela que procura determinar intervalos com limites aleatórios, que abrangem o
valor do parâmetro populacional com uma margem de segurança prefixada. Assim, quando se
quer considerar, conjuntamente, o estimador e a precisão com que se estima o parâmetro, a
forma usual utilizada é através dos intervalos de confiança.
∧ ∧
Sendo X1, X2,..., Xn uma amostra aleatória de uma população e θ 0 e θ 1 as estatísticas do
parâmetro de interesse θ, vem:
∧ ∧
P(θ 0 < θ < θ 1 ) = 1- α (5.10)
∧ ∧
Define-se como intervalo de confiança de nível 100(1-α)% ao intervalo [θ 0 , θ 1 ] , dentro do
qual se encontra o parâmetro desconhecido. A confiança 100(1-α) é representada por um
coeficiente de probabilidade. Usualmente, toma-se 1-α com o valor 0,95 ou 0,99, ou seja, 95
∧ ∧
ou 99% de o parâmetro desconhecido estar contido no intervalo [θ 0 , θ 1 ] .
Exemplo 5.9 – Para uma amostra de 50 observações de uma população normal com média
desconhecida, desvio padrão σ = 6 e média amostral X de 20,5, construir um
intervalo de 95% de confiança para a média populacional.
Solução:
Considerando X = 20,5, n = 50 e σ = 6
Usando o resultado da Equação 5.9 e tendo 1-α = 0,95, a Tabela da Distribuição Normal
Padronizada fornece:
P(-1,96 < Z < 1,96) = 0,95
isto é,
X−µ
P[-1,96 < <1,96]
σ n

Aplicando o Teorema Central do Limite sendo a confiança (1-α) = 0,95, o intervalo de

confiança é:
6 6
[ 20,5 − 1,96 ; 20,5 + 1,96 ]=
50 50
(18,84; 22 ,16)
O resultado obtido é um intervalo de 95% de confiança para a média populacional µ,

calculado com base na amostra observada.
5.2.5 - Intervalos de Confiança para a Média
A média é uma importante característica da população e, por isso, é de interesse sua estimação
via intervalo de confiança. O método a ser utilizado leva em consideração se o desvio padrão
da população é ou não conhecido. Chamar-se-á de Zα/2 ao valor de Z, dado pela Equação 5.11
e ilustrado na Figura 5.3:
P(|Z| < zα/2) = 1-α (5.11)
5.2.5.1 - População Normal com Desvio Padrão (σ) Conhecido
Seja X uma variável aleatória normalmente distribuída com média µ e desvio padrão σ
conhecido. Seja X a média aritmética da amostra aleatória n. Sabe-se que a distribuição
(X − µ)
é normalmente distribuída com média nula e variância unitária.
σ n
1-α
α/2 α/2
-zα/2 -zα/2
Figura 5.3 - Intervalo de confiança para a média
Assim, os limites do intervalo de confiança (L e U) serão dados por:
X−µ
P(−zα 2 _ < _ _ < _zα 2 ) = 1 − α
σ n
P[X − zα 2 (σ n) _ ≤ _ µ_ ≤ _ X + zα 2 (σ n)] = 1 − α

Assim, fazendo:
σ σ
L.=.X − zα 2 e U.=.X + zα 2
n n
O intervalo de confiança desejado é:
P(L ≤ µ ≤ U) = 1-α (5.12)
5.2.5.2 - População Normal com Desvio Padrão Desconhecido
Este é o caso mais comum pois normalmente não se conhecem os parâmetros da população e
sim da amostra. Neste caso:
• Usa-se o desvio padrão da amostra chamando-o de "s" (desvio estimado);

• Quando n > 30 usa-se a Distribuição Normal;
• Quando n ≤ 30 usa-se a Distribuição "t" ou de Student.
O intervalo de confiança é calculado por:
X−µ
T= (5.13)
s n
onde "s" é o estimador do desvio padrão.
A distribuição desta estatística é conhecida como "t" ou de Student com ν = n-1 graus de
liberdade, sendo o "n" o tamanho da amostra. Para pequenas amostras, a distribuição
apresenta valores menos precisos, o que leva a utilização da distribuição "t" ou de Student. A
forma desta distribuição é simétrica em relação a θ, semelhante à da Normal, mas
apresentando maior variância do que a Normal. Aumentando-se "n", a distribuição "t" tende à
Normal, conforme ilustrado na Figura 5.4.
normal
"t"
Figura 5.4 - Comparação entre as Distribuições Normal e a de Student
Como tem-se distribuições diferentes para cada valor de ν, apresenta-se uma situação
intermediária, tal que:

P[|tν| ≤ b] = 1-α (5.14)
Se P(-b ≤ tν ≤ b) = 1-α , b é denotado por "tα/2".
Existe um valor de t para cada amostra sendo que à medida que a amostra "n" cresce a
distribuição "t" aproxima-se da distribuição Normal. Para calcular o valor de "t" a ser usado é
necessário ter:
• um nível de confiança desejado: (1-α);

• qual o número de graus de liberdade a ser utilizado: (n-1).
Exemplo 5.10 – Sabendo-se que uma amostra tem 25 elementos e que a sua média é 30 e
possui um desvio padrão igual a 10, represente um intervalo de confiança de
nível de 90%.
Solução:
Se o número de elementos da amostra é n = 25 ou seja n < 30 logo a distribuição em "t" deve

ser usada. Se a confiança é 90%, tem-se:
90%
5% 5%
Para 90% de confiança e grau de liberdade de 25-1 = 24, obtem-se t = 1,71 (tabela na coluna
referente ao grau de liberdade ν = 24 e t0,90). Assim:
s 10
X +t = 30 + 1,71 × = 33,42
n 25
ààà (26,58 ; 33.42)
s 10
X−t = 30 - 1,71 × = 26,58
n 25

Nível de s s Intervalo de
α (%) t X −t X +t
Confiança (%) n n Confiança
99,50 0,50 3,09 23,82 36,18 (23,82 ; 36,18)

99,00 1,00 2,80 24,41 35,59 (24,41 ; 35,59)
97,50 2,50 2,39 25,22 34,78 (25,22 ; 34,78)
95,00 5,00 2,06 25,87 34,13 (25,87 ; 34,13)
90,00 10,00 1,71 26,58 33,42 (26,58 ; 33,42)
Exemplo 5.11 – Num ensaio de permeabilidade com uma manta sintética obteve-se as
seguintes medidas para o volume de água coletado em litros:
0,68 0,65 0,59 0,64 0,66 0,61 0,62 0,64 0,63 0,61
Encontre os intervalos de confiança de 95% para a média do volume líquido da distribuição

correspondente considerando que os dados são normais.
Solução:
Como o desvio padrão é desconhecido, deve ser utilizado a Distribuição de Student. O

intervalo de confiança µ é dado por:
X − t α s
 2
( )
n ; X + tα2 s ( )
n 

( )
2
∑ Xi − X
sendo s= = 0, 0267
n −1
s 0, 0267
= = 0, 00844
n 10
(
X − tα2 s )
n = 0, 633 − (0, 00844 × 2, 262) = 0, 633 − 0, 01909 = 0, 61391
(
X + tα2 s )
n = 0, 633 + 0, 01909 = 0,65209
Assim o intervalo bilateral para o valor médio, será:
(0,61391 ≤ µ ≤ 0,65209)

5.2.5.3 - População Não-Normal, Grandes Amostras
Nos casos anteriormente estudados conhecia-se a distribuição da estatística, com base na qual
se obteve o intervalo. Aqui não ocorre o mesmo e deve-se usar o Teorema Central do Limite
(X − µ)
para afirmar que, se "n" é suficientemente grande, tem distribuição
σ n
aproximadamente normal N(0; 1), e portanto um intervalo de confiança para a média com
nível aproximado de 100(1-α)% é dado por:
 s s 
 X − zα 2 ; X + zα 2  (5.15)
 n n
Exemplo 5.12 – A resistência à tração de 20 corpos de prova é:
131 132 134 135 135 138 138 139 139 140
142 143 144 144 145 146 147 148 149 150
Estabelecer uma estimativa intervalar de 95% de confiança para a média populacional.
Solução:
Considerando a amostra de tamanho n =20, calcula-se a média e o desvio:
X = 141
s = 5,73
 s s 
 X − z , X + z 
n 
α α
2
n 2
[141-1,96 (5,73/4,47) ; 141+1,96 (5,76/4,47)] = [138,49 ; 143,51]
5.2.6 - Erro de Estimação
Erro de estimação ou erro admitido em uma estimação é a diferença entre a média da amostra
e a verdadeira média da população. Como o intervalo de confiança tem centro na média da
amostra, o erro máximo provável que está sendo admitido é igual a metade da amplitude do
intervalo. Assim, o erro de estimação "d" pode ser escrito por:
s
d = Zα2 (5.16)
n
O intervalo será dado por:

s
X ± Z α2 (5.17)
n
5.2.7 - Determinação do Tamanho da Amostra
Pode-se calcular, para algumas situações especiais, o tamanho da amostra necessário para as
inferências. Se o objetivo é estimar a média, utiliza-se os intervalos de confiança
anteriormente estabelecidos, fixando-se o maior erro aceitável e o nível de confiança desejado.
Assim, pode-se obter "n", o tamanho da amostra. Para o caso da média, aceitando-se um erro
máximo de tamanho "d", com probabilidade 1-α, o intervalo de confiança de nível 100(1-
α)%, o tamanho da amostra é será rearranjando a Equação 5.16:
 Zα2 × s 
2
n =   (5.18)
 d 
Note que é necessário uma estimativa de "s" para obter o tamanho da amostra. Nos casos em
que se desconhece por completo este valor, o problema é resolvido em duas etapas. Usa-se
uma amostra preliminar para fornecer "s" e partir deste valor, pode-se calcular o tamanho
necessário da amostra.
Exemplo 5.13 – Numa amostra de peso específico dos grãos dos solos de Brasília com
X = 2,6 e s = 0,3, qual deve ser o tamanho da amostra para que tenha-se
95% de confiança em que o erro d = X - µ da estimativa de µ não supere
0,05?
Solução:
Como α = 0,05, a Tabela da Distribuição Normal Padronizada fornece zα/2 = z0,025 = 1,96.
Utilizando "s" como estimativa de σ, vem:
 ( z ) × s   (1,96) × 0,3  2
2
α /2
n=  =  = 138,3 = 139
 d   0,05 

6 – TESTES DE HIPÓTESES
6.1 - INTRODUÇÃO
Teste de hipótese é um aspecto do processo de inferência estatística. O objetivo é decidir se

uma determinada característica de uma ou mais populações é, ou não, apoiada pela evidência
obtida de dados amostrais. Então é formulada a chamada hipótese estatística, e a regra usada
para decidir se ela é verdadeira ou não é o teste de hipótese. Pode-se dizer que o teste
estatístico de uma hipótese compreende um processo no qual se emprega uma amostra para
determinar a aceitação da hipótese (verdadeira) ou sua rejeição (falsa).
Os testes estatísticos de hipóteses compreendem um ferramental importante no campo da

pesquisa. Uma situação típica é aquela onde se tem necessidade de decidir entre duas
possibilidades e onde a opção será feita fundamentada no resultado de um teste estatístico.
Pode-se comparar, por exemplo, dois métodos de trabalho, como demonstrado a seguir:
comparando o aumento de resistência de um solo de argila mole reforçado com estacas de
areia ou com geossintéticos, decidir qual dos dois métodos utilizados foi o melhor. Uma das
dificuldades aqui, e daí a necessidade de métodos estatísticos, é que a resistência de um solo
pode variar de ponto a ponto (variabilidade espacial).
Através dos testes de hipóteses é possível tomar decisões em presença da variabilidade, ou

seja, verificar se de fato existe uma diferença real, significativa, ou apenas devida à flutuação
aleatória inerente ao processo. As hipóteses podem ter diversas origens, tais como uma
especificação de qualidade, a experiência passada, uma teoria a ser verificada ou
simplesmente resultante de observações.
Uma hipótese estatística, denominada H, é qualquer afirmação sobre a população em estudo.

Em geral, o que realmente interessa são as afirmações sobre os parâmetros da população. A
hipótese que interessa verificar em dada situação surge ao especificar o problema e a
população associada. A viabilidade da hipótese é analisada com base num certo valor
(parâmetro) calculado de uma amostra extraída da população, através de uma regra de decisão.
6.2 - HIPÓTESE NULA E ALTERNATIVA
Quando se deve decidir entre duas hipóteses, usualmente uma é mais específica a respeito do
valor do parâmetro e a outra mais geral. A primeira se chama hipótese nula (H0), que
corresponde àquela a ser testada, e a segunda hipótese, contrária à H0, é denominada hipótese
alternativa (H1). A análise acurada de cada situação específica indicará qual deve ser
considerada a hipótese nula e qual a hipótese alternativa.
Uma hipótese nula pode ser falsa ou verdadeira. Convém, porém, ressaltar que o processo de
sua rejeição ou não-rejeição é diferente daquele utilizado para provar se uma proposição
matemática é falsa ou verdadeira. No caso da matemática a certeza é total; ou se prova a
proposição, ou se apresenta um contra-exemplo. Já numa hipótese estatística sempre há um
grau de incerteza na tomada de decisão, já que se trata de uma situação onde a variabilidade é
inerente.

Num teste de hipótese trabalha-se com os parâmetros α e C, sendo α o nível de significância

do teste e C o valor crítico. A região da curva de distribuição que contém os valores para os
quais ocorre a rejeição da hipótese H0 é chamada região crítica ou região de rejeição, RR, e a
região dos valores para os quais ocorre a aceitação da hipótese H0 é chamada região de
aceitação e representada por RA.
Considerando µ um parâmetro desconhecido de uma distribuição em que se deseja testar a

hipótese:
• H0 : µ = µ0
O valor µ0 compreende um valor específico. Existem três possibilidades diferentes para a

hipótese alternativa (Figura 6.1):
• H1 : µ > µ0
• H1 : µ < µ0
• H1 : µ # µ0
RA RR
(a)
− α µ 0 C + α
RR R A
(b)
− α C µ 0 + α
RR R A RR
(c)
− α C1 µ 0 C2 + α
Figura 6.1 - Representação gráfica das alternativas em um teste de hipótese
Na Figura 6.1, observa-se a ocorrência de duas situações distintas:
• As alternativas a e b como soluções unilaterais;

• A alternativa c como alternativa bilateral.
Existem dois possíveis tipos de erros na tomada de decisão baseada no teste de hipótese.
Pode-se rejeitar H0 quando na verdade ela é verdadeira. Este erro é denominado erro tipo I e a
probabilidade de ocorrência é representado por α. Ao contrário, pode-se aceitar H0 quando na
realidade esta hipótese é falsa. Este segundo erro é chamado erro do tipo II e a probabilidade
de ocorrência é representada por β. A Figura 6.2 representa graficamente os erros α e β.
Através da Figura 6.2 pode-se verificar que para diminuir o valor de α, C deve ser deslocado
para direita, o que faz com que β aumente. O inverso também é verdadeiro. A única maneira

de tornar mínimos os dois erros simultaneamente é aumentar bastante o tamanho da amostra,

o que muitas vezes não é econômico nem praticável. É importante, portanto, observar que na
tomada de uma decisão os erros se encontram diretamente relacionados com a conclusão do
experimento. Deve-se ressaltar também que num teste de hipótese sempre há a possibilidade
de tomar uma decisão correta ou incorreta (Tabela 6.1).
Figura 6.2 - Representação gráfica dos erros α e β
Tabela 6.1 - Probabilidade de uma decisão correta ou incorreta num teste de hipótese
Hipótese
H0 : µ = µ0 Decisão Correta P=1-α Erro do tipo II P=β
H1 : µ ≠ µ0 Decisão Correta P=1-β Erro do tipo I P=α
Exemplo 6.1 – Uma empresa instalou um equipamento de antipoluição sonora em um

compactador mecânico (pé de carneiro), com o objetivo de manter o ruído
médio abaixo de 60 decibéis. A questão é decidir se o equipamento está ou
não cumprindo sua função.
Solução:
Uma formulação para este problema consiste em testar:
• H0: µ ≥ 60 (hipótese nula - o nível médio de ruído continua o mesmo) contra

• H1: µ ∠ 60 (hipótese alternativa - o nível médio de ruído diminuiu).
A tabela abaixo sintetiza a conclusão do teste.
CONCLUSÃO DO TESTE H0 VERDADEIRA H0 FALSA

Não rejeitar H0 Correto Erro tipo II
Rejeitar H0 Erro tipo I Correto
Neste caso o erro tipo I é afirmar que µ < 60 (Rejeitar H0), quando na realidade, µ ≥ 60, ou
seja, dizer que não há poluição sonora quando o ruído é superior a 60 decibéis. O erro tipo II
consiste em afirmar que há poluição sonora quando o ruído é inferior a 60 decibéis. Do ponto
de vista do operador, que tem de suportar o barulho, o erro tipo I é muito mais grave.
6.3 - ESTÁGIOS DE UM TESTE DE HIPÓTESE
Um problema de teste de hipótese começa pela análise da situação e formulação das hipóteses
H0 e H1. A teoria do teste de hipótese é elaborada de forma que H0 só é rejeitada se houver
clara evidência contra ela, ou seja, H0 é a hipótese preferencial. Como em testes de hipótese
não é possível controlar os dois erros, existe uma preferência em controlar o erro tipo I, que
deve ser o mais sério. Por existir esta preferência fala-se em rejeição de H0, e não em
aceitação de H0, visto estar buscando evidência para rejeitar H0. A partir destas considerações
serão enunciados os estágios de um teste de hipótese sobre um parâmetro populacional θ:
• Definir a hipótese nula H0 : θ = θ0 e a hipótese alternativa H1;

• Escolher adequadamente o parâmetro a ser testado;
• Escolher o nível de significância α e estabelecer a região crítica;
• Calcular o valor do parâmetro a ser testado com base em uma amostra de tamanho n,
extraída da população;
• Rejeitar H0 se o valor calculado da estatística estiver na região crítica. Não rejeitar H0 em
caso contrário.
6.4 - TESTE DE HIPÓTESE SOBRE A MÉDIA DE UMA DISTRIBUIÇÃO NORMAL

QUANDO O DESVIO-PADRÃO É CONHECIDO
Considere-se um experimento composto por n observações, x1, x2, ..., xn, onde cada xi
corresponde a uma variável aleatória independente e normalmente distribuída com média
desconhecida µ e variância σ2. O melhor procedimento para testar a hipótese de que a média
da distribuição normal possui um valor específico µ = µ0 baseia-se sobre a variável aleatória
U:
U =
(x − µ )
0 n
σ
As etapas para a realização do teste devem ser as seguintes:

• Verificar se o procedimento é uni ou bilateral e estabelecer a hipótese inicial nula H0 : µ =

µ0, onde µ0 corresponde ao valor da média conhecida. Estabelecer a hipótese alternativa H1
: µ ≠ µ0 em procedimentos bilaterais ou H1 : µ > µ0 e H1 : µ < µ0 em procedimentos
unilaterais.
• Estabelecer os riscos máximos tolerados α e β bem como o valor da média µ1, que é
importante detectar e a partir da qual a mudança não mais é considerada aleatória. Estes
dois riscos determinarão o teste, onde µ0 corresponde ao valor médio; 1-α, à probabilidade
de aceitação de H0, quando H0 realmente ocorre; µ1, ao valor da média que é importante
detectar; e β, ao risco de concluir por H0 quando na realidade ocorre H1.
• Como µ0 e µ1 correspondem a uma distribuição normal geral, pode-se calcular o valor
limite entre as curvas, que em termos de variável normal padronizada é d, onde d é obtido
através da Tabela 6.3.
• Através da Tabela 6.3 e em função de α, β e d, determinar o tamanho mínimo da amostra n
de maneira a garantir um risco máximo de α e β.
• Determinar a região de aceitação RA através do intervalo indicado na Tabela 6.3.
• Extrair a amostra de n itens e calcular para a mesma os valores da média e do desvio-
padrão.
• Calcular o valor do teste estatístico indicado na Tabela 6.3.
• Concluir por H0 se o valor do teste estatístico estiver dentro da RA, e concluir por H1 em
caso contrário.
A seguir é demonstrada a Tabela 6.3, onde se encontram especificados os testes estatísticos,

os gráficos para obtenção de n e a região de aceitação.
Tabela 6.3 - Teste de hipótese sobre a média quando o desvio-padrão é conhecido

Teste estatístico RA
H1
U =
x(− µ 0 )
n Gráfico para
obtenção de n
(Distribuição
σ Normal)
µ ≠ µ0 d = | µ1 - µ0 | / σ 6A (- Zα/2; Zα/2)
µ > µ0 d = (µ1 - µ0) / σ 6B (-∝; Zα)
µ < µ0 d = (µ0 - µ1) / σ 6B (-Zα; ∝)
Exemplo 6.2 – Uma indústria utiliza um aço especial que apresenta uma resistência média de
36 kg/mm2, sendo que esta medida é considerada normalmente distribuída. O
engenheiro responsável pela produção aventou a hipótese de que uma
mudança na liga deste aço aumentaria esta resistência. De experiências
passadas sabe-se que o desvio-padrão é de 4,0 kg/mm2, acreditando-se que o
mesmo não se modifica com a mudança da liga. Caso a modificação da liga
não altere a resistência, o engenheiro deseja chegar a esta conclusão com uma
probabilidade mínima de 99% (α = 0,01). Se a resistência média aumentar 5,0
kg/mm2 ou mais, o engenheiro tolerará um risco máximo de 10% em não
detectar tal mudança (β = 10%). A hipótese da resistência diminuir com a
mudança da liga deve ser desconsiderada (teste unilateral).

Solução:
As hipóteses do experimento são:
• H0 : µ = µ0 (não aumenta a resistência)

• H1 : µ > µ0 (aumenta a resistência)
onde µ0 = 36 kg/mm2
Após o estabelecimento das hipóteses nula e alternativa, o procedimento correto indica que
deve-se verificar que tipo de teste deve ser aplicado. Como se quer testar a média de uma
distribuição normal com desvio-padrão conhecido, o teste a ser utilizado é o U baseado sobre
a distribuição normal. A próxima etapa será estabelecer os riscos máximos tolerados que são
α = 1% e β = 10%.
Para o estabelecimento do tamanho da amostra, verifica-se na Tabela 6.3 (para µ > µ0) que
deve-se utilizar a Tabela 6B (ver Apêndice). Assim para d = (µ1 - µ0) / σ = 5 / 4 = 1,25, α =
0,01 e β = 0,10 tem-se na Tabela 6B que n = 8.
A região de aceitação, obtida da Tabela 6.3 será:
RA: (-∝; Zα) = (-∝; Z0,01) = (-∝; 2,326)
Zα foi obtido da Tabela da Distribuição Normal para α = 0,01.
Supondo que ao ser medida a resistência das 8 peças de aço modificada encontrou-se o
seguinte valor para a média:
x = 45,52 kg/mm2
Isto faz com que o valor do teste estatístico seja de:
U =
(x − µ )
0 n
= [ (42,52 - 36) √8 ] / 4= 4,61
σ
Conclusão: Como o valor de U está fora da RA, rejeita-se a hipótese de igualdade de H0 e

passa-se a aceitar a hipótese alternativa H1, ou seja, a mudança na liga realmente acarreta um
aumento na resistência de no mínimo 5 kg/mm2. Ao afirmar este fato um erro máximo de α =
0,01 pode estar sendo cometido.
6.5 - TESTE DE HIPÓTESE SOBRE A MÉDIA DE UMA DISTRIBUIÇÃO NORMAL

QUANDO O DESVIO-PADRÃO É DESCONHECIDO
O melhor procedimento para testar a hipótese de que a média de uma distribuição normal
possui um valor específico µ = µ0, quando o desvio-padrão é desconhecido, baseia-se na
distribuição de Student e no seguinte teste estatístico:

t=
(x − µ ) 0 n
s
Mesmo não exigindo o conhecimento do valor exato de σ, este teste necessita do

conhecimento ou da determinação aproximada deste valor. Para a determinação da regra de
decisão para procedimentos uni e bilaterais com utilização de gráficos, utiliza-se um
procedimento idêntico ao indicado no Item 6.4, no entanto adotando a Tabela 6.4.
Tabela 6.4 - Teste de hipótese sobre a média quando o desvio-padrão é desconhecido

Teste estatístico RA
H1
t=
x (
− µ 0 )
n Gráfico para
obtenção de n
(Distribuição
s Normal)
µ ≠ µ0 d = | µ1 - µ0 | / σ 6C (-tα/2, n-1; tα/2, n-1)
µ > µ0 d = (µ1 - µ0) / σ 6D (-∝; tα, n-1)
µ < µ0 d = (µ0 - µ1) / σ 6D (-tα, n-1; ∝)
Exemplo 6.3 – Numa fábrica de tintas o produto é acondicionado em latas com peso líquido
nominal de 10 kg. O enchimento é executado por uma máquina cuja precisão
se deseja testar. Embora não conhecendo exatamente o valor de σ,
experiências anteriores têm indicado um desvio-padrão de aproximadamente
0,05 kg. O atual processo de enchimento será considerado insatisfatório se a
máquina encher as latas com peso superior a 10,1 ou inferior a 9,9 kg. Para
estes casos, a probabilidade de detectar esta diferença não deverá ser menor
que 0,90 (β = 0,10). É tolerado um nível de significância de 5%.
Solução:
a) Hipóteses:
• H0 : µ = µ0
• H1 : µ ≠ µ0
onde µ0 = 10 kg
b) Teste: Student devido à σ não ser conhecido exatamente
c) Riscos: α = 5% e β = 10%
d) Determinação de n
d = |µ1 - µ0| / σ = 0,10 / 0,05 = 2
Da Tabela 6C (Apêndice) encontra-se o valor n = 5 latas

e) Supondo que, após a pesagem da amostra composta de 5 latas escolhidas aleatoriamente, se

verificou que x = 10,022 kg e s = 0,0632 kg, o valor do teste estatístico será:
t=
(x − µ ) 0 n
= [(10,022 -10) √5] / 0,0632 = 0,7784
s
f) A região de aceitação será: RA: (-tα/2, n-1; tα/2, n-1)
Pela Tabela de Distribuição de Student (Apêndice): RA: (-t0,025, 4; t0,025, 4) = (-2,776; 2,776)
Conclusão: Como o valor do teste estatístico está dentro da RA, se aceita a hipótese H0: µ
= µ0 = 10 kg, ou seja, a máquina está enchendo as latas satisfatoriamente e com uma diferença
de peso inferior a 100 g. Com esta conclusão pode-se estar cometendo um erro máximo de β =
10%.
6.6 - TESTE DE HIPÓTESE DE AS MÉDIAS DE DUAS DISTRIBUIÇÕES NORMAIS

SEREM IGUAIS QUANDO AMBOS OS DESVIOS-PADRÃO SÃO
CONHECIDOS
Um problema que ocorre com certa freqüência é o da utilização das médias amostrais de dois
processos diferentes para a comparação dos mesmos. Se o experimento consistir, por
exemplo, da verificação do efeito da utilização de determinado método, por exemplo, estacas
de areia para aumentar a resistência de um solo, o resultado pode ser obtido pela análise do
aumento da resistência média em um solo x e do aumento da resistência média em um solo y.
O teste de hipótese de as médias de duas distribuições normais µx e µy serem iguais, quando
ambos os desvios-padrão σx e σy são conhecidos, baseia-se na diferença das médias amostrais
e utiliza a seguinte variável aleatória:
x−y
U=
σ2x σy
2
+
nx ny
Para a determinação da regra de decisão para procedimentos uni e bilaterais com utilização de
gráficos, as seguintes etapas devem ser seguidas na realização de um teste de hipótese sobre
dois parâmetros:
• Verificar se o procedimento é uni ou bilateral e estabelecer a hipótese inicial nula H0 :

µx = µy, (ou µx - µy = 0). A hipótese alternativa poderá ser H1 : µx ≠ µy para procedimentos
bilaterais ou H1 : µx > µy e H1 : µx < µy para procedimentos unilaterais.
• Estabelecer os riscos máximos tolerados α e β bem como a diferença de médias (µx - µy),
que é importante detectar.
• Como µx e µy correspondem a uma distribuição normal geral, pode-se calcular o ponto
limite d de uma curva normal padronizada, onde d é obtido através da Tabela 6.5.
• Considerando nx = ny = n, determinar o tamanho da amostra n pela entrada do ponto (d; β)
na Tabela 6.5. Se nx ≠ ny, pode-se obter um valor comum para n através da expressão:

σ 2x + σ 2y
n=
σ 2x σ y
2
+
nx ny
• Determinar a região de aceitação RA através do intervalo indicado na Tabela 6.5.

• Extrair as amostras nx e ny, determinando paras mesmas os valores x , y , sx e sy.
• Calcular o valor do teste estatístico indicado na Tabela 6.5.
• Concluir por H0 se o valor do teste estatístico estiver dentro da RA, ou por H1 em caso
contrário.
A seguir é demonstrada a Tabela 6.5 onde se encontram especificados os testes estatísticos, os

gráficos para obtenção de n e a região de aceitação.
Tabela 6.5 - Teste de hipótese de as médias de duas distribuições normais serem iguais
quando ambos os desvios-padrão são conhecidos
Teste estatístico
Gráfico para
x−y RA
H1 U= obtenção de n
(Distribuição
σ2x σy
2
nx = ny = n
+ Normal)
nx ny
µx ≠ µy d = | µx - µy | / √h 6A (-Zα/2; Zα/2)
µx > µy d = (µx - µy) / √h 6B (-∝; Zα)
µx < µy d = (µx - µy) / √h 6B (-Zα; ∝)
Onde h = σx 2 + σy 2
Exemplo 6.4 – Uma fábrica de automóveis está estudando duas marcas de pneus para uso
num modelo a ser lançado. Na realização de um teste, equipou 4 carros com
pneus da marca A e 3 carros com pneus da marca B, que apresentaram os
seguintes resultados: x A = 35800 km e x B = 36200 km. O desvio-padrão da
durabilidade média não é diferente para as duas marcas e é igual a 520 km,
conhecido de outros modelos. Será optado por uma determinada marca se a
mesma apresentar uma quilometragem significativamente superior que a
outra. É considerada significativa uma diferença de 1500 km ou mais. Se uma
marca não for superior à outra, o fato deve ser detectado com uma
probabilidade igual ou superior que 0,95 (α = 0,05).
Solução:
a) As hipóteses do experimento são:
• H0 : µA = µB
• H1 : µA ≠ µB

b) Riscos máximos tolerados α = 5% e β = desconhecido
c) Tamanho da amostra: já está determinado em função do teste.
nA = (4) (4) = 16 pneus

nB = (3) (4) = 12 pneus
d) Teste estatístico
x−y 35.800 − 36.200

U= _∴U = _ ⇒ _ U = −2, 014
σx2
σ 2
5202 5202
+ y
+
nx ny 16 12
e) Região de aceitação
RA: (-Zα/2 ; Z α/2) = (-Z0,025 ; Z 0,025) = (-1,96 ; 1,96)
Conclusão: Como o valor de U está fora da RA, aceita-se H1: µA ≠ µB , ou seja, os pneus da
marca A não têm a mesma durabilidade média dos pneus da marca B. A diferença na
quilometragem média não é aleatória, por isso a escolha deve recair sobre os pneus da marca
B.
f) Determinação do erro tipo II associado:
h = 520 2 + 520 2 = 735,391
µx − µy 1500
d= = = 2,04
h 735,391
Para a utilização do gráfico deve-se ter nA = nb , assim encontrando um valor comum
520 2 + 520 2
n= = 13,71
520 2 520 2
+
16 12
Entrando na Tabela 6A (Apêndice) para α = 5%, d = 2,04 e n = 14, tem-se β = 0.
6.7 - TESTE DE HIPÓTESE DE AS MÉDIAS DE DUAS DISTRIBUIÇÕES NORMAIS

SEREM IGUAIS QUANDO AMBOS OS DESVIOS-PADRÃO SÃO
DESCONHECIDOS MAS IGUAIS
Considerando xi e yi variáveis aleatórias independentes e normalmente distribuídas com média

µx e µy, respectivamente, desconhecidas e desvios-padrão σx e σx também desconhecidos, mas
iguais a um valor σ, o procedimento para testar a hipótese de que µx = µy se baseia na
distribuição de Student e na seguinte variável aleatória:

x+ y
t=
( ) ( )
2 2
1 1 Σ xi − x + Σ yi − y
+
nx n y nx + n y − 2
Para a determinação da regra de decisão para procedimentos uni e bilaterais com utilização de
gráficos, o procedimento a ser seguido é idêntico ao indicado no Item 6.6.1, adotando a Tabela
6.6.
Tabela 6.6 - Teste de hipótese de as médias de duas distribuições normais serem iguais
quando ambos os desvios-padrão são desconhecidos, mas iguais
Gráfico para RA
H1 Teste estatístico t obtenção de n (Distribuição
nx = ny = n’ Normal)
µx ≠ µy d = | µx - µy | / 2σ 6C (- t α/2, V ; t α/2, V)
µx > µy d = (µx - µy) / 2σ 6D (-∝; t α, V)
µx < µy d = (µy - µx) / 2σ 6D (-t α, V ; ∝)
Onde se tem
n′ + 1
n=
2
Exemplo 6.5 – Uma indústria de ferros industriais os produz em duas cidades diferentes,
fábricas A e B, sendo que ambas utilizam o mesmo fornecedor localizado na
cidade A. Na fábrica B pode ser conseguida uma economia pela aquisição do
termostato de um novo fornecedor local. Um pequeno lote foi adquirido para
a execução do teste. O termostato será testado, após montado no ferro
elétrico, a uma temperatura de 260°C, sendo que a temperatura real será
medida por um termopar com precisão de 0,5°C. Quanto ao fornecedor
antigo, sabe-se que seus termostatos nunca apresentaram diferenças maiores
que 10°C e que o desvio-padrão é de aproximadamente 8°C, não existindo
razões para acreditar que vai ser diferente para novo fornecedor. Adotar um
nível de significância de 5% e considerar um erro máximo do tipo II de 20%.
Solução:
a) Hipóteses:
• H0 : µx = µy
• H1 : µx ≠ µy
onde x = novo fornecedor e y = antigo fornecedor.

b) Riscos máximos tolerados: α = 5% e β = 20%
c) Determinação de tamanho da amostra: a Tabela 6.6 fornece que
d = |µx - µy| / 2σ = 10 / 2.8 = 0,625
Da Tabela 6C (Apêndice) encontra-se o valor n’ = 20 para os riscos indicados no item b.
Como n = (n’ + 1) / 2, então nx = ny = 11 unidades
e) Teste estatístico: Supondo que os 11 ferros elétricos com termostato B e os 11 ferros

elétricos com termostato A apresentaram os seguintes valores indicados na tabela abaixo:
Temperatura (°C) dos ferros elétricos com Temperatura (°C) dos ferros elétricos com
termostato B (novo fornecedor) termostato A (antigo fornecedor)
257,0 260,5
263,0 256,5
265,5 262,0
260,5 257,0
262,5 268,5
250,0 251,5
260,0 260,0
269,0 263,5
264,0 258,5
262,5 265,0
270,0 259,0
x = 262,182 y = 260,182
( ) ( )
2 2
Σ = xi − x = 303,144 Σ = yi − y = 210,136
Em função destes dados tem-se:
x+y 262,182 − 260,182

t= _∴_ t = = 0,9258
( ) ( ) 303,144 + 210,136
2 2
Σ xi − x + Σ yi − y 1 1
1 1 + +
+ 11 11 11 + 11 − 2
nx ny nx + ny − 2
f) A região de aceitação será: RA: (- t α/2, nx ; t α/2, ny + ny - 2 ) = (- t 0,025, 20 ; t 0,025, 20)
RA = (-2,086; 2,086)

Conclusão: Como o valor do teste estatístico t está dentro da RA, aceita-se a hipótese H0 :
µx = µy, ou seja, os termostatos do novo fornecedor (B) apresentam uma precisão compatível
com os de A e, por isso podem ser utilizados. A probabilidade de estar cometendo um erro é
de 5%.
6.8 - TESTES DE HIPÓTESE NÃO PARAMÉTRICOS
Todos os testes de hipótese apresentados anteriormente referem-se a um parâmetro

populacional ou à comparação de dois parâmetros. A seguir serão apresentados os testes não
paramétricos, ou seja, aqueles que não dependem dos parâmetros populacionais, nem de suas
respectivas estimativas.
6.8.1 - Testes de adequação do ajustamento e testes de aderência
Considere-se uma amostra de tamanho n. Sejam E1 , E2 , ..., EK , um conjunto de possíveis

eventos da amostra. Sejam Fo1 , Fo2 , ..., FoK , as freqüências observadas na amostra dos
respectivos eventos. Porém nem sempre estes resultados concordam exatamente com as
freqüências teóricas esperadas na população. Pode-se, então, estabelecer algumas hipóteses
sobre as freqüências esperadas Fe1 , Fe2 , ..., FeK e efetuar um teste de adequação de
ajustamento para se verificar se os dados da amostra se ajustam com as hipóteses feitas.
Para a realização destes testes será utilizada a seguinte estatística:
( Foi − Fei )
2
χ =Σ
2 k
i =1
Fei
Esta estatística tem uma distribuição χϕ2 “qui-quadrado”, com ϕ graus de liberdade. Quanto
ao número de graus de liberdade “ϕ“ deve ser observado:
• ϕ = K - 1, quando as freqüências esperadas puderem ser calculadas sem que se façam

estimativas dos parâmetros populacionais a partir das distribuições amostrais. Note-se que
K é o número de eventos ou categorias em que foi dividida a amostra.
• ϕ = K - 1 - r, quando para a determinação das freqüências esperadas r parâmetros tiverem
suas estimativas calculadas a partir das distribuições amostrais.
Quando se usa a estatística χϕ2 para comprovar a concordância entre valores observados e
esperados para certo fenômeno, está sendo realizado um teste de adequação do ajustamento.
Contudo, ao se usar o teste qui-quadrado para colocar à prova hipóteses referentes à forma de
distribuição da população, como a normal, a binomial, Poisson etc, está sendo realizado um
teste de aderência. Nesses testes admite-se que a distribuição da variável em estudo seja
descrita por determinado modelo teórico de probabilidade e verifica-se o grau de aderência
dos dados amostrais ao modelo.
Devido à similaridade do procedimento para se realizar ambos os testes é comum encontrar

essas provas sendo denominadas simplesmente por teste qui-quadrado, indiferentemente da
natureza do fenômeno.

A seguir são destacados os principais passos para a efetivação de um teste qui-quadrado:
• Enunciar as hipótese H0 e H1: H0 afirmará não haver discrepância entre as freqüências

esperadas e freqüências observadas, ou H0 será colocada em termos de distribuição de
probabilidade que se vai colocar à prova. Já H1 afirmará que se as Fei e Foi diferem, ou que
o modelo testado é inadequado para representar a distribuição da população.
• Fixar o nível de significância α , bem como a variável qui-quadrado com “ϕ“ graus de
liberdade, observando a regra exposta anteriormente, para o cálculo de ϕ.
• Determinar a região crítica e a região de aceitação. Para determinar se H0 deve ser
rejeitada ou não, ao nível de significância fixado, deve ser lembrado que, se H0 é
verdadeira, é esperado que as freqüências observadas (Foi) sejam bem próximas das
freqüências esperadas (Fei); portanto, o valor de χϕ2 será pequeno. Logo, valores baixos
de χϕ2 conduzem à aceitação de H0. A região crítica deverá estar concentrada à direita de
certo valor crítico tabelado. A seguir, na Figura 6.3, é apresentada esta configuração.
• Avaliar as freqüências esperadas com base na hipótese H0. Convém distribuir essas
freqüências num quadro (Tabela 6.8).
f ( X2 )
α
RA
RC
0 2 2
X X
Tab
Figura 6.3 - Configuração das regiões crítica e de aceitação
Tabela 6.8 - Freqüências observadas e esperadas

Categorias (Eventos) C1 C2 C3 .......... CK
Freqüências Observadas Fo1 Fo2 Fo3 .......... FoK
Freqüências Esperadas Fe1 Fe2 Fe3 .......... FeK
Conhecidos os valores das freqüências deve-se calcular o valor da variável:
( Foi − Fei ) 2
χ 2
cal =Σ k
i =1
Fei

Caso existam categorias que não satisfaçam à condição Fe1 ≥ 5, estas deverão ser somadas às
classes adjacentes, originando-se novas categorias.
Conclusão: Caso χcal2 ≥ χtab2, concluir-se-á que as freqüências observadas diferem das
esperadas e rejeitar-se-á H0 ao nível de significância correspondente. Caso contrário, dever-se-
á aceitá-la.
OBS: O valor de χtab2 é obtido a partir da Tabela de Distribuição de χ2, que se encontra no
Apêndice desta apostila.
Exemplo 6.6 – Realizar um teste de aderência para verificar se a distribuição dada a seguir se
aproxima de uma distribuição normal. A tabela abaixo apresenta as massas
específicas secas de 100 amostras de solos. Adotar α = 5%.
Massas específicas secas (g/cm3) Número de amostras de solos

1,50 a 1,56 4
1,56 a 1,62 12
1,62 a 1,68 22
1,68 a 1,74 40
1,74 a 1,80 20
1,80 a 1,86 2
100
Solução:
A partir desses valores calcular a média e desvio-padrão:
Média : 1,6896
Desvio-padrão : 0,0665
Para uma transformação normal tem-se Z = (X - µ) / σ:
Zi = (Xi - 1,6896) / 0,0665, onde Xi são os limites das classes.
A seguir será demonstrado o procedimento de cálculo da freqüência esperada da 1a classe

(1,50 |----- 1,56). As demais freqüências são obtidas de maneira semelhante.
Z1 = (1,50 - 1,6896) / 0,0665 = -2,85

Z2 = (1,56 - 1,6896) / 0,0665 = -1,94

Valores de Z
Limites das Probabilidade Freqüências Freqüências
Classes para os
classes das classes esperadas observadas
limites
1,50 a 1,56 1,50 -2,85 0,0240 2,4 4
1,56 a 1,62 1,56 -1,94 0,1230 12,30 12
2,40+12,30=14,70 4+12 = 16
1,62 a 1,68 1,62 -1,04 0,2951 29,51 22
1,68 a 1,74 1,68 -0,14 0,3291 32,91 40
1,74 a 1,80 1,74 0,75 0,1781 17,81 20
1,80 a 1,86 1,80 1,66 0,0433 4,33 2
17,81+4,33=22,14 20+2 = 22
1,86 2,56
Utilizando-se a distribuição normal padrão, encontra-se a probabilidade da classe:
P (1,50 ≤ X ∠ 1,56) = P (-2,85 ≤ Z ∠ -1,94) = 0,4978 - 0,4738 = 0,0240
Dessa forma
Fe1 = 100 (0,0240) = 2,40
Os outros valores são obtidos de maneira similar.
Teste
a) H0 : a distribuição é normal
H1 : a distribuição não é normal
b) α = 5% . Escolhe-se uma χ12 , pois ϕ = 4 -1 -2 = 1. Para a distribuição das freqüências

esperadas, 2 parâmetros tiveram suas estimativas calculadas a partir da amostra, ou seja, r = 2.
Como ϕ = K - r - 1 , tem-se ϕ = 1. Convém notar que K = 4, pois existem freqüências
esperadas ≤ 5, tendo que somá-las às classes adjacentes, diminui-se o número de categorias e
o número de graus de liberdade.
c) Determinação da RC e RA

f ( X2 )
RA 5%
RC
0 3,84 2
X
d) Cálculo do valor da variável
Tabela 6.11 - Distribuição dos eventos Foi e Fei nas classes
Evento 1,50 |----- 1,62 1,62 |-----1,68 1,68 |-----1,74 1,74 |-----1,86
Foi 16 22 40 22
Fei 14,70 29,51 32,91 22,14
( Foi − Fei ) (16 − 14, 70 ) ( 22 − 29,51) ( 22 − 22,14 )

2 2 2 2
χ 2
cal =Σ 4
i =1 _∴_ χ 2
cal = + + _ ⇒ _ χ 2cal = 3,55
Fei 14, 70 29,51 22,14
e) Conclusão: Como χcal2 ≤ 3,84, aceita-se H0. Isto é, com risco de 5% conclui-se que a
distribuição das massas específicas secas obedece a uma distribuição normal.
6.8.2 - Tabelas de Contingência - Teste de Independência e Teste de Homogeneidade
Uma importante aplicação do teste χ2 ocorre quando se quer estudar a relação entre duas ou
mais variáveis de classificação. A representação das freqüências observadas, neste caso, pode
ser feita por meio de uma tabela de contingência. Considerando-se dois critérios de
classificação, tem-se tabelas de dupla entrada (tabelas de classificação h x K), onde as
freqüências observadas ocupam h linhas e K colunas.
A cada freqüência observada em uma tabela de contingência tem-se uma freqüência esperada,
que será calculada com base na hipótese H0, de acordo com as regras das distribuições
conjuntas de probabilidade. A soma das freqüências das linhas e das colunas resulta nas
freqüências marginais.
Para investigar a concordância entre as freqüências observadas e freqüências esperadas,

utiliza-se a estatística:
( Foij − Feij ) 2
χ 2
cal =Σ h
i =1 Σ k
j =1
Feij

Esta estatística tem uma distribuição χϕ2 “qui-quadrado”, com ϕ graus de liberdade. Quanto
ao número de graus de liberdade “ϕ“ deve ser observado:
• ϕ = (h - 1) (K - 1), quando as freqüências esperadas puderem ser calculadas sem que se

façam estimativas dos parâmetros populacionais a partir das distribuições amostrais.
• ϕ = (h - 1) (K - 1) - r, quando para a determinação das freqüências esperadas r parâmetros
tiverem suas estimativas calculadas a partir das distribuições amostrais.
Os testes de significância para as tabela de contingência são semelhantes aos anteriores.

Obtém-se as freqüências sujeitas à hipótese H0 e efetua-se a prova usando o valor χcal2 . A
restrição Fei ≥ 5 também deve ser atendida.
6.8.2.1 - Teste de independência e teste de homogeneidade
Embora os testes de independência e de homogeneidade sejam formalmente os mesmos, isto

é, utilizem χ2 e possuam igual procedimento, há pelo menos uma característica que os
diferencia. Assim, para o teste de homogeneidade, uma das variáveis praticamente representa
uma classificação dos elementos em populações distintas. Esta classificação define diferentes
populações. Neste caso o teste χl2 . é utilizado para provar que os atributos da outra variável
considerada se distribui de forma idêntica (homogênea) nas populações caracterizadas pela
primeira variável.
Para os testes de independência, as duas variáveis estão classificadas segundo atributos que
necessariamente não identificam distintas populações. Neste caso, a preocupação é em se
testar o grau de associação entre as variáveis. As hipóteses, a seguir, serão colocadas à prova:
• H0 : as variáveis são independentes

• H1 : as variáveis não são independentes, ou seja, elas representam algum grau de
associação entre si.
Uma medida do grau de relacionamento, associação ou dependência das classificações em

uma tabela de contingência é dada pelo coeficiente de contingência:
χ 2cal
C=
χ 2cal + n
Quanto maior o valor de C, maior o grau de associação. O máximo valor de C dependerá do

número de linhas e de colunas da tabela e nunca excederá 1.
Exemplo 6.7 – Na tabela abaixo estão indicados os números de ensaios para a determinação
do limite de liquidez, considerados com repetibilidade e sem repetibilidade
por três laboratoristas. Testar ao nível de 5% a hipótese de as proporções dos
ensaios considerados sem repetibilidade pelos três laboratoristas serem iguais.

Freqüências observadas
Situação do ensaio
Laboratorista A Laboratorista B Laboratorista C Total
Com repetibilidade 10 11 12 33
Sem repetibilidade 2 2 3 7
Total 12 13 15 40
Solução:
A hipótese nula afirmará que ambas as populações (com repetibilidade e sem repetibilidade)
são homogêneas, considerando-se os três laboratoristas. Assim deveriam ser consideradas sem
repetibilidade 7 / 40 = 0,175 ou 17,5% dos ensaios. Neste caso o laboratorista A deveria
considerar 17,5% dos seus ensaios sem repetibilidade, O laboratorista B 17,5% dos seus e o
laboratorista C também 17,5%. Conseqüentemente cada um dos laboratoristas, segundo a
hipótese, deveria considerar com repetibilidade 82,5% dos seus respectivos ensaios. A seguir,
na tabela abaixo se encontram as freqüências esperadas considerando H0 verdadeira.
Situação do ensaio Freqüências esperadas

Laboratorista A Laboratorista B Laboratorista C Total
Com repetibilidade 9,9 10,725 12,375 33
Sem repetibilidade 2,1 2,275 2,625 7
Total 12 13 15 40
Obtenção da tabela acima:
Fe11 = (12 * 33)/40 = 9,9

Fe12 = (13 * 33) / 40 = 10,725
Fe13 = (15 * 33)/40 = 12,375
Fe21 = (12 * 7)/40 = 2,1
Fe22 = (13 * 7)/40 = 2,275
Fe23 = (15 * 7)/40 = 2,625
Quanto aos graus de liberdade tem-se:
ϕ = (h -1) (K - 1) = (2 -1) (3 - 1) = 2
Assim:
f ( X2 )
RA 5%
RC
0 5,99 X2

Quanto ao valor da variável tem-se:
( Foij − Feij ) 2
χ 2
cal =Σ 2
i =1 Σ 3
j =1
Feij
(10 − 9,9) (11−10,725) (12 −12,375) ( 2 − 2,1) ( 2 − 2,275) ( 3 − 2,625)

2 2 2 2 2 2
χ2
cal = + + + + + _ = _ 0,11
9,9 10,725 12,375 2,1 2,275 2, 625
Conclusão: Como χcal2 < 5,99, aceita-se H0, concluindo com um risco de 5% que há
homogeneidade nas proporções de ensaios com não repetibilidade executados pelos três
laboratoristas.
Exemplo 6.8 – A tabela abaixo exibe os resultados dos ângulos de atrito efetivos obtidos em
ensaios de cisalhamento direto com dois solos arenosos. Testar a hipótese de
que os resultados obtidos com o solo A sejam independentes dos resultados
obtidos com o solo B, ao nível de significância de 2,5%. Avaliar também o
coeficiente de contingência.
Solo A
27º ≤ φ' ≤ 30º 30º ≤ φ' ≤ 33º 33º ≤ φ' ≤ 35º Total
27º ≤ φ' ≤ 30º 75 35 13 123
30º ≤ φ' ≤ 33º 29 120 32 181
Solo B
33º ≤ φ' ≤ 35º 15 70 46 131
Total 119 225 91 435
Solução:
a) H0 : as variáveis são independentes

H1 : as variáveis são dependentes
b) α = 5% . Escolhe-se uma χ42 , pois ϕ = (h - 1) (K - 1) = (3 - 1) (3 - 1) = 4
c) Determinação da RC e RA
f ( X2 )
RA 2,5%
% RC
0 11,1 X2

d) Cálculo do valor da variável. A tabela abaixo apresenta as freqüências esperadas sob a

hipótese H0 de independência entre as variáveis:
Fe11 = (119 * 123)/435 = 33.65

Fe12 = (225 * 123) / 435 = 63,62
Fe13 = (91 * 123)/435 = 25,73
Fe21 = (119 * 181)/435 = 49,51
Fe22 = (225 * 181)/435 = 93,62
Fe23 = (91 * 181)/435 = 37,87
Fe31 = (119 * 131)/435 = 35,84
Fe32 = (225 * 131)/435 = 67,76
Fe33 = (91 * 131)/435 = 27,40
Solo A
27º ≤ φ' ≤ 30º 30º ≤ φ' ≤ 33º 33º ≤ φ' ≤ 35º Total
27º ≤ φ' ≤ 30º 33,65 63,62 25,73 123
30º ≤ φ' ≤ 33º 49,51 93,62 37,87 181
Solo B
33º ≤ φ' ≤ 35º 35,84 67,76 27,40 131
Total 119 225 91 435
Então o valor de χcal2 é dado por:
( Foij − Feij ) 2
χ 2
cal =Σ 2
i =1 Σ 3
j =1
Feij
( 75 − 33,65) ( 35 − 63,62) ( 70 − 67,76) ( 46 − 27,40)

2 2 2 2
χ2
cal = + + _ L_ + + _ = _ 111,64
33,65 63, 62 67,76 27,40
Conclusão: Como χcal2 ≥ 11,1, rejeita-se H0, concluindo-se com risco de 2,5% que as
variáveis são independentes.
Quanto ao coeficiente de contingência, tem-se:
C=
χcal
2
_∴_ C =
(11164 ) _ ⇒ _ C = 0, 45
χcal
2
+n (111, 64 ) + ( 435)

7 - ANÁLISE DE VARIÂNCIA
No último capítulo foi apresentada a técnica de comparar as médias de duas populações

através de testes de hipótese (teste "t" baseado na Distribuição de Student). Esta técnica está
limitada a comparar populações duas a duas de cada vez e assim quando se tem um número
maior de populações, o processo pode se tornar complicado ou tedioso. A técnica de comparar
as médias de duas ou mais populações, através de testes de hipóteses utilizando a Distribuição
de Fisher (Capítulo 4), é conhecida como Análise de Variância (ANOVA). A Análise de
Variância é útil para comparar a eficiência de diferentes fatores que produzam mudanças
sistemáticas nas médias das populações de interesse.
Por exemplo, pode-se estar interessado na eficiência de um processo de reforço de solos.

Evidentemente existem vários fatores que podem influenciar a eficiência do processo de
reforço tais como tipo de solo, traço da calda injetada, pressão de injeção etc. Por meio da
análise de variância é possível estimar se estes fatores, ou uma combinação deles, têm efeito
apreciável sobre o reforço do solo e também estimar a contribuição de cada fator para a
variabilidade global do reforço do solo.
Neste capítulo será apresentado a Análise de Variância, mostrando a técnica para até dois
possíveis fatores. O objetivo da Análise de Variância é comparar as médias de K amostras e
decidir se as amostras foram retiradas de populações que têm o mesmo valor da média. Como
normalmente as médias amostrais são diferentes, pode-se atribuir esta diferença a duas fontes
de variabilidade:
• As populações são diferentes. Esta variabilidade é chamada de Variabilidade Entre

Populações. Quanto maior for a Variabilidade Entre, maior será a evidência de que existem
diferenças entre as populações das quais foram retiradas as amostras.
• As amostras são diferentes, mas pertencem a mesma população. Esta variabilidade é
chamada de Variabilidade Dentro da População. Quanto maior for a Variabilidade Dentro,
maior será a dificuldade para concluir se as populações são ou não são diferentes.
Para a Análise de Variância valem as seguintes premissas:
• As amostras são aleatórias e independentes;

• As amostras são extraídas de populações normais;
• As populações normais possuem a mesma variância.
O teste de hipótese é estabelecido da seguinte forma:
• A hipótese nula H0 afirma que as K populações tem o mesmo valor da média

(H0: µ1 = µ2 = ... = µk);
• A hipótese alternativa H1 afirma que pelo menos uma das populações possui média
diferente das demais (H1: µi ≠ µj).
Como pelas premissas da Análise de Variância, as variâncias das populações são iguais, a
hipótese nula afirma que as populações são idênticas. Já a hipótese alternativa afirma que

existe alguma diferença, entre pelo menos duas das populações. Objetiva-se então, calcular a
variância de duas maneiras diferentes e independentes, obtendo o valor de F (Distribuição de
Fisher):
ˆ
Variancia _ Entre S 2
F= _ = _ E2
ˆ
Variancia _ Dentro SD
7.1 – ANOVA SIMPLES (FATOR ÚNICO)
Considerando K distribuições normais com a mesma variância σ2 e médias diferentes µ1, µ2,
µ3, ..., µk, das quais extraiu-se K amostras com n observações cada. Os dados podem assumir
a forma da matriz apresentada na Tabela 7.1.
Tabela 7.1 - Valores observados de K amostras e respectivas médias

Amostras Valores observados Médias
1 x11 x12 x13 … x1n x1
2 x21 x22 x23 … x2n x2
k xk1 xk2 xk3 … xkn xk
• Variância Dentro (SD2)
A variância da amostra i (que também é uma estimativa não-tendenciosa da variância da

população i) é dada por:
∑(x − xi )
2
ii
Si 2 = i =1
(7.1)
n −1
Como todas as distribuições são assumidas normais e com a mesma variância σ2, pode-se
considerar o conjunto de k variâncias amostrais e calcular k estimativas independentes de σ2,
igualmente válidas e extraídas de "dentro" das amostras. Em conseqüência, pode-se obter uma
estimativa conjunta SD2 dos k valores de Si2 :
S12 + S2 2 + _ L _ + Sk 2
Est ( σ2 ) = SD 2 =
k
∑∑ ( x − xi )
k n
2
ij
i =1 j=1
SD 2 = (7.2)
k ( n − 1)
O termo do numerador da Eq. 7.2 é chamado de Soma dos Quadrados dos Erros Dentro das
amostras (SQD), que é variabilidade não explicada dentro das amostras. O número de graus de
liberdade associado à SQD é k(n-1). O resultado final da Eq. 7.2 é chamado de Média da

Soma dos Quadrados dos Erros Dentro (MQD), e é uma das estimativas não-tendenciosas da
variância σ2 da população.
• Variância Entre (SE2)
Por outro lado, através das k médias X i , pode-se determinar a variância das médias das
amostras em torno da média global (também chamada de grande média):
n k
∑∑ x ij
X= i j
kn
∑( )
k 2
Xi − X
=
2 i
S x
( k − 1)
(7.3)
Como a variância amostral é S2x = σ 2 / n , pode-se obter outra estimativa não-tendenciosa da

variância σ2 da população, independente da primeira:
Est ( σ2 ) = SE 2 = nSx 2
 k
( ) 
2
 ∑ Xi − X
SE 2 = n  i =1  (7.4)
 ( k − 1) 
 
O termo no numerador é chamado de Soma dos Quadrados Entre Médias das amostras (SQE),
já que é avaliado pela variação entre as médias amostrais e a média global (variabilidade
explicada). O número de graus de liberdade associado à SQE é k-1. O resultado final da Eq.
7.4 é chamado de Média da Soma dos Quadrados Entre (MSE).
Concluindo, tem-se duas estimativas distintas e independentes da variância σ2 da população:
• A primeira (Eq. 7.2), obtida de dentro das amostras;

• A segunda (Eq. 7.4), obtida entre as médias das amostras.
• Teste de Hipótese "F"
O quociente entre ambas as estimativas da variância da população segue uma Distribuição de

Fisher com υ1 = k-1 e υ2 = k(n-1) graus de liberdade:
ˆ
Variancia _ Entre S 2
F= _ = _ E2 (7.5)
ˆ
Variancia _ Dentro SD

Assim, se k amostras forem aleatórias e independentes, para a conclusão de que

µ1 = µ2 = µ3 = ... µk, o quociente entre SE2 e SD2 (valor F observado) deverá ser unitário ou
próximo, não devendo ultrapassar o limite Fα; υ1; υ2, dado pela Distribuição de Fischer, para a
um certo grau de significância (α). Pode-se dizer que o número F é a razão entre duas
variáveis chi-quadrado independentes divididas pelos seus próprios graus de liberdade (este
tipo de razão sempre gera uma distribuição de Fisher, com υ1 e υ2 graus de liberdade).
Convém salientar que SE2 deverá corresponder sempre ao numerador, porque, se cada amostra
corresponder a um tratamento diverso, afetando para mais ou para menos as respectivas
médias, o valor de SD2 se tornará superior ao esperado.
Caso o valor de F seja menor que a unidade, não há necessidade de prosseguir o teste, pois
este fato invalida qualquer suspeita de desigualdade entre as populações, ou seja as
populações são iguais. No entanto, se for muito pequeno (próximo de zero), deve-se suspeitar
de tendenciosidade nas amostras, indicando ser impróprio qualquer conclusão sobre as
amostras.
O teste de hipótese é feito comparando o valor F observado com aquele previsto para a um
certo grau de significância Fα. O valor de Fα pode ser obtido de tabelas ou de funções
estatítica do EXCEL:
• FDIST (f; graus de liberdade do numerador; graus de liberdade do denominador) – fornece

o valor p ou seja a probabilidade associada ao valor "f" desejado;
• FINV (α; graus de liberdade do numerador; graus de liberdade do denominador) – fornece

o valor crítico de Fα associado ao grau de significância α.
Em caso em que o valor de F observado seja maior que o valor crítico de Fα, deve-se então
rejeitar a hipótese nula e aceitar a hipótese alternativa. Ou seja, as médias amostrais são
significativamente diferentes, não sendo razoável explicar as diferenças entre as médias
amostrais apenas pela variabilidade amostral. A diferença entre populações é estatisticamente
significante.
• Tabela ANOVA
Como forma de sistematizar os cálculos e agrupar resultados utiliza-se a tabela ANOVA,

definida para k amostras independentes de tamanhos diferentes:
Amostra 1 Amostra 2 … Amostra k

x1,1 x2,1 … xk,1
x1,2 x2,2 … xk,2
… … … …
x1, n1 x2, n2 … xk, nk
Média X1 X2 … Xk
Total T1 T2 … Tk
Tamanho n1 n2 … nk

Faz-se as seguintes definições:
• Número total de observações N
N = n1 + n2 + … + nk
• Soma das observações da amostra i
n
Ti = ∑ x j
j=1
• Soma global dos Ti (soma de todas as observações de todas as amostras)
∑ ( x ) = T1 + T2 + … + Tk
k n
T=∑ ij
i =1 j=1
• Termo de correção
T2
C=
N
• Soma dos quadrados totais
k n
SQT = ∑∑ x ij2 − C
i j
• Soma dos quadrados entre
k
T i2
SQE = ∑ −C
i ni
• Soma dos quadrados dentro
SQD = SQT - SQE
Logo:
 SQE 

 ( k − 1) 
F=
 SQD 
 
(N − k)
A tabela resumo dos cálculos da ANOVA de fator simples é:

Fonte de Graus de Soma dos Média da Soma Valor F

Variabilidade Liberdade Quadrados dos Quadrados Observado
SQE
Entre k-1 SQE MQE =
( k − 1)
MQE
F=
MQD
SQD
Dentro N-k SQD MQD =
( N − k)
Total N-1 SQT
Exemplo 7.1 – Considerando os dados da tabela a seguir, relativos aos resultados de ensaios
de limite de liquidez realizados por 4 laboratoristas diferentes, no mesmo dia.
Deseja-se saber, com uma confiança de 95%, se existe uma diferença
significativa entre os resultados produzidos por esses laboratoristas, com base
em 4 amostras de um mesmo solo.
Solução:
Assim, tem-se 4 laboratoristas (k = 4) e cada um analisou 4 amostras de solo (n = 4). Para este
problema, as hipóteses seriam:
• H0: µ1 = µ2 = µ3 = µ4 (α = 5%)
• H1: µ1 ≠ µ2 ≠ µ3 ≠ µ4
Amostras ─ Valores de w L
2
Laboratorista 1ª 2ª 3ª 4ª Ti Ti
1 35,00 36,00 34,00 37,00 142,00 20.164,00
2 37,00 38,00 35,00 39,00 149,00 22.201,00
3 36,00 38,00 34,00 38,00 146,00 21.316,00
4 34,00 36,00 34,00 36,00 140,00 19.600,00
Total 577,00 83.281,00
( 577 ) _ ⇒ _ C = 20.808,10
2
T2 T2
C= _∴_ C = _∴_ C =
N ( 4.laboratoristas ) × ( 4.Amostras ) 4 ( 4)
k n
SQT = ∑∑ x ij2 − C _ ∴ _ SQT = 20.849, 00 − 20.808,10 _ ⇒ _ SQT = 40,90
i j

T i2k
83.281, 00
SQE = ∑ − C _ ∴ _ SQE = − 20.808,10 _ ⇒ _ SQE = 12, 20
i ni 4
SQD = SQT − SQE _ ∴ _ SQD = 40,90 − 12, 20 _ ⇒ _ SQD = 28, 70
Assim:
 SQE  12, 20 

 ( k − 1)   3  _ ⇒ _ F = 1, 70
F= _∴_ F =
 SQD   28, 70 
   12 
(N − k)
Pela distribuição de F (tabela ou Excel), obtém-se que:
Fα1 ;..k −1;..k ( n −1) _ ⇒ _ F0,05;..3;..12 = 3, 49
Como ocorreu que o valor de F observado é menor que o F crítico (F < Fα), admite-se com
uma probabilidade de 95%, que não existe diferença significativa entre as médias, ou seja, não
há razão para acreditar que um dos laboratoristas produz resultados diferentes de ensaios dos
demais laboratoristas.
Solução Utilizando o Excel:
Primeiramente é necessário verificar se a opção "Ferramentas / Análise de Dados" está

instalada no Excel de seu computador. Inicie o programa Excel e clique em "Ferramentas". Se
a opção "Análise de Dados" não aparecer no menu é necessário instalá-la. Para isto, clique em
"Ferramentas" e depois em "Suplementos". Marque a opção "Ferramentas de Análise" e
depois clique "Ok". A partir daí, siga a seqüência abaixo:
• Digite os dados numa planilha Excel, em colunas ou linhas justapostas;
• Clique "Ferramentas", "Análise de Dados" e depois "ANOVA – Fator Único"
• Preencha a ficha com as seguintes informações – Intervalo de Entrada (digite a primeira

célula, esquerda superior, depois ":", e então a última célula, direita inferior, de tal forma
a definir um retângulo que cubra todos os dados), Orientação dos Dados por Linhas ou
Colunas (escolha uma opção, linha ou coluna, em função de como os dados foram
digitados; ou seja, os elementos que formam uma amostra estão orientados na horizontal
ou na vertical), Nível de significância α (o valor assumido é 5%, mas qualquer outro pode
ser digitado) e Opções de Saída dos Resultados (marque a opção desejada que pode ser na
mesma planilha, daí digite uma célula a partir da qual o Excel vai listar a tabela de
resultados; ou uma nova planilha ou até mesmo uma nova pasta).

• A seguinte tabela de resultados é impressa conforme a opção de Saída dos Resultados

escolhida. Os resultados confirmam os valores de F observado igual a 1,70 e crítico igual
a 3,49.
Anova: fator único
RESUMO
Grupo Contagem Soma Média Variância
Linha 1 4 142 35,50 1,66666667
Linha 2 4 149 37,25 2,91666667
Linha 3 4 146 36,50 3,66666667
Linha 4 4 140 35,00 1,33333333
ANOVA
Fonte da variação SQ gl MQ F valor-P F crítico
Entre grupos 12,1875 3 4,0625 1,69565217 0,22077906 3,4902996
Dentro dos grupos 28,75 12 2,39583333
Total 40,9375 15
7.2 - ANOVA COM DOIS FATORES (FATOR DUPLO)
O experimento da análise de variâncias pode se tornar mais sensível se houver a possibilidade

de identificar e isolar as causas que influenciam o experimento. Essas causas estranhas,
quando não identificadas, contribuem para aumentar o valor da variância entre (SE2) e
mascarar a conclusão final.
Assim, sempre que possível, essas causas de variação devem ser isoladas através de um
planejamento, onde são identificados os possíveis fatores que podem afetar as observações de
cada amostra. Isso equivale a fazer, em lugar de uma ANOVA simples, uma análise dupla e
cruzada das observações, segundo os fatores. É possível fazer uma ANOVA analisando dois
fatores de cada vez, um chamado de fator das linhas (L) e o outro de fator das colunas (C).
Assim, a soma dos quadrados totais (SQT) é, agora, dividida em três componentes:
• Soma dos Quadrados das Linhas (SQL)

• Soma dos Quadrados das Colunas (SQC)
• Soma dos Quadrados dos Erros
Testa-se simultaneamente dois valores de F, um correspondente às linhas (L) e outro às

colunas (C). Se este último valor resultar significativo, será indicativo de que se acertou em
isolar a causa da variação. Em caso contrário, a conclusão seria a mesma se fosse aplicado a
ANOVA simples. A metodologia na aplicação deste modelo é a mesma da anterior. Os
quadrados são, agora, obtidos através das seguintes equações, onde k é o número de colunas e
n o número de linhas:

T2
C=
kn
k n
SQT = ∑∑ x ij2 − C
i j
 n 2 
 ∑ ( Tj ) 
SQL =  j −C
 k 
 
 
 k 2 
 ∑ ( Ti ) 
SQC =  i −C
 n 
 
 
SQE = SQT − SQL − SQC
A Tabela 7.2 sintetiza a ANOVA com fator duplo, onde se rejeita a hipótese µ1 = µ2 = µ3 ...,
ou seja, de que o fator das linhas é igual, se:
FL > Fα ;..( n −1);..( k −1)( n −1) (7.6)
Por outro lado, rejeita-se a hipótese das colunas não se diferenciarem, ou seja, acerta-se em
isolar as causas de variação, se:
FC > Fα;..( k −1);..( k −1)( n −1) (7.7)
Tabela 7.2 ANOVA com fator duplo

Fonte de Graus de Soma dos Média da Soma dos
Valor F
Variabilidade Liberdade Quadrados Quadrados
SQC MQC
Colunas k-1 SQC MQC = FC =
( k − 1) MQE
SQL MQL
Linhas n-1 SQL MQL = FL =
( n − 1) MQE
SQE
Erros (k - 1)(n - 1) SQE MQE =
( k − 1)( n − 1)
Total (kn) - 1 SQT

Exemplo 7.2 – Considerando a tabela a seguir que condensa os tempos (minutos), que quatro
laboratoristas levaram para realizar ensaios de três tipos de solos diferentes
(arenoso, siltoso e argiloso). Deseja-se saber, com uma confiança de 95% se
existe uma diferença significativa entre o desempenho dos laboratoristas e/ou
em considerar o tipo de solo.
Solução:
Segundo a ANOVA com fator duplo, os laboratoristas foram alocados nas linhas e os tipos de
solos nas colunas. Assim, tem-se que n = 4 e k = 3.
2
Laboratorista Solo 1 Solo 2 Solo 3 Ti Ti
1 45 46 51 142 20.164,00
2 42 44 50 136 18.496,00
3 36 41 48 125 15.625,00
4 49 47 54 150 22.500,00
Ti 172 178 203 553 76.785,00
2
Ti 29.584,00 31.684,00 41.209,00 102.477,00
( 553) _ ⇒ _ C = 25.484,10
2
T2
C= _∴_ C =
kn ( 3)( 4 )
k n
SQT = ∑∑ x ij2 − C _ ∴ _ SQT = 25.749, 00 − 25.484,10 _ ⇒ _ SQT = 264, 90
i j
 n 2 
 ∑ ( Tj ) 
SQL = 
j
 − C _ ∴ _ SQL = 76.785, 00 − 25.484,10 _ ⇒ _ SQL = 110,90
 k  3
 
 
 k 2 
 ∑ ( Ti )  102.477, 00
SQC =  i  − C _ ∴ _ SQC = − 25.484,10 _ ⇒ _ SQC = 135, 20
 n  4
 
 
SQE = SQT − SQL − SQC _ ∴ _ SQE = 264,90 − 110,90 − 135, 20 _ ⇒ _ SQE = 18,80
SQE 18,80
MQE = _ ∴ _ MQE = _ ⇒ _ MQE = 3,13
( k − 1)( n − 1) ( 3 − 1)( 4 − 1)

SQC 135, 20
MQC = _ ∴ _ MQC = _ ⇒ _ MQC = 67, 60
k −1 3 −1
SQL 110,90
MQL = _ ∴ _ MQL = _ ⇒ _ MQL = 36,97
n −1 4 −1
MQL 36,97
FL = _ ∴ _ FL = _ ⇒ _ FL = 11,80
MQE 3,13
MQC 67, 60
FC = _ ∴ _ FC = _ ⇒ _ FL = 21, 60
MQE 3,13
Pela distribuição de Fischer (tabela ou Excel), tira-se os valores de F calculados para o fator
das linhas e das colunas, considerando um nível de significância de 5%:
• FLcritico = Fα ;..( k −1);..( k −1)( n −1) _ ∴ _ FLcritico = F0,01;..3;..6 _ ⇒ _ FLcritico = 4, 76
• FCcritico = Fα;..( k −1);..( k −1)( n −1) _ ∴ _ FLcritico = F0,01;..2;..6 _ ⇒ _ FLcritico = 5,14
Conclusão: Como o valor de FL (11,8) é maior que 4,76, concluiu-se pela rejeição da
igualdade das médias (µ1 ≠ µ2 ≠ µ3 ≠ µ4), ou seja, o desempenho dos laboratoristas influenciou
a velocidade do ensaio. Como FC (21,5) também resultou ser maior que 5,14, confirma que
acertou-se em medir os tempos separadamente para cada tipo de solo.
Solução Utilizando o Excel:
Após verificar que a opção "Ferramentas / Análise de Dados" já está instalada no Excel de seu
computador, siga a seqüência abaixo:
• Digite a tabela de dados numa planilha Excel, em colunas e linhas justapostas;
• Clique "Ferramentas", "Análise de Dados" e depois "ANOVA – Fator Duplo Sem

Repetição";
• Preencha a ficha com as seguintes informações – Intervalo de Entrada (digite a primeira

célula, esquerda superior, depois ":", e então a última célula, direita inferior, de tal forma
a definir um retângulo que cubra todos os dados), Nível de significância α (o valor
assumido é 5%, mas qualquer outro pode ser digitado) e Opções de Saída dos Resultados
(marque a opção desejada que pode ser na mesma planilha, daí digite uma célula a partir
da qual o Excel vai listar a tabela de resultados; ou uma nova planilha ou até mesmo uma
nova pasta).
• A seguinte tabela de resultados é impressa conforme a opção de Saída dos Resultados

escolhida. Os resultados confirmam os valores de F observados superiores aos F críticos.

Anova: fator duplo sem repetição
RESUMO Contagem Soma Média Variância

Linha 1 3 142 47,3333333 10,3333333
Linha 2 3 136 45,3333333 17,3333333
Linha 3 3 125 41,6666667 36,3333333
Linha 4 3 150 50 13
Coluna 1 4 172 43 30
Coluna 2 4 178 44,5 7
Coluna 3 4 203 50,75 6,25
ANOVA
Fonte da variação SQ gl MQ F valor-P F crítico
Linhas 110,9167 3 36,9722222 11,7787611 0,00631432 4,75705519
Colunas 135,1667 2 67,5833333 21,5309735 0,00182902 5,14324938
Erro 18,83333 6 3,13888889
Total 264,9167 11

8 - REGRESSÃO E CORRELAÇÃO
Regressão é o nome da técnica de ajuste de um modelo matemático (equação) a um conjunto

de dados de diversas variáveis, onde n-1 variáveis são independentes e uma é considerada
dependente. Já a correlação é uma forma de medir a provável relação existente entre as
variáveis dependente e independentes. Através da técnica de regressão (ajuste de curvas) é
sempre possível achar uma equação (modelo matemático) que ajuste os dados das variáveis
independentes e dependente. Daí dizer que existe uma correlação estatística, é necessário fazer
antes uma análise se existe alguma relação entre as variáveis, com fundamentos físicos,
químicos, biológicos, sociológicos etc. Muitas vezes, não se sabe ainda se a tal correlação
entre as variáveis existe, daí a partir da existência de uma regressão suspeita-se dela e inicia-se
um processo de pesquisa de fundamentos. Caso conclua-se que aquela relação entre as
variáveis sempre exista, e não foi apenas verificada localmente ou apenas para aquela
conjunto de dados, daí sim, pode-se estabelecer que a correlação entre as variáveis de fato
existe.
8.1 - REGRESSÃO LINEAR SIMPLES
Na análise de regressão simples são relacionadas duas variáveis por uma equação, uma
chamada variável resposta, ou dependente, e outra chamada variável independente. As etapas
da análise de regressão simples são:
• Conhecidos um conjunto de valores da variável independente e outro da variável resposta,

adota-se uma equação (modelo) e determina-se os parâmetros desta equação.
• Testa-se em seguida a aderência da equação, isto é, se o modelo fornecido pela equação
descreve bem as observações. Pode-se então concluir pela adequação do modelo e adotá-lo,
ou concluir que ele não é satisfatório e testar outro, voltando à etapa inicial e repetir todo o
processo.
• Obtida uma equação razoável pode-se utilizá-la para resolver os problemas como a
predição do valor da variável resposta, sua verificação e controle.
A seguir será estudado o modelo de regressão linear simples, onde existem apenas duas
variáveis envolvidas (a variável independente e a variável dependente) e o relacionamento
entre elas pode ser descrito por uma equação linear, ou seja, a equação de uma reta. Convém
ressaltar que a distinção entre as variáveis dependentes e independentes nem sempre é muito
clara, e algumas vezes depende dos objetivos envolvidos ou do significado físico das
variáveis. Entretanto, na prática, os papéis das variáveis são em geral facilmente
caracterizados.
Existem outros modelos de regressão envolvendo relacionamentos não-lineares e um maior

número de variáveis. Os modelos mais apropriados para estas situações são a Regressão Não-
Linear e a Regressão Linear Múltipla.
8.1.1 - DIAGRAMA DE DISPERSÃO
Na resolução de problemas de regressão, o primeiro passo é traçar o diagrama de dispersão

correspondente, marcando em um sistema cartesiano bidimensional os diversos pares de

valores observados (xi, yi). Muitas vezes os pontos observados não estão exatamente sobre
uma reta, porém a análise do gráfico pode sugerir um relacionamento aproximadamente linear
entre as duas variáveis (Figura 8.1).
y
y
=
ax
+
b
0 X
Figura 8.1 - Diagrama de dispersão
Neste caso são necessários modelos para representar o conjunto de pontos. Um dos modelos
matemáticos propostos é destacado a seguir:
yi = a xi + b + εi (8.1)
Determinados os parâmetros a e b, a cada valor de xi da variável independente corresponderá

um valor teórico yi da variável resposta, que se diferenciará do valor observado pelo erro εi.
Na Eq. 8.1, b é o intercepto com o eixo dos y e a é o coeficiente angular ou inclinação da reta.
8.1.2 - RETA DOS MÍNIMOS QUADRADOS
Para evitar um critério individual e discutível para o ajustamento linear dos pontos
distribuídos, torna-se necessária a definição da "melhor reta de ajustamento". Neste caso
pode-se arbitrar uma reta qualquer que se ajuste ao conjunto de pontos da Figura 8.1. Para
cada valor xi da variável independente obter-se-ia um valor predito para a variável resposta y
dado por:
∧
y = a xi + b (8.2)
∧
Seja ei, a diferença entre o valor observado yi e o valor predito y e considerando a soma dos
quadrados destas diferenças (erros) para todos os pontos, tem-se que:
∧
D = Σi ei2 = Σ (yi - y i)2 = Σi (yi - axi- b)2 (8.3)
O valor de D varia com a reta escolhida, isto é, depende dos coeficientes a e b. Quanto menor
o valor de D, mais ajustada será a equação de predição, ou seja, um bom ajuste será aquele em
que D for o menor possível. Este é o princípio básico do Método dos Mínimos Quadrados,

isto é, estimar os parâmetros a e b que minimizem D = Σe12. Determinar a e b tais que a soma
de quadrados dos resíduos seja mínima é um problema cuja resolução depende do cálculo
diferencial. A seguir são apresentados as formulações para as determinações destes
parâmetros:
a = Sxy / Sxx
b= Y -a X
Onde:
Sxx = Σ (xi - X )2 = Σxi2 - n X 2
Syy = Σ (yi - Y )2 = Σyi2 - n Y 2
Sxy = Σ (xi - X ) (yi - Y ) = Σ xi yi - n X Y
X = (Σ xi) / n
Y = (Σ yi) / n
8.1.3 - PRECISÃO DA RETA DE REGRESSÃO
Obtida uma certa reta de regressão, é necessário determinar sua precisão, isto é, verificar se
ela representa satisfatoriamente a tendência dos dados observados. Considere a seguinte
equação:
∧ ∧
(yi - y i) = (yi - Y ) - ( y i - Y ) (8.4)
∧
A Eq. 8.4 indica que o erro (resíduo), ei = yi - y i, é a diferença entre o desvio do valor
∧
observado yi em relação à sua média Y e o desvio do valor estimado y i em relação à sua
∧
média Y ( Y é a média tanto dos yi quanto dos y i). Reescrevendo a Eq. 8.4:
∧ ∧
(yi - Y ) = (yi - y i) + ( y i - Y )
Elevando ambos os membros ao quadrado e somando para i = 1, 2, ..., n, tem-se:
∧ ∧
Σ(yi - Y )2 = Σ(yi - y i)2 + Σ( y i - Y )2 (8.5)
∧ ∧
O duplo produto 2Σ(yi - y i) ( y i - Y ) é igual a zero.

Analisando a Eq. 8.5 observa-se que a variação total das observações em torno de sua média,
dada por Σ(yi - Y )2, que se chama soma total dos quadrados (SQT), pode ser decomposta em
duas parcelas:
∧
• Soma dos Quadrados dos Erros (ou Resíduos) SQE = Σ(yi - y i)2, que mede a variação em
torno da reta de regressão;
• Soma dos Quadrados dos Desvios dos Valores da Regressão em relação a sua média,
∧
SQR = Σ( y i - Y )2.
Resumindo, tem-se:
SQT = SQE + SQR
Onde:
SQT = Σ(yi - Y )2 = Σyi2 - n Y 2 = Syy
∧
SQR = Σ( y i - Y )2 = Σ[ Y + b (xi - X ) - Y ]2 = b2 Sxx
SQE = SQT - SQR
SQE é a soma dos quadrados das diferenças entre os valores observados e os previstos pela
equação de regressão, portanto é uma medida da variabilidade não explicada pela reta de
regressão. Se todos os pontos observados estiverem sobre a reta de regressão SSE será zero.
Assim, surge uma alternativa de medir o ajuste da curva, a qual é dada pela razão entre a
variância explicada pela reta de regressão (SQR) e a variância total (SQT). Esta razão é
conhecida como coeficiente de determinação ou simplesmente "r quadrado" (r2) e é dada por:
r =
SQR
2
.=.
( b 2 .Sxx )
SQT Syy
Esta razão mede a proporção da variação de Y que é explicada pela reta de regressão, ou seja é
um coeficiente de ajuste. Este coeficiente de determinação é particularmente importante se a
reta de regressão for usada para fazer previsões. Neste caso o que se quer é um r2 tão próximo
de 1 quanto possível.
Exemplo 8.1 – Relacionar os ângulos de atrito efetivos com as massas específicas secas de
um material granular.
xi (g/cm3) 1,95 2,04 2,08 2,18 2,23 2,27

yi (graus) 27,0 30,1 30,5 32,7 36,0 36,2

a) Fazer o diagrama de dispersão

b) Escrever a equação de regressão de Y sobre X.
c) Calcular o coeficiente de determinação.
Solução:
X = 2,125
Y = 32,083
Σxi2 = 27,169
Σxi yi = 411,234
Σyi2 = 6240,99
Sxy = Σxi yi - n X Y = 411,234 – 6(2,125)(32,083) = 2,176

Sxx = Σxi2 - n X 2 = 27,169 – 6(2,13)2 = 0,075
Syy = Σyi2 - n Y 2 = 6240,99 – 6(32,083)2 = 65,077
a = Sxy / Sxx = 2,176 / 0,075 = 28,97
b = Y - a X =32,083 - (28,97)(2,125) = -29,48
∧
A reta de regressão é : y = 28,97 xi – 29,48
r =
2 SQR
_∴_ r =
2 ( b 2 .Sxx )
_∴_ r =
2 ( −29, 48 ) ( 0, 075 )
2
_ ⇒ _ r 2 ≅ 1, 00
SQT Syy 65, 077
ÂNGULO DE ATRITO EFETIVO (graus)
38
36
34
32
30
28
26
1.9 1.95 2 2.05 2.1 2.15 2.2 2.25 2.3
MASSA ESPECÍFICA SECA (g/cm3)
8.1.4 - REGRESSÕES LINEARES POR TRANSFORMAÇÃO
Serão apresentados alguns tipos de transformações mais usados para linearizar a relação entre
as variáveis. A partir destas transformações todos os parâmetros estudados anteriormente
podem ser utilizados. Assim:
Função Potência (curva geométrica)
y = α Xβ

A função linear resultante de uma transformação logarítmica dupla será:
log Y = log α + β log X ou seja, Z = A + βT
onde:
Z = log Y
A = log α
T = log X
β>1
α 0<β<1
0 1 X
Figura 8.7 - Gráfico da função potência
Função Hipérbole
a) Y = αX-β
A função linear resultante de uma transformação logarítmica dupla será:
logY = log α - β log X ou seja, Z = A - βT
onde
Z = log Y
A = log α
T = log X

α 0<β<1
β=1
β>1
0 1 X
Figura 8.8 - Gráfico da função hipérbole (a)
b) Y = α ± β X-1
Neste caso tem-se uma transformação recíproca, e a função linear resultante será:
Y = α ± βT
onde T = X-1
Y Y
α
α
0 -1 X 0 -1 X
Y= α+β X Y= α−β X
Figura 8.9 - Gráfico da função hipérbole (b)
c) Y = 1 / (α + βX)
A função linear resultante de uma transformação recíproca será:
Z = α + βX
onde Z=1/Y

α > 0 X -1
β>0
0
X
Figura 8.10 - Gráfico da função hipérbole (c)
Função exponencial
Y = αβX
Mediante uma transformação logarítmica tem-se:
logY = log α + X log β ou Z = A + BX
onde
logY = Z
log α = A
log β = B
β>1
0<β<1
0 X
Figura 8.11 - Gráfico da função exponencial
8.2 - REGRESSÃO LINEAR MÚLTIPLA
Regressão Linear Múltipla é o estudo do modelo de regressão com mais de uma variável
independente, visando a uma melhor compreensão do comportamento da variável dependente.

Supondo que a variável Y dependa dos valores assumidos por k variáveis independentes (X1,
X2, X3, ..., Xk) e que essa dependência seja expressa pelo modelo:
Yi = α + β1X1 i + β2X2 i + ... + βkXk i + Ui
Onde:
ƒ(x) = α + β1X1 + β2X2 + ... + βkXk é a componente funcional
U1 é a componente aleatória
Como no caso da Regressão Linear Simples, pode-se assumir que esta dependência é dada por
(lê-se média de Y dados X1, X2, ... , Xk):
E [Y/X1, X2, ... , Xk] = ƒ(x)
Isto é ƒ(X) fornece a média da distribuição dos Y, dados os valores particulares de

X1, X2, X3, ..., Xk. Detalhando ainda mais, ƒ(X) descreve a "trajetória" média das variações de
Y para uma coleção de valores das variáveis X1, X2, ..., Xk, enquanto a variável aleatória U
capta as variações decorrentes das medidas, bem como as influências de outras variáveis que
foram omitidas no modelo.
8.2.1 - ESTIMAÇÃO DOS PARÂMETROS
Considerando o caso em que a variável dependente seja postulada como função de duas
variáveis explicativas, X1 e X2, tem-se então o seguinte modelo de regressão linear múltipla:
Yi = α + β1X1 i + β2X2 i + Ui
Retirada uma amostra de n observações das variáveis Y, X1 e X2, deve-se, a partir desses
dados, determinar as estimativas "a", "b1" e "b2" dos parâmetros α, β1 e β2 e, dessa forma,
obter a estimativa do modelo adotado, compondo o estimador Y$ = a + b1X1 + b2X2.
Calculando-se a, b1, b2 de tal forma que os quadrados dos desvios dos valores observados em
relação aos calculados para Y sejam um mínimo. Isto exige que a equação de M (abaixo) seja
um mínimo:
M = ∑ (Y - Y$ )2 = ∑ (Y - a - b1X1 - b2X2)2
Para tanto, deve-se ter:
δM δM δM
=0 =0 =0
δa δb1 δb2
ou seja:

δM
= −2 ∑ ( Y − a − b1X1 − b2 X 2 ) = 0
δa
δM
= −2 ∑ X1 ( Y − a − b1X1 − b 2 X 2 ) = 0
δb1
δM
= −2 ∑ X 2 ( Y − a − b1X1 − b 2 X 2 ) = 0
δb 2
Sendo fornecido as três equações normais para a determinação de a, b1 e b2, resolve-se o

seguinte sistema:
∑ Y = na + b1 ∑ X1 + b 2 ∑ X 2

∑ YX1 = a ∑ X1 + b1 ∑ X1 + b2 ∑ X1X 2
2

∑ YX 2 = a ∑ X 2 + b1 ∑ X1X 2 + b 2 ∑ X 2
2
Dividindo a primeira equação por n tem-se:
∑ Y na ∑ X1 ∑ X2
= + b1 + b2
n n n n
Y = a + b1X1 + b2 X 2 ou a = Y − b1X1 − b 2 X 2
Substituindo-se o valor de a na segunda equação, vem:
∑ YX1 = ∑ X1 ( Y − b1X1 − b2 X 2 ) + b1 ∑ X12 + b 2 ∑ X1X 2

= ∑ X1Y − ∑ X1b1X1 − ∑ X1b 2 X 2 + b1 ∑ X12 + b 2 ∑ X1X 2
∑ X1 ∑ Y ∑ X1 ∑ X2
= − b1 ∑ X1 − b 2 ∑ X1 + b1 ∑ X12 + b 2 ∑ X1X 2
n n n
( ∑ X1 ) − b ∑ X1 ∑ X 2 + b ∑ X 2 + b ∑ X X
2
∑ X1 ∑ Y
= − b1 2 1 1 2 1 2
n n n
Colocando-se b1 e b2 em evidência:
 ( ∑ X1 ) 
2
∑ X1 ∑ Y  ∑ X1 ∑ X 2 
∑ YX1 − = b1  ∑ X1 −
2
 + b 2  ∑ X1X 2 − 
n  n   n
∑ X1 ∑ Y
Chamando SY1 = ∑ YX1 −
n
( ∑ X1 )
2
∑ X1 ∑ X 2
S11 = ∑ X 2
1 − e S12 = ∑ X1X 2 −
n n
tem − se SY1 = b1S11 + b 2S12
Analogamente, substituindo-se o valor de a na terceira equação tem-se:

SY2 = b1S2 1 + b 2S2 2
Então, uma das maneiras para encontrar a, b1 e b2 será resolver o sistema:
SY1 = b1S11 + b 2S1 2


SY2 = b1S21 + b 2S2 2
Encontra-se assim b1 e b2 e, determina-se o valor de a, substituindo b1 e b2 em:
a = Y − b1X1 − b 2 X 2
Lembra-se que:
∑ X1 ∑ X2 ∑Y
X1 = X2 = e Y=
n n n
Pode-se utilizar as seguintes fórmulas:
SY2 SY1
−
S2 1 S11 SY2 S2 2
b2 = b1 = − b2
S2 2 S1 2 S21 S2 2
−
S1 2 S11
Estas equações se constituirão na solução do sistema encontrado acima.
Uma outra alternativa interessante para a solução do sistema é o emprego de matrizes. É fácil
constatar que para K variáveis explicativas, ou seja, o modelo Y = α + β1X1 + β2X2 + β3X3 +
... + βkXk + Ui, para encontrar os estimadores b1, b2, b3, ... bk deve-se resolver o sistema:
SY1 = b1S11 + b 2S1 2 + b3S13 + K + b KS1K

SY2 = b1S2 1 + b 2S2 2 + b3S2 3 + K + b KS2K
SY3 = b1S31 + b2S3 2 + b3S3 3 + K + b K S3K
M
SYK = b1SK 1 + b 2SK 2 + b3SK 3 + K + bSKK
O valor de a será obtido através da fórmula:
a = Y - b1 X 1 - b2 X 2 - b3 X 3 -. . . - bK X K
Exemplo 8.2 - Estimar o plano de regressão considerando as seguintes variáveis:
Gastos com material de construção (Y) 6 7 15 18 20 23

Gastos com cimento (X1) 3 4 8 8 10 11

Gastos com areia (X2) 1 2 3 5 8 6
Será conveniente a elaboração da seguinte tabela:
Y X1 X2 YX1 YX2 X1 X2 X 12 X 212 Y2

6 3 1 18 6 3 9 1 36
7 4 2 28 14 8 16 4 49
15 8 3 120 45 24 64 9 225
18 8 5 144 90 40 64 25 324
20 10 8 200 160 80 100 64 400
23 11 6 253 138 66 121 36 529
89 44 25 763 453 221 374 139 1563
∑ Y 89 ∑ X1 44
Y= = = 14,83 X1 = = = 7,33
n 6 n 6
∑ X 2 25
X2 = = = 4,17
n 6
∑ Y ∑ X1 (89) ⋅ (44)
SY1 = ∑ YX1 − = 763 − = 110,33
n 6
∑ Y ∑ X2 (89) ⋅ (25)
SY2 = ∑ YX 2 − = 453 − = 82,17
n 6
( ∑ X1 )
2
(44) 2
S11 = ∑ X 2
1 − = 374 − = 51,33
n 6
∑ X1 ∑ X 2 (44)(25)
S1 2 = S2 1 = ∑ X1X 2 − = 221 − = 37, 67
n 6
( ∑ X2 )
2
(25) 2
S2 2 = ∑ X 2
2 − = 139 − = 34,83
n 6
Resolvendo o sistema:
SY1 = b1S11 + b 2S1 2 110,33 = b1 51,33 + b 2 37,67

 
SY2 = b1S2 2 + b 2S2 2 82,17 = b1 37, 67 + b 2 34,83
tem − se b1 = 2, 03 e b 2 = 0,16
Logo, a = Y − b1X1 − b 2 X 2
a = 14,83 − (2, 03) (7,33) − (0,16) (4,17)
a = −0, 72
Portanto, o plano estimado será:

Ŷ = a + b1X1 + b2 X 2
Ŷ = −0, 72 + 2, 03X1 + 0,16X 2
8.2.2 - ESTUDOS DAS VARIAÇÕES
a) Variação Total - VT
(∑ Y)2
VT = ∑(Y − Y) 2 = SYY, onde SYY = ∑ Y 2 −
n
b) Variação Explicada - VE
( )
2
VE = ∑ Y
ˆ −Y
Encontrando uma fórmula mais prática para o cálculo de VE:
( ) = ∑ ( a + b1X1 + b2 X 2 − a − b1X1 − b 2 X 2 )
2 2
∑ Ŷ − Y
Ŷ = a + b1X1 + b 2 X 2 e Y = a + b1X1 + b 2 X 2
Então:
VE = ∑  b1 ( X1 − X1 ) + b 2 ( X 2 − X 2 ) 
2
= ∑ b12 ( X1 − X1 ) + ∑ b 22 ( X 2 − X 2 ) + 2 ∑ b1b 2 ( X1 − X1 )( X 2 − X 2 )
2 2
= b12 ∑ ( X1 − X1 ) b 22 ∑ ( X 2 − X 2 ) + 2b1b 2 ∑ ( X1 − X1 )( X 2 − X 2 )
2 2
= b12S11 + b 22S2 2 + 2b1b 2S1 2
Mas, lembrando do sistema:
SY1 = b1S11 + b 2S1 2


SY2 = b1S2 2 + b 2S2 2
Multiplicando-se as equações acima por b1 e b2, respectivamente, tem-se:
b1SY1 = b12S11 + b1b 2S1 2 b12S11 = b1SY1 − b1b 2S1 2

  2
b 2SY2 = b1b 2S2 1 + b 2S2 2 b 2S2 2 = b 2SY2 − b1b 2S1 2
2
Substituindo-se os valores de b12 S1 1 e de b22 S 2 2 na Eq. VE , vem:
VE = b1SY1 − b1b 2S1 2 + b 2SY2 − b1b 2S1 2 + 2b1b2S1 2

VE = b1SY1 + b 2SY2
c) Variação Residual - VR
VR = (Y − Y)
ˆ 2
Será obtida por diferença, isto é, VR = VT - VE, ou seja,
VR = SYY - b1SY1 - b2SY2
Para o cálculo de VR usa-se o fato também aqui válido de que VT = VE + VR, ou seja, a
variação total é igual à soma das variações explicada e residual.
8.2.3 - COEFICIENTE DE DETERMINAÇÃO MÚLTIPLA
Deve-se calcular o coeficiente de determinação como um indicador da validade do modelo

idealizado. Considerando-se duas variáveis explicativas, tem-se:
b1SY1 + b 2SY2 VE
R2 = .=.
SYY VT
Para k variáveis:
∑ b SY i i
R =
2 i =1
SYY
Exemplo 8.3 – Aproveitando os dados do Exemplo 8.2, calcular o coeficiente de

determinação. Relembrando:
Y: Gastos com material de construção;

X1: Gastos com Cimento;
X2: Gastos com Areia.
Solução:
n=6
SY1 = 110,33
SY2 = 82,17
S11 = 51,33;
b1 = 2,03
b2 = 0,16
a = -0,72
Ŷ = −0, 72 + 2,03 X1 + 0,16 X 2 .
VE = b1SY1 + b2SY2 = 2,03 (110,33) + 0,16 (82,17) = 237,12.

(∑ Y)
2
(89) 2
SYY = ∑ Y 2
− = 1563 − = 242,83.
n 6
Finalizando, calcula-se o coeficiente de determinação:
VE b1SY1 + B2SY2 237, 23

R2 = = = = 0,976 = 97, 6%.
VT SYY 242,83
8.2.4 - REGRESSÃO POLINOMIAL
Todo modelo do tipo Y = α + β1X + β2X2 + β3X3 + ... + βkXk + U, constitui-se no modelo de
Regressão Polinomial de grau k em x. Um caso particular e muito aplicado surge quando K =
2, originando a parábola do 2o grau, isto é: Y = α + β1X + β2X2 + U. Para estimar os
parâmetros, neste caso, basta fazer X1 = X1 e X2 = X2 e utilizar o mesmo processo de
determinação dos estimadores utilizado na regressão linear múltipla. As equações normais
para determinação de a, b1 e b2, neste caso serão:
∑ Y = na + b1 ∑ X + b 2 ∑ X 2

∑ YX = a ∑ X + b1 ∑ X + b 2 ∑ X
2 3

∑ YX = a ∑ X + b1 ∑ X + b 2 ∑ X
2 2 3 4
Exemplo 8.4: Os dados abaixo representam o lucro bruto de uma firma de construção civil:
t 1963 1964 1965 1966 1967 1968

Y 80 84 100 105 117 120
Para ajustar os dados numa parábola, convém realizar a seguinte mudança:
X i = ( t i − t ) ⋅ 2, onde t = 1965,5.
t X Y XY X2 YX2 X4
1963 -5 80 -400 25 2.000 625
1964 -3 84 -256 9 756 81
1965 -1 100 -100 1 100 1
1966 1 105 105 1 105 1
1967 3 117 351 9 1.053 81
1968 5 120 600 25 3.000 625
606 304 70 7.014 1.414
Substituindo-se os valores no sistema:
∑ Y = na + b 2 ∑ X 2

∑ YX = b1 ∑ X
2

∑ YX = a ∑ X + b 2 ∑ X
2 2 4

vem:
606 = 6a + b 2 70

304 = 70b1
7014 = 70a + 1414b
 2
Resolvendo o sistema, encontra-se:
a = 102,05
b1 = 4,34
b2 = -0,09
Então, Ŷ = 102, 05 + 4,34 X − 0, 09 X 2 é a parábola ajustada por mínimos quadrados.
8 3- CORRELAÇÃO
Dentre as análises feitas com o objetivo de obter os parâmetros geotécnicos para projetos de
engenharia é freqüente o interesse na determinação de uma grandeza partindo do
conhecimento do valor de outra, ou porque esta apresenta facilidade de medida ou porque
antecede no tempo. Concomitantemente a esta necessidade, outra situação, igualmente
importante, é a verificação da existência ou não de um relacionamento entre duas ou mais
variáveis X e Y, como elas estão associadas e medir o grau de associação. Por exemplo, a
pressão de um gás e sua temperatura conseqüente, a resistência de um aço e seu acabamento
superficial ou a permeabilidade de um filtro sintético e sua gramatura. Tais problemas se
resolvem através da Teoria da Correlação, objeto deste item.
8.3.1 - TEORIA DA CORRELAÇÃO
É a verificação da existência e o grau de relação entre as variáveis de um problema, que

procura determinar quão bem uma equação linear, ou de outra espécie, descreve ou explica a
relação entre as variáveis. Se todos os valores das variáveis satisfazem uma equação, diz-se
que elas estão perfeitamente correlacionados ou que há uma correlação perfeita entre elas.
Assim, as circunferências “C” e os raios “r” de todos os círculos estão perfeitamente
correlaciondos porque C = 2πr. Por outro lado, o lançamento de 2 dados, 100 vezes, não
apresenta relação entre os pontos correspondentes a cada um deles (a não ser que os dados
estejam viciados), isto é, eles são incorrelacionados. Quando se tratar do estudo simultâneo de
somente 2 variáveis aleatórias, fala-se de Correlação Simples. Quando se tratar de mais de
duas variáveis fala-se de Correlação Múltipla.
8.4 - CORRELAÇÃO LINEAR
Se X e Y representam as 2 variáveis aleatórias, e considerando "n" pares de observações (x1,

y1), (x2, y2), , (xn, yn), efetuadas sobre as variáveis X e Y, o primeiro passo da investigação
será colocar estas observações num diagrama de dispersão, que mostra a localização destes
pontos em um sistema de coordenadas retangulares. De acordo com o relacionamento
apresentados pelos pontos, pode-se inferir duas situações diferentes:

1o Caso - Correlação Linear: se todos os pontos deste diagrama caem nas proximidades de
uma reta, como na Figura 8.12 (a) e (b).
• Se y tende a aumentar quando x cresce, Figura 8.12 (a), a correlação é denominada positiva
ou direta.
• Se y tende a diminuir quando x aumenta, Figura 8.12 (b), a correlação é denominada
negativa ou inversa.
Chama-se Correlação Não-Linear quando os pontos parecem estar próximos de alguma

curva. Também a correlação não-linear pode ser positiva ou negativa.
2o Caso - Incorrelacionadas: se não há relação entre as variáveis, como na Figura 8.1 (c),
diz-se que não há correlação entre elas.
Y Y Y
X X X
(a) (b) (c)
Figura 8.12 - Tipos de correlação
8.3.2 - MEDIDAS DE CORRELAÇÃO
A observação direta do diagrama de dispersão permite determinar de modo qualitativo, quão

bem uma certa reta ou curva representa a relação entre as variáveis. Por exemplo, vê-se que
uma linha reta é mais conveniente para representar a relação entre X e Y, para os dados da
Figura 8.1 (a), do que para os da Figura 8.1 (b), devido haver menor dispersão em torno da
reta da primeira figura. Mas, a avaliação quantitativa do problema da dispersão dos dados
amostrais, em relação a retas ou curvas, exige o estabelecimento de medidas de dispersão.
8.3.3 - AJUSTAMENTO LINEAR PELO MÉTODO DOS MÍNIMOS QUADRADOS
Primeiramente, verificar-se-à quão bem uma linha reta representa a relação entre duas
variáveis. Para isto, é necessário a equação de uma reta. Para se evitar utilizar um critério
individual e discutível para o ajustamento linear dos pontos distribuídos, define-se a melhor
reta de ajustamento, que é a reta de regressão de mínimo quadrado, de Y para X, ou seja:
Y$ = a + bx (8.6)
Os coeficientes "a" e "b" são constantes geralmente conhecidas e estimadas de dados

experimentais. A estimação de "a" e "b" pode ser efetuada corretamente através do método
dos mínimos quadrados. Assim, para qualquer ponto xi o ponto correspondente sobre a linha

reta será obtido por a + bxi, onde a diferença entre o valor observado yi e o valor estimado Y$
será de:
di = yi - Y$ i = yi - (a + bxi) (8.7)
As estimativas de mínimo quadrado para a e b são obtidas pela escolha de valores que
minimizem a soma dos quadrados desses desvios:
( )
2
S = ∑ d i 2 = ∑ y i − ( a + bx ii )
n n
(8.8)
i =1 i =1
A minimização é obtida pela derivação parcial de "S" em relação a "a" e "b", e pela resolução
simultânea das duas equações derivadas. Assim:
∂s
= ∑ 2 ( y i − a − bx i )( − 1 ) = 0
∂a
∂s
= ∑ 2 ( y i − a − bx i )( − x i ) = 0
∂b
o u , en tão ,
n a+ b ∑ x i = ∑ y i
a ∑ x i + b ∑ x i2 = ∑ x i y i (8.9 )
resu ltan d o,
a= Y − b x
( ( )( y )) / ( ∑ ( x ) )
2
b = ∑ xi − x i −y i −x
( )
b = ∑ x i y i − n xy / ∑ x i2 − n x ( 2
) (8.1 0 )
Exemplo 8.5 – Os resultados de um experimento para verificar a variação do calor específico

de um produto químico com a sua temperatura estão na tabela abaixo.
Estabelecer a reta de mínimo quadrado.
Solução:
A reta de mínimo quadrado de Y para X, onde X é a temperatura e y o calor específico é:
Temperatura (0 C) 50 60 70 80 90 100
Calor Específico 1,60 1,63 1,67 1,70 1,71 1,71

∑ X = 450 X = 75 ∑ XY=775,6
∑ Y=10,02 ∑ Y=1,67 ∑ X 2 = 35.500
assim,
755, 6 − (6)(75)(1, 67)
b= = 0, 0023428
35.500 − (6))(75)(75)
a = 1,67 - (0,0023428)(75) = 1,49429
Assim, a reta que melhor se ajusta à distribuição dos pontos é:
Y = 1,49429 + 0,0023428 X
Y
1,72 di
+ bx
1,7
s t =a
1,68 Ye
1,66
1,64
1,62
1,6
1,58
40 50 60 70 80 90 100 110
X
8.3.4 - ERRO PADRÃO DA ESTIMATIVA
Se Yest representar os valores de Y correspondentes a valores de X, avaliados por Y = ax + b,

uma medida de dispersão em relação à reta de regressão Y para X, denominado erro padrão
da estimativa de Y para X, será dada pela fórmula:
s y.x =
∑ (y i i − Yest ) 2
(8.11)
n−2
Do mesmo modo, o erro padrão da estimativa de X para Y é definido por:
s x.y =
∑ (x i i − X est ) 2
(8.12)
n−2
Em geral, os erros-padrão são diferentes (syx ≠ sxy).
A Equação 8.11 pode ser escrita sob a forma:
s 2
=
∑ yi 2 − a (∑ y ) − b (∑
i x i yi ) (8.13)
n−2
y.x

O erro padrão tem propriedades análogas às do desvio padrão. Da mesma forma que se
N
verificou o desvio padrão corrigido, dado por ŝ = × s , é conveniente para as pequenas
N −1
N
amostras, também o é o erro padrão corrigido, dado por ŝ x.y = s y.x .
N−2
8.3.5 - VARIAÇÃO EXPLICADA E NÃO-EXPLICADA
( )
2
A variação total de Y é definida como ∑ Y − Y , isto é, a soma dos quadrados dos desvios
dos valores de y em relação à média Y . Esta expressão pode ser escrita sob a forma:
( ) ( ) ( )
2 2 2
∑ Y−Y = ∑ Y−Y
ˆ +∑ Y
ˆ −Y (8.14)
Onde:
( )
2
∑ Y−Y é a variação não-explicada
∑(Y
ˆ − Y) é a variação explicada
Estes valores são assim denominados porque os desvios (Y$ − Y ) tem um padrão definido,
enquanto que os (Y − Y$ ) comportam-se de maneira casual ou imprevisível.
8.3.6 - COEFICIENTE DE CORRELAÇÃO
Se xi e yi forem variáveis aleatórias, a medida do grau de dependência entre as duas variáveis

pode ser obtida através do coeficiente de correlação “ρ“, onde:
σ 
ρ = b× x  (8.15)
σ 
 y
onde σx e σy são os desvios padrão das variáveis X e Y, respectivamente.
Como o coeficiente de correlação possui o mesmo sinal de "b", pode variar de -1 a 1.

Enquanto o seu sinal indica o sentido da dependência, seu módulo indicará o grau da
dependência. Então, se:
• ρ = -1 - a dependência será total e negativa (Figura 8.1 a)

• -1 < ρ < 0 - a dependência será parcial e negativa (Figura 8.14 b)
• ρ=0 - não existirá dependência (Figura 8.14 c)
• 0 < ρ <1 - a dependência será parcial e positiva (Figura 8.14 d)
• ρ=1 - a dependência será total e positiva (Figura 8.14 e)

Y Y Y
X X X
(a ) (b ) (c )
Y Y
X X
(d ) (e )
Figura 8.14 - Formas de dependência do coeficiente de correlação
Uma estimativa adequada de ρ pode ser obtida do coeficiente de correlação amostral “r”,
definido como o coeficiente da variação explicada para a variação total. Se a variação
explicada for nula, isto é, se a variação total for toda não-explicada, este quociente será igual a
zero. Se a variação total for toda explicada, o quociente será igual a 1. Nos outros casos, o
quociente terá valor entre zero e 1. Como a relação é sempre positiva, ela é representada por
“r2”, sendo a quantidade “r” denominada coeficiente de correlação, e é dada por:
∑x
2
var iação explicada
2
− nx
r=b =b i
(8.16)
∑y
2
variação total
i
2
− ny
O valor r é uma quantidade sem dimensões, que depende das unidades adotadas.
Exemplo 8.6 – Um aeroporto do interior acusou entre os anos 1968 e 1973 o movimento de
passageiros mostrado na tabela abaixo. Calcular o coeficiente de correlação.
Ano 1968 1969 1970 1971 1972 1973

(X) 1 2 3 4 5 6
Passageiro Y (x 1000) 140 305 476 602 717 867
Solução:
Representando por x = variável independente = ano (reduzido para unidades 1, 2, ..., 6), tem-
se os dados,
∑X = 21 ∑XY = 13373 X = 3,5

∑Y = 3107 ∑X = 91
2
Y = 517,8333
∑Y = 1967383
2
n=6
b = 13373-(6)(3,5)(517,8333)/91-(6)(3,5)(3,5) = 142,77148
a = 517,8333-(142,77148)(3,5) = 18,13315

O coeficiente de correlação amostral, será:
 91 − (6)(3,5) 2 
r = 142, 771448  
 1967383 − (6)(517,83) 2 
 
r = 0, 99735
Para o caso de uma correlação linear, a quantidade "r" conserva-se a mesma, quer se considere
X ou Y como variável independente. Por isto, "r" é uma medida muito boa da correlação
linear entre duas variáveis. A interpretação de "r" como medida de dependência entre duas
variáveis é puramente matemática e isenta de qualquer implicação de causa e efeito. A
magnitude de "r" demonstra somente a concentração dos pontos. Quanto menor o valor de "r"
mais espalhados se encontram os pontos. De maneira prática, a interpretação de "r" poderia
ser feita da seguinte forma:
0,00 ≤ r ≤ 0,20 - dependência insignificante

0,21 ≤ r ≤ 0,40 - dependência fraca
0,41 ≤ r ≤ 0,70 - dependência marcante
0,71 ≤ r ≤ 1,00 - dependência forte
O coeficiente de correlação mede a excelência do ajustamento aos dados da equação

realmente considerada.
8.3.7 - COVARIÂNCIA E CORRELAÇÃO
A covariância de duas variáveis é uma medida numérica da associação linear existente entre X
e Y. Se for admitida uma relação linear entre duas variáveis, tem-se:
r=
∑ xy (8.17)
( ∑ x )( ∑ y
2 2
)
em que x=X-X e y=Y-Y.
Esta fórmula é denominada co-variância e indica claramente a simetria entre X e Y. Se se

escrever:
sxy =
∑xy ; sx =
∑x 2
; sy =
∑y 2
(8.18)
N N N
Onde:
sx e sy são reconhecidos como desvios padrão corrigidos das variáveis X e Y,
respectivamente
sx2 e sy2 são suas variânçias
sxy é a co-variância de X e Y.

Pode-se escrever sob a forma:
sxy
r= (8.19)
sx sy
O valor da cov(X, Y) depende da unidade de medida de X e Y. Para obter uma medida

admensional do relacionamento entre duas variáveis X e Y, divide-se a covariância pelos
desvios padrão de X e Y. Obtem-se, então, o coeficiente de correlação entre X e Y:
cov(X, Y)
corr ( X , Y ) = ρ = (8.20)
σxσ y
Exemplo 8.7 – Determinar o coeficiente de correlação linear entre as variáveis X e Y,

apresentadas na tabela abaixo:
X 1 3 4 6 8 9 1 14
Y 1 2 4 4 5 7 8 9
Solução: As operações necessárias ao cálculo podem ser dispostas como na tabela abaixo:
X Y x=X−X y = Y −Y x2 xy y2
1 1 -6 -4 36 24 16
3 2 -4 -3 16 12 9
4 4 -3 -1 9 3 1
6 4 -1 -1 1 1 1
8 5 1 0 1 0 0
9 7 2 2 4 4 4
11 8 4 3 16 12 9
14 9 7 4 49 28 16
∑X=56 ∑Y=40
∑x2=132 ∑xy=84 ∑y2=56
X = 56 8 = 7 Y = 40 8 = 5
r=
∑ xy =
8
= 0,977
( ∑ x )( ∑ y )
2
(
2
132 )( 56 )
Esse valor mostra que há uma correlação muito forte entre as variáveis.
8.4 - INTERPRETAÇÃO DOS COEFICIENTES
Obtida uma reta de regressão, o primeiro passo é verificar o sinal de a (inclinação da reta
estimada). Se for positivo, indica que quanto maior o valor de X, maior o valor de Y; se
negativo, indica que quanto maior o valor de X, menor o de Y. O sinal deve estar de acordo
com a intuição ou com o significado físico entre as variáveis. Matematicamente b representa o

intercepto da reta estimada com o eixo dos y e representa o valor inicial de y para x = 0. São
estimativas de β0 e β1, os coeficientes de regressão já definidos anteriormente.
8.4.1 - INTERVALO DE CONFIANÇA PARA OS PARÂMETROS A E B
Para o estabelecimento de um intervalo de confiança para os parâmetros a e b torna-se

necessário que as seguintes condições sejam satisfeitas:
• que o valor esperado de Y seja igual a A + BX
• que a variância de Y seja constante para todos os valores de X e igual ao valor
desconhecido σ2
• que a distribuição de Y seja normal
• que a amostra seja aleatória.
Satisfeitas estas condições, as variâncias de b e a podem ser obtidas pelas expressões:
σ2b = σ2 / [Σi (xi - X )2] (8.21)
σ2a = σ2 [1/n + Xmed2)/ [Σi (xi - xmed)2] (8.22)
Assim, os intervalos de confiança de 100(1 - α)% para b e a são:
 
Sy / x
b ± t α / 2;n − 2  

( )
2 
Σn x − x 
 i =1 i 
 2 
a ± t α / 2;n − 2Sy / x 1+ X 
 n
( )
2 
Σin=1 x i + X 
 
Sy/x compreende uma estimativa da variabilidade em torno da reta e pode ser calculado por
intermédio de uma das seguintes expressões:
S x/ y = (Σ ( y
i i )
− Y$i / (n − 2) )
1
S y2/ x = Σy i2 − a( Σy i ) − b( Σx i y i )
n−2
8.4.2 - INTERVALO DE PREVISÃO PARA UMA OBSERVAÇÃO FUTURA
Supondo que se pretenda fazer uma previsão da capacidade de um aeroporto e que a mesma
deva ser suficiente para os próximos cinco anos. Esta previsão pode ser conseguida através do
levantamento do movimento atual e passado. Em função dos dados passados, pode-se
determinar uma reta de regressão, que se ajusta aos mesmos, e através desta reta, estimar por
ponto (o ponto da reta) ou numa estimativa por intervalo. A probabilidade de (1-α) de que
uma observação futura Y correspondente a um valor X0 esteja dentro do intervalo é:


( )

2
1  X0 − X 
Y ± t α / 2;n − 2Sy / x 1+ +
 i (
n  Σ x − X 2 
)
O erro εi é uma variável aleatória sobre a qual podem ser feitas as seguintes suposições:
• E (εi ) = 0, isto é, os erros se dispõem indiferentemente de um lado ou de outro da reta,

levando a uma média igual a zero;
• var (εi ) = σ2 (variância populacional), ou seja, todos os erros têm a mesma variabilidade.
A variável resposta y, sendo função de ε, é também uma variável aleatória. Assim:
E(x/y) = a x + b
var(x/y) = σ2
Isto é, para cada valor de x existe uma distribuição de valores de y, e não um valor único.
Todas as distribuições têm a mesma variância σ2 e suas médias estão sobre a reta de regressão
a x + b, ainda desconhecida, e cujos parâmetros se quer determinar (Figura 8.2).
0 X
Figura 8.2 - Relação entre as distribuições e as retas de regressão
8.5 - TEORIA AMOSTRAL DA CORRELAÇÃO
Pode-se supor que os N pares de valores (X, Y) de duas variáveis constituem uma amostra da
população de todos os pares possíveis. Esta população é denominada bidimensional pois
existe duas variáveis implicadas, e admite-se que ela apresente uma distribuição normal
bidimensional. Assim, admite-se um coeficiente de correlação de uma população teórica,
representado por "ρ", e é avaliado a partir do coeficiente de correlação amostral "r". O
conhecimento da distribuição amostral de r, permite o estudo através dos testes de
significância ou hipóteses concernentes a vários valores de ρ:

• Para ρ= 0, esta distribuição é simétrica e se utiliza uma estatística que envolve uma
distribuição de Student.
• Para ρ ≠ 0, a distribuição é assimétrica e se utiliza uma distribuição devida a Fisher, que
produz uma estatística com distribuição aproximadamente normal.
8.5.1 - TESTE DE HIPÓTESE
• Teste de Hipótese ρ = 0
A estatística t, que tem distribuição de Student com N-2 graus de liberdade, é:
r n−2
t= (8.23)
1− r2
• Teste de Hipótese ρ = ρ0 ≠ o
A estatística Z, que tem distribuição aproximadamente normal, é:
1  1+ r   1+ r 
Z = log e   = 1,1513 × log10   (8.24)
2  1− r   1− r 
onde e = 2,71828
A média e o desvio padrão são dados por:
1  1 + ρ0   1 + ρ0 
µz = log e   = 1,1513 × log 10  
2  1 − ρ0   1 − ρ0 
1
σz =
N−3
então ,
(Z − µ z )
z=
σz
Exemplo 8.8 – Um coeficiente de correlação baseado em uma amostra de tamanho 18, foi
calculado como sendo 0,32. Pode-se concluir, nos níveis de significância a)
0,05 e b) 0,01, que o coeficiente de correlação correspondente à população é
diferente de zero?
Solução:
As hipóteses são:
H0 : ρ = 0
H1 : ρ > 0

r n−2 0,32 18 − 2
t= = = 1,35
1− r 2
1 − ( 0,32 ) 2
a) Com base no teste unilateral da distribuição de Student no nível 0,05, rejeitar-se-ia H0

quando t > t0,95 = 1,75 para (18-2) = 16 graus de liberdade. Portanto, pelo resultado obtido não
se pode rejeitar H0 no nível 0,05.
b) Como não se pode rejeitar H0 no nível 0,05, certamente não se pode rejeitá-lo no nível 0,01.
Exemplo 8.9 – Um coeficiente de correlação, baseado em uma amostra de tamanho 24, foi
calculado como r = 0,75. Pode-se rejeitar a hipótese do coeficiente de
correlação da população ser tão pequeno quanto a) ρ = 0,60 e b) ρ = 0,50, no
nível de significância 0,05?
Solução:
 1 + 0, 75 
Z = 1,1513 × log   = 0,9730
 1 − 0, 75 
 1 + 0, 60 
µ z = 1,1513 × log   = 0, 6932
 1 − 0, 60 
1 1
a) σz = = = 0, 2182
N−3 21
então,
(Z − µ z ) (0,9730 − 0, 6932)
z= = = 1, 28
σz 0, 2182
No nível de significância 0,05, mediante o emprego de um teste unilateral da distribuição

normal, rejeitar-se-ia a hipótese somente quando z fosse maior do que 1,64. Dessa forma não
se pode rejeitar a hipótese de que o coeficiente de correlação populacional seja tão pequeno
quanto 0,60.
b) Para ρ = 0,50, µz= 1,1513 log3. = 0,5493 e z = (0,9730-0,5493)/0,2182 = 1,94. Então,

pode-se rejeitar a hipótese de que o coeficiente de correlação populacional seja tão pequeno
quanto ρ = 0,50, no nível de significância 0,05.
8.5.2 - DIFERENÇA ENTRE COEFICIENTES DE CORRELAÇÃO
Para determinar se dois coeficientes de correlação r1 e r2 , tirados de amostras de tamanhos N1

e N2 diferem entre si, calculam-se Z1 e Z2, correspondentes a r1 e r2, através da Equação 8.24.
A estatística usada possui distribuição normal, sendo:

Z 1 − Z 2 − µ Z 1− Z 2
z= (8.25)
σ Z 1− Z 2
Em que:
1 1
µ z 1− z 2 = µ z1 − µ z 2 e σ z1-z2 = σ z1 2 + σ z 2 2 = +
N1 − 3 N 2 − 3
Exemplo 8.10 – Dois coeficientes de correlação, obtidos de amostras de tamanhos N1 = 28 e

N2 = 35, foram calculados como r1 = 0,50 e r2 = 0,30, respectivamente.
Haverá uma diferença significativa entre os dois coeficientes, no nível 0,05?
Solução:
 1 + r1   1 + r2 
Z1 = 1,1513 × log   = 0,5493 e Z2 = 1,1513 × log   =0,3095
 1 − r1   1 − r2 
1 1
σz1-z2 = + =0,2669
N1 − 3 N 2 − 3
Deseja-se decidir entre as hipóteses H0 :µ z1 =µ z2 e H1:µ z1 ≠ µ z2
Para a hipótese H 0 :
Z1 − Z2 − (µ z1 − µ z2 ) 0,5493 − 0,3095 − 0
z= = = 0,8985
σz1 − σ z2 0, 2669
Por meio de um teste bilateral da distribuição normal, rejeitar-se-ia H0 somente quando

z > 1,96 ou z < -1,96. Portanto, não se pode rejeitar H0 e conclui-se que os resultados não são
diferentes, de modo significativo, no nível 0,05.
8.6 - CORRELAÇÃO E CAUSALIDADE
O relacionamento causal entre 2 grandezas não implica na tendência simultânea de variação

das mesmas no mesmo sentido. Por exemplo, o número mensal X de contratações de
operários e o número mensal Y de obras civis, para várias cidades de grande porte, os dados
provavelmente indicarão uma correlação positiva. É a flutuação de uma terceira variável
(população da cidade) que faz com que X e Y variem no mesmo sentido, embora X e Y
possam ser não-correlacionadas ou até mesmo correlacionadas negativamente.
A terceira variável, que no exemplo, causa a correlação observada entre obras civis e
contratações de operários é chamada variável intercorrente (não conhecida) e a falsa
correlação que ela origina é chamada correlação empírica. Por isto, ao utilizar um coeficiente

de correlação como medida de relacionamento, deve-se verificar a possibilidade de uma

variável intercorrente estar afetando qualquer das variáveis em estudo. Esta verificação é feita
intuitivamente ou por regressão múltipla.
8.7 - TESTE DE CORRELACIONAMENTO
Em uma amostra bivariada, é possível determinar se duas variáveis aleatórias são realmente
correlacionadas ou não. Quando a população segue o modelo bivariado normal, dispõe-se de
um teste bastante simples para a hipótese nula H0 : ρ = 0 que equivale à independência das
duas variáveis. A estatística de teste é:
r n−2
t= (8.26)
1− r
Esta estatística t tem distribuição de Student com n-2 graus de liberdade; n é o tamanho da
amostra e r é o coeficiente de correlação amostrado.
Para uma alternativa bilateral H1: ρ # 0, a hipótese nula é rejeitada se o valor observado da
r n−2
estatística é maior do que tα/2 ou | |≥ t α 2
1− r2
Exemplo 8.11 – Um antropólogo mediu a largura e o comprimento de 27 crânios obtendo um

coeficiente de correlação amostral r = 0,82. Admitindo os dados extraídos de
uma população normal bivariada, testar H: ρ = 0 contra H: ρ = 0 ao nível de
0,05.
Solução:
n = 27 r = 0,82 α/2 = 0,025
0,82 25
t= = 7,16
1 − (0,82) 2
t(25; 0,025) = 2,060
Como 7,16 >> 2,060, rejeitamos H0 ao nível de 5% e concluímos que existe

correlacionamento entre as variáveis.
8.8 - CORRELAÇÃO MÚLTIPLA
Denomina-se correlação múltipla ao grau de relação existente entre três ou mais variáveis. Os
princípios fundamentais aplicados em correlação múltipla são análogos aos da correlação
simples onde para se obter generalizações relativas a grande número de variáveis é
conveniente uma notação que expressa símbolos. Representa-se por X1 , X2 , X3 ,..., os valores
assumidos pela variável X1 e por X21, X22, X23, ..., os assumidos pela variável X2, e assim por

diante. Então, uma soma como X21+X22+X23,...,X2n seria escrita sob as formas
n
∑X
i =1
2j , ∑X j
2j ou, simplesmente, ∑X 2 . Neste caso, a média de X2 será expressa por:
X2 =
∑X 2
8.8.1 - O COEFICIENTE DE CORRELAÇÃO MÚLTIPLA
É definido para 2 variáveis independentes, como:
2
s1,23
R 1,23 = 1- (8.27)
s12
Onde:
R21,23 é o coeficiente de determinação múltipla;
s1 é o desvio padrão da variável X1;
s1,23 é o erro padrão da estimativa de X1 e dado pela expressão;
S1,23 =
∑ (X 1 − X)
ˆ 2
(8.28)
n
Sendo que X$ indica os valores estimados de X1 e calculados por equações de regressão.
Quando for usada uma equação de regressão linear aquela quantidade será denominada
coeficiente de correlação linear. Em função de r12, r13, r23, pode-se escrever também:
r122 + r132 − 2r12 r13 r23

R 1,23 = (8.29)
1 − r232
Um coeficiente de correlação múltipla, como R1,23, está compreendido entre 0 e 1. Quanto

mais próximo de 1, mais bem definida será a relação linear entre as variáveis. Quanto mais
próximo de 0, menos acentuada ela será. Se o coeficiente de correlação múltipla for igual a 1,
a correlação é denominada perfeita. Embora um coeficiente de correlação nulo indique que
não há nenhuma relação linear entre as variáveis, é possível que haja uma não-linear.
8.9 - CORRELAÇÃO PARCIAL
É a correlação entre uma variável dependente e uma independente partícular quando todas as
outras implicadas se conservam constantes, ou seja, quando se removem os efeitos de todas as
outras variáveis. O coeficiente de correlação parcial é definido através da Equação 8.30, com a
consideração das variações explicadas e não-explicadas que surgem, tanto com a variável
independente como sem ela. Assim, representando-se por r12,3 o coeficiente de correlação
parcial entre X1 e X2 , quando X2 é constante, tem-se:

r12 − r13 r23

r12,3 = (8.30)
(1 − r132 )(1 − r232 )
De modo semelhante, se r12,34 é o coeficiente de correlação parcial entre X1 e X2 conservando-

se X3 e x4 constantes, então:
r12,4 − r13,4 r23,4 r12,3 − r14,2 r24,3

r12,34 = = (8.31)
(1 − r 2
13,4 )(1 − e 2
23,4 ) (1 − r14,3
2
)(1 − r24,3
2
)
Estes resultados mostram que qualquer coeficiente de correlação parcial pode ser tomado em
termos dos valores dos coeficientes de correlação de ordem zero, r12, r23 etc.
O caso de duas variáveis x e y, quando as duas retas de regressão têm equações Y = a0+a1X e
X=b0+b1Y, viu-se que r2 = a1b1. Este resultado pode ser generalizado. Assim, as equações de
regressão linear de X1 para X2, X3, X4 e de X4 para X1, X2 e X3, são:
X1 = b1,234+b12,34X2+b13,24X3+b14,23X4 (8.32)
X2 = b4,123+b41,23X1+b42,13X2+b43,12X3
(8.33)
E, então:
r214,23 = a14,23b41,23
Os resultados acima, referentes à regressão múltipla linear, podem ser estendidos à não-linear.
Podem, então, ser definidos coeficientes de correlação múltipla e parcial por meio de métodos
semelhantes aos expostos acima.

9 - MÉTODOS DE CÁLCULOS PROBABILÍSTICOS
Métodos probabilísticos são aqueles que permitem a avaliação da distribuição de

probabilidade de uma variável dependente em função do conhecimento das distribuições
estatísticas das variáveis independentes que geram a variável dependente. Existem hoje três
métodos bastante utilizados na estatística aplicada que são:
• Método de Monte Carlo

• Método FOSM (índice de confiabilidade)
• Método dos Pontos de Estimativa (Rosenblueth)
9.1 - MÉTODO DE MONTE CARLO
As primeiras considerações sobre o Método de Monte Carlo serão feitas a partir do exemplo
abaixo.
Exemplo 9.1:
• Na figura abaixo, w representa a abertura de uma peneira de arame (abertura

quadrada). O fio do arame é esférico e possui diâmetro D. Determinar a probabilidade
da partícula esférica de diâmetro d ficar retida na malha da peneira.
a b
d
A B
w D
E C
e c
w
Solução:
Os possíveis resultados podem ser relatados a partir da localização do centro da esfera relativo
à malha. Pode ser considerado somente um quadrado, desde que todos os quadrados presentes
sejam similares. A probabilidade da esfera acertar a malha pode ser medida pela probabilidade
do centro da esfera se encontrar fora do limite ABCE. Os resultados possíveis são medidos
pela área do quadrado abce, sendo igual a (w + D)2. Então, assumindo que as esferas se
encontrem uniformemente sobre a área abce, a região favorável é medida pela área do
quadrado ABCE e o quadrado abce, ou seja, (w + D)2 - (w - d)2. A probabilidade requerida é:

 ( w − d)   (w − d) 
2 2
P[esfera _ ficar _ retida ] = 1−   P[esfera _ passar] = 

( w + D)   ( w + D) 
Estes resultados fornecem algumas indicações sobre o que acontece no processo de

peneiramento. Assumindo que não há interferência entre as partículas, numa malha de #200,
com w = 0,074 mm, D = 0,021 mm, a partícula com o diâmetro 90% da abertura d = 0,067
mm tem a probabilidade de 0,9915 de ficar retida na malha sob condições fixas. Se a peneira é
movimentada através de N ciclos, a probabilidade da partícula ficar retida após estes N ciclos
será de (0,9915)N. Para calcular o número de ciclos N necessário para haver o peneiramento,
considerando uma probabilidade da partícula passar na peneira de 90% (que significa uma
probabilidade dela ficar retida de 0,10), tem-se que:
(0,9915)N = 0,10
N = 270 ciclos ─ uma tarefa dificilmente realizada de forma manual
Na seqüência para entender a metodologia de Monte Carlo será apresentado a seguir o cálculo
do valor numérico da integral da função limitada por 0 ≤ f(x) ≤ c, a ≤ x ≤ b.
b
∫a
f (x)dx (9.1)
Considerando o retângulo com a área (b - a)c, apresentado na Figura 9.1(a), e plotado nos
limites da integral f(x). O valor da integral seria a área (região hachurada) limitada pela curva
f(x) no intervalo [a, b]. Arremessando dardos (ou esferas) aleatoriamente na direção do
retângulo, esta a integral poderia ser assim estimada:
NH
I ≈ c(b − a) (9.2)
N
Onde:
NH = dardos que atingiram a região hachurada
NM = dardos que não atingiram a região
N = NH + NM
p = NH / N (probabilidade dos acertos)
c c
f(x) r2 f(x)
f(r1)
0 a b x 0 a r1 b x
(a) (b)
Figura 9.1 - Método de integração de Monte Carlo

No lugar dos dardos poderia se pensar em dois grandes grupos de números aleatórios
uniformemente distribuídos r1 e r2, com a ≤ r1 ≤ b e 0 ≤ r2 ≤ c. Na Figura 9.1(b) tem-se r2 >
f(r1) constituindo a área fora do alvo, e r2 < f(r1) a região do alvo. Repetindo este processo
para um grande número de pares de números aleatórios, a integral pode ser estimada pela
Equação 9.2.
A metodologia descrita acima é denominada metodologia de Monte Carlo do "acerto ou erro".

A geração de números aleatórios uniformes é essencial para a metodologia de Monte Carlo,
que atualmente se baseia em procedimentos determinísticos dada por uma relação de
recorrência:
xN = AxN-1 _ ( mod_M ) (9.3)
onde M e A são números inteiros positivos.
M é geralmente uma potência de 2 ou 10, com A escolhido próximo de 2Z/2. A notação x = y

(mod M) significa que x é o resto da divisão do número y após a divisão por M. Por exemplo,
152 (mod 100) = 52. Com efeito, um valor inicial para x0 é selecionado, que é então
multiplicado por A e operado pelo produto mod M e x1. Este processo é repetido para
produzir uma seqüência de números aleatórios uniformes (pseudo-aleatórios).
Exemplo 9.2:
• Encontrar a seqüência gerada pela Equação 9.3, com A = 13, x0 = 1 e M = 100.
Solução:
O resultado desta seqüência é 1, 13, 69, 97, 61, 93, 9, 17, 21, 73, 49, 37, 81, 53, 89, 57, 41, 33,
29, 77 etc., seqüência que vai se repetindo. Os números são uniformemente distribuídos entre
0 e 99.
A faixa da distribuição uniforme aleatória se encontra entre [0, 1], Ru (0, 1), que pode ser
estendida para a faixa [a, b] por transformação:
R u . ( a.,.b ) .=. ( b.-.a ) .R u . ( 0.,.1) .+.a (9.4)
Exemplo 9.3:
• Dados os valores da variação uniforme aleatória Ru (0, 1) = 0,31 na faixa [0, 1], obter
os correspondentes valores aleatórios para a faixa [3; 6,5].
Solução:
Ru (3, 6,5) = (6,5 - 3) (0,31) + 3 = 4,09

Convém ressaltar que a maioria das técnicas para geração de valores de distribuição faz uso de
função de distribuição de função acumulada, F(r) = P[x ≤ r]. Por definição a função
acumulada para qualquer variável contínua é distribuída uniformemente no intervalo [0, 1].
Conseqüentemente, se o valor aleatório Ru (0, 1) é gerado, o valor de x = r que satisfaz F(r) =
Ru (0, 1) seria um valor aleatório da função de distribuição de probabilidade f(x) dentro de
F(r). O procedimento é ilustrado na Figura 9.2. O primeiro passo é a geração do valor
aleatório Ru (0, 1); o segundo passo é a formação de Ru (0, 1) = F(r) e o terceiro passo é a
determinação de x = r correspondente à especificada distribuição de probabilidade F(r).
f(x)
1,0
0,8
1 2
F(r) = P[x < ρ]

0.6
0,4
0,2
3
0
0 x x=r
x
(a) (b)
Figura 9.2 - Procedimento para obtenção de números aleatórios através de distribuição
Exemplo 9.4:
• Calcular os valores aleatórios correspondentes a dois parâmetros exponenciais da

função de probabilidade f(x) = 2,35exp[-2,35 (x -1,06)], 1,06 ≤ x ≤ 8, sendo dado o
valor aleatório Ru = (0, 1) = 0,6403.
Solução:
F(r) = ∫1,06x 2,35 e -2,35(X - 1,06) dx = - e -2,35(X - 1,06)
Conseqüentemente
x = -1 / 2,25 ln [1 - F(r)] + 1,06
F(r) = Ru = (0,1) = 0,6403
O valor aleatório de x para a distribuição exponencial dada é:
x = -1 / 2,25 ln [1 - 0,6403] + 1,06 = 1,50
A maior aplicação da técnica de Monte Carlo está na aproximação da função de probabilidade

para uma ou mais variáveis aleatórias. É desnecessário dizer que a simulação de Monte Carlo
requer uma velocidade alta para os cálculos, para a geração de uma larga faixa de números.
Para investigar o número de Monte Carlo são necessárias várias tentativas, que conduzem ao

êxito dentro de um nível específico de confiança. Cada tentativa é o resultado de um

experimento com a probabilidade de sucesso R e a probabilidade de insucesso 1 - R, sendo
todas as tentativas independentes. Por conseguinte, as tentativas geram uma distribuição
binomial. Para N tentativas, onde N é amplo, pode ser usada a aproximação normal para a
distribuição binomial com valor esperado de NR e desvio padrão de NR (1 − R ) .
O número x é definido como o número de sucesso das N tentativas (se a simulação de Monte
Carlo for correta), tendo uma distribuição normal. O símbolo xα~ / 2 representa o número das
N tentativas, de forma que a probabilidade de ter valores menores não serão maiores do que
~ / 2 Conseqüentemente tem-se que:
α
~
1 α  x − xα~ / 2   NR − x ~ 
 = Ψ 
α /2
− = Ψ
2 2  σ [ x ]  
 NR ( 1 − R ) 
Após alguns algebrismos tem-se:
R (1 − R ) hα~2 / 2
N= (9.5)
ε2
~ / 2 ) – veja Tabela 9.1 – e

onde hα~ / 2 = Ψ −1 (1 / 2 − α ε = R − ( xα~ / 2 / N ) .Nesta
expressão, ε é o máximo erro permissível na estimativa de R. O que se tem é que R(1 – R) é
máximo quando R = 1/2. Desde já, conservativamente, nós temos com R(1 – R) = 1/4:
hα~2 / 2
N= 2 (9.6)
4ε
Tabela 9.1 – Coeficientes de confiância para a

distribuição normal.
Nível de Confiância (%)
(1− α% ) hα% / 2
90 1,64
95 1,96
95,45 2,00
98 2,33
99 2,58
99,5 2,81
99,73 3,00
99,9 3,29
99,99 3,89
99,994 4,00

Quando se pretende uma simulação de Monte Carlo que não difere de mais do que 1% do
valor estimado (ε = 0,01), ou seja com 99 % de confiança:
~ ) = 0,99
(1 - α
hα~ / 2 = 2 ,58
N = (2,58)2 / 4 (0,01)2 = 16.641 tentativas
Se fosse utilizado este método para mais do que uma variável aleatória, quantas simulações
seriam necessárias? Sendo dadas duas variáveis aleatórias, com uma constante, a Equação 9.6
seria válida. Para cada simulação de Monte Carlo e para cada variável se tem N tentativas.
Conseqüentemente para duas variáveis com α ~ constante:
2
 hα2% / 2 
N = 2 
 4ε 
O mesmo para m variáveis fornece:
m
 hα~2 / 2 
N = 2 (9.7)
 4ε 
Exemplo 9.5:
• É dado que a aceleração de uma partícula a é uma variável normal com E[a] = 1,00 e
σ[a] = 0,4. A massa M da partícula varia uniformemente entre 0 e 4 (E[M] = 2,0 e
σ[M] = 1,155). Assumindo unidades compatíveis, obter o valor esperado e desvio
padrão da força gerada, F = Ma, usando a metodologia de Monte Carlo.
Solução:
Este problema foi resolvido usando geração de números aleatórios.
Número de tentativas E[F] σ[f] V(F) (%)

500 2,54 2,05 80,8
1000 2,47 2,06 83,5
10000 2,44 2,01 82,3
100000 2,43 2,01 83,3
1000000 2,42 2,03 83,9
O método de Monte Carlo pode ser apresentado como um método exato, pois a partir do
conhecimento das distribuições estatísticas das variáveis independentes, valores destas
variáveis poderiam ser obtidos através de um gerador de números aleatórios e valores da
variável independente serem calculados. Pode-se dizer que quando este processo fosse

repetido N vezes, a distribuição de probabilidade (forma e magnitude) da variável

independente seria obtida, para (1-α)% de confiança. A partir desta distribuição, seus
parâmetros estatísticos tais como média, variância, probabilidades acumuladas etc. poderiam
ser calculados.
9.2 - SÉRIE DE TAYLOR
A Série de Taylor corresponde à segunda categoria dos métodos probabilísticos desenvolvidos

para determinação da distribuição de probabilidade de uma função com um número de
variáveis aleatórias, e é denominada método FOSM ("First-order, second moment").
O truncamento da função de expansão da Série de Taylor forma a base destes métodos. As

saídas e entradas de dados são expressas por valores esperados e desvios-padrão. As
vantagens deste tipo de solução são cálculos matemáticos simplificados e o conhecimento
apenas dos valores dos momentos das distribuições estatísticas das variáveis que formam a
função. As desvantagens são que os requisitos matemáticos necessários às derivações, embora
mais simples que de outros métodos exatos, geralmente não são elementares.
Exemplo 9.6:
• A viga em balanço da figura abaixo contém 2 forças concentradas com valores

esperados, como mostrado:
─ Se seus coeficientes de variação são 10%, encontrar o significado da média e

desvio-padrão do momento de curvatura para o ponto A;
─ A capacidade do momento resistente do balanço tem uma variação normal, MR
= N (600, 100);
Qual a probabilidade da viga se romper (assumir que os momentos são independentes)?
Solução:
Escrevendo o momento do balanço para A, com E(L1) = 100 e E(L2) = 80, σ(L1) = 10 e σ(L2)
= 8:
MA = 10L1 - 8L2
Da equação de uma distribuição bivariada:
E[a + bx +cy] = a + bE(x) + cE(y)
E[MA] = 10E[L1] - 8E[L2] = 360 t.m
V[MA] =100V[L1] + 64V[L2] = 14,096 (t.m)2

10 m 100 t
8m 80 t
Conhecendo somente o significado do desvio-padrão do momento do balanço para o ponto A,

toma-se MA = N(360, 118). Usando a equação dos momentos, tem-se:
MR − MA = ( 600 − 360, ( 118) 2 + (100) 2 )

A probabilidade de ruptura ou p[ MA ≥ MR] = p[ MR − MA ≤ 0] é
p(f) =
1
−Ψ
(
C−D )
2 σ ( C − D)
1 ( 240)
p( f ) = −Ψ = 0,011
2 σ ( 155)
Sua confiabilidade é 98,9%. O principal fator de segurança é 1,67.
A fórmula de Taylor para a expansão da função f(x) sobre o ponto
x = x, é
()
f" x f ( N −1) x
( )( ) ( ) ( )
2 N −1
f(x)=f x x − x + x − x + ..... + x− x + RN (9.8)
2! (N −1)
()
onde f (m) x é o m(ésimo) derivado avaliado para x=x e RN é o resto (o qual pode ou não ser zero)
O caso especial com x = 0 é a Série de Maclaurin.
Truncando a série na Equação 9.8 depois do termo quadrado (aproximação de 2a ordem), e

trocando o valor esperado de ambos os lados nos termos, com:

E ( x ) = x,

() ( )(
E[ f ( x) ] = E f x + f ' x x − x +
f" x
) 2
 ( )(
x − x  , que produz )
 2 
()
E[ f ( x) ] = f x +
f" x( ) V ( x) (9.9)
2
De modo similar, a aproximação de 2a ordem produz para a variância:
[ ( )] V ( x) + 14 [ f "( x)] V
V [ f ( x)] = f ' x ( x ) [ β ( 2) − 1] + β ( 1)σ 3 ( x )[ f ' ( x ) ][ f "( x ) ] (9.10)
2 2
2
onde β1 e β2 são coeficientes assimétricos.
Se f(x) é simétrica β1 = 0, e a Equação 9.8 se reduz a:
()
E [ f ( x )] = f x +
f" x( ) V (x) (9.11)
2

()
V[ f ( x ) ] =  f ' x V ( x ) +

2 1
4 [ () 
f " x V 2 ( x ) [ β ( 2 ) − 1] 
2
 ]
Para a distribuição Normal β(2) = 3 e adequando a Equação 9.11:
( ) V (x)
()
f" x
E [ f ( x )] = f x + (9.12)
2
[ ( )] V ( x ) + 21 [ f "( x ) V
V[ f(x) ] = f ' x ]
2
2 2
(x)
Usando a Equação 9.11, conservando somente os termos lineares, pode-se escrever:
()
E [ f ( x )] = f x (9.13)
9.2.1 - SÉRIE DE TAYLOR MULTIDIMENSIONAL
A expansão da Série de Taylor de uma função de 2 variáveis F(x, y) nos pontos x, y,

conservando somente termos de 1a ordem (lineares), produz:
∂F ∂F
( )
F (x, y) = F x, y +
∂x
(
x−x +
∂y
y−y) ( ) (9.14)
onde todas as derivadas são estimadas para x = x e y = y.

Tomando x e y para ser os respectivos valores esperados das variáveis e aplicando o

formulário para distribuições bivariadas, tem-se as aproximações:
( )
E  F ( x, y )  = F x, y
2
∂ F  ∂ F   ∂ F  ∂ F 
2
V  F ( x, y )  =   V ( x) +   V ( y) + 2   cov ( x, y ) ______ __ θ _____ ( 9.15 )

∂x ∂y  ∂ x  ∂ y 
onde novamente todos as derivadas são estimadas para os valores esperados das variáveis.
Exemplo 9.7:
• Dado que a aceleração da partícula é uma variação normal com E(α) = 1,00 e σ(α) =
0,4. A massa M da partícula varia uniformemente entre 0 e 4 (E(M) = 2,0 e σ(M) =
1,155). Assumindo unidades compatíveis, obter os valores esperados para desvio-
padrão da força generalizada, F = Mα, usando a Série de Taylor.
Solução:
E(α) = 1,0 E(M) = 2,0

σ(α) = 0,4 σ(M) = 1,155
Substituindo na Equação 9.15 por F = Mα:
E[F] = E[M] E(α) = 2 x 1 = 2,0
Avaliando as derivadas para os seus respectivos valores:
∂F ∂F
| = E (α ) = 1,0 ; | = E ( M ) = 2,0
∂M M ,α ∂α M ,α
cov( M ,α ) = 0
então ,
 ∂F   ∂F 
2 2
V (F ) =   V(M) +  V (α ) = ( 1,0) (1155

, ) + ( 2,0) ( 0,4 ) = 1,97
2 2 2 2
 ∂M   ∂α 
e
σ ( F ) = 1,41
Para N variáveis aleatórias não correlacionadas, F(x1, x2, ....., xN), conservando somente os
termos lineares na Série de Taylor, produz:

E ( F ) = F ( x 1 , x 2 , ....., x N ) (9 .1 6 )
2
N
 ∂F 
V (F )= ∑   V ( xi ) (9 .1 7 )
i= 1  ∂ xi 
o n d e x i = E ( xi )
A função F é avaliada para os pontos médios de todas as variáveis, bem como é a variância de
F. As expressões acima da série de Taylor foram truncadas a partir de seus termos de segunda
ordem, desprezando-se portando os efeitos dos terceiro e quarto momentos probabilísticos. No
entanto, esta aproximação é plenamente aceitável para fins práticos.
Exemplo 9.8:
• Supondo na fórmula de flexão (s = MC/I); E(M) = 10; σ(M) = 1; E(c) = 2; σ(c) = 0;

E(I) = 4; σ(I) = 0,2. Assumindo unidades compatíveis, obter os valores esperados e o
coeficiente de variação para as forças resultantes.
Solução:
Da Equação 9.16 tem-se E(s) = 10 x 2/4. Como c = 1, constante e σ(c) = 0, são formadas e
estimadas as derivadas necessárias para os correspondentes valores esperados:
∂s c 2
= = = 0,5
∂M I 4
∂s M c − 10(2 )
=− 2 = = −1,25 e
∂I I (4 )2
V(s ) = (0,5) (1) + (− 1,25) (0,2 ) = 0,31

2 2 2 2
σ (s ) = 0,56
O coeficiente de variação é:
CV(s) = 0,56 / 5,00 = 0,11 = 11%
Estes resultados são um efeito dos momentos de indução de forças na viga. Cada um deles
representa uma demanda.
Exemplo 9.9:

• Supor que no exemplo anterior a viga foi projetada com fator de segurança central de
1,2, E(capacidade) = 1,2 F(s). Se o coeficiente de variação de capacidade é 20%,
estimar a confiabilidade da viga.
Solução:
Usando a capacidade C e demanda s, vem:
E ( s ) = s = 5,0 ; σ (s) = 0,56 ;

E(C) = c = 1,2(5,0) = 6,0 ; σ (C) = 0,2(6,0) = 1,2
Conhecendo somente os dois primeiros momentos das variáveis, toma-se a distribuição

desconhecida para ser Normal e assume-se que o coeficiente de correlação entre a capacidade
e a demanda é ρ =+0,75. Então, a confiabilidade do sistema será:
 
C−s
R = 1 − p( f ) = + ψ  =
1
 
2
[σ ( s)] 2 + [σ (C )]
2
 − 2σ ( s )σ (C ) ρ 
 
1 6−5  = 1 + ψ (116
= + ψ , ) = 88%
  2
( 0,56) 2 + (1,2) − 2( 0,56)( 1,2)( 0,75) 
2
2

9.2.2 - EQUAÇÃO VETORIAL
Para o caso especial da função ser constituída de produtos de variáveis aleatórias:
( )
G x1 , x 2 ,....., x N = ax1g1 x 2g 2 ........ x NgN (9.18)
onde, ‘a’ e ‘gi’ são constantes (positivas ou negativas).
Substituindo na Equação 9.16, demonstra-se que o coeficiente de variação da função V(G)

(denominado de Equação Vetorial) pode ser obtido da expressão:
( )
V 2 (G ) = g12V 2 ( x1 ) + g 22V 2 x 2 + ......+ g N2 V 2 x N ( ) (9.19)
onde V2(xi) são os quadrados dos coeficientes de variação das variáveis xi.
Combinando-se com a Equação 9.17, o desvio padrão pode ser facilmente obtido.
Exemplo 9.10:
• Repetir o exemplo anterior usando a Equação Vetorial.

Solução:
Da Equação 9.16, tem-se:
E[s] = 10(2)/4 = 5,0
Para s = Mc/I, a Equação 9.19 produz:
1  0,2 
2 2
V ( s ) = V ( M ) + V ( c ) + ( −1) V ( I ) =   + ( 0) +   = 0,0125
2 2 2 2 2 2
 10   4 
V ( s ) = 0,112 = 11%
σ ( s ) = 0,112( 5,0) = 0,56
Este resultado é exatamente igual ao obtido anteriormente.
9.3 - MÉTODO DO ÍNDICE DE CONFIABILIDADE
Este método é uma aplicação direta do método FOSM que tem sido muito aplicado em
Geotecnia, em especial na avaliação estatística do coeficiente de segurança de taludes. Os
procedimentos sugeridos são referenciados a seguir:
• A variância do coeficiente de segurança, V[FS], calculada através da formulação de
primeira ordem e segundo momento (FOSM). O cálculo consiste na obtenção das parcelas
de variância do FS causadas por cada um dos parâmetros (γ, c, φ, piezometria etc.)
envolvidos no cálculo de FS. A avaliação destas parcelas estabelece a importância relativa
de cada um dos parâmetros conduzindo as proposições de projeto;
• O índice de confiabilidade, β, do coeficiente de segurança, é definido pela seguinte
expressão, uma vez que o FS crítico é igual a 1,0:
{E [ FS ] − 1}
β = (9.20)
σ [ FS ]
Onde:
E[FS] é o valor usual (determinístico), do coeficiente de segurança calculado com os
parâmetros médios;
σ[FS] é o desvio-padrão do coeficiente de segurança.
O método relaciona o índice β com a probabilidade de ruptura, o que permite uma avaliação
mais consistente da estabilidade.
A probabilidade de ruptura é dada pela parcela da área sob a curva unitária de distribuição de
freqüência (função densidade de probabilidade) do FS correspondentes a valores de FS
inferiores a 1,0. A Figura 9.4 ilustra as duas situações hipotéticas: distribuição "A", que tem
coeficiente de segurança médio baixo (1,2) e desvio-padrão de FS pequeno (0,1), e
distribuição "B", cujo coeficiente de segurança médio é alto (1,5) e desvio-padrão elevado

(0.5). A probabilidade de ruptura é menor no caso A (área da zona preta) do que B (zona
hachurada), apesar do coeficiente de segurança de B ser bem superior ao de A.
NOTA
A ÁREA SOB AS CURVAS DISTRIBUIÇÃO "A"
É UNITÁRIA
E[FS] = 1,20
4
β=2 P[R]=1;50
σ=[FS]=0,1
FREQUÊNCIA RELATIVA
P[R]
PROBABILIDADE DE FS<1,
2 IGUAL A ESTA ÁREA DISTRIBUIÇÃO "B"
E[FS] = 1,50
β=1 P[R]=1;7
σ[FS]=0,5
1
0 0,5 1 1,5 2 2,5 3
COEFICIENTE DE SEGURANÇA
Figura 9.4- Distribuição de freqüência de FS
A probabilidade de ruptura é expressa por seu inverso, 1/P[R]. Assim, quando se fala em 1:50,
a probabilidade é de 0,02 (ou 1/50). Outra forma de apresentação, é em porcentagem,
multiplicando-se o seu valor por 100, ou seja, a probabilidade 0,02 seria expressa por 2%.
O índice de confiabilidade indica o número de desvios-padrão que distancia a ruptura do

coeficiente de segurança encontrado. O valor de β complementa o valor de FS e permite
estimar a probabilidade de ruptura. Este índice pode ser relacionado com a probabilidade de
ruptura, P[R], desde que se conheça a forma da distribuição de FS. A Figura 9.5 mostra a
relação entre β e P[R], para o caso de distribuição Normal (Gaussiana), do coeficiente de
segurança.
PROBABILIDADE DE RUPTURA, P[R], %
ÍN D IC E D E C O N F IA B IL ID A D E , β
Figura 9.5 - Relação entre β e P[R] para distribuição Normal do coeficiente de segurança

A Figura 9.6 mostra a relação entre FS e P[R] para valores de σ[FS] entre 0,05 e 0,25. O
desvio-padrão reflete a variabilidade dos parâmetros e pode-se observar que, dependendo do
seu valor, uma mesma probabilidade de ruptura pode corresponder a uma ampla gama de
valores de coeficientes de segurança.
P [R ] (% )
COEFICIENTE DE SEGURANÇA
1 /P [R ]
Figura 9.6 - Relação entre P[R] e coeficiente de segurança para diversos valores de desvio-
padrão de FS
Segundo Witman (1984), são quatro os aspectos que devem ser avaliados relativos à incerteza
quanto aos parâmetros (γ, c, φ, piezometria. etc.):
• Erro estatístico devido à quantidade insuficiente de ensaios, de medições

piezométricas etc. Sabe-se que quanto menor o número de ensaios, maior é a
probabilidade de produzir estimativas de parâmetros diferentes daqueles presentes no
campo. Muitos autores apresentam indicações visando minimizar esta condição. Sayão &
Sandroni (1992), citam Lumb (1974) e Lee et al. (1983). No exemplo de aplicação do
método utilizou-se 50 amostras, concluindo que foram suficientes para a obtenção de
estatísticas confiáveis.
• Dados tendenciosos (Bias), que são aspectos do comportamento real persistentemente

alterados pelos ensaios, resultados de instrumentação etc. Cita-se como exemplos destes
fatores: amolgamento das amostras, diferenças de tipo de solicitação nos ensaios e no
campo, diferenças na velocidade de carregamento nos ensaios e no campo etc. Um caso
importante a ser observado é o das curvas tensão-deslocamento dos ensaios de
cisalhamento direto, que exibem uma significativa perda de resistência após o pico, com a
possibilidade de ruptura progressiva. A avaliação dos valores médios de "c" e φ através dos
pontos de pico dos ensaios introduz um desvio (bias), para mais, em relação à resistência
que pode ser mobilizada no campo. O tratamento estatístico não tem a capacidade de
compensar esta diferença, que é contra a segurança, sendo necessário, portanto, a utilização
dos pontos dos ensaios correspondentes à situação pós-pico.
• Erros de ensaio (ruídos), são aqueles associados à precisão de calibrações e medições, à

acuidade das leituras etc. A minimização destes erros é obtida através da correta

especificação, qualificação de equipes e equipamentos, acompanhamentos dos ensaios e

medições;
• Variabilidade espacial (“natural” ou “inerente”) dos parâmetros, que é a diferença real

de características comportamentais devida a diferenças de composição, intemperismo e
história de tensões entre um ponto e outro.
Os dois primeiros aspectos analisados contribuem para o que se denomina “erro sistemático”,
que atua independente da posição ou do tamanho da superfície de ruptura, afeta
principalmente a média. Aqui, o aumento do número de ensaios (para diminuir o “erro
estatístico”) deve-se aliar à experiência do engenheiro (para compensar as “bias”). Os dois
últimos aspectos contribuem principalmente para a “dispersão” dos dados. As dispersões
espacial e de ruído dos parâmetros não ocorrem em todos os pontos da superfície de ruptura,
sendo que quanto maior o comprimento da superfície, maior a redução da parcela espacial da
variância. Tang & Baecher (1994), apresentam técnicas para a redução da parte da variância
de FS devida à variância espacial dos parâmetros. A aplicação do método na prática resulta
em valores de β menores, portanto com probabilidades de ruptura maiores, do que aqueles
obtidos incluindo reduções na componente espacial da variância de FS. Deve-se ressaltar,
entretanto, que esta diferença no valor de β é tanto maior quanto mais longa for a superfície de
ruptura.
A relação entre β e a probabilidade de ruptura apresentada na Figura 9.6 é aplicada para o

caso em que o FS tem distribuição normal. Entretanto, para valores de β menores que 2,5, a
relação entre β e P[R] é praticamente a mesma, e para valores maiores que 2,5, a relação
difere daquela mostrada na Figura 9.6. Por outro lado, qualquer que seja a distribuição do FS,
a probabilidade de ruptura se relaciona monotonicamente com β, de modo que, quanto maior
o valor de β, menor a possibilidade de ruptura. Assim, pode-se admitir que a distribuição de
freqüência do coeficiente de segurança é normal.
No exemplo apresentado por Sandroni & Sayão (1992), como o material do talude é arenoso,
a poropressão em qualquer ponto é obtida em função de sua distância à linha freática,
desprezando-se qualquer componente de excesso de poropressão gerada durante o
cisalhamento. Então, a poropressão em qualquer ponto se relaciona univocamente com a
geometria da linha freática, que por sua vez, foi simulada por dois trechos retos e definida por
sua cota superior.
O valor de β foi determinado apenas para a superfície de ruptura obtida com os parâmetros
geotécnicos médios. Esta não é necessariamente a superfície crítica de ruptura que poderia ser
obtida com parâmetros mais desfavoráveis, gerando FS menores. O que ocorre com o valor de
β não se pode dizer a priori.
Quando não se dispõe de um número suficiente de ensaios pode-se, em caracter preliminar,

utilizar coeficientes de variação estimados (desvios-padrão sobre a média), a partir de valores
típicos. A Tabela 9.1 mostra faixas de coeficientes de variação dos parâmetros geotécnicos de
interesse para análises de estabilidade de taludes.

Tabela 9.2 – Valores típicos do coeficiente de variação.

Parâmetro Coeficiente de Variação
Peso específico 03 (02 a 08)
Coesão 40 (20 a 80)
Ângulo efetivo de resistência 10 (04 a 20)
Coesão não-drenada 30 (20 a 50)
Exemplo 9.11:
• A avaliação estatística das análises de estabilidade de um talude de mineração com

200 m de altura e inclinação de 34o cuja configuração é mostrada na figura abaixo. O
lençol freático é representado por dois trechos retos: um inclinado se estendendo do pé
do talude até um ponto verticalmente abaixo da crista e outro, horizontal, a partir deste
ponto. A quota do trecho horizontal é fixada através de observações com piezômetros
e se situa 80 m abaixo da crista do talude.
Numa primeira etapa do estudo foi feita uma análise de estabilidade convencional
(determinística) com a fixação dos parâmetros geotécnicos médios (tabela abaixo), a busca da
superfície crítica de ruptura e a conseqüente obtenção do coeficiente de segurança médio,
E[FS}. Para o exemplo citado, obteve-se E[FS] = 1,341.
80+20m
34
200 m
SOLO SAPROLÍTICO DE
QUARTZITO FERRÍFERO
γ nat = 28,3+1,4 kN/m3
γ sat = 29,0+1,4 kN/m3
C = 25+24 kPa
tanφ = 0,781+0,085
SUPERFICIE CRÍTICA
E[FS] = 1,34
σ[FS] = 0,161
β = 2,12 P[R] = 1:60
Em seguida são efetuados os procedimentos para avaliação estatística do coeficiente de

segurança. Alguns símbolos são utilizados:
E[x] é a média de x
σ[x] é o desvio padrão de x
V[x] é a variância de x, igual ao quadrado de σ[x]
CV[x] é o coeficiente de variação de x, igual a σ[x] / E[x]
FS é o coeficiente de segurança
β é o índice de confiabilidade
P[R] é a probabilidade de ruptura.

O valor da variância do coeficiente de segurança, V[FS], é obtido da seguinte fórmula (Harr,

1977):
2
n
 δFS i 
V [FS ] = ∑   × V [ X i ] (9.21)
1  δX i 
Onde:
V[FS] é o quadrado do desvio-padrão;
δFsi é a variação de FS que ocorre quando se varia de δXi cada um dos “n” parâmetros Xi
(peso específico, coesão, ângulo de atrito, piezometria, inclinação e altura do talude, etc.).
V[Xi] é a variância de cada um dos Xi.
Os “n” valores de δFsi /δXi são obtidos rodando “n” vezes a superfície crítica, sendo que para
cada rodada, somente um dos parâmetros de um dos materiais é variado, para mais ou menos,
enquanto os demais são mantidos fixos.
A determinação dos valores de variância é feita através de procedimentos estatísticos simples.

No exemplo analisado, dispunha-se de uma campanha de laboratório composta por 50 ensaios
de cisalhamento direto em amostras representativas do material do talude. Da análise destes
ensaios foram obtidas as estatísticas apresentadas na tabela abaixo.
Parâmetro Média Variância

Peso específico acima do NA (kN/m³) 28,3 1,96
peso específico abaixo do NA (kN/m³) 29,0 1,96
Coesão efetiva 25,0 590,00
Tangente do ângulo de atrito 0,781 0,0072
No exemplo, considerou-se como variável também a piezometria. Com base nas informações
piezométricas obtidas no trecho em estudo e em outros pontos da mina, estimou-se o desvio
padrão da cota superior da linha freática em 20 metros. A variância correspondente é,
portanto, 400 m2.
O cálculo da variância do coeficiente de segurança para o exemplo em foco está detalhado na

tabela abaixo. O valor da variância, V[FS], encontrado no caso foi de 0,0259. As porcentagens
que as parcelas de variância representam em relação à variância total, correspondem à última
coluna da tabela abaixo.
δ FSii 2
 δ FS ii 
Xi δXi δ FS ii
δ Xi
V[X i ]   _× _ V [ X i ]
 δ Xi 
γnat = 28,3 +2,83 -0,004 -0,0014 1,96 3,92E-06 (0,02%)
γsat = 29,0 +2,90 +0,022 0,0076 1,96 0,0001 (0,44%)
c = 25,0 +2,50 +0,004 0,0016 590 0,0015 (5,83%)
tanφ = 0,781 +0,113 +0,188 1,6637 0,0072 0,0199 (76,91%)
Piezometrica +10 -0,033 -0,0033 400 0,0044 (16,81%)
Total = V[FS] 0,0259 (100%)

A figura abaixo mostra estas parcelas em um diagrama de barras. Desta figura, observa-se,
que o ângulo de atrito é o fator dominante (77% da variância), que a piezometria influi em
cerca de 17%, que a coesão contribui algo como 6% e que o peso específico tem participação
inexpressiva. Sandroni & Sayão (1992) afirmam que este tipo de avaliação permite discernir a
importância relativa dos parâmetros e nutre o processo de decisão do engenheiro. No exemplo
em análise, particular atenção deva ser dada ao ângulo de atrito e à piezometria.
80%
φ
70%
60%
50%
V[FS] 40%
30%
20%
10% γnat γsat c U
0%
Parâmetros
O Índice de Confiabilidade do coeficiente de segurança (β) é dado por:
E[ FS ] − 1
β = (9.22)
σ[ FS ]
onde E[FS] é o coeficiente de segurança médio e σ[FS] é o desvio padrão do coeficiente de

segurança.
Neste exemplo:
σ[FS] = (V[FS])1/2 = (0,0259)1/2 = 0,161
β = 1,341 / 0,161 = 2,12 (valor crítico)
Para este valor de β corresponde uma probabilidade de ruptura da ordem de 1:60 (ou 1,8%). A
inclusão da variabilidade da piezometria é relativamente simples, bastando considerar como
variável a cota superior da freática, cujo desvio padrão foi estimado em 20 metros (com base
em leituras piezométricas existentes).
O desvio padrão do coeficiente de segurança (e, portanto, o valor de β) é uma função da

variabilidade dos parâmetros geotécnicos (γ, c, φ, piezometria), da geometria (configuração do

talude, posição dos contatos entre os materiais) e das solicitações externas (cargas externas,
vibrações etc.) considerados em seu cálculo. O valor de β refere-se apenas aos parâmetros que
foram considerados como variáveis, por exemplo, pode-se considerar os parâmetros
geotécnicos como variáveis e os demais parâmetros (piezometria, geometria e solicitações
externas) como constantes. Assim sendo, o índice de confiabilidade refere-se apenas às
incertezas quanto aos valores de (γ, c, φ). A probabilidade de ruptura obtida é menor(e o valor
de β é maior) do que a obtida caso todos os elementos fossem considerados como variáveis.
A probabilidade de ruptura obtida através da avaliação de FS assim considerada não indica a

probabilidade real ou global de ruptura, mesmo se considerados todos os parâmetros
geotécnicos e geométricos variáveis, pois muitos outros fatores de risco intervêm na
composição da probabilidade global de ruptura. Estabelecer o valor aceitável do índice β ou
da probabilidade de ruptura a ele associada, é a principal decisão de projeto deste método.
Tornam-se necessários o acúmulo de experiência no uso do procedimento, bem como as
retroanálises de projetos existentes para obter o valor de β a eles associados.
Whitman (1984) apresentou um gráfico (Figura 9.8), onde são delimitadas regiões de
probabilidade e conseqüências de ruptura que correspondem à pratica usual. O exemplo é
restrito ao ambiente de uma mina de grande porte onde muitos taludes já foram executados e
poucas rupturas foram observadas permitindo estabelecer um critério específico. As
retroanálises das rupturas indicam valores de β menores ou pouco maiores do que 1,0
(probabilidade de ruptura na faixa de 1:4 a 1:20). As análises de diversos taludes estáveis
produziram valores de β entre 1,8 e 3,0, indicando uma probabilidade de ruptura entre 1:30 e
1:1000. Assim decidiu-se por um valor de β = 2,0, ou seja, probabilidade de ruptura menor
que 1:50.
10
1/P[R]
"Marginalmente Aceito"
1E-1
taludes
10
PROBABILIDADE ANUAL DE RUPTURA, P[R]
de
Minas Plataformas
Móveis
1E-2
1E2
Fundações
"Aceito"
1E-3
Plataformas
1E3
Fixas
1E-4
Barragens
1E4
1E-5
1E5
Barragens EUA
Estimado
1E-6
E6
PERDA DE VIDAS 1 10 100 1000 10000

CUSTO EM US$ 1E6 1E7 1E8 1E9 1E10
CONSEQUÊNCIAS DE RUPTURA
Figura 9.8 - Valores usuais de probabilidade e conseqüências de ruptura em projetos de

engenharia

Como principais vantagens da avaliação estatística instituída pelo método apresentado, tem-
se:
• maior clareza na apreciação geotécnica;
• padronização dos enfoques de projeto.
A clareza vem da informação obtida através das parcelas de variância, que possibilitam ao
engenheiro geotécnico localizar com objetividade, os fatores mais ou menos importantes para
a resolução do problema. A padronização é obtida através da utilização do valor de β
associado com o coeficiente de segurança. Assim, o engenheiro geotécnico passa a dispor de
uma base sólida para a comparação entre diferentes pontos de uma obra, entre diferentes obras
do mesmo tipo e entre alternativas de uma mesma obra. Por exemplo, comparações de custo
devem ser feitas para alternativas com o mesmo valor de β e não com o mesmo valor de FS,
ou ainda, taludes em diferentes trechos de uma mina, cuja ruptura traga conseqüências
semelhantes, devem se projetados com igual β e não FS.
9.4 - MÉTODO DE ROSENBLUETH
Muitos problemas práticos da engenharia necessitam um tratamento probabilístico que,

geralmente, não é feito porque consome algum tempo se realizado rigorosamente.
Rosenblueth (1975, 1981) propôs um método aproximado que simplifica muito esta tarefa e
somente compromete ligeiramente a acurácia se as dispersões das variáveis envolvidas forem
muito grandes. Consiste em estimar os momentos (média, desvio padrão, coeficiente de
assimetria etc.) da variável dependente em função das variáveis aleatórias independentes, para
as quais se conheçam pelo menos dois momentos, média e desvio-padrão (ou pelo menos suas
estimativas), sem a necessidade de conhecer as distribuições de probabilidade completas das
variáveis independentes ou da dependente.
Supondo que exista uma função bem definida que una a variável dependente às
independentes, com procedimentos simples, pode-se trabalhar com a variabilidade sem
introduzir complexidades numéricas muito grandes na análise determinística. Trata-se de
ponderar a participação de cada variável, calculando dois valores da função densidade de
probabilidade arbitrariamente escolhida para cada variável independente (Xi), o que resultará
em concentrações Pi onde se terão pontos de estimativa da variável dependente (Y), que
servirão para o cálculo dos momentos de Y.
Para o caso univariado, onde tem-se Y como função de apenas uma variável aleatória X,
Rosenblueth mostra como se pode estimar a média, o desvio padrão e o coeficiente de
assimetria, onde X tem média X, desvio padrão σx e o coeficiente de assimetria υx.
As expressões seriam:

1
p + + p− = 1, onde: p + = 1 ± 1 −
1 − ( υx / 2)
2
p− p+
x+ = x + σx , x− = x − σx
p+ p−
Y = p+ y + + p− y − , sen do: yi = f ( xi )
σY = p+p − y + − y −
υYσY = ( p+ − p− )( y + − y − )
No caso em que a variável X pode ser considerada como tendo uma distribuição simétrica, ou
seja, υx = 0, vê-se que p+ = p- = ½ e conseqüentemente:
y+ + y−
Y=
2
y+ − y−
σY =
2
Quando Y é função de duas variáveis aleatórias simétricas, ρ é o coeficiente de correlação

entre tais variáveis, σ1 e σ2 os respectivos desvios padrões, as concentrações serão:
M 1 = E ( y ) ≅ ∑ pi . yi = p ++ y ++ + p +− y +− + p −+ y −+ + p −− y −−
[
M 2 = E ( y − E ( y )) ]
2
= σ 2y ≅ ( p ++ y ++ + p +− y +− + p −+ y −+ + p −− y −− ) − M 12
2 2 2 2
Onde os coeficientes p são:
p++ = p-- = 0,25(1+ρx1,x2)
p+- = p-+ = 0,25(1-ρx1,x2)
ρx1,x2 é o coeficiente de correlação (Se x1 e x2 são independentes => ρx1,x2 = 0)

Onde os valores de y são:
y++ = y(x1+ , x2+)
y+- = y(x1+ , x2-)
y-+ = y(x1- , x2+)
y-- = y(x1- , x2-)
x1+ = x1 + sx1
x1- = x1 - sx1
Pode-se ainda obter os momentos M3 e M4:
{
M 3 = E [ y − E ( y )]
3
}≅ p ++
y ++ + p +− y +− + p −+ y −+ + p −− y −− − 3 M 1 M 2 − M 13
3 3 3 3
{
M 4 = E [ y − E ( y )]
4
}≅ p ++
y ++ + p +− y + − + p −+ y −+ + p −− y −− − 4 M 1 M 2 − 6 M 12 M 2 − M 14
4 4 4 4
Considera-se neste caso que as coordenadas e grandezas das concentrações são independentes
da função f. Mostra-se que os pontos indicados no retângulo são definidos pelas coordenadas
X 1 ± σ1 , X 2 ± σ2 simétricas em relação as médias.
A relação entre as concentrações pode ser generalizada, como se pode ver, sendo proporcional
a 2n, onde n é o número de variáveis independentes. No caso de Y ser função de X1 , X2 , X3
obtem-se as seguintes concentrações:

P+++ = P−−− =
1
8
(1 + ρ12 + ρ23 + ρ31 )
P++− = P−−+ =
1
8
(1 + ρ12 − ρ23 − ρ31 )
P+−+ = P−+− =
1
8
(1 − ρ12 − ρ23 + ρ31 )
P+++ = P−−− =
1
8
(1 − ρ12 + ρ23 − ρ31 )
Considerando o sistema de coordenadas formado pelos eixos definidos pelas variáveis X1, X2,
X3, as concentrações correspondem aos vértices do paralelepípedo de lados 2σ1, 2σ2, 2σ3.
Pode-se então generalizar estas condições para o caso multivariado, onde Y depende de n
variáveis aleatórias. Para o caso das n variáveis poderem ser consideradas não correlacionadas
entre si, pode-se obter as estimativas da média e do desvio padrão de Y pelas fórmulas
seguintes:
1 2n
Y= ∑ yi
2n i=1
∑ ( yi − Y )
1 2n 2
σ2Y = n
2 i =1
Os valores de yi são obtidos com a aplicação da função que define a dependência entre Y e as
variáveis independentes, substituindo alternadamente os valores dessas variáveis por X j ± σj,
j = 1, 2, ..., n, obtendo-se dessa maneira os 2n valores de yi.
HARR (1987) admite uma analogia entre o método proposto e uma viga carregada. A
distribuição de probabilidade seria análoga a uma carga vertical distribuída em uma viga
rígida horizontal cuja resultante do carregamento pode ser associada à idéia da média (valor
esperado) da distribuição enquanto que o desvio padrão está associado ao raio de aplicação da
resultante. Consistirá o processo então em substituir a resultante única por duas reações P
atuando em pontos estratégicos de tal forma a manter o equilíbrio, pontos estes
necessariamente distribuídos antes (-) e após (+) o ponto de aplicação da resultante. Estas
reações p- e p+ são os pontos estimados da distribuição de ƒ(X) que pode até não ser
conhecida. Portanto, conhecendo-se, nos casos mais comuns, as médias e os desvios padrões
das variáveis independentes, e uma solução matemática que reuna estas variáveis às variáveis
dependentes, pode-se estimar a variabilidade destas através da combinação das soluções
obtidas para as variáveis somadas ou subtraídas de um desvio padrão. Resolvendo
sucessivamente o problema, e combinando estas 2n soluções, sendo n o número de variáveis
independentes que apresentam desvio padrão diferente de zero, obtem-se a estimativa da
média e do desvio padrão de cada uma das variáveis dependentes de interesse.

Departamento de Engenharia Civil / FT
______________________________________________________________________________________
10 – APLICAÇÃO DE MÉTODOS ESTATÍSTICOS E

PROBABILÍSTICOS À GEOTECNIA
Este capítulo visa a apresentação de três casos-históricos de obras geotécnicas, onde métodos
estatísticos e probabilísticos tem sido utilizados, indicando grandes melhorias na qualidade
dos resultados e nas tomadas de decisão.
10.1 - COMPARAÇÃO ENTRE MÉTODOS PROBABILÍSTICOS APLICADOS À

ESTABILIDADE DE TALUDES
Este exemplo baseia-se no trabalho a ser apresentado por Farias & Assis (1998) no próximo
congresso da ABMS (XI COBRAMSEG), onde é feita uma comparação entre dois métodos
probabilísticos (Método das Estimativas Pontuais – Rosenbleuth e Método FOSM – Primeira
Ordem Segundo Momento) aplicados à análise de estabilidade de dois taludes: um baixo,
típico de obras rodoviárias em solo, no qual predominava o efeito da coesão; e outro alto,
típico de mineração em rocha, no qual predominava o efeito do ângulo de atrito.
10.1.1 - INTRODUÇÃO
A análise probabilística distingue-se da determinística por considerar a variabilidade dos

parâmetros de cálculo:
• As variabilidades devem-se à dispersão dos resultados de ensaios ou à variabilidade

natural;
• Há portanto uma distribuição de valores para cada parâmetro (variáveis aleatórias);
• Fatores de segurança diferentes serão obtidos se valores diferentes dessas variáveis forem
usados, ou seja possui sua própria distribuição.
Diversas métodos probabilísticos têm sido desenvolvidos para gerar a distribuição de funções
de variáveis dependentes:
• Métodos "exatos";
• Aproximações da série de Taylor da variável dependente;
• Método das Estimativas Pontuais.
Os métodos ditos exatos exigem que as funções de distribuição de probabilidade de todas as

variáveis independentes sejam inicialmente conhecidas. Na falta destas, geralmente assume-se
uma distribuição normal, ou lognormal, ou até mesmo uniforme. O principal método neste
categoria é o Monte Carlo (Hammersley & Handscomb, 1964). A principal vantagem desta
metodologia é que se obtém a distribuição completa da variável dependente. Como
desvantagem o método exige considerável tempo, grande esforço computacional e programas
específicos.
Numa segunda categoria se incluem vários métodos baseados em truncamentos da série de

Taylor para a função da variável dependente. O método apresentado por Christian et al. (1992)
______________________________________________________________________________________
______________________________________________________________________________________
é dito de Primeira Ordem Segundo Momento (FOSM). O valor médio da variável dependente
é calculado a partir dos valores médios das variáveis independentes. O desvio padrão é
calculado a partir das variâncias dos parâmetros de entrada e das derivadas da variável
dependente em relação a cada variável independente. Estas derivadas nem sempre são de fácil
determinação. Como vantagens estes métodos possuem uma formulação matemática mais
simples, não requerem grandes esforços computacionais, e permitem quantificar a influência
de cada variável independente na variância da variável dependente. Como desvantagem, não
obtém uma distribuição completa da variável dependente devendo-se adotar hipóteses sobre
esta distribuição. Ademais, a probabilidade de ruptura máxima nem sempre está relacionada
com a superfície de ruptura com fator de segurança mínimo (Tobutt & Richards, 1979).
Numa terceira categoria está o Método das Estimativas Pontuais (Rosenbleuth, 1975). O
Método de Rosenbleuth dispensa, a priori, o conhecimento das funções de distribuição das
variáveis independentes, utilizando apenas os valores das estimativas pontuais calculados na
média mais desvio padrão e média menos desvio padrão de cada variável. A variável
dependente é calculada para estes pontos, obtendo-se uma amostra da qual se pode calcular
sua média e desvio padrão. O método é versátil e de fácil aplicação. Deve-se, entretanto,
assumir uma distribuição para a variável dependente e supõe-se que a distribuição de cada
variável independente seja simétrica.
Enquanto a abordagem determinística adota o fator de segurança como índice de estabilidade

no problema de equilíbrio do talude, os métodos probabilísticos adotam um parâmetro
adicional que é probabilidade de ruptura. Vários fatores podem influenciar o cálculo da
probabilidade de ruptura, entre os quais destacam-se:
• Método de cálculo do fator de segurança utilizado (Tobutt & Richards, 1979);

• Correlação entre os parâmetros de entrada (Alonso, 1976);
• Autocorrelação, ou distribuição espacial de um parâmetro (Vanmarcke, 1977).
10.1.2 - CASOS ESTUDADOS
Dois taludes são analisados neste artigo:
• Caso 1 - talude relativamente baixo e homogêneo, com 8 m de altura e 45o de inclinação,

típico de cortes rodoviários em solos;
• Caso 2 - talude de 200 m de altura e inclinação de 34o, representando um talude de
mineração em rocha descrito por Sandroni & Sayão (1992).
As variáveis independentes (Xi) consideradas para as análises probabilísticas são:
• Coesão (c’);
• Ângulo de atrito (φ’) ou alternativamente tanφ';
• Peso específico (γ);
• Poro-pressão através do parâmetro (ru) no Caso 1 e da posição do nível d'água (NA) no
Caso 2como variável independente.
______________________________________________________________________________________
______________________________________________________________________________________
Para o Caso 1, os parâmetros médios ( X i ) e os desvios padrões (σ[Xi]) utilizados (arbitrados

com base em coeficientes de variação típicos dados por Lumb, 1974) estão apresentados na
Tabela 10.1.
No Caso 2, o lençol freático é simulado por dois trechos retos: um inclinado partindo do pé do
talude até um ponto verticalmente abaixo da crista e outro horizontal a partir deste ponto. O
nível de água (NA) médio se situa a 80 m abaixo da crista do talude. Os parâmetros foram
obtidos de uma campanha de laboratório composta de 50 ensaios de cisalhamento direto
(Sandroni & Sayão, 1992) e estão listados na Tabela 10.2.
Tabela 10.1 - Parâmetros do Caso 1

Xi c’ (kPa) φ’ (o) ru γ (kN/m3)
Xi 20 25 0,25 17
σ[Xi] ±6 ±2,5 ±0,10 ±2
Tabela 10.2 - Parâmetros do Caso 2

Xi c’ (kPa) φ’ (o) NA (m) γ (kN/m3)
Xi 25 38 80 29
σ[Xi] ±24,3 ±3 ±20 ±1,4
O peso específico apresentado na Tabela 10.2 se refere ao material saturado abaixo do NA.
Acima do NA, o peso específico é de 28,3 kN/m3 e foi considerado constante, uma vez que as
análises de Sandroni & Sayão (1992) indicaram uma influência insignificante deste parâmetro.
10.1.3 - METODOLOGIA DE CÁLCULO
As análises de estabilidade foram realizadas com auxílio do programa SLOPE/W (Geoslope,

1995), adotando o Método de Bishop Simplificado para o cálculo do fator de segurança (F). A
probabilidade de ruptura dos taludes foi calculada pelo Método FOSM (Christian et al., 1992)
e pelo Método das Estimativas Pontuais (Rosenbleuth, 1975).
• MÉTODO FOSM
No método FOSM, o fator de segurança médio, E[F], é calculado usando-se os valores de

parâmetros médios ( X i ), os quais estão apresentados nas Tabelas 10.1 e 10.2. O índice de
confiabilidade (β), o qual mede quantas vezes a diferença entre o fator de segurança e o fator
de ruptura (F = 1) é maior do que o desvio padrão do fator de segurança, é definido pela
expressão:
E [ F] − 1
β= (10.1)
σ [ F]
onde σ[F] é o desvio padrão do valor do fator de segurança F.
______________________________________________________________________________________
______________________________________________________________________________________
O desvio padrão é, por definição, igual raiz quadrada da variância, V[F], a qual é calculada no
método FOSM pela seguinte expressão (Christian et al., 1992):
2
n
 dF 
V[F] = ∑   V[Xi ] (10.2)
i =1  dX i 
As derivadas (dF/dXi) são calculadas a partir das variações no fator de segurança (dF)
causadas por "pequenas" variações nas variáveis independentes (dXi). Cada variável é
incrementada separadamente, enquanto as demais são mantidas fixas e iguais aos valores
médios. O tamanho dos incrementos (dXi) foi investigado, tomando-se valores crescentes
(1%, 5%, 10%, 20% etc) em torno dos valores médios.
O método FOSM exige pelo menos n+1 análises, para n variáveis independentes:
• Uma para os valores médios;

• "n" análises para determinar as derivadas (dF/dXi) para cada variável independente.
• MÉTODO DAS ESTIMATIVAS PONTUAIS
Para o Método de Rosenbleuth, tomam-se combinações dos valores nas estimativas pontuais
máximas (Xi+σ[Xi]) e mínimas (Xi-σ[Xi]) para cada variável independente. São, portanto,
necessárias 2n análises separadas. A cada análise é feita uma nova procura pela superfície
crítica, a qual pode diferir significativamente daquela calculada com os valores médios no
método FOSM.
Assumindo-se uma distribuição normal (Gauss) para os valores do fator de segurança (Fi)
calculados com as variáveis nos estimativas pontuais, o fator de segurança médio E[F] pode
ser calculado pelo primeiro momento da distribuição:
n
Fi
E[F] = ∑ (10.3)
i =1 n
O desvio padrão é dado por:
1/ 2
 n ( Fi ) 2 n F 
σ[F] =  ∑ −∑ i  (10.4)
 i =1 n i =1 n

 
A probabilidade de ruptura (Pr) em ambos os métodos representa a probabilidade do fator de

segurança ser inferior à unidade. Assumindo-se uma distribuição normal para o fator de
segurança, a probabilidade de ruptura é representada pela área abaixo da curva de distribuição
entre -∞ e 1,0. Este valor é facilmente calculado a partir dos valores da média E[F] e do
desvio padrão σ[F].
______________________________________________________________________________________
______________________________________________________________________________________
10.1.4 - APRESENTAÇÃO DOS RESULTADOS
• Caso 1 (Talude Baixo) e Método FOSM

A Figura 10.1 mostra o comportamento do fator de segurança para os diversos métodos
investigados para o talude do Caso 1. Há uma forte correlação linear positiva (R2≅1) entre F e
coesão e entre F e ângulo de atrito. Há uma correlação negativa entre F e ru. Para este caso em
particular, há uma correlação negativa entre F e peso específico. A Tabela 10.3 mostra as
derivadas calculadas a partir da inclinações das curvas na Figura 10.1.
O tamanho do incremento (dXi) deve ser tomado com cuidado. Valores muito pequenos levam
a erros, uma vez que o fator de segurança geralmente é apresentado com poucas decimais para
acusar pequenas variações. Valores muito grandes podem levar a superfícies críticas
diferentes da superfície média. Para este caso, valores da ordem de 1 a 10% dos valores
médios se mostraram satisfatórios.
 dF 
Tabela 10.3 - Derivadas   para o Caso 1
 dX i 
dF dF dF dF
Método
dc dφ dru dγ
Bishop 0,0474 0,0231 -1,1452 -0,0516
Variação de F com coesão FS versus Ang. Atrito

1,8
1,6
FS-Fell
FS-Bishop
1,7
FS-Janbu
FS-M&P
FS
FS
1,6 1,5
FS-Fell
FS-Bishop
1,5 FS-Janbu
FS-M&P
1,4
1,4
25 25,5 26 26,5 27 27,5
20 21 22 23 24 25 26
Coesão (kPa) Ângulo de Atrito
FS versus Ru FS versus Gama

1,5 1,5
1,48 FS-Fell
1,46 FS-Bishop
1,44 FS-Janbu
1,4
1,42 FS-M&P
FS
FS
1,4
FS-Fell 1,38
1,3 FS-Bishop 1,36
FS-Janbu 1,34
FS-M&P 1,32
1,3
1,2
17 17,5 18 18,5 19
0,25 0,27 0,29 0,31 0,33 0,35
Ru
Peso específico (kN/m3)
Figura 10.1 - Variação do fator de segurança para o Caso 1
______________________________________________________________________________________
______________________________________________________________________________________
A Tabela 10.4 apresenta os resultados obtidos para o fator de segurança médio (E[F]), o
desvio padrão (σ[F]), o índice de confiablidade (β) e a probabilidade de ruptura (Pr).
Tabela 10.4 - Resumo dos resultados do Caso 1

Método E[F] σ[F] β Pr (%)
Bishop 1,477 0,329 1,452 7,3
A Equação 10.2 permite quantificar a contribuição de cada variável na variância do fator de

segurança, tendo-se obtido aproximadamente: 75% para a coesão, 3% para o ângulo de atrito,
12% para ru e 10% para o peso específico. Para este talude em particular, há, portanto, uma
predominância da coesão e da poropressão. O ângulo de atrito pouco contribuiu para a
variância do fator de segurança. Já a influência do peso específico foi significativa e não pode
ser desconsiderada, uma vez que afeta negativamente o fator de segurança. Em todas as
análises realizadas a superfície crítica manteve-se constante, embora nenhuma restrição tenha
sido feita neste sentido (Figura 10.2).
1 . 4 7 4
45 o
Figura 10.2 - Superfície crítica do Caso 1
• Caso 1 (Talude Baixo) e Método de Rosenbleuth
Foram tomadas as mesmas variáveis independentes e respectivas variâncias assumidas no

Método FOSM. Desta forma foram utilizados os seguintes valores nas estimativas pontuais
mínimas (-) e máximas (+):
• Coesão - 14 e 26 kPa;
• Ângulo de atrito - 22,5 e 27,5o;
• Parâmetro ru - 0,15 e 0,35;
• Peso específico saturado - 15 e 19 kN/m3.
Isto perfaz um total de 24 = 16 casos, cujos resultados são apresentados na Tabela 10.5. As
superfícies críticas em cada caso foram monitoradas e estão assinaladas com um asterisco na
Tabela 10.5, quando diferem daquela encontrada no método FOSM com os valores médios.
______________________________________________________________________________________
______________________________________________________________________________________
Tabela 10.5 - Resultados do método de Rosenbleuth para o Caso 1

i c’ φ’ ru γ Fb
1 (+) (+) (+) (+) 1,566
2 (+) (+) (+) (-) 1,847*
3 (+) (+) (-) (+) 1,822
4 (+) (+) (-) (-) 2,119*
5 (+) (-) (+) (+) 1,462*
6 (+) (-) (+) (-) 1,740*
7 (+) (-) (-) (+) 1,678*
8 (+) (-) (-) (-) 1,958*
9 (-) (+) (+) (+) 1,046
10 (-) (+) (+) (-) 1,207
11 (-) (+) (-) (+) 1,281*
12 (-) (+) (-) (-) 1,459
13 (-) (-) (+) (+) 0,955
14 (-) (-) (+) (-) 1,170
15 (-) (-) (-) (+) 1,156
16 (-) (-) (-) (-) 1,320
E[f] 1,487
σ[F] 0,347
Pr 8,1%
Obs. (*) indica superfície crítica diferente da média.
Para este caso, em se tratando de um talude baixo, as superfícies eram semelhantes e os

fatores de segurança diferiram apenas marginalmente quando comparados aos calculados
(com os parâmetros nos estimativas pontuais) nas superfícies médias. No entanto, a variação
no desvio padrão não é óbvia. Neste caso a probabilidade de ruptura aumentou marginalmente
em relação àquela obtida pelo método FOSM.
• Caso 1 – FOSM x Rosenbleuth
Comparando-se os resultados obtidos pelos dois métodos probabilísticos utilizados no Caso 1,

observa-se uma boa concordância como mostra a Tabela 10.6.
Tabela 10.6 - FOSM x Rosenbleuth no Caso 1

Metodo Probabilístico Bishop
FOSM 1,477
E[F]
PE 1,487
FOSM 0,329
σ[F]
PE 0,347
FOSM 7,30%
Pr
PE 8,10%
______________________________________________________________________________________
______________________________________________________________________________________
As médias calculadas pelo Método de Rosenbleuth foram ligeiramente superiores à calculada

pelo FOSM. Os desvios padrões também foram mais elevados para Rosenbleuth. Isto pode ser
explicado pelo fato do método FOSM usar uma superfície fixa, enquanto Rosenbleuth
pesquisa diferentes superfícies para cada combinação de valores extremos, refletindo assim
num maior desvio padrão. O efeito combinado da média e desvio padrão na probabilidade de
ruptura não é óbvio, tendo resultado em maiores valores de Pr para Rosenbleuth neste caso.
• Caso 2 (Talude Alto) e Método FOSM
A Figura 10.3 mostra a variação do fator de segurança com as variáveis independentes para o
talude do Caso 2. Observa-se uma excelente correlação linear entre F e as variáveis
independentes. As primeiras derivadas de F calculadas da inclinação das curvas na Figura 10.3
são apresentadas na Tabela 10.7. Nota-se, no entanto, que para este caso há uma correlação
positiva entre F e peso específico, apesar de dF/dγ ser relativamente baixa.
 dF 
Tabela 10.7 - Derivadas   para o Caso 2
 dX i 
dF dF dF dF
Método
dc dφ dru dγ
Bishop 0,0021 0,0469 -0,0045 0,0030
Variação de F com coesão FS versus Ang. Atrito

1,3
1,5
FS-Fell
FS-Bishop
1,4
FS-Janbu
FS-M&P
FS
1,2
FS
1,3
FS-Fell
FS-Bishop
1,2
FS-Janbu
FS-M&P
1,1
1,1
38 38,5 39 39,5 40 40,5 41 41,5 42
25 26 27 28 29 30 31 32 33
Coesão (kPa) Ângulo de Atrito
FS versus NA FS versus Gama
1,3 1,3
1,2
FS
FS
1,2
FS-Fell FS-Fell
1,1
FS-Bishop FS-Bishop
FS-Janbu FS-Janbu
FS-M&P FS-M&P
1 1,1
0 5 10 15 20 29 29,5 30 30,5 31 31,5 32
NA
Peso específico (kN/m3)
Figura 10.3 - Variação do fator de segurança para o Caso 2
______________________________________________________________________________________
______________________________________________________________________________________
A partir da comparação entre as derivadas nas Tabelas 10.3 e 10.7, pode-se também esperar
uma maior influência do ângulo de atrito e uma menor influência da coesão para o talude do
Caso 2. Os valores dos fatores de segurança médio, desvio padrão, índice de confiabilidade e
probabilidade de ruptura calculados pelo método FOSM estão resumidos na Tabela 10.8.
A contribuição relativa de cada variável para a variância final do F apresenta os seguintes

valores aproximadamente: 9% para a coesão, 63% para o ângulo de atrito, 28% para a posição
do NA e 0,1% para o peso específico. Chama-se a atenção para a baixa influência relativa da
coesão neste caso, apesar do grande coeficiente de variação deste parâmetro (±100%). Para
este talude predominam os efeitos do ângulo de atrito e da piezometria.
Tabela 10.8. Resultados do FOSM para o Caso 2
Método E[F] Desvio Padrão Beta Pr

Bishop 1,280 0,169 1,654 4,9%
Em linhas gerais os resultados da Tabela 10.8 reproduzem qualitativamente os obtidos por

Sandroni & Sayão (1992). No entanto, algumas diferenças devem ser ressaltadas. Na presente
análise, através de uma criteriosa busca pelo círculo crítico, determinou-se um fator de
segurança mínimo F = 1,280 para o método de Bishop, contra um valor de 1,341 obtido pelos
autores citados. Para este novo círculo crítico as derivadas dF/dXi também são um pouco
diferentes levando a uma probabilidade de ruptura de 4,9% a qual é três vezes superior àquela
encontrada por Sandroni & Sayão de 1,8%. Este fato ressalta a importância da determinação
rigorosa da superfície crítica para este método.
• Caso 2 (Talude Alto) e Método de Rosenbleuth
Diante da pequena influência do peso específico neste caso, adotou-se valores fixos de γnat e
γsat iguais aos valores médios (28,3 e 29 kN/m3). Os demais parâmetros (c', φ' e NA)
assumiram valores nas estimativas pontuais máximas e mínimas de acordo com os desvios
estabelecidos na Tabela 2. Os resultados do total de 8 casos analisados são mostrados na
Tabela 10.9.
Tabela 10.9 - Resultados do método de Rosenbleuth para o Caso 2

i c' φ' NA Fb
1 (+) (+) (+) 1,368
2 (+) (+) (-) 1,540*
3 (+) (-) (+) 1,121*
4 (+) (-) (-) 1,260*
5 (-) (+) (+) 1,256*
6 (-) (+) (-) 1,372*
7 (-) (-) (+) 1,012*
8 (-) (-) (-) 1,106*
E[F] 1,254
σ[F] 0,172
Pr 7,0%
Obs. (*) indica superfície crítica diferente da média.
______________________________________________________________________________________
______________________________________________________________________________________
As superfícies críticas foram monitoradas para cada caso analisado, tendo se mostradas
bastante diferentes daquelas obtidas com os valores médios no método FOSM. As superfícies
para o Método de Bishop são mostradas na Figura 10.4. Nota-se que para as análise (5)-(8),
para as quais a coesão é praticamente nula, as superfícies críticas são bem mais superficiais.
(1)&FOSM
(2)
(3), (4)
(5),(7)
(6),(8)
Figura 10.4 - Superfícies críticas (Bishop) dos métodos Rosenbleuth e FOSM para o Caso 2
Este mesmo talude havia sido estudado pelo Método das Estimativas Pontuais por Assis et al.
(1997) os quais encontram uma probabilidade ruptura muito maior (18%) pelo Método de
Bishop. Acredita-se que esta discrepância se deva ao fato de os autores terem usado uma
maior variação para φ' (±5o) comparada a uma variação de ±3o, usada aqui e no artigo original
de Sandroni & Sayão (1992). Uma vez que este talude tem forte dependência do valor do
ângulo de atrito, um pequeno erro na variância de φ', leva uma grande variação na
probabilidade de ruptura. Ressalta-se, portanto, a importância de uma criteriosa determinação
dos coeficientes de variação das variáveis independentes do problema, preferencialmente
através de uma campanha representativa de ensaios, para uma melhor aplicação de métodos
probabilísticos.
• Caso 2 – FOSM x Rosenbleuth
A Tabela 10.10 apresenta um resumo dos métodos FOSM e Rosenbleuth para o talude do
Caso 2. De um modo geral o método FOSM apresentou uma maior média e um menor desvio
padrão. O efeito geral se refletiu numa menor probabilidade de ruptura para o Método FOSM.
Tabela 10.10 - FOSM x Rosembleuth (PE) para o Caso 2

Metodo Probabilístico Bishop
FOSM 1,280
E[F]
PE 1,254
FOSM 0,169
σ[F]
PE 0,172
FOSM 4,90%
Pr
PE 7,00%
______________________________________________________________________________________
______________________________________________________________________________________
10.1.5 - CONCLUSÕES
• Foram analisados dois taludes: um baixo, típico de obras rodoviárias em solo, no qual
predominava o efeito da coesão; outro alto, típico de mineração em rocha, no qual
predominava o efeito do ângulo de atrito. Os taludes foram analisados por dois métodos
probabilísticos (FOSM e Estimativas Pontuais) e o cálculo do fator de segurança foi feito
através do Método de Bishop Simplificado.
• Ressalta-se a importância de determinar com precisão o desvio padrão de cada variável
envolvida no problema. Pequenos erros no coeficiente de variação de uma variável, podem
levar a erros significativos na probabilidade de ruptura em um talude que dependa
fortemente desta variável.
• A importância do peso específico não pode ser relevada a priori. Este parâmetro afeta tanto
os esforços resistivos, quanto os solicitantes. Desta forma pode afetar positivamente ou
negativamente o fator de segurança.
• Para o Método FOSM, ressalta-se a importância da determinação rigorosa da superfície
crítica uma vez que todas as demais variáveis são calculadas em torno desta superfície.
• A probabilidade de ruptura é função do efeito conjunto da média e do desvio padrão e deve
ser pensada em função destas duas variáveis inseparáveis. Quando estes parâmetros variam
na mesma direção (ambos aumentam ou diminuem), o efeito na probabilidade de ruptura
não é previsível apriori.
• Para os dois casos analisados a probabilidade de ruptura pelo Método das Estimativas
Pontuais foi maior, principalmente para o talude alto (Caso 2). No entanto, não se pode
ainda generalizar esta afirmativa. Em ambos os casos, o Método das Estimativas Pontuais
forneceu maior desvio padrão. Este fato pode estar ligado a uma maior dispersão das
superfícies de ruptura. Porém no primeiro caso a média também foi maior que a obtida pelo
FOSM, o que não implicaria necessariamente em maior Pr; enquanto que no segundo caso
a média foi menor, com conseqüente aumento na probabilidade de ruptura.
• O método FOSM apresenta a vantagem de quantificar a influência relativa de cada
parâmetro, além de exigir em princípio menos análises. No entanto, pode fornecer
probabilidades de ruptura abaixo das fornecidas pelo método de Rosenbleuth. Neste
sentido, os dois métodos podem se complementar.
• Diante da crescente disponibilidade de programas e microcomputadores eficientes, o custo
computacional de análises probabilísticas é muito pequeno, se comparado às informações
adicionais que podem fornecer. O único empecilho atual a uma maior utilização prática
destes métodos se justifica pela falta de valores de referência da probabilidade de ruptura
(Pr) para fixar critérios de projeto. Esta limitação, no entanto, tenderá a diminuir com a
aumento da utilização e confiança dos métodos probabilísticos.
10.2 - CONTROLE GEOTÉCNICO DE UM ATERRO HIDRÁULICO
No caso específico de barragens de rejeito é muito importante estabelecer as conseqüências

que podem advir do mau funcionamento ou ruptura das mesmas, pois podem causar danos
materiais e ao meio ambiente. Além disto um acidente com estas barragens também pode
significar perdas de vidas humanas. Todos estes danos e perdas podem ser causados devido a
um não controle tecnológico deficiente ou ineficaz.
______________________________________________________________________________________
______________________________________________________________________________________
Dentro desta visão encontra-se um trabalho que objetiva avaliar a qualidade de construção de
barragens de rejeito alteadas pelo método de montante (Assis & Espósito, 1995, Espósito,
1995 e Espósito et al., 1997). A seguir será feita uma breve apresentação deste trabalho, com a
finalidade de ilustrar a aplicação direta de métodos estatísticos e probabilísticos no estudo da
estabilidade de taludes de uma barragem de rejeito construída através de aterro hidráulico.
Como controle de qualidade de construção foi feito o monitoramento da densidade e

porosidade in situ, índices indiretos da resistência e da permeabilidade de materiais
granulares. Foi realizada uma campanha de campo mapeando a variabilidade natural das
densidades e porosidades in situ numa barragem de rejeito projetada para alteamentos
sucessivos à montante. Esta campanha teve por objetivo conhecer as porosidades em função
das variáveis que controlam a energia de deposição do material lançado (vazão, concentração,
altura de queda e espaçamento entre os pontos de lançamento do rejeito). Tendo em vista a
variabilidade dos valores encontrados de porosidade in situ foram obtidos em laboratório os
parâmetros de resistência da barragem analisada. Com base nestes parâmetros foi feita uma
análise probabilística da estabilidade, com a determinação da função do fator de segurança FS
e respectiva probabilidade de risco (potencial de ruptura). Este trabalho conclui mostrando
como que o controle de densidade e porosidade in situ pode ser utilizado para avaliar
geotecnicamente a qualidade de um aterro depositado hidraulicamente, através de métodos
estatísticos e probabilísticos de projeto.
10.2.1 - GERAÇÃO DOS PARÂMETROS UTILIZADOS NAS ANÁLISES
A massa específica seca do rejeito ρd foi obtida através das campanhas de ensaios de campo,
sendo verificada uma variação de ρd para o mesmo material, que foi chamado de A. Os
parâmetros efetivos de resistência, φ’ e c’, foram obtidos em laboratório para os valores
fixados de ρd, conforme Tabela 10.11.
Tabela 10.11 - Parâmetros efetivos de resistência em função das massas específicas secas
ρd (g/cm3) φ’(°) c’ (kPa)
1,85 26,5 10,2
1,95 27,0 10,6
2,04 30,1 10,2
2,08 30,5 9,8
2,18 32,7 2,6
2,23 36,0 7,9
2,27 36,2 9,0
Foi plotada a relação de ρd com φ’ (Figura 10.5), através de três trechos lineares. Vale
observar que os trechos onde aparecem retas pontilhadas são extrapolações das relações
obtidas em laboratório para cobrir toda a faixa de variabilidade encontrada em campo.
______________________________________________________________________________________
______________________________________________________________________________________
ÂNGULO DE ATRITO EFETIVO (graus) 39 TRECHO EQUAÇÃO

4
1 a 2 φ = 4,6 ρd - 18,0
2 a 3 φ = 29,5 ρd - 30,5
34 3
3 a 4 φ = 20,5 ρd - 10,6
29
2
1
24
1.7 1.9 2.1 2.3 2.5
MASSA ESPECÍFICA SECA ( g/cm3)
Figura 10.5 - Relação entre a massa específica seca e o ângulo de atrito efetivo
A partir das equações obtidas através da relação entre ρd e φ’ para cada trecho (Figura 10.5),
foram determinados os valores de φ’ correspondentes a cada ρd encontrado no campo,
assumindo que φ’ obedece à mesma distribuição estatística de ρd (Tabela 10.14). A partir da
distribuição estatística de φ’ gerada em função da distribuição estatística de ρd foram
calculados o ângulo de atrito efetivo médio (φ’med ) e seu desvio padrão (∆φ’), que também se
encontram na Tabela 10.14. Em função da média e do desvio padrão de φ’ foram calculados
os pontos extremos, ou seja, φ’med - ∆φ’ e φ’med + ∆φ’, utilizados nas análises estatísticas que
se seguiram (Tabela 10.12).
Tabela 10.12 - Valores dos ângulos de atrito efetivos utilizados nas análises de estabilidade
φ’ (grau)
φ’med - ∆φ’ 26,2
φ’med 29,1
φ’med + ∆φ’ 32,0
Os valores da coesão efetiva (c’) também foram plotados em relação ρd (Figura 10.6), não
sendo possível definir equações que representassem a relação entre estas duas grandezas.
12
10
COESÃO EFETIVA (kPA)
2
1 .8 1 .9 2 2 .1 2 .2 2 .3
M A S S A E S P E C ÍF IC A S E C A (g /c m 3 )
Figura 10.6 - Relação entre a massa específica seca e a coesão efetiva
______________________________________________________________________________________
______________________________________________________________________________________
Desta forma, foi assumida uma distribuição constante, representada pela média e o desvio
padrão obtidos dos valores de c’ encontrados nos ensaios de laboratório, independentes dos
valores da massa específica seca (ρd). Foram, então, calculados a coesão efetiva média (c’med )
e o desvio padrão (∆c’), que se encontram na Tabela 10.13.
Tabela 10.13 - Valores das coesões efetivas utilizadas nas análises de estabilidade
c’ (kPa)
c’med - ∆c’ 5,78
c’med 8,60
c’med + ∆c’ 11,42
A Tabela 10.14 a seguir sintetiza os valores da distribuição do ângulo de atrito efetivo (φ‘) em
função da distribuição da massa específica seca (ρd).
Tabela 10.14 - Valores da distribuição do ângulo de atrito efetivo (φ’) em função da

distribuição da massa específica seca (ρd).
fi ρd (g/cm3) φ’ (°) fi ρd (g/cm3) φ’ (°) fi ρd (g/cm3) φ’ (°)
1 1,75 26,0 3 1,93 26,9 2 2,07 30,5
1 1,77 26,1 2 1,94 26,9 3 2,08 30,8
1 1,78 26,2 1 1,95 27,0 1 2,09 31,1
2 1,79 26,2 5 1,96 27,2 6 2,10 31,4
1 1,80 26,2 2 1,97 27,5 2 2,11 31,7
1 1,83 26,4 1 1,98 27,8 3 2,13 32,3
1 1,85 26,5 1 1,99 28,1 1 2,14 32,6
3 1,87 26,6 1 2,00 28,4 1 2,20 34,3
1 1,88 26,6 1 2,02 29,0 2 2,21 34,6
3 1,89 26,7 1 2,03 29,3 1 2,23 35,2
4 1,91 26,8 1 2,04 29,6 1 2,27 36,0
4 1,92 26,8 3 2,05 29,9
OBS: fi = freqüência de ocorrência dos valores de ρd em campo.
Média 1,99 29,1

σ 0,12 2,9
10.2.2 - ANÁLISE DE ESTABILIDADE DA BARRAGEM
No estudo de estabilidade de taludes busca-se o Fator de Segurança (FS), que pode ser
entendido como o valor numérico da relação estabelecida entre a resistência ao cisalhamento
disponível do solo e a resistência ao cisalhamento mobilizada para garantir o equilíbrio do
corpo deslizante, sob o efeito dos esforços atuantes. Um valor de FS ≥ 1 demonstra que os
esforços atuantes são menores do que os esforços resistentes.
A metodologia aqui apresentada não se restringiu à análise determinística do FS, em que é

realizada uma única determinação do mesmo. Procurou, também, avaliar a estabilidade
através de uma análise probabilística, levando em consideração o conceito de confiabilidade e
______________________________________________________________________________________
______________________________________________________________________________________
a variabilidade dos parâmetros do rejeito. É importante definir a probabilidade de risco (ou de

ruptura) como sendo P (FS < 1,0).
Para executar uma análise estatística rigorosa, tendo em vista as variabilidades encontradas
nos parâmetros c’ e φ’ deveriam ser executados ensaios de resistência para cada tipo de
material encontrado, incluindo principalmente as variabilidades de granulometria e massa
específica seca ou porosidade. Com os resultados dos ensaios seria então feito um estudo das
distribuições estatísticas de c’ e φ’ sendo posteriormente aplicado no estudo probabilístico da
estabilidade da barragem. Obviamente este processo levaria a um número muito grande de
ensaios, o que não teria respaldo prático. Foram feitas, então, algumas simplificações:
• A partir das diversas granulometrias encontradas em campo dividiu-se os materiais em

duas faixas, A (mais grosso) e B (mais fino), atendendo apenas ao critério de que a faixa A
continha a grande maioria dos rejeitos depositados. Assim, definiu-se o material de ensaio
como os situados na faixa A;
• Foi estudada a distribuição de densidades encontradas no campo, sendo correlacionadas as
densidades in situ com os parâmetros c’ e φ’ obtidos em laboratório. Foram calculados a
média e o desvio padrão das distribuições dos ângulos de atrito e coesões.
Para a elaboração das análises de estabilidade, na configuração final da barragem, foi

considerado o perfil típico apresentado na Figura 10.7, sendo utilizados alguns parâmetros
geotécnicos constantes, relatados na Tabela 10.15.
1000 m
970 m
4
950 m 1
ENROCAMENTO REJEITO
CANGA
900 m
ARGILA MOLE
AREIA
AREIA ARGILOSA
SOLO RESIDUAL
ROCHA DE FUNDAÇÃO
Figura 10.7 - Perfil típico da barragem
Para a análise de estabilidade dos taludes da barragem foram utilizados métodos baseados no
princípio do equilíbrio limite para a determinação do fator de segurança FS, sendo os
reportados neste trabalho obtidos do Método de Bishop Simplificado. Também limitou-se a
análise de círculos críticos somente na região do espaldar de montante (rejeito), permitindo
círculos apenas pelas camadas superficiais da fundação, uma vez que o rejeito era o objeto
principal deste estudo.
______________________________________________________________________________________
______________________________________________________________________________________
Tabela 10.15 - Parâmetros constantes utilizados nas análises de estabilidade

MATERIAL γsat (kN/m3) c’ (kPa) φ’ (°) ru
Enrocamento 25,0 0 45 0
Argila mole 18,0 50 0 0
Areia argilosa 20,0 15 25 0,3
Areia 20,0 15 30 0,1
Solo residual 20,0 100 35 0,2
Rocha de fundação 25,0 200 40 0
10.2.3 - ANÁLISE DETERMINÍSTICA
Na estabilidade de taludes existem algumas incertezas, como parâmetros geotécnicos c’, φ’ e

ru. Na prática tradicional da engenharia, ao analisar a estabilidade de taludes, é muito comum
deparar com a utilização do bom senso para escolher certos parâmetros e executar a análise,
correspondendo à Análise Determinística. No caso em estudo, ao optar-se pela Análise
Determinística, foram utilizados, para o rejeito, os parâmetros médios de c’ e φ’, com valores
de poropressão arbitrados dentro de uma faixa considerada razoável para casos como a pilha
em estudo de 10 a 40 % (análise paramétrica).
Para as análises de estabilidade foi utilizado o parâmetro ru , por não possuir dados referentes
à poropressão. Por definição, ru é considerado um percentual entre a poropressão u e a tensão
geostática aplicada, ou seja ru = u / γ.h, sendo utilizado quando não se tem condições de
quantificar a poropressão real.
A utilização dos valores médios de c’ e φ’, juntamente com os valores estimados para ru, levou
a uma Análise Determinística em relação aos parâmetros de resistência, e Paramétrica em
relação à poropressão. Na Tabela 10.16, a seguir, são apresentados os parâmetros utilizados
nas análises e os resultados de FS obtidos. Através da Tabela 10.16, pode ser verificado que
quanto maior o valor de ru menor o valor de FS, como esperado, já que a poropressão afeta
diretamente a resistência ao cisalhamento.
Tabela 10.16 - Casos estudados na análise determinística

CASO φ’med (o) c’ med (kPa) ru FS
0A 29,0 8,6 0,1 1,871
0B 29,0 8,6 0,2 1,727
0C 29,0 8,6 0,3 1,585
0D 29,0 8,6 0,4 1,436
10.2.4 - ANÁLISE PROBABILÍSTICA
A visão probabilística adota uma metodologia lógica e sistemática, onde se considera a

variação de cada parâmetro até o final da análise. Ao solucionar um problema dentro desta
visão é preciso que cada parâmetro que afeta a questão seja associado a uma distribuição
estatística. A partir desta distribuição estatística introduz-se o conceito de confiabilidade, que
avalia a probabilidade de ocorrer o que se está calculando acima de um critério de segurança
qualquer.
______________________________________________________________________________________
______________________________________________________________________________________
Para o estudo probabilístico foi utilizado o Método das Estimativas Pontuais (Rosenblueth,
1975), que dispensa a priori o conhecimento das distribuições estatísticas das variáveis
independentes, usando somente suas médias e desvios padrão. Assim, cada variável tem dois
pontos de estimativa, média mais desvio padrão e média menos desvio padrão. Neste método
o FS é calculado em apenas alguns pontos, e com base nestes pontos se torna possível obter os
parâmetros estatísticos (momentos) da distribuição probabilística de FS. Segundo Rosenblueth
(1975) o número de casos a ser estudado corresponde a 2n, onde n é o número de variáveis
independentes. Neste estudo trabalhou-se com os parâmetros c’, φ’ e γsat, do rejeito, sendo c’ e
φ’ considerados variáveis independentes e, φ’ e γsat considerados variáveis dependentes entre
si. Desta forma, foi utilizado n = 2 (coesão e ângulo de atrito), logo, 4 casos foram analisados.
Para cada caso, por não ter dados referentes a poropressão, foi também realizado uma análise
paramétrica acoplada, com ru assumindo os valores de 10, 20, 30 e 40%. Assim, foram
analisadas 16 situações probabilísticas/paramétricas, sendo 4 paramétricas para cada análise
probabilísticas. Os resultados se encontram na Tabela 10.17.
Tabela 10.17 - Casos estudados na análise probabilística/paramétrica

CASO γsat φ’ c’ ru FS
1A γsat + φ’+ c’ + 0,1 2,019
1B γsat + φ’+ c’ + 0,2 1,857
1C γsat + φ’+ c’ + 0,3 1,697
1D γsat + φ’+ c’ + 0,4 1,538
2A γsat + φ’+ c’- 0,1 1,998
2B γsat + φ’+ c’- 0,2 1,837
2C γsat + φ’+ c’- 0,3 1,676
2D γsat + φ’+ c’- 0,4 1,518
3A γsat - φ’ - c’ + 0,1 1,757
3B γsat - φ’ - c’ + 0,2 1,630
3C γsat - φ’- c’+ 0,3 1,497
3D γsat - φ’ - c’ + 0,4 1,327
4A γsat - φ’ - c’- 0,1 1,734
4B γsat - φ’ - c’- 0,2 1,608
4C γsat - φ’- c’- 0,3 1,475
4D γsat - φ’ - c’- 0,4 1,251
γsat = 26,1 kN/m
+ 3 γsat = 24,2 kN/m
- 3
φ’ + = 32,0 ° φ’ = 26,1 °
-
c’+ = 11,4 kPa c’- = 5,8 kPa
Dentro da análise probabilística foram realizados os estudos de confiabilidade do talude para

poropressões de 10, 20, 30 e 40%. Estas análises foram efetuadas a partir de valores de FS
obtidos nas análises probabilísticas de estabilidade. Com os valores de FS, em cada situação
de poropressão, foram calculados os parâmetros estatísticos (momentos) da distribuição
probabilística de FS, assumindo que esta é uma distribuição de Gauss. A distribuição normal é
totalmente definida apenas por dois momentos, a média (momento M1) e o desvio padrão
(raiz quadrada do momento M2), sendo calculados pelas seguintes expressões (Rosenblueth,
1975):
______________________________________________________________________________________
______________________________________________________________________________________
M1 = ∑ pi FSi (10.5)
M2 = ∑ pi (FSi)2 - M1 2 (10.6)
∆FS = (M2)1/2 (10.7)
Onde:
pi = probabilidade de ocorrência de cada caso; como são 4 análises independentes, pi = 0,25;
FSi = valor do FS de cada análise.
Os resultados podem ser observados na Tabela 10.18.
Tabela 10.18 - Valores da média e do desvio padrão de FS em função de ru

ru M1 (FSmed) ∆ FS
0,1 1,877 0,132
0,2 1,733 0,116
0,3 1,586 0,105
0,4 1,409 0,116
Embora a distribuição escolhida permita teoricamente valores de FS menores do que zero, o

que é fisicamente inaceitável, na prática não foi constatada tal situação. A função de
probabilidade do fator de segurança (curva gaussiana) é dada pela seguinte expressão:
1   FS − FSmed  
2
f ( FS) = exp  −0,5    (10.8)

∆FS 2π   ∆FS  
De forma geral, as curvas gaussianas podem indicar duas situações extremas:
• A curva apresenta-se fechada em torno da média, havendo conseqüentemente uma

pequena dispersão. Isto significa uma pequena variabilidade em torno do valor médio
encontrado (neste caso estudado, FS). Se este valor de FS atender aos critérios
especificados pode-se dizer a probabilidade de risco será mínima;
• A curva apresenta-se aberta em torno da média, havendo conseqüentemente uma maior
dispersão. Isto significa uma maior variabilidade em torno do valor médio encontrado.
Apesar deste valor pode-se atender aos critérios especificados, existe neste caso,
probabilidades de risco maiores.
No estudo em questão, para obter as curvas gaussianas fez-se FS variar de 0 até duas vezes o
valor de FSmed . Assim, foram determinadas as distribuições gaussianas para cada valor de ru ,
que se encontram apresentadas na Figura 10.8.
As curvas gaussianas (Figura 10.8) podem ser enquadradas na situação 1 (menores

dispersões), não obstante, convém ressaltar que os comportamentos não foram iguais para os
diferentes valores de ru . Pode ser observado que para ru = 0,1 a dispersão foi maior, embora o
FS médio fosse o de maior valor.
______________________________________________________________________________________
______________________________________________________________________________________
4.0
ru = 0.1
3.0
ru = 0.2
ru = 0.3
f (FS)
2.0
ru = 0.4
1.0
0.0
0.0 1.0 2.0 3.0
FS
Figura 10.8 - Distribuição gaussiana do fator de segurança para os valores de ru
A confiabilidade R é um complemento da probabilidade de risco, pr ,que é a probabilidade de

risco de ocorrer um FS menor do que um (FS < 1,0). Ao somar os valores da probabilidade de
risco com os da confiabilidade, devem perfazer um total de 1,0. Para calcular a probabilidade
acumulada, em relação a um certo valor de FSi , deve-se calcular a área sob as curvas
gaussianas. Nas Tabelas 10.19 a 10.22 são apresentados os valores da probabilidade de risco e
da confiabilidade, gerados para cada valor de ru, com FS variando de zero até FS médio, já
que existe simetria nas curvas.
Tabela 10.19 - Dados da curva de confiabilidade para ru = 0,1

FSi pr (FS < FSi) R
0 0,0000 1,0000
0,1 6,701E-41 ~ 1,0000
0,2 1,351E-36 ~ 1,0000
0,3 1,533E-32 ~ 1,0000
0,4 9,804E-29 ~ 1,0000
0,5 3,531E-22 ~ 1,0000
0,6 7,167E-22 ~ 1,0000
0,7 8,197E-19 ~ 1,0000
0,8 5,285E-16 ~ 1,0000
0,9 1,921E-13 ~ 1,0000
1,0 3,942E-11 ~ 1,0000
1,1 4,572E-09 ~ 1,0000
1,2 3,005E-07 ~ 1,0000
1,3 1,124E-05 ~ 1,0000
1,4 0,0002 0,9998
1,5 0,0030 0,9970
1,6 0,0221 0,9779
1,7 0,0997 0,9003
1,8 0,2872 0,7128
1,877 0,5000 0,5000
______________________________________________________________________________________
______________________________________________________________________________________

FSi pr (FS < FSi) R
0 0,0000 1,0000
0,1 1,5869E-44 ~ 1,0000
0,2 2,0379E-39 ~ 1,0000
0,3 1,2448E-34 ~ 1,0000
0,4 3,6166E30 ~ 1,0000
0,5 4,9981E-26 ~ 1,0000
0,6 3,2857E-22 ~ 1,0000
0,7 1,0276E-18 ~ 1,0000
0,8 1,5291E-15 ~ 1,0000
0,9 1,0831E-12 ~ 1,0000
1,0 2,0657E-10 ~ 1,0000
1,1 5,800E-08 ~ 1,0000
1,2 4,542E-06 ~ 1,0000
1,3 0,0002 0,9998
1,4 0,0031 0,9969
1,5 0,0284 0,9716
1,6 0,1390 0,8610
1,7 0,3901 0,6099
1,733 0,5000 0,5000
Tabela 10.21- Dados da curva de confiabilidade para ru = 0,3

FSi pr (FS < FSi) R
0 0,0000 1,0000
0,1 6,117E-454 ~ 1,0000
0,2 2,771E-399 ~ 1,0000
0,3 5,068E-344 ~ 1,0000
0,4 3,742E-29 ~ 1,0000
0,5 1,116E-24 ~ 1,0000
0,6 1,343E-20 ~ 1,0000
0,7 6,531E-17 ~ 1,0000
0,8 1,283E-13 ~ 1,0000
0,9 1,018E-10 ~ 1,0000
1,0 3,268E-08 ~ 1,0000
1,1 4,261E-06 ~ 1,0000
1,2 2,273E-04 ~ 1,0000
1,3 0,0051 0,9949
1,4 0,0031 0,9969
1,5 0,0284 0,9716
1,586 0,5000 0,5000
______________________________________________________________________________________
______________________________________________________________________________________

FSi pr (FS < FSi) R
0 0,0000 1,0000
0,1 3,8472E-29 ~ 1,0000
0,2 4,4486E-25 ~ 1,0000
0,3 2,4468E-21 ~ 1,0000
0,4 6,4027E-18 ~ 1,0000
0,5 7,9725E-15 ~ 1,0000
0,6 4,7262E-20 ~ 1,0000
0,7 1,0000E-09 ~ 1,0000
0,8 1,8000E-07 ~ 1,0000
0,9 1,1660E-05 ~ 1,0000
1,0 3,6530E-04 ~ 1,0000
1,1 0,0057 0,9943
1,2 0,0444 0,9556
1,3 0,1883 0,8117
1,4 0,4692 0,5308
1,409 0,5000 0,5000
Para cada caso de ru analisado, foi plotada uma curva de áreas integradas, denominada curva
de confiabilidade. Os valores das tabelas anteriores foram plotados, e se encontram na Figura
10.9.
1.0
0.8 ru = 0.1
ru = 0.2
CONFIABILIDADE
0.6
ru = 0.3
ru = 0.4
0.4
0.2
0.0
0.0 1.0 2.0 3.0 4.0
FS
Figura 10.9 - Curvas de confiabilidade considerando todas as poropressões
Através das curvas de confiabilidade, pôde-se calcular as probabilidades de risco, conforme

Tabela 10.23.
______________________________________________________________________________________
______________________________________________________________________________________
Tabela 10.23 - Probabilidades de risco de acordo com o critério de projeto.
FS ru pr (FS < FSi)

1
1,0 0,1
100000000000
1,0 0,2 0
1
1,0 0,3
100000000
1
1,0 0,4
10000
Por se tratar de uma metodologia recente, ainda não se tem experiência suficiente para
determinar a probabilidade de ruptura aceitável. A partir de que probabilidade de ruptura seria
conveniente indicar que um talude de barragem de rejeito não é confiável? Whitman (1986)
apresentam esta questão filosófica em torno da análise probabilística. Citam situações de
confiabilidade de 1/100000 ou menores para barragens de terra convencionais, e de 1/10 a
1/100 para casos de taludes de minas. Neste trabalho, devido a falta de referências para
barragens de rejeitos, optou-se por um valor aceitável da probabilidade de ruptura entre
1/10000 a 1/100000, dependendo dos riscos e danos envolvidos (materiais, ecológicos e
humanos). Dentro deste critério, no caso-estudo para a condição analisada, poderia ser
considerada uma otimização dos taludes, caso fosse constatada, através de piezômetros, uma
poropressão construtiva de apenas 0,1, uma vez que a probabilidade de ruptura é praticamente
zero. Por outro lado, para ru = 0,4 a probabilidade de ruptura seria de 1/10000, portanto não
aceitável. Assim será de fundamental importância o conhecimento das poropressões durante o
processo construtivo, para certificar a real probabilidade de risco desta barragem de rejeito.
10.3 - CONTROLE ESTATÍSTICO APLICADO A PAVIMENTAÇÃO
No controle de qualidade dos serviços de engenharia, além do acompanhamento permanente

por inspeções dos serviços, há necessidade de determinações de valores de aferição, que
ocorrem, de uma maneira geral, muito mais dispersos do que nos outros processos industriais
de produção. Até mesmo a determinação de características de qualidade de certos materiais
industrializados, que chegam aos canteiros de obras, apresentam esta dispersão. Dessa
maneira, é também importante a utilização dos cálculos estatísticos para interpretar, resolver e
responder o mais corretamente possível aos diversos problemas existentes no intuito de
reduzir-se ao mínimo o risco de imperfeições. Por outro lado, enquanto no controle de
qualidade de outros produtos industriais a correção de imperfeições é feita sem ônus
exagerado, na indústria de construção, esta reparação é muitas vezes difícil e onerosa,
podendo apresentar reflexos técnicos e políticos inaceitáveis.
10.2.1 - VARIABILIDADE DOS MATERIAIS E ENSAIOS
Na aferição dos índices de qualidade dos serviços de pavimentação, os diversos resultados

apresentam dispersões provenientes das seguintes causas principais:
______________________________________________________________________________________
______________________________________________________________________________________
• Variabilidade dos ensaios de laboratório utilizados no controle dos serviços;

• Variabilidade das ocorrências dos vários materiais naturais terrosos e rochosos e dos
materiais industrializados utilizados nos serviços;
• Variabilidade de cada camada componente do corpo do pavimento, proveniente dos
processos construtivos utilizados.
10.2.2 - AMOSTRAGEM ALEATÓRIA PARA CONTROLE DE PAVIMENTAÇÃO
As amostragens para realização dos ensaios e as aferições “in situ” para o controle tecnológico
das obras de pavimentação devem ser executadas por um processo de escolha (sorteio)
aleatório, que apresente as seguintes vantagens principais:
• Todos os pontos da superfície de uma determinada camada de pavimento, que está sendo
verificada para aceitação, devem ter chance de serem escolhidos.
• As equipes de controle e os executantes dos serviços só devem tomar conhecimento dos
locais de verificação no momento de sua realização.
Para isto, é recomendado o uso de tabelas de números aleatórios ou de calculadoras com

programas de geração de números aleatórios. Um exemplo destas tabelas, a Tabela 10.15,
compõe-se de 15 colunas e 15 linhas e para utilizá-la são sorteados pares de números de 01 a
15, correspondentes às colunas e às linhas, os quais determinarão os números aleatórios que
servirão para localização dos pontos de amostragem. Como sempre existe um sistema de
marcação de serviços, fica relativamente fácil definir o local da amostragem, utilizando os
números aleatórios sorteados ou gerados por calculadora, como multiplicadores de distâncias
longitudinais e transversais no sistema de marcação de qualquer via.
Tabela 10.15 - Tabela de Números Aleatórios

LINHA COLUNA
01 02 03 04 05 06 07 08 09 10 11 12 13 14 15
01 39 65 76 45 45 19 90 69 64 61 20 26 36 31 62
02 72 20 47 33 84 51 67 47 97 19 98 40 07 17 66
03 37 48 79 88 74 63 52 06 34 30 01 31 60 10 27
04 87 18 15 70 07 37 79 49 12 38 48 13 93 55 96
05 10 08 58 07 04 76 62 16 48 68 58 76 17 14 86
06 93 05 31 03 07 34 18 04 52 35 74 13 39 35 22
07 95 18 94 06 97 27 37 83 28 71 79 57 95 13 91
08 69 26 88 86 13 59 71 74 17 32 38 38 75 93 29
09 91 94 14 63 62 08 61 74 51 69 92 79 43 89 79
10 67 72 77 63 99 89 85 84 46 06 64 71 06 21 66
11 63 62 06 34 31 79 53 36 02 95 94 61 09 43 62
12 87 68 62 15 43 97 48 72 66 48 53 16 71 13 81
13 56 88 87 59 41 06 87 37 78 48 65 88 69 58 39
14 19 36 27 59 46 39 77 32 77 9 79 57 92 36 59
15 78 43 76 71 61 97 67 63 99 61 80 45 67 93 82
______________________________________________________________________________________
______________________________________________________________________________________
10.2.3 - ESTABELECIMENTO DA ROTINA PARA O CONTROLE ESTATÍSTICO

DE QUALIDADE DAS OBRAS DE PAVIMENTAÇÃO
Qualquer sistema de controle de qualidade de obras, para ser útil e eficiente, deve ser de
simples realização e permitir que, a qualquer momento, o controlador visualize as falhas, que,
porventura, apareçam e tome a decisão acertada de corrigi-las, sem atrasar o andamento da
obra.
• Etapa I: Seleção dos parâmetros de controle de acordo com as especificações a serem

observadas; A seleção dos parâmetros de controle são aqueles constantes das
especificações de serviço de terraplanagem mecanizada, regularização sub-base, base
granular, materiais betuminosos e bases e revestimentos betuminosos pré-misturados do
DNER. Outros parâmetros podem ser estabelecidos pela Fiscalização no início de cada
serviço, de acordo com as especificações adotadas em cada prefeitura.
• Etapa II: Listagem das informações conhecidas sobre cada parâmetro, isto é, coeficientes
de variação e/ou desvios padrão;
• Etapa III: Cálculo dos valores das médias prováveis e número mínimo de ensaios a serem
realizados em função dos valores máximos, mínimos ou intervalos estabelecidos pelas
especificações;
• Etapa IV: Listagem, análise estatística ou construção de gráficos de controle dos
parâmetros especificados, de acordo com os modelos adotados e/ou criados pela
Fiscalização para arquivamento, apresentação em relatório, e liberação de medições e
pagamentos quando for o caso.
O cálculo dos valores das médias e/ou desvios padrões prováveis para assegurar os índices de
qualidade de cada serviço de acordo com as especificações, é feito através do que foi
estabelecido nas Etapas I e II.
Quanto ao número mínimo de unidades de amostragem a serem analisadas, é recomendado o

uso das seguintes fórmulas:
σ σ
P = z0 ou P = t 0 (10.9)
n n
Onde:
P = Acurácia (na mesma unidade de desvio padrão)

Z0 = coeficiente tabelado da curva Normal
t0 = coeficiente tabelado de Student para n-1 graus de liberdade
σ = desvio padrão da população
s = desvio padrão da amostra
n = número de unidades de amostragem
Os exemplos ilustrativos selecionados são correspondentes a casos reais de obras já

concluídas com bastante sucesso. Destaca-se que, nestes exemplos ilustrativos, o Construtor
usou os critérios do DNER, vigentes no controle dos serviços, enquanto que a Fiscalização
(Consultora) realizava apenas uma parte dos ensaios de controle previstos pelas
______________________________________________________________________________________
______________________________________________________________________________________
especificações, o que não impediu no entanto que em momento algum ela não estivesse de
posse de todos os elementos para um julgamento correto para aceitação ou não dos serviços.
Exemplo 10.1 – Controle da Regularização da Rodovia BR-174/364-MT trecho Cáceres-

Pontes e Lacerda.
Estabelecimento de rotina da Fiscalização para o Controle do GC - Grau de Compactação.
Etapa I
• Parâmetro a ser Controlado - Grau de Compactação.

• Pelas Especificações, 95% dos resultados deveriam estar com valores acima de GC ≥ 100%
∴ 100 ≤ µ
Etapa II
• Dados sobre a variabilidade do GC (valores conhecidos) – Desvio Padrão s = 1,5 a 4,5.

• A Fiscalização adotou s = 2,5 com base em experiência anterior e em função de diversos
condicionantes observados no trecho, tais como: pessoal especializado, supervisão dos
engenheiros, sistemática padronizada dos ensaios, etc.
Etapa III
• A fiscalização decidiu verificar a qualidade dos serviços nos segmentos dados como
concluídos pela Construtora através de 3 ensaios no mínimo, portanto, n = 3.
• Fórmulas do limite inferior quando s é conhecido e o valor mínimo da especificação.
_
x - z0 σ ≤ µ
100 ≤ µ
Pela tabela da curva Normal, para uma probabilidade de ocorrências de apenas 5% de valores
abaixo do especificado, tem-se:
P (Z ≥ 0,05) ∴ z0 = 1,64
Sabendo-se que pela estatística X é o melhor valor estimativo da média µ, e de acordo com o
valor mínimo da especificação tem-se:
X - 1,64 (2,5) = 100 ∴X = 104,1

µ ≈ 104
Etapa IV
• Com o aumento do tamanho da amostra (n = 17), como foi feito pela Construtora, o valor
do desvio padrão mostrou uma tendência de uma dispersão levemente maior do que foi
previsto, isto é, σ > 2,5.
______________________________________________________________________________________
______________________________________________________________________________________
• A Média do total dos resultados Construtora + Fiscalização foi a prevista e o valor mínimo
absoluto calculado pela fórmula do Limite Inferior (X - z0 = 104 - 1,64 x 2,6 = 99,74 ≈
100).
• A decisão da Fiscalização de realizar somente 3 ensaios, para verificação dos resultados,
parece ser perfeitamente aceitável, conforme pode verificar-se para os seguintes valores de n
de acordo com a Equação 10.5.
P = z0 + σ n em que z 0 = 1, 64 e σ = 2,5
n=1 P = 4,1
n=2 P = 3,0
n=3 P = 2,4
n=4 P = 2,1
n=5 P = 1,8
n=6 P = 1,7
n=7 P = 1,6
Estes resultados são apresentados na Figura 10.9.
5
4
3
P
2
1
0
0 1 2 3 4 5 6 7
n
Figura 10.9 - Curva de limites de acurácia.
A partir de n=3, a acurácia P não é melhorada substancialmente.
•Os ensaios aleatórios da fiscalização atestaram a boa qualidade dos serviços.

•Os ensaios realizados oscilaram em torno da média conforme previsão estatística.
Exemplo 10.2 – Controle da Regularização da rodovia BR-174/364-MT trecho Cáceres-

Pontes e Lacerda
Estabelecimento da Rotina da Fiscalização para o Controle do ISC
Etapa I
______________________________________________________________________________________
______________________________________________________________________________________
• Parâmetro a ser controlado I.S.C.

• Pelas especificações, 90% dos resultados deve estar com os valores acima do especificado
pelo projeto I.S.C. ≥ 10 ∴ 10 ≤ µ.
Etapa II
• Dados sobre a variabilidade do I.S.C. – C.V. = 0,25 a 0,30.

• Valor adotado C.V. = 0,25.
• Pesquisas realizadas pela ABPv apontam o valor do C.V. = 0,25 como um dos valores
prováveis.
Etapa III
• A Fiscalização decidiu que vai verificar a qualidade dos serviços através de 3 ensaios no
mínimo, portanto n=3.
• Fórmulas do limite inferior quando σ e/ou C.V. é conhecido e o valor mínimo especificado.
•
X - z0 σ ≤ µ
10 ≤ µ
• Pela tabela da curva normal, para uma probabilidade de ocorrência de apenas 10% de
valores abaixo do especificado tem-se:
Pr (z ≥ 0,10) ∴ z0 = 1,28
• Sabendo-se, pela estatística, que X é o melhor valor estimativo da média µ do universo e,

assumindo-se momentaneamente que X = µ como é comum em várias determinações de
projetos e obras de engenharia, de acordo com os valores do coeficiente de variação provável
e do valor mínimo especificado. Assim, tem-se:
•
σ / X = 0,25 ∴ σ = 0,25 X
X - 1,28 (0,25 X) = 10 ∴ X (1 - 1,28 x 0,25) = 10 ∴ X = 14,75 ≈ µ
σ = 3,68 ≈ 3,7
Etapa IV
• Os ensaios do I.S.C. deste segmento foram os seguintes:

•
Construtora : 15, 12, 20, 13 X = 15 S = 3,6
Fiscalização : 12, 11, 14 X = 12 S = 1,5
Conjunto : X = 14 S = 3,0
• O valor mínimo encontrado com o total dos resultados reais das amostragens de campo foi:
______________________________________________________________________________________
______________________________________________________________________________________
LI = X - Z0 σ = 14 - 1,28 x 3 = 10,16 ≈ 10
A especificação foi cumprida.
• A média X e o desvio padrão s, calculados com o total dos resultados reais de campo,
confirmaram praticamente as previsões estatísticas para estes valores.
• Os três ensaios aleatórios da fiscalização atestaram boa qualidade dos serviços com respeito
a este parâmetro.
• A curva da acurácia com σ = 3,6 e diversos valores de n indica também que para n > 3 a
acurácia não é substancialmente melhorada conforme se pode verificar na Figura 10.4.
P = z 0 + σ n ∴ P = 1, 28 + 3, 7 / n
n=1 P = 5,0
n=2 P = 3,9
n=3 P = 3,4
n=4 P = 3,1
n=5 P = 2,9
n=6 P = 2,8
Estes resultados são apresentados na Figura 10.10.
5
4
3
P
2
1
0
0 1 2 3 4 5 6
n
Figura 10.10 - Curva de limites de acurácia
______________________________________________________________________________________
BIBLIOGRAFIA
ANG, A.H.S. & TANG, W. (1975). Probability Concepts in Engineering Planning and
Design: Basic Principles. John Wiley & Sons, New York, USA, vol. 1, 422p.
ABPv (1985). Manual de Pavimentação Urbana: Controle Estatístico de Qualidade. ABPv,
Rio de Janeiro, RJ, III(4): 64 p.
Alonso, E.E. (1976). Risk analyses of slopes and its application to slopes in Canadian
sensitive clays. Geotechnique, 26(3): 453-472.
Arias, F.J. & Auvinet, G. (1999). Confiabilidad de trincheras estabilizadas com lodo. XI Pan-
American Conference on Soil Mechanics and Geotechnical Engineering, ISSMGE / ABMS
/ SAMS / SPG, Foz do Iguassu, Brazil, 1: 35-41.
Assis, A.P. & Espósito, T.J. (1995). Construção de barragens de rejeito sob uma visão
geotécnica. III Simpósio sobre Barragens de Rejeitos e Disposição de Resíduos, REGEO
'95, ABMS & ABGE, Ouro Preto, MG, pp. 259-273.
Assis, A.P., Espósito, T.J. & Gardoni, M.G. (1997). Comparação entre dois métodos
probabilísticos na análise da estabilidade de um talude de mina. 2a Conferência Brasileira
sobre Estabilidade de Encostas (COBRAE) e 2nd Pan-American Symposium on
Landslides, ABMS, ABGE & ISSMGE, Rio de Janeiro, Brazil, pp. 347-352.
Bowles, D.S. & Ko, H-Y (1984). Probabilistic Characterization of Soil Properties: Bridge
Between Theory and Practice. ASCE, New York, USA, 185 p.
Chowdhury, R.N. (1992). Simulation of risk of progressive slope failure. Canadian
Geotechnical Journal, 29: 94-102.
Chowdhury, R.N. (1993). Rational polynomial technique in slope-reliability analysis. Journal
of Geotechnical Engineering, ASCE, 119(12): 1910-1928.
Christian, J.T. (1999). Factors affecting the calculated reliability of slopes. XI Pan-American
Conference on Soil Mechanics and Geotechnical Engineering, ISSMGE / ABMS / SAMS /
SPG, Foz do Iguassu, Brazil, 3: 1225-1231.
Christian, J.T.; Ladd, C.C. & Baecher, G.B. (1992). Reliability and probability in stability
analysis. Stability and Performance of Slopes and Embankments II, Geotechnical Special
Publication No. 31, ASCE, New York, USA, 2: 1071-1111.
Davis, J.C. (1973). Statistic and Data Analysis in Geology. John Wiley & Sons, New York,
USA, 646 p.
D'Andrea, R.A. & Sangrey, D.A. (1982). Safety factors for probabilistic slope design. Journal
of the Geotechnical Engineering Division, ASCE, 108(GT9): 1101-1118.
Dell'Avanzi, E. (1995). Confiabilidade e Probabilidade em Análises de Estabilidade de
Taludes. Dissertação de Mestrado, Departamento de Engenharia Civil, PUC-Rio, Rio de
Janeiro, RJ, 135 p.
Dell'Avanzi, E. & Sayão, A.S.F.J. (1998). Avaliação da probabilidade de ruptura de taludes.
XI Congresso Brasileiro de Mecânica dos Solos e Engenharia Geotécnica, COBRAMSEG,
ABMS, Brasília, DF, 2: 1289-1295.
Espósito, T.J. (1995). Controle Geotécnico da Construção de Barragens de Rejeito - Análise
da Estabilidade de Taludes e Estudos de Percolação. Dissertação de Mestrado, Publicação
G.DM-021A/95, Departamento de Engenharia Civil, Universidade de Brasília, Brasília,
DF, 187 p.
Espósito, T.J. & Assis, A.P. (1998). Análise comparativa da variabilidade de parâmetros
geotécnicos entre diferentes alteamentos de uma barragem de rejeitos. XI Congresso
Brasileiro de Mecânica dos Solos e Engenharia Geotécnica, COBRAMSEG, ABMS,
Brasília, DF, 3: 1797-1804.
Métodos Estatísticos e Probabilísticos em Geotecnia - Bibliografia 1

Espósito, T.J., Assis, A.P. & Ribeiro, L.F.M. (1997). Una alternativa de control de la calidad
de la construcción de represas de relaves. 4o Congreso Chileno de Ingenieria Geotecnica,
SOCHIGE, Valparaíso, Chile, pp. 455-468.
Farias, M.M. & Assis, A.P. (1998). Uma comparação entre métodos probabilísticos aplicados
a estabilidade de taludes”. XI Congresso Brasileiro de Mecânica dos Solos e Engenharia
Geotécnica, COBRAMSEG, ABMS, Brasília, DF, 2: 1305-1314.
Haldar, A. & Mahadavam, S. (1999). Probability, Reability and Statistical Methods in
Engineering Desing. John Wiley & Sons, New York, USA, 304 p.
Harr, M.E. (1985). Reliability – Based Design in Civil Engineering. McGraw-Hill Publishing
Company, New York, USA, 291 p.
Huamán, E.A.O., Campos, T.M.P. & Vargas, E.A. (1992). Análise de estabilidade de taludes
considerando ruptura progressiva. 1a Conf. Brasileira sobre Encostas, COBRAE, ABMS,
Rio de Janeiro, RJ, pp. 537-557.
Kottegoda, N.T. & Rosso, R. (1997). Statistics, Probability, and Reliability for Civil and
Environmental Engineers. McGraw-Hill Publishing Company, New York, USA,
735 p.
Lapponi, J.C. (1997). Estatística Usando Excel Versões 5 e 7. Lapponi, São Paulo, SP, 401 p.
Levine, D.M., Berenson, M.L. & Stephan, D. (1998). Estatística: Teoria e Aplicações. Livros
Técnicos e Científicos Editora S.A., Rio de Janeiro, RJ, 811 p.
Li, K.S. & Lo, S-C.R. (1993). Probabilistic Methods in Geotechnical Engineering. Balkema,
Rotterdam, Netherlands, 333 p.
Mello Franco, J.A. (1997). The coupling of Monte Carlo techniques with the fuzzified
determination of safety factors of slopes, aiming at the assessment of its overall stability
conditions. 2a Conferência Brasileira sobre Estabilidade de Encostas (COBRAE) e 2nd
Pan-American Symposium on Landslides, ABMS, ABGE & ISSMGE, Rio de Janeiro,
Brazil, pp. 545-556.
Mendonça, R.M.G., Silva, L.J.R.O.B. & Barroso, E.V. (1997). Um estudo sobre a
variabilidade da rugosidade de juntas de alívio em gnaisse facoidal do município do Rio de
Janeiro. 2a Conferência Brasileira sobre Estabilidade de Encostas (COBRAE) e 2nd Pan-
American Symposium on Landslides, ABMS, ABGE & ISSMGE, Rio de Janeiro, Brazil,
pp. 521-526.
Pacheco, M. (1990). Conceitos de probabilidade e análise de risco em estudos e projetos de
geotecnia. IX COBRAMSEF, ABMS, Salvador, BA, pp. 35-56.
Rétháti, L. (1988). Probabilistic Solutions in Geotechnics. Elsevier, Amsterdam, Netherlands,
451 p.
Riela, J., Urzúa, A., Christian, J.T., Karzulovic, A. & Flores, G. (1999). Slide rock wedge
reliability analysis of Chuquicamata mine slopes. XI Pan-American Conference on Soil
Mechanics and Geotechnical Engineering, ISSMGE / ABMS / SAMS / SPG, Foz do
Iguassu, Brazil, 3: 1289-1296.
Riela, J., Urzúa, A., Christian, J.T. & Troconis, M. (1999). Reliability analysis of slopes in a
fuel-oil storage reservoir. XI Pan-American Conference on Soil Mechanics and
Geotechnical Engineering, ISSMGE / ABMS / SAMS / SPG, Foz do Iguassu, Brazil, 3:
1165-1170.
Rosenblueth, E. (1975). Point estimates for probability moments. Proc. Nacional Academy of
Sciences, 72(10): 3812-3814.

Sandroni, S.S. & Sayão, A.S. (1992). Avaliação estatística do coeficiente de segurança de
taludes. 1a Conf. Brasileira sobre Encostas, COBRAE, ABMS, Rio de Janeiro, RJ, pp. 523-
536.
Sandroni, S.S. & Sayão, A.S. (1993). The use of relative probability of failure in the design of
open pit mine slopes. Innovative Mine Design for the 21st Century, Balkema, Rotterdam,
The Netherlands, pp. 21-24.
Santos da Silva, L., Sahlit, C.L. & Farias, M.M. (1999). Aplicação da análise plástica limite
aos métodos probabilísticos em Geotecnia”. XX Congresso Ibero-Latino Americano de
Métodos Computacionais em Engenharia, CILAMCE, São Paulo, SP.
Silveira, A. (1965). An analysis of the problem of washing through in protective filters. 6th
ICSMFE, ISSMFE, Montreal, Canada, pp. 551-555.
Soares, E.P., Lima, D.C., Bueno, B.S. & Virgili, J.C. (1997). Análise de estabilidade de um
talude da Mina de Águas Claras - MBR: Uma visão probabilística. 2a Conferência
Brasileira sobre Estabilidade de Encostas (COBRAE) e 2nd Pan-American Symposium on
Landslides, ABMS, ABGE & ISSMGE, Rio de Janeiro, Brazil, pp. 469-473.
Trueba, V. & Rodea, A. (1999). Análisis de la probabilidad de falla de presas. XI Pan-
American Conference on Soil Mechanics and Geotechnical Engineering, ISSMGE / ABMS
/ SAMS / SPG, Foz do Iguassu, Brazil, 3: 1027-1034.
Wackernagel, H. (1998). Multivariate Geostatistic: An Introduction with Applications.
Springer-Verlag, Berlin, Germany.
Whitman, R.V. (1984). Evaluating calculated risk in geothechnical engineering. Journal of
Geothecnical Engineering, ASCE, 110(2): 145-189.

Assis A. 2002. Métodos Estadísticos y Probabilísticos en Geotecnia2 PDF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Assis A. 2002. Métodos Estadísticos y Probabilísticos en Geotecnia2 PDF

Enviado por

Direitos autorais:

Formatos disponíveis

Universidade de Brasília

Prof. André P. Assis, Ph.D

APOSTILA: Publicação G.AP-002/01

BRASÍLIA / DF, 2002

2 – ESTATÍSTICA DESCRITIVA ....................................................................................... 2.1

3 – PROBABILIDADE ......................................................................................................... 3.1

4 - DISTRIBUIÇÃO DE PROBABILIDADE ...................................................................... 4.1

Métodos Estatísticos e Probabilísticos em Geotecnia - Índice

4.6.5 – OUTRAS DISTRIBUIÇÕES CONTINUAS ............................................................ 4.19

5 - AMOSTRAGEM E ESTIMAÇÃO ................................................................................. 5.1

6 - TESTES DE HIPÓTESES ............................................................................................... 6.1

Métodos Estatísticos e Probabilísticos em Geotecnia - Índice ii

7 - ANÁLISE DE VARIÂNCIA ........................................................................................... 7.1

8 - REGRESSÃO E CORRELAÇÃO................................................................................... 8.1

9 - MÉTODOS PROBABILÍSTICOS................................................................................... 9.1

10 - ESTATÍSTICA APLICADA ......................................................................................... 10.1

Métodos Estatísticos e Probabilísticos em Geotecnia - Índice iii

10.1.1 - INTRODUÇÃO ....................................................................................................... 10.1

Métodos Estatísticos e Probabilísticos em Geotecnia - Índice iv

A palavra Estatística é comumente associada à idéia de conjunto de dados. Ultimamente, a

A Estatística usualmente é dividida em três grandes áreas:

• Amostragem e Planejamento de Experimentos (mecanismo de coleta de dados);

A Estatística desempenha um papel fundamental na pesquisa científica, especialmente no que

Em Engenharia Civil, principalmente na área de Geotecnia, já há bastante tempo, tem sido

Os métodos estatísticos e probabilísticos aparecem então com uma alternativa sistemática de

Na engenharia geotécnica, por exemplo, na análise de estabilidade de um talude, a aplicação

Métodos Estatísticos e Probabilísticos em Geotecnia – Capítulo 1 1.1

Métodos Estatísticos e Probabilísticos em Geotecnia – Capítulo 1 1.2

A Estatística Descritiva é a parte da Estatística que procura descrever e analisar um certo

2.2. POPULAÇÃO E AMOSTRA

Denomina-se População ou Universo Estatístico, o maior conjunto tomado como referência na

Figura 2.1 - População e amostra

2.3. AGRUPAMENTOS DE DADOS E DISTRIBUIÇÃO DE FREQÜÊNCIA

Métodos Estatísticos e Probabilísticos em Geotecnia – Capítulo 2 2.1

Porém, quando o volume de dados é muito grande, o processo de ordenação torna-se

• As classes devem abranger todas as observações;

Onde n é o número total de observações.

fi é a freqüência relativa da classe (ni / n);

Fi é a freqüência relativa acumulada (Ni / n).

Métodos Estatísticos e Probabilísticos em Geotecnia – Capítulo 2 2.2

Massas específicas secas (g/cm3):

Pela Lei de Sturges tem-se: k = 1+ log230 = 5,90.

Quadro Completo de Distribuição de Freqüência (n = 30).

Métodos Estatísticos e Probabilísticos em Geotecnia – Capítulo 2 2.3

2.4. VARIÁVEIS E GRÁFICOS

• Variáveis: quando os dados têm expressão quantitativa estando, portanto, estreitamente

• Atributos: quando os dados têm expressão qualitativa, não trazendo em si a idéia de

A seguir são ilustrados os tipos de gráficos usualmente utilizados.

2.4.1. Gráfico de Hastes ou Bastões

Tabela 2.1. Dados relativos a acidentes de tráfego por dia.

Métodos Estatísticos e Probabilísticos em Geotecnia – Capítulo 2 2.4

O histograma é muito utilizado na representação gráfica de dados agrupados em classes, o que

Métodos Estatísticos e Probabilísticos em Geotecnia – Capítulo 2 2.5

2.4.3. Polígono de Freqüências

O polígono de freqüência é também utilizado para representar a distribuição de freqüência, o

2.4.4. Curva de Freqüências

A partir do polígono de freqüências pode-se representar contornos mais suaves utilizando

É o gráfico representativo de uma distribuição acumulada de freqüências. Consta de uma

Tabela 2.3. Dados relativos a massa específica seca (Exemplo 2.1)

Métodos Estatísticos e Probabilísticos em Geotecnia – Capítulo 2 2.6

2.4.6. Gráfico em Setores

Tabela 2.4 - Porcentagem de freqüências das massas específicas secas

Métodos Estatísticos e Probabilísticos em Geotecnia – Capítulo 2 2.7