Material PME 2021 Online PDF

Universidade Zambeze – Faculdade de Engenharia Ambiental de Recursos Naturais
UNIVERSIDADE ZAMBEZE
FACULTAD DE ENGENHARIA AMBIENTAL E DOS RECURSOS NATURAIS
Probabilidade e Métodos Estatísticos
Matérias do programa da disciplina de PME (material em produção)

ESTATISTICA BASICA
1. CONCEITOS BÁSICOS DA ESTATÍSTICA

Este capítulo tem como objetivo....
1.1. Introdução
De uma forma genérica, a palavra estatística provem do latim (status) que significa Estado. A sua
aplicação teve início antes de Cristo (a.C.), e começou a ter uma abrangência significativa no começo do
século XIX. As primeiras necessidades da estatística estavam ligadas ao Estado para formulação de
políticas públicas, fornecimento de informações demográficas e informações económicas para a
administração pública. Atualmente a estatística é largamente aplicada nas ciências naturais e sociais para
acumulação e análise de dados de uma forma geral para tomada de diversas decisões do quotidiano.
1.2. Definição
Na literatura, muitos autores definem a estatística de diversas formas. De uma forma genérica, a
estatística é uma ciência usada para descrever os procedimentos de coletar, organizar, analisar e
apresentar os resultados. A estatística é subdividida em duas áreas principais que são: 1. Estatística
Descritiva ou Dedutiva, 2. Estatística Inferencial ou Indutiva. A estatística descritiva é o ramo que lida com
a organização dos dados, resumos e apresentação. Enquanto que a inferência estatística compreende a
possibilidade de generalizar os resultados obtidos de certos dados para um contexto maior.
1.3. Conceitos básicos
Em seguida são apresentados alguns conceitos fulcrais da estatística.
1.3.1. Dado
É a unidade mínima da informação que é colhida e processada para produzir uma informação. Exemplo:
idades dos alunos numa turma, as notas da primeira prova duma turma, ...
O dado é classificado em quantitativo e qualitativo. Dados quantitativos são aqueles que identificam
quantidade, caraterísticas suscetíveis a medição, por exemplo; idade dos alunos, altura dos alunos, peso
dos alunos, ... Dados qualitativos são aqueles que indicam uma qualidade, classificação, caraterística ou
categoria não suscetíveis a medição. Exemplo: sexo dos alunos, cor dos olhos dos alunos, estado civil dos
alunos, ...
Material de PME/2021 Docente: Joaquim Francisco Mazunga, MSC Page 1
1.3.2. Informação
É o resultado do processamento dos dados. Exemplo: percentagens das idades dos alunos duma turma, a
média das notas dos alunos...
1.3.3. População
Em estatística população (N) é o conjunto de indivíduos, objetos ou resultados experimentais acerca dos
quais pretende-se estudar algumas caraterísticas em comum. Exemplo: quantidade dos alunos de uma
turma, plantas de uma espécie plantadas numa área, todos habitantes de um país, ...
1.3.4. Censo
É atividade de inspecionar, coletar ou observar todos os elementos de uma população real, finita, com
objetivo de conhecer as suas caraterísticas.
1.3.5. Amostra
A amostra (n) é um termo usado para designar uma parte dos indivíduos da população. Exemplo:
melhores alunos de uma turma, algumas espigas de milho retirados num hectare, população de um
município num determinado país, ...
1.3.6. Variável
São caraterísticas observáveis em cada elemento pesquisado.
As variáveis classificam-se em quantitativas (fenômenos mensuráveis) e qualitativas (fenômenos

observáveis).
As variáveis quantitativas subdividem-se em discretas e contínuas. As variáveis quantitativas discretas

assumem valores que resultam de uma contagem, exemplo; número de alunos de uma turma, número de
irmãos dos alunos de uma turma, número de habitantes de um bairro, ... enquanto que as variáveis
quantitativas continuas assumem infinidade de valores que resultam duma mensuração, exemplo; altura
dos alunos duma turma, temperatura atmosférica dos últimos cinco anos, notas dos alunos duma turma,
... .
As variáveis qualitativas subdividem-se em nominais e ordinais. As variáveis qualitativas nominais são

aquelas que identificam categorias, nomes dos objetos ou fenômenos, exemplo; sexo, morada,
naturalidade, ... enquanto que as variáveis qualitativas ordinais permitem ordenar as categorias dos
fenómenos, por exemplo; grau de instrução de um indivíduo, classe social de um indivíduo, classificação
de indivíduos numa corrida, ...
2. ESTATÍSTICA DESCRITIVA
Este capítulo tem como objetivo ...
2.1. Introdução
A estatística descritiva é o ramo que lida com a organização dos dados, resumos e apresentação da
informação desejada. O trabalho inicial na estatística é a coleta de dados que pode ser realizada numa
população ou amostra. Os dados coletados encontram se na sua forma bruta, de forma muito
desorganizada sem qualquer ordem ou padrão. Os dados coletados precisam de ser organizados e
apresentados numa forma sistemática e sequenciada por meio de tabelas e gráficos, que permitem dar
uma clareza para determinar os métodos estatísticos apropriados para serem aplicados num
determinado estudo.
2.1.1. Dados brutos
São aqueles que são obtidos diretamente da recolha para uma determinada pesquisa, que ainda não
sofreram nenhum processo de análise. Podem ser apresentados em tabelas de frequências ou gráficos.
Para começar a trabalhar com os dados, primeiro devem ser organizadas de forma crescente ou
decrescente. Usualmente usa-se o sentido crescente dos dados.
2.1.2. Frequência
A frequência é a medida que quantifica a ocorrência dos valores de uma variável num determinado
conjunto de dados. Os tipos de frequências de ocorrência de categorias ou valores de uma variável
podem ser absolutas, relativas, percentual e acumuladas.
A distribuição de frequência de uma variável observada em populações finitas e amostras pode ser
apresentada de duas maneiras que são tabular ou gráfica. Para melhor percepção, abaixo vem um
exemplo de aplicação.
Tabela 2.1. Atividade agropecuária predominante em 20 propriedades de um município.
café leite leite milho

café milho soja leite
leite café milho café
olericultura leite café laranja
café milho café café
Tabela 2.2. Distribuição de frequências da atividade agropecuária predominante em 20 propriedades de

um município.
Atividade Fa Fr Fp Fac. Abs Fac. Per

café 8 0,4 40 8 40
leite 5 0,25 25 13 65
milho 4 0,2 20 17 85
olericultura 1 0,05 5 18 90
soja 1 0,05 5 19 95
laranja 1 0,05 5 20 100
Total 20 1 100
Frequência absoluta (Fa) é a ocorrência de cada atividade por município.

Frequência relativa (Fr) é o quociente entre ocorrência de cada atividade pelo total das atividades.
Onde n é o tamanho da amostra.
Frequência percentual (Fp) é o produto entre a frequência relativa por 100%.
Frequência acumulada absoluta (Fac. Abs) é o somatório de cada observação da frequência absoluta.
Idem para frequência acumulada percentual.
Tabelas de frequência em forma gráfica:

2.1.3. Dados agrupados
Na recolha de dados para uma determinada pesquisa seja censo ou amostra, dependendo dos objetivos
de cada pesquisador, os tamanhos da população ou da amostra variam. Eles podem possuir tamanhos
pequenos ou grandes. Quando o tamanho da população ou amostra de um estudo é pequeno, não há
necessidade de agrupar os dados. Pode ser feito como os dados da tabela 2.1. Em estatística geralmente
considera-se uma amostra maior quando o número das observações é igual ou superior a trinta unidades.
Quando o número das observações é superior a trinta unidades, já pode ser considerado tamanho da
população ou amostra grande. Sendo grande, para apresentá-los numa tabela de frequências
(dependendo de cada pesquisador) podem ser agrupados de modo a condensar a informação. O
agrupamento de dados tem uma vantagem de diminuir constrangimentos para o manuseio de muitos
dados. A desvantagem de agrupar os dados reflete nos resultados a serem obtidos através dos
estimadores. Os resultados a serem obtidos que provem de dados agrupados, não são reais, mas são
muito aproximados aos resultados obtidos com os dados não agrupados.
Para o agrupamento de dados, depois de organizados, o critério mais utilizado é da escolha do número de
classes (k) entre 5 e 20 em função do conhecimento do investigador sobre os dados de sua pesquisa.
Existem muitos autores que abordam os critérios de agrupamento de dados de formas diferentes que
não serão apresentados todos. O objetivo do autor que produziu este material, é ilustrar o critério mais
clássico para o leitor ter uma base para resolver exercícios propostos.
2.1.4. Etapas para agrupar os dados
Passo 1. Número de classes
Utilizando o critério empírico para determinar o número de classes (k) em função do tamanho da
população ou amostra na distribuição de frequências toma-se em consideração o seguinte:

i) Tamanho da amostra até 100, o número de classes obtém-se através da expressão arredondado
por excesso:
ii) Quando o tamanho da amostra é superior que 100, usa-se a expressão abaixo, também
arredondado:
Passo 2. Amplitude total dos dados
A amplitude da classe (A) calcula-se pela diferença entre o valor máximo (max) das observações pelo
valor mínimo (min) utilizando a expressão abaixo:
Passo 3. Amplitude da classe
A amplitude da classe (c) é o valor que quantifica a separação entre o limite inferior da classe e o limite
superior da classe. Depois de obtido o valor, é constante para todas classes a serem utilizadas. O valor da
amplitude da classe é obtido utilizando a seguinte expressão:
A razão para eu o denominador da divisão seja K-1 ao invés de k, é explicada por uma correção que é feita
no limite inferior da primeira classe. Esta correção é justificada pela suposição de que a amostra de
tamanho n tem grande chance de não conter o valor mínimo da população. Ou por outra, a medida que o
tamanho da amostra aumenta, tem uma maior chance de obter elementos menores que o valor mínimo
que foi encontrado para amostra de um tamanho menor.
Passo 4. Limite inferior da primeira classe
O limite inferior da classe é o valor inicial que consta na primeira classe. Este valor é obtido usando a
expressão:
Passo 5. Limite superior da primeira classe
Depois de obtido o valor do limite inferior da primeira classe, segue o valor que limita a classe que se
obtém utilizando a expressão abaixo:
Exercício de aplicação 1.

Para melhor compreensão da matéria sobre coleta de dados, organização dos dados, organização dos
dados não agrupados em tabelas de frequência ou em gráficos e etapas de agrupamento de dados. Para o
efeito, o autor considerou dados referentes a falências múltiplas de órgãos coletados em Lisboa no ano
1993.
Com os dados não agrupados
Quadro 2.1. Tempo de hemodiálise (HD) antes do transplante renal dos doentes em meses.
51 35 7 17 60 50 36 64
24 60 35 24 12 55 54 70
55 42 79 18 44 96 28 19
75 34 28 19 36 36 36 54
24 60 16 32 3 60 42 10
27 65 26 52 22 26 32 21
22 48 67 37 76 69 5 30
23 144 97 49 24 19 38 55
48 84 59 103 18 43 21 30
18 50 26 18 10 22 18 72
96 28 39 136 36 58 10 108
24 36 47 84 37 10 15 30
26 93 135 16 52 21 32 30
Quadro 2.2. Dados do quadro 2.1. organizados em ordem crescente.
3 18 23 28 36 48 58 76
5 18 24 30 36 48 59 79
7 18 24 30 36 49 60 84
10 18 24 30 36 50 60 84
10 19 24 30 37 50 60 93
10 19 24 32 37 51 60 96
10 19 26 32 38 52 64 96
12 21 26 32 39 52 65 97
15 21 26 34 42 54 67 103
16 21 26 35 42 54 69 108
16 22 27 35 43 55 70 135
17 22 28 36 44 55 72 136
18 22 28 36 47 55 75 144

Tabela 2.3. Frequência do tempo (meses) de espera dos doentes.
Meses(X) Fa Meses(X) Fa Meses(X) Fa Meses(X) Fa Meses(X) Fa

3 1 24 5 43 1 64 1 103 1
5 1 26 4 44 1 65 1 108 1
7 1 27 1 47 1 67 1 135 1
10 4 28 3 48 2 69 1 136 1
12 1 30 4 49 1 70 1 144 1
15 1 32 3 50 2 72 1 Total 104
16 2 34 1 51 1 75 1
17 1 35 2 52 2 76 1
18 5 36 6 54 2 79 1
19 3 37 2 55 3 84 2
21 3 38 1 58 1 93 1
22 3 39 1 59 1 96 2
23 1 42 2 60 4 97 1
Com os dados não agrupados, temos na tabela 2.3. a variável (meses de espera) e a frequência absoluta,
que é o número de vezes que os meses observados se repetiram. Foram 104 doentes que transplantados.
Com dados agrupados
Considerando os dados do quadro 2.2. vamos agrupa-los usando as etapas do ponto 2.2.4.
Fazendo os cálculos utilizando as expressões apresentados nos passos para agrupar dados, eremos K igual
a 10,085 que pode ser arredondado por excesso. Desta feita, prevê-se que o número de classes será 10.
Calculada a amplitude total das observações é igual a 141 meses. E a amplitude das classes, utilizado a
devida expressão matemática, será de 15 meses. O limite inferior a considerar será 0 (zero), a partir do
resultado 0,4 arredondado.
Tabela 2.4. Dados agrupados em meses e suas frequências absolutas.
Classes (meses) Fa X
]0,15] 9 7,5
]15,30] 35 22,5
]30,45] 20 37,5
]45,60] 20 52,5
]60,75] 7 67,5
]75,90] 4 82,5
]90,105] 5 97,5
]105,120] 1 112,5
]120,135] 1 127,5
]135,150] 2 142,5
Total 104

Na tabela de frequência 3.3. temos a variável número de meses designado pela letra X, e são valores de
quantidade de meses observados. Enquanto que na tabela 3.4. já não pode acontecer porque a
quantidade de meses já se apresenta condensada, isto é, os seus valores estão agrupados. Para a
obtenção dos valores de X (marca da classe), é feita a adição entre o valor do limite inferior da classe e do
limite superior divididos por dois. Este valor de X será aplicado para o cálculo das medidas de tendência
central, assimetria e de dispersão que serão abordados nos pontos seguintes.
2.1.5. Medidas de tendência central
As medidas de tendência central ou medidas de posição, indicam a concentração de um conjunto de

dados. São grandezas numéricas que descrevem um conjunto de dados pela indicação da posição do
conjunto na escala de valores possíveis em que a variável em estudo pode assumir. Elas têm como
objetivo definir o centro de gravidade de uma distribuição de frequências. As principais medidas de
posição são a média, mediana, a moda e os quantís.
2.1.5.1. Média
A média ou (média aritmética) é uma medida de posição mais comum que é muito utilizada. Ela indica o
centro de gravidade do conjunto de dados e, obtém-se pela soma das observações dividida pelo número
delas (sua quantidade).
Cálculo da média com dados não agrupados:
Média amostral
Média populacional
Cálculo da média com dados agrupados:
Média amostral
Média populacional

2.1.5.2. Mediana
A mediana é definida em um conjunto de dados ordenados como o valor central. Por outra, ela divide o
conjunto de dados em dois subconjuntos com o mesmo número de elementos, ficando abaixo dela 50%
das observações e acima 50% das observações. A mediana é obtida através das fórmulas abaixo:
Para os dados agrupados em intervalos de classes da mesma amplitude, a mediana é calculada através da
fórmula abaixo:
Onde:
2.1.5.3. Moda
É o valor que ocorre com maior frequência num conjunto de dados, (o valor que se repete mais). Ela ode
não existir, também podem ocorrer muitas modas dentro do mesmo conjunto de dados.
Para os dados não agrupados é fácil identificar num conjunto de dados organizados em ordem crescente
ou decrescente.
Para dados agrupados, a moda é obtida através da fórmula abaixo:
Onde:
2.1.5.4. Quantís (quartís) ou separatrizes
Os quantís tem como objetivo fornecer indicadores do local onde a maioria dos dados se
concentram, indicam o ponto de corte para uma certa posição. Eles podem ser percentís, decís e
quartís. Os percentís dividem o conjunto de dados e 100 partes iguais, os decís dividem o
conjunto em 10 partes iguais. Os mais usados são os quartís, que dividem o conjunto de dados
em quatro partes iguais (25%, 50%, 75% e 100%).
Geralmente nos quartís calcula-se o primeiro quartil e o terceiro quartil excetuando o segundo
quartil e o quarto quartil. O segundo quartil é coincidente com o valor da mediana e o quarto é a
última posição do conjunto dos dados.
Cálculo dos quartís
Quando os dados não estão agrupados considera-se o número total das observações dividido por
quatro. O valor obtido, é a posição onde se encontram os quartís.
Por exemplo, tomando em consideração os dados do quadro 3.2., sabendo que o número das
observações são 104 meses, teremos:
Quartil 25% 50% 75% 100%

Posição 26 52 78 104
Valor 22 36 55 144
Para os dados agrupados, primeiro calcula-se a posição da classe o primeiro quartil pelo
quociente do número total das observações e quatro (seja par ou ímpar), em segundo, identifica-
se a classe que contém o primeiro quartil, em terceiro, calcula-se o valor através da fórmula:

Onde:
Para o cálculo do terceiro quartil que deixa 75% dos elementos do conjunto, calcula-se a posição
pelo produto de três vezes o tamanho da amostra dividido por quatro (seja par ou ímpar),
segundo, também identifica-se a classe que contém o terceiro quartil, terceiro, aplica se a
fórmula:
Onde:
2.1.6. Medidas de dispersão
Na descrição de um conjunto de dados, apenas a utilização de medidas de posição é insuficiente para

explicar o comportamento dos dados, pois estas medidas não dizem nada sobre a sua variabilidade.
Medem o grau de variabilidade ou de dispersão dos dados em estudo em relação ao centro de
distribuição.
2.1.6.1. Amplitude total
A amplitude é uma medida de posição que se obtém pela diferença de um conjunto de dados entre o
valor maior observado pelo valor menor.
2.1.6.2. Variância e desvio padrão
Para falar da variância e desvio padrão, é indispensável o conhecimento do desvio médio, que é a média
dos valores absolutos dos desvios dado pela expressão abaixo:
A variância é a média dos quadrados dos desvios dado pela expressão:

Dados não agrupados;
Dados agrupados;
O desvio padrão é raiz quadrada da variância de um conjunto de dados. Calcula-se pela fórmula:
2.1.6.3. Coeficiente de variação
Uma pequena dispersão absoluta dos dados pode ser consideráveis quando comparada a ordem de
grandeza dos valores da variável. Para perceber o tamanho real da dispersão dos dados, define-se o
coeficiente de variação. O coeficiente de variação é uma medida adimensional geralmente expressa em
percentagem, indicando a percentagem que o desvio padrão apresenta em relação à média. Calcula-se
pela expressão abaixo:
Exercícios ...
3. PROBABILIDADES
Neste capítulo, o objetivo é ....
3.1. Introdução
Algumas escrituras relatam que a teoria de probabilidades é uma invenção que surgiu através de jogos de
azar no Mónacon na França. Foi aprimorado pela necessidade de tentar prever alguma tentativa para que
o apostador poderia ganhar um prémio. Teve início no séc XVI pelo Matemático Italiano Niccollo Fontana.
No séc XVII surgiram seus seguidores Matemáticos Blaise Pascal e Pierre Fermat. Tornou-se um
importante ramo da matemática adequado ao estudo dos fenómenos aleatórios regidos pela lei do acaso,
e é uma ferramenta fundamental para o estudo da Estatística.
3.2. Conceito de probabilidade
Probabilidade é uma medida de passibilidade de ocorrência de um determinado evento onde pode

assumir valores entre 0 e 1.
Evento é uma coleção de um ou mais resultados de um experimento.
Experimento é uma experiencia cujos resultados são imprevisíveis.

Exemplo de experimento: no lançamento de uma moeda duas vezes, espera -se como resultados
possíveis (espaço amostral), Ω = {CC, CK, KC, KK}, considerando K – saída de coroa e C – saída de cara. O
espaço amostral é designado por uma letra maiúscula qualquer.
Exemplo de evento: saída de pelo menos uma cara Ω = {CC, CK, KC}.
3.3. Teoria de conjuntos
A teoria de conjuntos é um ramo da matemática é muito importante para o estudo de probabilidades dos
eventos. Os eventos são subconjuntos do espaço amostral. Considere o exemplo a seguir:
S = {cana, soja, milho, algodão}
É um conjunto de quatro elementos. Seja um evento A, definido como culturas relacionadas a grãos. Esse
evento corresponde a um subconjunto de S representado por:
A = {soja, milho}
Diz-se que A está contido em S, denotado por;
Se A está contido em B, e B contido em A, então A e B contém os mesmos elementos. Denota-se:
Considerando outro evento B, definido como a cultura ser uma gramínea. Teremos um subconjunto
formado por cana e milho. B = {cana, milho}.
Havendo mais um evento C constituído pela cultura de inhame, corresponde a um evento impossível,
denominada conjunto vazio. Denota-se:
3.3.1. Reunião
Algumas operações entre conjuntos podem ser definidas. A reunião dos elementos de dois ou mais
conjuntos é denominada união ou reunião.
Por exemplo, o evento A reunião com B teremos;
Da operação de união seguem as propriedades:

3.3.2. Interseção
Outra operação é a interseção entre conjuntos. É definida como um conjunto com elementos que
pertencem em simultâneo aos conjuntos em estudo. Representa-se:
A interseção entre os eventos A e B é constituído por milho;
3.3.3. Eventos excludentes
Dois eventos (conjuntos) tem interseção mula, que são mutuamente exclusivos. Se D={cana, algodão} e A
= {soja, milho}, então o conjunto A interseção com D é igual ao conjunto vazio, ou seja, A e D são
mutuamente exclusivos.
3.3.4. Complementaridade
O complemento de um determinado evento é uma operação que gera um conjunto de todos os

elementos de S que não pertencem ao evento em questão. O complemento de A é representado por Ā.
Tomando como exemplo, Ā = {cana, algodão}.
Algumas propriedades de complementaridade:

3.4. Axiomas e teoremas de probabilidades
A maior ou menor possibilidade de ocorrência dos diversos eventos é medida por um número chamado
probabilidade. Historicamente a probabilidade foi objeto de muita discussão, tendo sido definido como
sendo um limite da frequência relativa de ocorrências de um evento quando o número de provas tendia
ao infinito. Esta definição é a chamada frequência, que padecia de uma limitação.
Surgiu a segunda definição, a chamada clássica, que define a probabilidade como o quociente do número
de casos favoráveis ao evento pelo número de casos possíveis, desde que todos sejam igualmente
prováveis. Esta definição é considerada até hoje como uma regra prática para a atribuição das
probabilidades aplicáveis.
Atualmente adota se a definição axiomática de proposta em 1933 por Kolmogorov Smirnov de

nacionalidade Russa, segundo a qual a probabilidade obedece a três axiomas:
Partindo destes três axiomas, surgem outras propriedades que podem ser deduzidas como teoremas:

Para o cálculo da probabilidade usando a definição clássica usa-se a fórmula:
Onde:
3.5. Análise combinatória
Os conceitos de análise combinatória são necessários no estudo da teoria de probabilidades. Estas regras
são consequências do princípio fundamental de contagem.
3.5.1. Permutação
A permutação corresponde a uma determinada disposição de um número de elementos. Por exemplo,

consideremos três equipas de futebol denominadas por A, B e C. Para uma delas ocupar os primeiros três
lugares resulta na seguinte permutação:
ABC, ACB, BCA, BAC, CAB, CBA
São seis permutações possíveis. A notação é:
Sendo n igual a três equipas, teremos:
Lê-se três fatorial é igual a seis.
3.5.2. Arranjo
Arranjo é a disposição de um determinado número de elementos de um total de n considerando a ordem.

Considerando as três equipas anteriores, considerando as duas primeiras posições:
AB, BA, AC, CA, BC, CB
Da mesma forma que na permutação, o termo arranjo de n elementos tomados X a X, denota o número
de arranjos possíveis.
Tomando como exemplo as equipas:

3.5.3. Combinação
Consiste na disposição de X elementos de um total de n elementos ignorando a ordem. Considerando

quatro equipas A, B, C, D. A combinação será:
AB, AC, AD, BC, BD, CD.
O número de combinações possíveis denominada de n elementos tomados X a X, é dado por:
Calculando o exemplo das quatro equipas:
3.6. Probabilidade condicional
Em muitos casos o fato de se saber que certo evento ocorreu, faz com que se modifique a probabilidade
que se atribui a outro evento. Denota-se por P(E\F), a probabilidade do evento E sabendo que F ocorreu,
ou probabilidade de E condicionada a F. A ocorrência da relação denota-se:
Analogamente;
Das regras acima, resulta da regra do produto que se refere ao cálculo da probabilidade do evento
interseção,
Note que a ordem de condicionamento pode ser invertida. Para três eventos pode ser escrito:
A seguir vem os dois importantes teoremas da probabilidade condicional.

3.6.1. Teorema da probabilidade total
Seja E1, E2, ..., En; uma partição e F um evento qualquer de S, teremos:
Esse resultado pode ser demonstrado considerando-se o evento F subdividido em suas interseções com
eventos E, e aplica-se as propriedades anteriores.
3.6.2. Teorema de Bayes
Nas mesmas condições do teorema anterior, temos:
A ideia contida no teorema de Bayes deu origem a uma nova maneira de se pensar na Estatística gerando
a chamada Estatística Bayesiana.
Exercícios de aplicação ...
4. DISTRIBUIÇÕES DE PROBABILIDADES
Neste capitulo o objetivo é...
O conceito de variável aleatória que vamos definir nos permite associar aos resultados de um
experimento aleatório de números reais para que, utilizando o conceito de função, possa-se calcular mais
facilmente as probabilidades das ocorrências de vários eventos desse experimento.
4.1. Medidas de posição e dispersão de uma variável aleatória

4.1.1. Medidas de posição
A principal medida de posição nas v.a. é a média, também chamada de valor esperado ou esperança. Para
v.a.d. é dado por:
E para v.a.c. é dado por:

Exemplo v.a.d.: são lançadas três vezes uma moeda, espera-se obter:
N° de
caras Probabilidade
0 1/8
1 3/8
2 3/8
3 1/8
Total 8/8=1
Exemplo v.a.c.: dada uma variável contínua X pela função densidade de probabilidade f(x)=3x2, onde X
varia de o a 1.
4.1.2. Medidas de dispersão
As medidas de dispersão mais abordadas são a variância e o desvio padrão. A variância de uma v.a. X de
população infinita, é uma medida que quantifica a dispersão dos valores em torno da média. É o principal
parâmetro de dispersão e mede a variabilidade dos valores em relação a sua média.
Pode-se verificar facilmente que a variância pode ser calculada por:
No caso de variável discreta é dada por:
No caso de variável contínua e dada por:
Exemplo: um jogo consiste em lançar uma moeda. Se sair cara ganha-se 10 meticais e se sair coroa perde-
se 5 meticais. Qual é o lucro médio do jogo e qual é a sua variância?
Resultado Probabilidade P(Xi) Valor Xi X2i

Cara 1/2 10 100
Coroa 1/2 -5 25
A média é dada por:
A variância é dada por:
Ou
4.1.3. Desvio padrão
Com objetivo de manter a mesma unidade da variável aleatória original, e necessário definir desvio
padrão como sendo a raiz quadrada da variância. O desvio padrão da variável X é a raiz quadrada positiva
da variância de X dada por:
4.2. Variáveis aleatórias discretas
São variáveis que somente assumem valores inteiros, ou seja, sem funções. Geralmente os valores são
obtidos por contagens.
Seja X uma variável aleatória. Se o número de valores possíveis de X for finito ou infinito enumerável,
denomina-se X de varável aleatória discreta (v.a.d.).
A probabilidade de que a v.a. X assuma um valor qualquer Xi, é distribuída por meio da função de
probabilidade de X que é representada por P(X = x) ou simplesmente P(x).
P(X = xi) é uma função de probabilidade se e somente se satisfaz as seguintes condições:
O conjunto dos pares formados pelos valores assumidos pela v.a. e suas respetivas probabilidades de
ocorrência formam a distribuição de probabilidade da v.a. em estudo. A distribuição de probabilidade
pode ser expressa por meio de uma tabela ou gráfico.

É muito comum encontrar aplicações com variáveis que seguem diferentes tipos de distribuição discreta.
As mais comuns, que iremos abordar são; Uniforme Discreta, Bernoulli, Binomial, Hipergeométrica e
Poisson.
4.2.1. Distribuição Uniforme discreta
Uma variável discreta X, com os valores X1,X2,...,Xk, segue distribuição uniforme discreta se todos valores
forem equiprováveis e se sua função de probabilidade puder ser representada da seguinte forma:
Não há restrição quanto aos prováveis valores da variável, que podem ser qualquer número real, desde
que o número de valores diferentes seja finito.
4.2.2. Distribuição de Bernoulli
Uma variável aleatória discreta X segue distribuição de Bernoulli se sua probabilidade p ser o único
parâmetro da distribuição que em geral, representa a probabilidade de sucesso 1, e o seu complemento
1-p que mostra a probabilidade de fracasso 0. Assim, um experimento ou ensaio de Bernoulli é
caraterizado pelo fato de a variável discreta assumir resultados dicotômicos (0 ou 1).
A sua função de probabilidade é dada por:
Valor esperado:
A variância:
4.2.3. Distribuição Binomial
Considere uma variável discreta X que representa o número total de sucessos obtidos em N ou n
experimentos independentes de Bernoulli. Então N ou n e p são os parâmetros da distribuição, em que N
representa o número total de ensaios e p a probabilidade de sucesso 1, que deve ser a mesma em cada
ensaio independente de Bernoulli.
A sua função de probabilidade e dada por:
Valor esperado:

A variância:
4.2.4. Distribuição Hipergeométrica
Considere um conjunto com N objetos, dos quais r são do tipo I e N-r são do tipo II. Uma amostra é
escolhida ao acaso sem reposição com tamanho n onde (n<N) e define-se X como número de objetos com
caraterística I na amostra. Nesse caso diz se que a variável X segue uma distribuição Hipergeométrica com
r,N e n. Em que N é a população, n é amostra, r é o valor observado na população, k é o valor observado
na amostra.
A sua função de probabilidade e dada por:
Valor esperado:
A variância:
4.2.5. Distribuição de Poisson
Seja X uma variável que segue uma distribuição de Poisson com parâmetro λ. A sua função de
probabilidade é dado por:
Valor esperado:
A variância:
4.3. Variáveis aleatórias contínuas
Uma variável aleatória X é classificada contínua se X puder assumir todo e qualquer valor em algum
intervalo [a,b]. Em geral, é obtida em aparelhos de medição. Exemplo, altura de um indivíduo (cm ou m);
tempo de anestesia em humanos (hora e frações); produção de leite de vacas (litros e frações).

Qualquer função f(.) com domínio real e contradomínio [0, ꚙ[ é uma função densidade de probabilidade
se somente se:
A probabilidade da variável aleatória assumir valores no intervalo [a,b] é dada pela integral da função
densidade no intervalo de interesse, ou seja:
Se a variável aleatória é contínua, a probabilidade de se obter exatamente determinado valor k é zero,

isto é, P(X=k)=0. Assim o valor obtido como probabilidade na integral acima não se altera com a exclusão
ou não dos extremos a e b, isto é, o valor da probabilidade é mesmo para ]a,b[, [a,b[, [a,b].
Em muitos experimentos, diversas distribuições contínuas são associadas a estes tipos de variáveis como
Uniforme, Exponencial e Normal. Entre estas, a mais utilizada em resultados de inferências estatísticas é a
distribuição Normal.
4.3.1. Distribuição Uniforme contínuo
A variável aleatória X segue o modelo Uniforme Contínuo com parâmetros a e b se sua função densidade
de probabilidade é dada por:
Valor esperado:
A variância:
4.3.2. Distribuição Exponencial
Suponha-se que X segue distribuição Exponencial com parâmetros λ, λ>0 se e somente se sua função
densidade de probabilidade for dada por:

Valor esperado:
A variância:
4.3.3. Distribuição Normal
A distribuição Normal, também conhecida como curva de Gauss, é a mais importante das distribuições
contínuas de probabilidades. Inicialmente utilizada para representar a distribuição dos erros
experimentais nas observações astronómicas, depois passou a ser aplicada em inúmeras variáveis como o
comportamento coletivo dos movimentos das moléculas dos gases, experimentos agrícolas.
Em decorrência de um resultado teórico conhecido como Teorema do Limite Central, a distribuição da

soma de variáveis aleatórias quaisquer pode ser aproximada pela distribuição normal, quando o número
de variáveis cresce. Por esse fato, permite a utilização da distribuição normal para a realização de
inferências estatísticas.
Uma variável aleatória X tem distribuição normal com média e variância, µ e σ2, a função densidade é
dada por:
Indica-se resumidamente que a variável aleatória X tem distribuição normal com média e variância
conhecidas por:
Em termos de notações temos E(X)=µ e Var(X)=σ2.
Para se calcular as probabilidades da variável X assumir valores em certos intervalos, probabilidades

dadas pelas áreas sob a curva da distribuição normal nesses intervalos, utiliza-se uma distribuição normal
particular de média (0) e variância (1), denomina se distribuição normal padronizada. As áreas sob esta
curva estão tabeladas e fornecem diretamente essas probabilidades.
...imagem da curva
Para a padronização usa se a fórmula:
4.4. Distribuições conjuntas de probabilidades

4.4.1. Variáveis Aleatórias Bidimensionais
Seja X uma variável aleatória bidimensional, ou seja, para determinado experimento, cada resultado é
proveniente da avaliação simultânea de dois caracteres. Por exemplo, ao se estudar o número de vagens
e o número de grãos por vagem de feijão, X é uma variável aleatória bidimensional discreta (v.a.b.d.).
Se X é uma v.a.b.d., então cada par de valores (Xi,Yi) será associada a sua probabilidade de ocorrência
representada por P(xi,yi)=P(X=xi, Y=yi). Assim a v.a.b.d. terá a função de probabilidade se somente se
atender as seguintes condições:
Para o caso contínuo em que (x,y) será função densidade contínua (v.a.b.c.), f(x,y), será função densidade
de probabilidade conjunta se e somente se atender as condições seguintes:
Exemplo.....
4.4.2. Distribuições marginais
Seja X,Y uma variável aleatória bidimensional com determinada distribuição conjunta de probabilidades.
É possível obter a distribuição X sem considerar ou ao longo de Y e vice-versa. Estas distribuições
marginais de X e de Y, respetivamente. As distribuições marginais são obtidas considerando:
i) (X,Y) v.a.b.d.
ii) (XY) v.a.b.c.
exemplo....
4.4.3. Variáveis aleatórias independentes
Se (X, Y) é uma variável aleatória bidimensional discreta, então X e Y serão independentes se e somente
se, para todo par de valores (Xi,Yj), tem:
Isto, se a probabilidade conjunta do par (Xi,Yj) for igual ao produto de suas marginais.
Se (X,Y) é uma variável aleatória bidimensional continua, então X e Y serão independentes se e somente
se:
Para todo x e y, ou seja, se a função densidade de probabilidade (f.d.p.) conjunta de (X, Y) for igual ao
produto de suas funções marginais.
Se X e Y são v.a. independentes, então cov(X,Y)=0, mas se cov(X,Y)=0, não implica dizer que X e Y são v.a.
independentes.
Exemplo: seja X e Y variáveis aleatórias discretas bidimensionais cuja distribuição de probabilidade é dada
a seguir:
Y
-1 0 1
X
-1 1/5 0 1/5
0 0 1/5 0
1 1/5 0 1/5
Pede-se para determinar a esperança de X, a esperança de Y, a esperança de XY, a covariância de XY e

verificar se X e Y são independentes.
Resolução:

5. AMOSTRAGEM
Neste capitulo o objetivo é...
5.1. Amostragem
Todas estatísticas iniciam quando temos dados disponíveis. Estes dados provem de uma determinada
população identificada pelo investigador para um estudo, em que na impossibilidade de recolher dados
de toda a população, por vários motivos, recorre-se a uma parte desta população chamada amostra. Mas
as conclusões que serão obtidas através da amostra, são apenas um meio para chegar à população. A
amostra não é relevante enquanto amostra, mas sim, como a base a partir da qual se podem fazer
extrapolações a toda população.
A amostragem classifica-se em aleatória e não aleatórias. A seleção dos elementos da amostra depende
da técnica de amostragem escolhida (aleatória, não aleatória ou a combinação de ambas), resultado da
ponderação de vários fatores de modo que a amostra seja representativa.
Fig: 1 População e amostra
N = população ou universo; n = amostra, parte da população por ser estudada
5.1.1. Representatividade de uma amostra
Uma amostra é representativa quando as características em estudo dos elementos da amostra são
as mesmas que toda a população ou universo apresenta. Amostra representativa é aquela que
reflete os aspectos típicos da população. É uma espécie de maquete, que capta, para o estudo
concreto, às características mais relevantes da população.

Chama-se população alvo, aos elementos componentes da população que possuem em comum as
características em estudo.
5.2. Tipos de amostragem
As técnicas de amostragem agrupam-se em duas categorias que são aleatórias e não aleatórias.
Dentro de cada uma delas há uma diversidade de procedimentos amostrais, sendo ainda possível
combinar processos aleatórios com os não aleatórios.
Uma amostra é considerada aleatória ou probabilística, se for recolhida por um processo tal que
assegura que todo e qualquer elemento ou grupo de elementos da população tem probabilidade
calculável e diferente de zero, de ser escolhido para integrar a amostra.
5.2.1. Amostras aleatórias
Neste tipo de amostragem, o princípio é da eficiência, traduzida na obtenção de informação o mais

rigoroso possível com custo mínimo.
Os principais tipos de amostra probabilístico são: simples, sistemática, estratificada, por clusters e
multi-etapas.
5.2.1.1. Amostra aleatória simples
A amostragem aleatória simples é a considerada conceptualmente mais fácil, mas raramente é

adoptada nas operações de amostragens. Ela é mais cara e quase impraticável em muitos casos
porque ela exige que todos elementos da população sejam enumerados, tarefa que se considera
mais complexa quando maior for a população alvo.
Uma amostra aleatória simples de n elementos retirada de uma população N elementos, é tal que
qualquer dos elementos da amostra tem a mesma probabilidade de ser selecionada 1/NCn . Em
muitos casos a seleção é feita recorrendo a uma tabela de números aleatórios.
A representatividade de uma amostra depende da variabilidade da população estudada quanto a

sua dispersão. Tomando como exemplo caso da média amostral como estimador da população
deve-se calcular este parâmetro;

A obtenção de uma amostra aleatória simples pode ser feita mediante os passos seguintes:
i. Enumerar consecutivamente os elementos da população de 1 a N;
ii. Escolher n elementos mediante o uso de um procedimento aleatório como seja o método
de lotaria, consulta de tabelas de números aleatórios, ou a geração de números aleatórios
informaticamente. Qualquer que seja o procedimento a utilizar desde que assegure que os
números escolhidos são diferentes e não superiores a N;
iii. Estabelecer a correspondência entre os números selecionados e a identificação dos

elementos da população através desses números.
A representatividade de uma amostra depende da variabilidade da população em estudo quanto a

sua dispersão. Uma amostra de uma população que apresenta uma maior dispersão dos elementos
com as características em estudo, para que ela seja significativa, no mínimo a amostra deve
possuir 10% da população ou universo. Mas se a dispersão for menor, não é exigido o número
mínimo do tamanho da amostra desde que exceda 30 indivíduos.
5.2.1.2. Amostra aleatória sistemática
Uma amostra aleatória sistemática ou quasi-aleatória, como também é designada, é obtida

selecionando aleatoriamente um elemento de entre os primeiros k elementos da população e
adicionando sucessivamente o valor k. Admitindo que existe disponível um registo enumerado da
população, o processo de recolha de uma amostra sistemática consiste em:
i. Calcular o intervalo da amostra k obtido pelo quociente N/n. Quando se trabalha com
populações (base de sondagem) em que os elementos são claramente individualizados
(caso das populações humanas) é vulgar recomendar-se que aquele quociente seja
arredondado ao inteiro mais próximo por defeito;
ii. Escolher aleatoriamente um número de j entre 1 e k;
iii. Partindo desse número, adicionar sucessivamente o valor k, ficando assim selecionados os
elementos j, j+k, j+2k, j+3k, ... , j+(n-1)k, perfazendo o número n.

As opções ao nível de construção de base de sondagem têm impacto na precisão dos estimadores.
Tomando novamente o caso da média amostral, a sua variabilidade é;
5.2.1.3. Amostragem aleatória estratificada
As duas formas de amostragem já vistas envolvem a seleção da amostra tomando a população

como um todo. Existem, contudo, situações em que se define uma partição na população
originando a criação de grupos ou estratos. Aqui a população é dividida em subconjuntos
(estratos) relativamente homogéneas. Se N1, N2, ..., NL representam o número de elementos em
cada estrato, e n1, n2, ..., nL representam o número de elementos aleatoriamente selecionados em
cada estrato, então o número total de amostras estratificadas possíveis é igual a N1Cn1 x N2Cn2 x ...
NL
x CnL que é o menor ou igual a NCn, número de amostras aleatórias simples possíveis. A
probabilidade de cada estrato num elemento ser selecionado é igual a ni/Ni (i=1,2,3,...,L).
O objetivo de estratificar uma população é reduzir a variabilidade dos estimadores e assim obter
estimativas mais precisas. Tendo presente que a variância total de uma população é constante e
pode ser decomposta em:
“variância total = var. entre os estratos + var. dentro dos estratos”
Levar em prática o processo de amostragem estratificada exige os seguintes passos:
i. Definir os estratos. Estudos pilotos, informação de estudos anteriores, opiniões de

conhecedores da população ou até mesmo a intuição do investigador, são utilizados para
definir os estratos. As variáveis geográficas, demográficas, económicas ou outras podem
ser relevantes para definir um grupo homogéneo de elementos relevantes às características
em estudo;
ii. Organizar as bases de sondagem, pois se cada estrato é tratado como uma população
independente nas outras serão necessárias tantas bases de sondagem quantos os estratos
definidos;

iii. Selecionar os elementos dentro de cada estrato mediante um processo aleatório simples ou
sistemático. Nesta fase a opção por uma estratificação proporcional ou não proporcional
ajuda a determinar quantos elementos de cada estrato devem incluir na amostra.
Na amostragem estratificada proporcional a variância da média é dada por:
5.2.1.4. Amostragem por aglomerados (clusters)
Nesta amostragem, divide-se a população em aglomerados (clusters) em vez de estratos. Em geral,

os aglomerados (agrupamentos de indivíduos) correspondem a zonas geográficas. Pode se tomar
como exemplo, Postos Administrativos, localidades, bairros, quarteirões, turmas, etc. A amostra é
retirada a partir dos aglomerados sendo inquiridos todos os indivíduos que compõe os
aglomerados escolhidos aleatoriamente.
5.2.1.5. Amostragem por etapas múltiplas
Na amostragem por múltiplas etapas usa-se uma combinação de procedimentos dos vários tipos
anteriores em diferentes fases. Por exemplo, para uma amostra de famílias que vivem na cidade de
Chimoio, numa primeira etapa escolhem-se aleatoriamente os bairros que compõe a cidade, na
segunda etapa escolhem-se aleatoriamente os quarteirões dentro destes bairros escolhidos, na
terceira etapa escolhe-se aleatoriamente a rua ou prédio e, na última etapa, também aleatoriamente
identifica-se a casa onde vai se inquirir um representante da família.
5.2.2. Amostras não aleatórias
Este tipo de amostragem que confere a categoria de não aleatória a uma amostra é a ausência de
um mecanismo que determinar rigorosamente quem é escolhido, recorrendo-se para o efeito ao
julgamento humano, existem várias formas de o fazer, como as mais usuais são: intencional,
quotas, bola de neve, por conveniência.
5.2.2.1. Amostragem intencional

Nesta amostragem o investigador usa como base o seu conhecimento para identificar elementos
representativos ou típicos da população. Uma vez conhecidos os critérios que interessam ao
estudo, os indivíduos são escolhidos em função desses critérios.
5.2.2.2. Amostragem por quotas
Esta amostragem é uma variante da amostragem intencional que apresenta semelhanças com a
amostra probabilística estratificada, da qual difere por não se usarem procedimentos aleatórios de
seleção dos indivíduos. Usa-se o critério de incluir um certo número (quota) de indivíduos de cada
um dos subgrupos considerados na população.
5.2.2.3. Amostra em bola de neve
É uma variante de amostra intencional normalmente usada para populações pequenas ou com
caraterísticas especificas que interessam para o estudo, mas que não é possível listar para fazer
uma amostra aleatória. A amostra é constituída gradualmente a partir de um núcleo inicial de
indivíduos aos quais se vão juntar outros indicados pelos anteriores que possuem as mesmas
caraterísticas de interesse.
5.2.2.4. Amostra por conveniência
É uma amostra definida em função da conveniência do investigador. São inquiridos os indivíduos

mais acessíveis. Este é o tipo de amostra geralmente usado para se fazer o teste de um
questionário ou para uma investigação de caráter exploratório.
5.3. Etapas para a realização de um inquérito por amostragem

5.3.1. Inquérito
O inquérito é um instrumento importante para a recolha de dados primários para efeitos de um

determinado estudo. Existem várias formas de obter dados para a realização de um estudo, sendo
as mais usadas, dados administrativos, imprensa e outros, a mais segura é obter dados primários
através de um inquérito ou entrevista à população alvo.
Um bom estudo, depende geralmente do uso de um bom instrumento de recolha dos dados, isto é,
se o instrumento de recolha dos dados não for bem planificado, ou elaborado, a consistência do
trabalho será pobre.

Um bom inquérito tem que possuir poucas perguntas e concisas de modo a não deixar o inquirido
cansado ou desanimado. Tem que evitar perguntas embaraçosas como a idade, o salário que
aufere, o nível acadêmico, etc. Nas questões, deve haver uma questão chave do estudo. Também o
tipo de perguntas mais recomendadas são as fechadas, porque facilitam na análise dos dados e
consequentemente bons resultados. E as perguntas abertas são muito difíceis de analisar porque
contém respostas muito diferentes, fazendo com que haja dificuldades de agrupar e analisar.
5.3.2. Etapas para realização de um projeto estatístico
A realização de um projeto estatístico é um trabalho preparado e executado por uma equipa na

qual se inclui um estaticista.
5.3.2.1. Definição dos objetivos
Torna-se indispensável, antes de mais, questionar-se sobre os objetivos do projeto e sobre a

adequação desses objetivos ao orçamento de que se dispões.
O projeto não deve ser executado antes da reflexão preliminar, documentação e estudo do domínio
do objeto da inquirição. Uma vez os objetivos estabelecidos, torna-se necessário definir as
nomenclaturas, conceitos e metodologias a utilizar que devem ser compatíveis com os padrões
internacionais.
5.3.2.2. Definição da população alvo
A escolha da população (no sentido estatístico) que será interrogada deve se fazer a delimitação
do universo a que o estudo diz respeito, o que passa por explicar unidades a inquirir.
5.3.2.3. Elaboração do questionário
A elaboração do questionário é uma fase delicada, necessita de trabalho em equipa, se possível um

primeiro contato com o terreno designado por inquérito piloto, que permitirá testar a redação dos
questionários. Um bom questionário deve ser simples e sem número exagerado de questões, pois,
os questionários complicados ou não são preenchidos ou serão susceptíveis a dúvidas que tornarão
as respostas incompreensíveis.

Um bom questionário não deverá em princípio, levar mais de uma hora a se preencher. É preciso
insistir que esta etapa necessita de ser feita com profissionalismo, pois muitos estudos fracassam
devido a questionários mal redigidos.
5.3.2.4. Fase de interrogação (trabalho de campo)
Torna-se indispensável controlar o trabalho dos inquiridores, esta fase deve ser bem delimitada
quanto ao tempo que deve durar o trabalho de inquirição. Nesta fase, é recomendado que os
inquiridores sejam capacitados antes de irem ao campo.
5.3.2.5. Registo e controle de coerência (validação)
Quando os questionários são recolhidos, procede-se ao registo e verificação de eventuais erros, a

qual é feita através de testes de coerência (ex: se existem pais com idade inferior a 10 anos,
reformados com 25 anos de idade...etc.). É possível detectar inquéritos preenchidos ficticiamente.
É preciso ter atenção ao que o controle de coerência pode induzir ao erro, corrigir um inquérito
que apresenta um rácio normal quando ele reflete um caso excepcional e não um erro. Faz se
também a imputação das não respostas.
5.3.2.6. Análise dos dados e sua interpretação
Nesta fase faz se a análise dos dados utilizando pacotes estatísticos, sua interpretação e as
possíveis recomendações. Com o desenvolvimento da indústria electrónica e dos
microcomputadores, em particular, provocaram uma autêntica evolução nas metodologias
estatísticas estando em via de alterar profundamente o conteúdo e a programação das etapas
anteriores. Grande parte do trabalho para ser automatizado fazendo com que se junte a etapa de
trabalho do campo e validação dos dados.
5.4. Determinação do tamanho da amostra
Ao planear qualquer sondagem, uma questão que merece sempre grande atenção é a decisão
quanto ao número de indivíduos n que a amostra deve conter. Não se pode planear e implementar
uma sondagem sem conhecer a dimensão da amostra. É uma decisão nem sempre fácil, pois, na
essência há que contrabalancear dois efeitos opostos: a precisão que a partida aumenta com a
dimensão da amostra, e o custo diretamente relacionado com a dimensão da amostra. As amostras
podem variar de dimensão por várias razões. O cálculo da dimensão da amostra pode ser feito

matematicamente desde que os elementos sejam escolhidos por um procedimento aleatório. Não
existe uma fórmula matemática fixa para a determinação do tamanho da amostra.
5.4.1. Fatores determinantes na dimensão da amostra
A opção por uma dimensão de amostra depende da ponderação de diversos fatores. Para o seu
cálculo matemático são; variáveis chaves à variabilidade da população no que respeita a
característica em estudo, a precisão e confiança requerida para os resultados e, a distribuição
amostral do estimador utilizado na estimação do parâmetro. Importa ainda ponderar o n assim
encontrado com fatores como o custo ou o efeito nos erros não relacionados com a amostragem.
5.4.2. Caraterísticas da população
Existem dois aspectos da população que importa considerar na determinação do número de

elementos da amostra; a variância das características em estudo e, o número de elementos, ou seja,
a dimensão de N. Importa tratá-los independentemente porque a forma como influenciam o
cálculo de n é diferente.
5.4.3. Distribuição amostral
Para estimar um parâmetro é necessário dispor de um estimador, que com base na informação de
uma amostra concreta fornece uma estimativa para o parâmetro. Contudo, de uma população de N
elementos é possível retirar NCn diferentes amostras de dimensão n, sendo que cada amostra
conduzirá a diferentes valores para o estimador. Se esse processo de retirar amostras da mesma
dimensão da população, fosse repetido inúmeras vezes, obter-se-ia um padrão de resultados que
em conjunto dariam origem à sua distribuição amostral.
5.4.4. Precisão e confiança requerida
A determinação matemática de n exige que se obtenha primeiramente a resposta à questão: Qual o

limite de erro desejado para o resultado? A resposta a esta questão permite controlar o erro
amostral? Controlar não significa eliminar, o aumento da amostra é uma forma de controlar este
erro, por muito grande que seja, os resultados contem sempre um erro amostral e, portanto, nunca
podem ser tidos como certezas. Uma amostra não dá certeza, mas pode dar um grau de confiança
e uma medida de precisão dos resultados.
5.4.5. Custo

A precisão dos resultados cresce com o aumento da dimensão da amostra, mas existem outros
fatores que colocam restrições ao aumento ilimitado da amostra, restrições essas que se prendem
com os custos a suportar em todo o processo amostral. O tempo que se dispões para a realização
do estudo e outros fatores como sejam o pessoal disponível para efetuar o trabalho, ditam aumento
de custos.
5.4.6. Passos na determinação matemática da dimensão da amostra
• Fixar o limite de erros desejados;
• Encontrar uma equação que relacione n com a precisão e confiança desejada para os
resultados;
• Determinar parâmetros desconhecidos;
• Estimar características para sub-domínios;
• Estimar mais do que uma característica;
• Avaliar o n encontrado.
6. ESTIMAÇÃO
Neste capítulo o objetivo é...
6.1. Inferência estatística
Inferência estatística é um conjunto de técnicas e procedimentos que permitem dar ao pesquisador

um grau de confiabilidade, de confiança, nas afirmações que faz para a população, baseadas nos
resultados das amostras.
Quando se observa uma população, devido a diversas dificuldades, examina-se uma amostra. Se
essa amostra for representativa, os resultados obtidos serão generalizados para toda a população.
O pesquisador pode levantar as hipóteses e depois testa-las sendo depois rejeitada ou não
rejeitada. Geralmente um experimento tem por finalidade a determinação da estimativa por um
parâmetro de uma função. Toda conclusão tirada por meio de uma amostragem, quando
generalizada para a população, vem acompanhada de um grau de incerteza.
6.1.1. Tipos de estimação

Existem dois principais tipos de estimação que são; estimação por ponto e estimação por
intervalos.
6.1.1.1. Estimação por ponto
Na estimação por ponto, a partir das observações, calcula-se uma estimativa usando o estimador.
A distribuição por amostragem dos estimadores, torna-se possível o estudo das qualidades do
estimador.
6.1.1.1.1. Qualidades de um bom estimador
Quanto maior for o grau de concentração da distribuição amostral do estimador em torno do

verdadeiro valor do parâmetro populacional, melhor será o estimador. As principais qualidades de
um bom estimador são:
i) Consistência;
ii) Ausência de vício;
iii) Eficiência;
iv) Suficiência.
6.1.1.2. Estimação por intervalo
Geralmente a estimação por pontos de um parâmetro, não possui uma medida do possível erro
cometido na estimação. Uma maneira de expressar a precisão da estimação é estabelecer limites
que com certa probabilidade inclua o verdadeiro valor do parâmetro do verdadeiro valor do
parâmetro da população. Esses limites, são chamados limites de confiança, que determinam um
intervalo de confiança que deverá estar o verdadeiro valor do parâmetro.
A estimação por intervalo consiste na fixação de dois valores tais que (1-α) seja a probabilidade
de que o intervalo por ele determinado contenha o verdadeiro valor do parâmetro.
α: chama-se nível de incerteza ou grau de desconfiança (nível de significância);
1-α: chama-se coeficiente de confiança ou nível de confiabilidade (nível de confiança).
6.2. Intervalos de confiança para médias e proporções

6.2.1. Intervalos de confiança para média de uma população normal com variância
conhecida

Considerando uma população normal com média desconhecida que desejamos estimar, e com
variância populacional conhecida, X: ~N(?; var), para a construção do intervalo de confiança
segue os procedimentos abaixo:
i) Retira-se a amostra de n elementos;

ii) Calcula-se a média da amostra usando a expressão:
iii) Calcula-se o desvio padrão da média amostral pela expressão:
iv) Fixa-se o nível de significância e com ele determina-se Zα tal que;
E dessa forma calcula-se o intervalo de confiança a partir da fórmula abaixo:
6.2.1.1. Intervalos de confiança para grandes amostras
Considera-se uma amostra grande quando n > 30. Precisa-se construir intervalos de confiança para
parâmetros de populações não normais com distribuições binomiais, de Poisson, de frequências
relativas, distribuições aproximadamente normais ou de populações normais com variâncias
desconhecidas.
6.2.2. Intervalos de confiança para proporções
Quando p populacional é conhecida, tem distribuição normal N(0,1) assintoticamente.
Para a construção do intervalo de confiança para p desconhecida, determina-se o parâmetro p

estimado na amostra através da expressão abaixo:

Logo, ao nível de significância dado,
Daí chega-se facilmente a formula do intervalo de confiança para a proporção p populacional.
6.2.3. Intervalo de confiança para a média de uma população normal com variância
desconhecida
Quando quer-se estimar a média de uma população normal com variância desconhecida,
considera-se dois procedimentos:
i) Se n 30, então usa-se a distribuição t de Student;

ii) Se n 30, então usa-se a distribuição normal com o estimador de .
Como a amostra é grande, então:
Daí vamos para a formula para intervalo de confiança para a média:
7. TESTES DE HIPÓTESES
Neste capítulo o objetivo é...
Suponhamos que uma certa distribuição dependa de um parâmetro θ e que não se conheça θ, ou
haja razões para acreditar que o θ variou, seja pelo tempo ou pela introdução de novas técnicas na
produção, a inferência estatística fornece um processo de analise denominado teste de hipótese. O
teste de hipóteses permite decidir por um valor do parâmetro pela sua modificação com um grau
de risco conhecido.

7.1. Formulação das hipóteses básicas para médias e proporções

Na formulação das hipóteses, primeiro constrói-se a hipótese de existência, que é considerada a
hipótese nula. Nesta hipótese considera-se que a não existência de diferenças entre os fenômenos
em análise, isto é, os fenômenos em análise são iguais. Na segunda hipótese, considera-se a
existência de pelo menos uma diferença entre os fenómenos em estudo, e denomina-se por
hipótese alternativa.
7.1.1. Hipóteses genéricas que englobam a maioria dos casos:

Caso de testes de hipóteses para média de populações normais com variâncias conhecidas.
i) Testes bilaterais
ii) Testes unilaterais à direita
iii) Testes unilaterais à esquerda
iv) Testes aplicados a valores do parâmetro obtido após a decisão tomada em um dos três
testes anteriores
Procedimentos padrão para a realização de um teste de hipóteses para média:
• Definem-se as hipóteses do teste, nula e alternativa;

• Fixa-se um nível de significância α;
• Levanta-se uma amostra de tamanho n e calcula-se uma estimativa do parâmetro θ;
• Usa-se para cada tipo de teste uma variável cuja distribuição amostral do estimador do
parâmetro seja a mais concentrada em torno do verdadeiro valor do parâmetro;
• Calcula-se com o valor do parâmetro θ0, dado por H0, o valor crítico, valor observado na
amostra ou valor calculado (Vcalc);
• Fixam-se duas regiões: uma de não rejeição de H0 (RNR) e de rejeição de H0 ou crítica
(RC) para o valor calculado ao nível de risco dado;

• Se o valor observado (Vcalc) pertencer a região de não ejeição, a decisão é de não rejeitar
H0;
• Se Vcalc pertencer a região crítica, a decisão é de rejeitar H0.
7.1.2. Testes de hipóteses para proporções

Procedimentos padrão para a realização de um teste de hipóteses para proporções:
• Fixam-se as hipóteses;
• Fixa-se o nível de significância α;

• Retira-se uma amostra de tamanho n e define-se x, número de sucesso que se calcula
pela expressão;
• Determina-se com p dados por H0,
• Define-se como variável crítico,
• Definem-se as regiões RNR e RC da mesma forma anterior e com o mesmo

procedimento para a rejeição ou não do H0.
7.2. Erros de decisão

Pode-se cometer erros de decisão quando se fazem os testes de hipóteses que são, rejeitar uma
hipótese nula verdadeira, chamado erro da primeira espécie ou erro do tipo I. Ainda pode
acontecer que não se rejeite a hipótese nula falsa, denominado de erro da segunda espécie ou
erro do tipo II.
H0 Verdadeira Falsa
Decisão
Não rejeitar Não há erro Erro do tipo II
Rejeitar Erro do tipo I Não há erro
Pode-se cometer erro do tipo I quando rejeitamos H0, e o erro do tipo II quando não
rejeitamos H0.
7.2.1. Probabilidade de cometer erro do tipo I

Comete-se erro da primeira espécie quando rejeitamos H0, ou quando se levanta uma amostra e a
sua média cair na RC.
Se a média populacional for verdadeira, conclui-se que;
7.2.2. Probabilidade de cometer erro do tipo II

Quando não se rejeita H0 com média populacional verdadeira, e depois verificar-se que H0 é falsa,
comete-se então o erro da segunda espécie.
8. CORRELAÇÃO E REGRESSÃO
O objetivo deste capítulo é...
8.1. Correlação linear simples

Na investigação cientifica em várias áreas de interesse, é importante conhecer como uma variável
varia com a ocorrência de mudanças nos valores das outras. Sem conhecer como uma variável
varia com a ocorrência da outra, é impossível fazer previsões ou controlar uma das variáveis pela
manipulação da outra.
O coeficiente de correlação linear é um estimador simples que retrata a intensidade da relação

linear entre duas variáveis.
8.1.1. Coeficiente de correlação linear simples de Pearson

O coeficiente de correlação de Pearson mede a intensidade da associação linear simples entre duas
variáveis quantitativas contínuas X e Y. esse nome deve-se ao trabalho pioneiro de Karl Pearson
(1857 – 1936). Nesse trabalho Karl Pearson apresenta a expressão para o coeficiente de
correlação, após o trabalho de Sir Francis Galton (1822 – 1911). Para se realizar inferências,
assume-se que as variáveis X e Y têm distribuição normal bivariada.

Para o cálculo de r, nenhuma pressuposição é feita a respeito da distribuição das variáveis

amostrais. Qualquer inferência a ser realizada depende do conhecimento da distribuição bivariada
parental. (ρ também representa coeficiente de correlação populacional).
Os valores de r ou ρ, determinam a intensidade da relação entre as variáveis X e Y. Quando o

valor de ρ = 0 indica que as variáveis X e Y não são correlacionados linearmente. Quando ρ > 0,
existe uma relação linear positiva entre X e Y, ou diretamente proporcional. Quando ρ = 1, existe
uma relação linear perfeita positiva entre as variáveis X e Y. Quando ρ < 0, existe uma relação
negativa entre X e Y. E quando ρ = -1, a relação entre as variáveis X e Y é perfeita negativa ou
inversamente proporcional. O resultado da correlação varia de .
8.2. Regressão linear simples

Na ciência um dos assuntos mais investigados, é a relação funcional entre variáveis mensuradas
com a ideia de estabelecer uma relação funcional as variáveis para predizer mudanças nos seus
valores. Pelo modelo linear ser considerado o mais simples, o procedimento denomina-se de
regressão linear simples. A expressão matemática do modelo de regressão linear é:
A distinção que se faz entre regressão e correlação linear simples, é que a regressão visa
estabelecer uma relação funcional entre duas variáveis e, a correlação mede a intensidade da
relação entre duas variáveis, sem estabelecer uma variável dependente e outra independente. Na
regressão, pode-se estabelecer uma relação funcional entre uma variável aleatória Y (dependente)
e outra variável independente que pode ser aleatória tanto como fixa.
Para a obtenção da equação matemática, devem ser calculados os parâmetros e através das
derivadas parciais da variável dependente Yi e função destes ( e ).

8.2.1. Coeficiente de determinação

O coeficiente de determinação ou variação no modelo de regressão, é uma medida simples da
qualidade do ajuste do modelo de regressão aos dados. O coeficiente de determinação é
representado por R2 e refere-se a proporção da variação da variável dependente (Y) que é
explicada pelo modelo de regressão ajustado.
Para o ajuste, primeiro, precisa-se da variação total, também chamada de Soma de Quadrados
Total (SQTotal), que mede a variação dos dados observados em torno da média da variável
dependente.
Segundo, calcula-se a variação na regressão linear, ou Soma de Quadrados de Regressão Linear

(SQRL):
O coeficiente de determinação é expresso em percentagem.
9. TESTES NÃO PARAMÉTRICOS

O objetivo deste capitulo é ...
9.1. Testes de aderência (ajustamento)

O teste de aderência serve para verificar se os dados determinados seguem uma distribuição de
probabilidade como binomial, Poisson ou normal.

Os procedimentos para efetuar o ajustamento e o teste de aderência são:
i) Realiza-se um levantamento da amostra e ordenam se os dados;

ii) Observa-se o tipo de distribuição e propõe-se um modelo para a distribuição, binomial,
Poisson, normal, etc.;
iii) Estimam-se os parâmetros de que dependem essa distribuição proposta;
iv) Com estas estimativas, executa-se o ajustamento, verificando quais seriam os valores
esperados, com base nessas estimativas, isto é, testa-se a aderência, verificando-se se é
possível admitir que os valores observados seguem a distribuição proposta.
Considerando um experimento aleatório onde:
- Categoria de provas ou classes;
- Frequência absoluta observada da i-ésima categoria;
- Frequência absoluta esperada da i-ésima categoria.
Por meio dessa da expressão acima pode-se realizar testes que permitem verificar se os resultados
práticos obtidos em um experimento aleatório seguem uma determinada distribuição.
No teste só há uma região de rejeição à direita, quando mais próximo for Oi de ei, mais próximo
de zero (à esquerda da X2), mais perfeita é a aderência testada. Ou por outra, rejeita-se H0 a um
nível de significância α caso o valor da estatística de teste seja superior a Xcalc, isto é, rejeita-se H0
se X2calc > X2tab, caso contrário, não se rejeita H0.
Exemplo:
Considere um dado lançado 120 vezes obtendo-se os resultados na tabela abaixo. Teste as
hipóteses de que o dado seja perfeito ao nível de 5%.
faces Oi
1 23
2 15
3 14
4 21
5 22
6 25

faces Oi Pi n.pi=ei Oi2 Oi2/ei

1 23 1/6 20 529 26,45
2 15 1/6 20 225 11,25
3 14 1/6 20 196 9,80
4 21 1/6 20 441 22,05
5 22 1/6 20 484 24,2
6 25 1/6 20 625 31,25
Total 120 1 125
X2calc=125-120
Logo; X2calc < X2tab
Não se rejeita a H0. Isto quer dizer que o dado não é viciado.
9.2. Tabelas de contingencia

São tabelas de dupla entrada construídas com o proposito de estudar a relação entre duas variáveis
de classificação. Em particular pode-se desejar saber se as duas variáveis são relacionadas de
algum modo. Por meio do teste X2, é possível verificar se as variáveis são independentes.
Se r = número de linhas e c = número de colunas, então o número de graus de liberdade é ɸ = (r-

1)(c-1).
Para melhor compreensão, com base no exemplo abaixo, siga os passos:
Exemplo:
No congresso americano, grupos de democratas e Republicanos votaram em um projeto de

interesse nacional como está na tabela abaixo. Ao nível de 5%, testar a hipótese de não haver
diferença entre dois partidos, com relação a esse projeto.

Valores observados ou Oi
Votos
A favor Contra Indecisos Total
Partido
Democratas 85 78 37 200
Republicanos 118 61 25 204
Total 203 139 62 404
Determinação dos valores ajustados:
Valores ajustados
Votos
A favor Contra Indecisos Total
Partido
Democratas 100 69 31 200
Republicanos 103 70 31 204
Total 203 139 62 404

Oi ei (Oi – ei) (Oi – ei)2 (Oi – ei)2/ei

85 100 -15 225 2,2500
78 69 9 81 1,1739
37 31 6 36 1,1613
118 103 15 225 2,1845
61 70 -9 81 1,1571
25 31 -6 36 1,1613
404 404 9,0881
r=2
c=3
ɸ = (2-1)(3-1) = 2
α = 5%
Xα2 = 5,9915
X2tab < X2cal
Logo: rejeita-se H0, isto quer dizer que ao nível de 5% de significância, pode se afirmar que os
políticos não votaram independentemente da orientação de seus partidos.
Bibliografia
LUIZ GONZAGA MORETTIN, (2010), Estatistica Básica (Probabilidade e Inferencia), São Paulo.
DANIEL F. FERREIRA, (2014), Estatística Básica, 2ª Edição Revisada, UFLA.
PAULO R. CECON et al., (2012), Métodos Estatísticos (Série-Didática), 1ª Edição, UFV.
MONTGOMERY, D; RUNGER, C. Estatística Aplicada e Probabilidade para Engenheiros. Rio de

Janeiro, 4ª ed., Editora LTC, 2009.
WILTON O. BUSSAB, Análise de Variância e Regressão (Métodos Quantitativos). São Paulo, 2ª ed.
Atual, 1988.

REINALDO CHARNET et al, Análise de Modelos de Regressão Linear (com aplicações). São Paulo, 2ª
ed., Unicamp, 2008.
COSTA NETO & CYMBALISTA, Probabilidades, São Paulo, 2ª ed., Editora Blucher, 2006.

Material PME 2021 Online PDF

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Material PME 2021 Online PDF

Enviado por

Direitos autorais:

Formatos disponíveis

Universidade Zambeze – Faculdade de Engenharia Ambiental de Recursos Naturais

FACULTAD DE ENGENHARIA AMBIENTAL E DOS RECURSOS NATURAIS

Probabilidade e Métodos Estatísticos

Matérias do programa da disciplina de PME (material em produção)

1. CONCEITOS BÁSICOS DA ESTATÍSTICA

1.3. Conceitos básicos

Em seguida são apresentados alguns conceitos fulcrais da estatística.

São caraterísticas observáveis em cada elemento pesquisado.

As variáveis classificam-se em quantitativas (fenômenos mensuráveis) e qualitativas (fenômenos

As variáveis quantitativas subdividem-se em discretas e contínuas. As variáveis quantitativas discretas

As variáveis qualitativas subdividem-se em nominais e ordinais. As variáveis qualitativas nominais são

Este capítulo tem como objetivo ...

2.1.1. Dados brutos

Tabela 2.1. Atividade agropecuária predominante em 20 propriedades de um município.

café leite leite milho

Tabela 2.2. Distribuição de frequências da atividade agropecuária predominante em 20 propriedades de

Atividade Fa Fr Fp Fac. Abs Fac. Per

Frequência absoluta (Fa) é a ocorrência de cada atividade por município.

Material de PME/2021 Docente: Joaquim Francisco Mazunga, MSC Page 3

Onde n é o tamanho da amostra.

Frequência percentual (Fp) é o produto entre a frequência relativa por 100%.

Idem para frequência acumulada percentual.

Tabelas de frequência em forma gráfica:

Material de PME/2021 Docente: Joaquim Francisco Mazunga, MSC Page 4

2.1.3. Dados agrupados

2.1.4. Etapas para agrupar os dados

Passo 1. Número de classes

Material de PME/2021 Docente: Joaquim Francisco Mazunga, MSC Page 5

Passo 2. Amplitude total dos dados

Passo 3. Amplitude da classe

Passo 4. Limite inferior da primeira classe

Passo 5. Limite superior da primeira classe

Material de PME/2021 Docente: Joaquim Francisco Mazunga, MSC Page 6

Com os dados não agrupados

Quadro 2.2. Dados do quadro 2.1. organizados em ordem crescente.

Material de PME/2021 Docente: Joaquim Francisco Mazunga, MSC Page 7

Tabela 2.3. Frequência do tempo (meses) de espera dos doentes.

Meses(X) Fa Meses(X) Fa Meses(X) Fa Meses(X) Fa Meses(X) Fa

Com dados agrupados

Tabela 2.4. Dados agrupados em meses e suas frequências absolutas.

Material de PME/2021 Docente: Joaquim Francisco Mazunga, MSC Page 8

2.1.5. Medidas de tendência central

As medidas de tendência central ou medidas de posição, indicam a concentração de um conjunto de

Cálculo da média com dados não agrupados:

Cálculo da média com dados agrupados:

Material de PME/2021 Docente: Joaquim Francisco Mazunga, MSC Page 9

Para dados agrupados, a moda é obtida através da fórmula abaixo:

2.1.5.4. Quantís (quartís) ou separatrizes

Cálculo dos quartís

Quartil 25% 50% 75% 100%

Material de PME/2021 Docente: Joaquim Francisco Mazunga, MSC Page 11

2.1.6. Medidas de dispersão

Na descrição de um conjunto de dados, apenas a utilização de medidas de posição é insuficiente para

2.1.6.1. Amplitude total

2.1.6.2. Variância e desvio padrão

A variância é a média dos quadrados dos desvios dado pela expressão:

Material de PME/2021 Docente: Joaquim Francisco Mazunga, MSC Page 12

Dados não agrupados;

2.1.6.3. Coeficiente de variação

Neste capítulo, o objetivo é ....

3.2. Conceito de probabilidade

Probabilidade é uma medida de passibilidade de ocorrência de um determinado evento onde pode