Você está na página 1de 55

UNIVERSIDADE CATÓLICA DE

MOÇAMBIQUE - TETE
Faculdade de Gestão de Recursos Naturais e Mineralogia

Apresentacao da cadeira e do
docente aos alunos e vice versa

Docente: Andissene Andissene


Unidade Temática

➢ Introdução à Estatística
➢ Estatística Descritiva
➢ Teoria de probabilidades
➢ Variáveis Aleatórias Discretas (Distribuição Binomial)
➢ Variáveis Aleatórias Continuas (Distribuição Normal)
Formas de avaliação

➢ Assiduidade;
➢ Participação nas aulas;
➢ Trabalhos em grupo/individuais;
➢ Seminários;
➢ Testes;
➢ Exames.
Introdução a estatística
Estatística é um conjunto de métodos e processos quantitativos
que servem para colectar, organizar, analisar ou estudar e
interpretar um determinado fenómenos.

Estatística é a ciência que trata da coleta, organização, análise e


interpretação dos dados para a tomada de decisões.

 E o objecto de estudo é o dado, com o objectivo de analisar o


mesmo.
Estatística

A estatística divide se em duas partes que são:

 Estatística descritiva - é a parte da estatística que descreve os


dados observados.

 Estatística indutiva ou inferencial - é a parte que tem como


objectivo obter e generalizar conclusões para a população a
partir de uma amostra, isso através do cálculo de
probabilidades.
Estatística
População ou universo (N) – é o conjunto ou a colecção de todos os
elementos com uma ou mais características comuns do objecto de
estudo.

Amostra (n) – é aparte da população que é seleccionada para análise.

Dado – é a unidade mínima da informação recolhida.

Variável (xi) – é a característica relativa a todos indivíduos observados a


qual nos interessa estudar estatisticamente.

Rol – é uma sequência ordenada dos dados sendo de forma crescente


ou decrescente.
Variável
Quantitativas – são os que identificam alguma quantidade ou
característica susceptível a medida e podem ser:

Discretas – podem assumir apenas alguns valores.


Ex: número de maquinarias numa planta de mineração como:
dragas, estufas, etc. Número de trabalhadores numa mineração.

Contínuas – podem assumir uma infinidade de valores.


Ex: teor, peso das rochas, temperatura,.
Variável
Qualitativas – são aquelas que identificam alguma qualidade,
categoria ou características não susceptíveis a medida, que podem
ser:

Nominais – apenas identificam categorias não existindo uma


ordenação.
Ex: naturalidade, nacionalidade, raça, etc., etc.
Ordinais – que permitem ordenar as categorias.
Ex: qualidade do carvão (baixa, media e alta);
AMOSTRAGEM
É o processo utilizado para seleccionar uma amostra a partir de uma
população. Esta selecção pode ser com ou sem reposição usando
dois tipos de métodos: Amostragem aleatória/ probabilística e não
aleatória/ não probabilística.

Amostra com reposição é aquela em que cada elemento da


população pode ser escolhido mais de uma vez.

Amostra sem reposição nesta, cada elemento da população


não pode ser escolhido mais de uma vez.
Métodos ou Principais Técnicas de
Amostragem

 Amostragem Aleatória - são as que selecionam os indivíduos da


população de forma que todos tenham as mesmas probabilidades
ou chances de participar da amostra.

✓ Amostragem aleatória simples


✓ Amostragem sistemática
✓ Amostragem estratificada
Amostragem aleatória simples
Neste tipo de amostragem faz-se um sorteio de forma aleatória “às
cegas” sem saber qual será o elemento a fazer parte da amostra, sem
necessariamente utilizar algum cálculo, mas por vezes algumas
tabelas de números aleatórios. Neste caso a cada amostra possível
de mesmo tamanho tem a mesma chance de ser selecionada.

 Um dos exemplos são um dos diferentes sorteios que ocorrem


nas televisões com o PREMIR LOTO
Amostragem Aleatória Sistemática:
 Quando uma população já está ordenada, neste caso escolhe-se todos os
enésimos múltiplos membros, depois de determina-se o intervalo de
𝑁
amostragem (I) onde o 𝐼 = . De entre as primeiras (I) unidades
𝑛
selecciona-se um numero inicial, e os nuumeros posteriores provem da
adicao do anterior com intervalo (I) regular.

Exemplo: Suponhamos que numa área de indução tenha 720


colaboradores de uma determinada empresa, dentre os quais
deseja-se uma amostra formada por 30 destes colaboradores.
Amostragem Aleatória Estratificada

 Quando uma população é formada por subgrupos ou extractos


específicos diferentes uns dos outros, usa-se este tipo de
amostragem para formar uma amostra que será constituída por
um pouco de cada extracto de forma proporcional.
Amostragem Aleatória Estratificada
proporcional
Exemplo: Deseja-se fazer uma estimativa do tempo médio de
trabalho dos engenheiros de várias categorias de uma empresa através
de uma amostra de tamanho 10. Usando a amostragem aleatória
estratificada proporcional, seleccione os engenheiros a pertencerem a
tal amostra. Categorias N° de
Trabalhadores

Eng. Minas 20
Eng. Geólogos 60
Eng. 120
Processamento
Total 200
Amostragem não Aleatória

 Este método é de caracter pragmatico ou intuitivo, ou seja, a


selecção dos indivíduos da população pode ser feita através de
uma opinião pessoal do pesquisador fazendo com que alguns
desses indíviduos não tenha chance de ser escolhido para fazer
parte da amostra.
Tipos de amostras não aleatórias:

 Amostra Intencional é composta por elementos da população


seleccionados intencionalmente pelo investigador, porque este
considera que esses elementos possuem características típicas ou
representativas da população;
Tipos de amostras não aleatórias:

 Amostra por Conveniência os elementos são escolhidos por


conveniência ou por facilidade.
Tipos de amostras não aleatórias:

Amostra “Snowball” é tipo de amostra intencional em que o


investigador escolhe um grupo inicial de indivíduos e pede-lhes o nome
de outros indivíduos pertencentes a mesma população.

Amostragem de Voluntários: Nesse tipo de amostragem, os


elementos da amostra são definidos pela opção do próprio elemento
em participar do processo.
Tamanho de amostra em população

Para determinar o tamanho da amostra, pode usar a fórmula de


Yamane (1967).
N
n 2
1 + N (e)
Onde:
N – número total da população.
n – tamanho da amostra.
e – nível de significância/margem de erro

Exemplo: Determine o tamanho da amostra usando a fórmula de


Yamane, tendo em conta a margem de erro de 5% num universo
de 1500.
Razões do uso da amostra

Existem várias razões para o uso da amostra mas podemos


resumi-las em minimização dos recursos e minimização do tempo.
Dentre elas podemos também destacar as seguintes:
✓ Infinidade da população
✓ Precisão dos resultados
✓ Problemas de acessos
✓ Instabilidade política
✓ Problemas demográficos
Tabela de distribuição de
frequências
Definição - é uma tabela na qual encontramos os possíveis valores
de uma variável agrupados ou não em classes com as suas
respectivas frequências.

Dados brutos – é o conjunto de dados numéricos obtidos


inicialmente.

Amplitude total ou range (R) – é a diferença entre o maior e o


menor valores observados, dada pela seguinte formula:
𝑅 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛
Tabela de distribuição de
frequências
Frequência absoluta (𝒇𝒊 ) - é o numero de vezes que o elemento
aparece na amostra, ou o numero de elementos pertencentes a uma
classe.

Frequência absoluta acumulada (𝒇𝒂𝒄 ) −é a soma das frequências


absolutas do valor inferiores ou iguais ao valor dado.

Frequência relativa (𝒇𝒓 ) - é a percentagem ou proporção da quele


valor da amostra ou categoria em relação ao numero total de
𝑓𝑖
observações, ou seja: 𝑓𝑟 =
𝑛
Distribuição de frequências de
dados não agrupados
Exemplo: Apos o desflorestamento numa determinada área devido a
exploração de um determinado minério, a empresa responsável
investiu na plantação na mesma área onde foi constatada a seguinte
quantidade plantada diariamente:
14 12 11 14 13
12 14 13 11 12
12 14 10 15 11
15 13 16 14 14
a) Faça o rol
b) Ache a amplitude total
c) Faça a distribuição das frequências
Distribuição de frequências de
dados não agrupados

Imaginemos no laboratório de Ray – X da Vale teria se constatado


as seguintes quantidades em grama de concentração de óxidos:
TiO2 (240), Al2O3 (40), ZrO2 (390), SiO2 (250) e Fe2O3 (30).

Faça a distribuição percentual dos óxidos


Distribuição de frequências de
dados não agrupados

Sample Data Qnt. (g) Per. (%)


TiO2 240 25.26
Al203 40 4.21
ZrO2 390 41.05
SiO2 250 26.32
Fe203 30 3.16
Total 950 100
Distribuição de frequências de
dados não agrupados
Suponhamos que no laboratório da ICVL estejam a fazer a análise
granulométrica de um determinado minério usando uma amostra de
1000 gramas. No entanto, encontre as quantidades referidas na tabela
abaixo.
Peneira Massa % Retida % Retida % Passante
(mm) Retida na Peneira Acumulad pela
(g) a Peneira
1.2 0
0.6 300
0.3 400
0.15 290
Fundo 10
Total
Distribuição de frequências de
dados não agrupados

Peneira Massa % Retida % Retida % Passante


(mm) Retida na Acumula pela
(g) Peneira da Peneira
1.2 0 0 0 100
0.6 300 30 30 70
0.3 400 40 70 30
0.15 290 29 99 1
Fundo 10 1 100 0
Total 1000 100 ______ _____
Representação gráfica de dados
não agrupados em classe
Exemplo: Apos o desflorestamento numa determinada área devido a
exploração de um determinado minério, a empresa responsável investiu na
plantação na mesma área onde foi constatada a seguinte quantidade
plantada diariamente :

xi fi fr(%) fac F(%)


10 1 5 1 5
a) Represente graficamente 11 3 15 4 20
12 4 20 8 40
13 3 15 11 55
14 6 30 17 85
15 2 10 19 95
16 1 5 20 100
∑ 20 100
Representação gráfica de dados
não agrupados em classe
Gráfico de reflorestamento
7

4
fi
3

0
10 11 12 13 14 15 16
Quantidades
Representação gráfica de dados
não agrupados em classe
Gráfico de reflorestamento
16
Q
u 15
a
n 14
t
i 13
d
a 12
d
e 11
s
10

0 1 2 3 4 5 6 7
fi
Medidas de tendência central
de dados não agrupados
Media aritmética simples – é o conjunto de todos o valores
𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛 ao quociente que se obtém da soma de todos os
valores pelo efectivo numero total n.

σ 𝑥𝑖
Simbolicamente, 𝑥ҧ =
𝑛

Exemplo: Calcule a media aritimetica dos


seguintes dados: 3, 7, 8, 12, 15.
Medidas de tendência central
de dados não agrupados
Media aritmética ponderada – se uma variável discreta toma os
valores 𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛 com a suas respectivas frequências absolutas
𝑓1 , 𝑓2 , 𝑓3 , … , 𝑓𝑛 respectivamente, a media aritmética é dada por:

σ 𝑓𝑖 𝑥𝑖 xi fi fr(%) fac F(%)


𝑥ҧ = 10 1 5 1 5
𝑛 11 3 15 4 20
12 4 20 8 40
Exemplo: Calcule a media
13 3 15 11 55
aritmética dos s dados ao 14 6 30 17 85
lado: 15 2 10 19 95
16 1 5 20 100
∑ 20 100
Moda

Moda (𝑴𝒐 ) - é o valor da variável que corresponde a maior


frequência. Portanto, existem series estatísticas com duas modas
(bimodal), com três (trimodal), etc. E também existem series em
que não existe a moda.

Para o exemplo anterior a moda é a variável 14 (𝑴𝒐 = 𝟏𝟒) pois, a


sua 𝒇𝒊 = 𝟔 que é a maior de todas as outras.
Mediana

Mediana 𝑴𝒆 𝒐𝒖 (෥ 𝒙) – quando colocados em ordem crescente,


a mediana é o valor que divide a amostra ou a população em
duas partes iguais. Assim:

𝑛+1
Se n for impar, a mediana será o elemento central de ordem
2
caso contrario, ou seja se for par, a mediana será a media entre
𝑛 𝑛
os elementos centrais de ordem e + 1.
2 2
Mediana

xi fi fr(%) fac F(%)


10 1 5 1 5
11 3 15 4 20
12 4 20 8 40
13 3 15 11 55
14 6 30 17 85
15 2 10 19 95
16 1 5 20 100
∑ 20 100
Medidas de dispersão ou de variação
Variância 2
1 2 ( σ 𝑋𝑖 𝐹𝑖 )
𝜎2 = ෍ 𝑋𝑖 𝐹𝑖 −
𝑁 𝑁
ou
2
2
1 2 ( σ 𝑋𝑖 𝐹𝑖 )
𝑆 = ෍ 𝑋𝑖 𝐹𝑖 −
𝑛−1 𝑛

σ 𝑓𝑖 𝑥𝑖 − 𝑥ҧ 2
σ 𝑓𝑖 𝑥𝑖 −𝑥ҧ 2
2
𝑆 = 𝜎2 =
𝑛−1 𝑁
Medidas de dispersão ou de variação

Desvio padrão

σ 𝑓𝑖 𝑥𝑖 −𝑥ҧ 2
S= 𝑆 2 𝑜𝑢 S=
𝑛−1

𝜎= 𝜎2
Distribuição de frequências de
dados agrupados
Número de classes (K) – não há uma formula exacta para o calculo
de numero de classes mas 𝐾 = 5 𝑝𝑎𝑟𝑎
𝑛 ≤ 25 𝑜𝑢 𝐾 ≅ 𝑛 𝑝𝑎𝑟𝑎 𝑛 > 25.

Já a formula de Sturges 𝐾 ≅ 1 + 3,22 log 𝑛 em que 𝑛 =


𝑡𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎.

Exemplo: 𝑛 = 49, 𝑒𝑛𝑡𝑎𝑜 𝐾 = 49 = 7 𝑜𝑢 𝐾 ≅ 1 +


3,22 log 49 ≅ 7

Amplitude das classes (h): ℎ = 𝑅 ÷ 𝐾


Distribuição de frequências de
dados agrupados
Limite das classes
I. 6 ⊢⊣ 10 𝑜𝑢 [6; 10]
II. 6 ⊢ 10 𝑜𝑢 [6; 10[
III. 6 − 10 𝑜𝑢 ]6; 10[
IV. 6 ⊣ 10 𝑜𝑢 ]6; 10]

Ponto médio ou marca da classe – é a media aritmética


entre o limite inferior e o superior da classe.
10+12
Exemplo: Se 10 ⊢ 12, teremos 𝑋𝑖 = = 11, como o
2
ponto médio.
Distribuição de frequências de
dados agrupados
Exemplo: Suponhamos que uma certa empresa teria exportado para
os países vizinhos as seguintes quantidades em (toneladas) do seu
minério processado como mostra os seguintes dados em rol:

150 154 155 157 160 161 162 164 166 169

151 155 156 158 160 161 162 164 167 170

152 155 156 158 160 161 163 164 168 172

153 155 156 160 160 161 163 165 168 173
Representação gráfica de
dados agrupados em classe

Histograma – é a representação gráfica de uma distribuição de


frequências por meio de rectângulos justapostos.

Polígono de frequências – é a representação gráfica de uma


distribuição por meio de um polígono.
Representação gráfica de
dados agrupados em classe

Suponhamos que uma certa empresa teria exportado para os


países vizinhos as seguintes quantidades em (toneladas) do seu
minério processado como mostra a tabela a seguir:

Represente-os graficamente.
Representação gráfica de
dados agrupados em classe
quantidades
em
(toneladas) xi fi fr(%) fac F(%)

150 Ⱶ 154 152 4 10 4 10

154 Ⱶ 158 156 9 22.5 13 32.5

158 Ⱶ 162 160 11 27.5 24 60

162 Ⱶ 166 164 8 20 32 80

166 Ⱶ 170 168 5 12.5 37 92.5

170 Ⱶ 174 172 3 7.5 40 100


∑ ___ 40 100 ____
Representação gráfica de
dados agrupados em classe
Gráfico do minério exportado
12

10

fi 6

0
150 Ⱶ 154 154 Ⱶ 158 158 Ⱶ 162 162 Ⱶ 166 166 Ⱶ 170 170 Ⱶ 174
Quantidades (toneladas)
Representação gráfica de
dados agrupados em classe
Gráfico do minério exportado
12

10

fi 6

0
150 Ⱶ 154 154 Ⱶ 158 158 Ⱶ 162 162 Ⱶ 166 166 Ⱶ 170 170 Ⱶ 174
Quantidades (toneladas)
Medidas de tendência central de
dados agrupados em classes

Media aritimética ponderada

σ 𝑓𝑖 𝑥𝑖
𝑥ҧ =
𝑛
Medidas de tendência central de
dados agrupados em classes
𝑛
Mediana 2
− σ𝑓
𝑥෤ = 𝑙𝑀𝑑 + ×ℎ
𝑓𝑀𝑑

Onde:
𝑙𝑀𝑑 – limite inferior da classe mediana
𝑛 – tamanho da amostra ou numero de elementos
σ 𝑓 – somatório de todas as frequências absolutas
anteriores a classe mediana
𝑓𝑀𝑑 – Frequência absoluta da classe mediana
ℎ - Amplitude da classe mediana
Medidas de tendência central de dados
agrupados em classes
Moda (1° processo - formula Czuber)
∆1
𝑀𝑜 = 𝑙 + ×ℎ
∆1 + ∆2

Onde:
𝑙 – Limite inferior da classe modal
∆1 − diferença entre a frequência absoluta da classe modal e a
frequência absoluta da classe anterior
∆2 − diferença entre a frequência absoluta da classe modal e a
frequência absoluta da classe seguinte
ℎ − amplitude da classe modal
Exemplo:
 Calculemos as medidas anteriormente referidas para o exemplo
referente a tabela abaixo.
quantidades
em
(toneladas) xi fi fr(%) fac F(%)

150 Ⱶ 154 152 4 10 4 10

154 Ⱶ 158 156 9 22.5 13 32.5

158 Ⱶ 162 160 11 27.5 24 60

162 Ⱶ 166 164 8 20 32 80

166 Ⱶ 170 168 5 12.5 37 92.5

170 Ⱶ 174 172 3 7.5 40 100


∑ ___ 40 100 ____
Medidas de dispersão ou de variação
Variância 2
1 2 ( σ 𝑋𝑖 𝐹𝑖 )
𝜎2 = ෍ 𝑋𝑖 𝐹𝑖 −
𝑁 𝑁
ou
2
2
1 2 ( σ 𝑋𝑖 𝐹𝑖 )
𝑆 = ෍ 𝑋𝑖 𝐹𝑖 −
𝑛−1 𝑛

σ 𝑓𝑖 𝑥𝑖 − 𝑥ҧ 2
σ 𝑓𝑖 𝑥𝑖 −𝑥ҧ 2
2
𝑆 = 𝜎2 =
𝑛−1 𝑁
Medidas de dispersão ou de variação

Desvio padrão

σ 𝑓𝑖 𝑥𝑖 −𝑥ҧ 2
S= 𝑆 2 𝑜𝑢 S=
𝑛−1

𝜎= 𝜎2
Medidas de dispersão ou de variação

Coeficiente de variação

𝑆
𝐶𝑣 = × 100%
𝑥ҧ
Exemplo: Suponhamos que o peso das amostras colectadas em determinado
processo da Vale é em média de 400 𝑔 com o desvio padrão de 150 𝑔 e as
amostras da ICVL tem sido média de 300 𝑔 com desvio-padrão de 120 𝑔. Então
verifique qual dos pesos apresenta maior dispersão em função ao outro?
Medidas de dispersão ou de variação
Coeficiente de variação
Diz-se que a distribuição possui pequena variabilidade (dispersão) quando o
coeficiente der até 10%, média dispersão quando estiver acima de 10% até 20%; e
grande dispersão quando superar 20%.

Alguns analistas consideram:


➢ Baixa dispersão: 𝐶𝑉 ≤ 15%
➢ Media dispersão: 15% < 𝐶𝑉 < 30%
➢ Alta dispersão: 𝐶𝑉 ≥ 30%
Exemplo: Calculemos o 𝐶𝑣 para o exemplo
referente aos dados abaixo

Quantidades
(toneladas) xi fi fr(%) fac F(%)

150 Ⱶ 154 152 4 10 4 10

154 Ⱶ 158 156 9 22.5 13 32.5

158 Ⱶ 162 160 11 27.5 24 60

162 Ⱶ 166 164 8 20 32 80

166 Ⱶ 170 168 5 12.5 37 92.5

170 Ⱶ 174 172 3 7.5 40 100


∑ ___ 40 100 ____
Muito obrigado ate a
próxima!

Você também pode gostar