Você está na página 1de 111

FUNDAÇÃO UNIVERSIDADE FEDERAL DE PELOTAS

Horário: Segunda – feira - 18:00 às 21:30 hs

Sala – Mini-auditório

Avaliação: 1º Trabalho – Peso 3 – 12/05/2014


1ª Prova – Peso 7 – 19/05/2014

2º Trabalho – Peso 3 – 07/07/2014


2ª Prova – Peso 7 – 14/07/2014

Exame - 21/07/2014
Programa
1) Estatística descritiva
2) Probabilidade
3) Análise Estatística
4) Variáveis aleatórias
5) Noções de amostragem
6) Regressão linear simples
7) Correlação
8) Análise de componentes principais
9) Análise estatística vetorial
 Por serem mais precisos do que as
palavras, os números são particularmente
mais adequados para transmitir as
conclusões científicas.”

(PAGANO e GAUVRE 2004 )

Fonte: http://textosdetherezapires.blogspot.com/2011/12/platao.html
 O estudo da estatística explora:

- o planejamento e a coleta;

- a organização;

- a análise e a interpretação dos dados.


- complicação matemática

- instrumento extremamente útil na


organização e na interpretação de
dados.
• De um modo geral, não existe certeza
sobre a correção das conclusões
científicas;

• No entanto, os métodos estatísticos


permitem determinar a margem de erro
associada às conclusões, com base no
conhecimento da variabilidade
observada nos resultados.
 Para o desenvolvimento de uma
pesquisa científica com qualidade é
necessário:

- um bom planejamento;

- obtenção dos dados com precisão;

- correta exploração dos resultados.


Aplicações da Geomatemática

 Exploração de Petróleo
 Exploração Mineira
 Ambiente
 Florestas
 Pescas e Recursos Marinhos
 Poluição Atmosférica
 Qualidade da Água
 Demografia
 Medicina
Fonte: http://sosriosdobrasil.blogspot.com/2012/01/passivo-ambiental-em-derramamento-de.html
Fonte: http://amazonnewsbr.blogspot.com/2010_08_01_archive.html
Fonte:http://mariorangelgeografo.blogspot.com/2011_05_01_archive.html
Metodologia Geomatemática
A metodologia geomatemática apresenta dois
passos fundamentais:

1º) Análise da continuidade espacial


- caracterizar e quantificação espacialmente
a variável;

- determinar uma base para os processos de


inferência espacial / estimação e simulação
2º)Estimação geomatemática

 avaliação de uma grandeza desconhecida, a


partir da informação existente (modelos
resultantes da análise da continuidade espacial)
Simulação Geomatemática

 Permite gerar um conjunto de imagens do


fenômeno espacial com as mesmas
características estatísticas de variabilidade
espacial das amostras;

 Os modelos de simulação pretendem,


essencialmente, reproduzir imagens múltiplas
da realidade, permitindo modelar a incerteza
espacial;

 Criação de cenários com as mesmas


características que a variável em estudo.
VISUALIZAÇÃO DE RESULTADOS - SIG
VISUALIZAÇÃO DE RESULTADOS
Aula 1 - Estatística Descritiva

 Introdução

 Estatística em Geologia

 Dados Geológicos

 Populações em Geologia

 Amostragem

 Médias
Métodos Quantitativos

Trabalho
Campo da estratigrafia

O número e a proporção de
moluscos presentes nos
diversos estratos da Bacia de Paris.

Subdivisão do Terciário
Sir Charles Lyell
Plioceno, Mioceno e Eoceno
1797 - 1875
 As camadas são depositadas em
camadas (estratos) horizontais em
continuidade lateral através da
superfície da Terra e são depositadas
em sucessão cronológica de tal forma
que as mais antigas posicionam-se na
base e as mais novas no topo.
História da Estatística

A palavra estatística não existia

3.000 A.C. - censos na Babilônia, China e


Egito.

Aumentar impostos
Bíblia

Velho testamento começa com uma instrução a


Moíses: fazer um levantamento dos homens de
Israel que estivessem aptos para guerrear.

Imperador César Augusto

Censo em todo império romano


A palavra “censo” deriva

“censere” - em latim, singnificará “taxar”

A palavra ESTATÍSTICA vem de

“STATUS” - estado, em latim


Em 1085, Guilherme, o Conquistador

Levantamento ESTATÍSTICO da Inglaterra

Informações sobre terras, proprietários, uso


da terra, empregados, animais

Cálculo de impostos
No século XVIII, ganhou destaque na
Inglaterra

Tábuas de Mortalidade

Análise de nascimentos e mortes


1.1 Definição
Geomatemática

Aplicação de conhecimentos matemáticos a


problemas geológicos

Aplicação de métodos quantitativos em


Geologia.

Nos últimos 30 anos mudança

fase descritiva dos fenômenos geológicos

enfoque quantitativo.
Definição de Geomatemática
Tem por objeto a caracterização da
dispersão espacial e espaço-temporal das
grandezas que definem a quantidade e
qualidade de recursos naturais ou outros
fenômenos espaciais em que os atributos
manifestam uma certa estrutura no espaço
e/ou tempo.

Problema básico da Geomatemática

Caracterização da distribuição espacial


das grandezas em estudo e avaliação das
medidas de incerteza
 Processo de transformação das baseia-
se em três fatores principais:

› a facilidade de acesso a computadores


digitais;

› a introdução do conceito de modelos


quantitativos para a explicação de
fenômenos geológicos;

› a procurada integração dos diversos


fenômenos geológicos.
2. Aplicações da Estatística em
Geologia
 amostragem

 análise de dados

 comprovação de hipóteses

 modelagem

 previsão quantitativa
- Estatística Descritiva ou Dedutiva

- Probabilidade

- Inferência Estatística ou
Estatística Indutiva
o Descrição dos dados ali presente, o
resumo destes dados.

o Exemplo:
-50 alunos da sala de aula:

- 25 alunos do sexo feminino


- 25 alunos do sexo masculino
Neste caso eu descrevo.
o Verifico um dado aleatório.

Exemplo:
Qual a probabilidade de jogar um dado
para cima e cair a face 3?

Probabilidade 1/6
oUma nova inferência, um novo
conhecimento, uma conclusão, uma
observação, a identificação de um novo
conhecimento a partir da probabilidade que
vai ser utilizada como suporte para encontrar
este novo conhecimento.

o Inferir alguma informação nova a partir dos


dados que foram coletados, analisados e
interpretados,
Inferir um novo conhecimento.
Estatística descritiva e Estatística
inferencial

 Estatística Descritiva: conjunto de métodos


estatísticos que visam sumariar e descrever
os atributos mais proeminentes aos dados.

 Estatística Inferencial: conjunto de métodos


estatísticos que visam caracterizar (ou
inferir sobre) uma população a partir de
uma parte dela (a amostra).
3. População e Amostra

 População – conjunto completo de


observações reais ou potenciais sobre as
quais se fazem inferências,engloba
objetos, eventos ou números que são do
interesse direto num estudo geológico;

 Amostra – subconjunto da população


selecionado de acordo com um
método de amostragem.
 Parâmetros populacionais são medidas
estatísticas obtidas com base em uma
população.

 Exemplo:

 A média da população é representada pela


letra grega μ (lê-se mi).
 Estimadores são medidas estatísticas obtidas
com base em amostras.
 Estimativas são os valores numéricos
assumidos pelos estimadores ou estatísticas
amostrais.

 Parâmetro é obtido a partir da análise de


toda a população .
 Estimador ou estatística amostral é obtido a
partir da análise da amostra.
 Na inferência estatística, é impossível ou
impraticável observar a população inteira.

 Dependemos de uma amostra de observações


da população que ajude a tomar decisões
acerca desta.

 Para que as inferências sejam válidas, é


necessário que a amostra seja representativa
da população.
 Métodos probabilísticos e os
 Métodos não-probabilísticos

 Métodos probabilísticos – exigem que cada


elemento ou indivíduo da população tenha uma
probabilidade conhecida (não-nula) de ser
selecionado para compor a amostra.Neste
método a amostragem é realizada com seus
elementos selecionados independentemente uns
dos outros ( um por vez). Os resultados podem ser
inferidos para a população.
 Métodos não- probabilísticos – a escolha
destes elementos depende em parte do
julgamento do pesquisador ou do
entrevistador – há escolha deliberada dos
elementos da amostra. Uma vez que os
elementos da população não têm a mesma
probabilidade de compor a amostra, na
amostragem não-probabilística não é
garantida a representatividade da
população.
 Para escolha do método de amostragem, o
pesquisador deve levar em conta:

 o tipo de pesquisa,
 a acessibilidade e disponibilidade dos
elementos da população,
 a variabilidade da população,
 a disponibilidade de tempo para a realização
da pesquisa,
 os recursos financeiros e humanos disponíveis,
 outros fatores.
Método de Vantagens Desvantagens
amostragem
Probabilístico Há garantia de Custo alto
representatividade da Demorado
população
Não-probabilístico Conveniência Falta de exatidão
Rapidez devido a tendência na
Baixo custo seleção.
Não há garantia de
representatividade da
população.
 Métodos de amostragem probabilísticos temos:

 amostragem aleatória simples,


 amostragem sistemática,
 amostragem estratificada
 amostragem por agrupamento ou
conglomerados.
 Todos os elementos da população têm a
mesma probabilidade de compor a
amostra.
 A amostra pode se selecionada por sorteio,
ou, quando a população for muito grande,
os elementos podem ser numerados e em
seguida selecionados por meio de
calculadoras ou computadores.
 Exemplo:
 O professor deseja selecionar cinco alunos
para apresentar um trabalho entre 30 do
total.
 Amostragem sistemática é utilizada quando a
população apresenta-se organizada segundo
algum critério, de tal modo que cada um de
seus elementos possa ser unicamente
identificado pela posição (ex. fichas, lista
telefônica, etc.).
 Neste método a amostragem, supõe-se que a
distribuição dos elementos da população, em
uma lista, é aleatória. Neste caso a
amostragem é realizada por intervalos fixos.
 Seleciona-se, aleatoriamente, o primeiro
elemento, que deve estar entre 1 e o fator
de sistematização, depois escolhem-se os
membros da amostra a intervalos regulares.
O fator de sistematização é obtido por meio
da divisão do número de elementos da
população (N) pelo número de elementos
da amostra(n):

 Fatos de sistematização =

 Arredonda-se o fator de sistematização


para o número inteiro mais próximo.
 Ao selecionar-se uma amostra sistemática
com 30 elementos de uma população de 600
indivíduos, o fator de sistematização será de
600/30 = 20 intervalos. Um número entre 1 e 20
será escolhido aleatoriamente entre os
primeiros indivíduos da população. Suponha-
se que tenha sido escolhido o número 7. O
sétimo elemento será o primeiro elemento da
amostra. As seleções subseqüentes serão 27,
47, 67, 87, ...., 567 e 587.
 A amostragem estratificada é indicada
quando a população encontra-se dividida
em grupos distintos ( população
heterogênea). Dependendo dos objetivos
do estudo, a população será dividida em
dois ou mais subgrupos, denominados
estratos, que compartilham uma
característica comum, como sexo, grau de
instrução e classe social. Depois que uma
população é dividida em estratos
apropriados, podemos fazer uma amostra
aleatória simples em cada estrato.
 Os resultados da amostragem podem
então ser ponderados e combinados
obtemos estratos homogêneos
internamente e heterogêneos em relação
aos outros estratos. Nessa situação, a
estratificação gera amostras mais
representativas da população.
 O número de elementos de cada estrato
que constituirão a amostra é calculado
com base em duas informações:
 (1) o tamanho que deve ter a amostra total
 (2) como a amostra total deve ser alocada
entre os estratos.
 As amostras dentro de cada estrato podem
ser proporcionais ou desproporcionais ao
tamanho do estrato em relação à
população.
 Exemplo:
 Uma comunidade universitária é formada por
8.000 indivíduos, entre professores, estudantes
e funcionários. Na tabela 1.2 é apresentado o
número de indivíduos em cada um destes
estratos, proporcional ao seu número na
população, considerando uma amostra com
5% dos elementos da população.
Estratos População Amostra
Professores 800 40
Funcionários 1.200 60
Estudantes 6.000 300
Total 8.000 400
 Na amostragem por agrupamento ou
conglomerado, os elementos da população
são divididos em grupos, de forma que cada
grupo seja representativo da população total.
Uma amostra aleatória simples dos grupos é
então obtida, e todos os elementos dentro de
cada grupo são analisados. Podemos citar
como agrupamentos agências, quarteirões,
edifícios ou bairros.
 A amostragem por agrupamentos resulta em
economia de custo, particularmente se a
população estiver dispersa por uma extensa
área geográfica, pois em um agrupamento
muitas observações da amostra podem ser
obtidas em tempo relativamente curto, o
que possibilita obter um tamanho de
amostra maior, com custo total
significativamente mais baixo.
 Métodos de amostragem não-probabilístico
são:

 Amostragem por conveniência;


 Por julgamento;
 Por cotas.
 Amostragem por conveniência os elementos
ou indivíduos são selecionados com base na
sua semelhança presumida com a
população e na sua disponibilidade
imediata.
 Tem a vantagem de ser rápida e barata
pela fácil seleção da amostra e coleta de
dados, no entanto é difícil avaliar quão
representativa da população é essa
amostragem.
 Um programa de televisão libera uma
número de telefone para que os
telespectadores possam ligar e dar sua
opinião sobre determinado assunto.

 Um repórter de TV faz entrevistas na rua.


 A amostragem por julgamento a pessoa mais
conhecedora do assunto a ser pesquisado
escolhe intencionalmente os indivíduos ou
elementos que ela considera representativos
da população para comporem a amostra.
Com frequência este é um modo
relativamente fácil de selecionar uma
amostra. No entanto, a qualidade dos
resultados da amostra depende do
julgamento da pessoa que faz a seleção.
 Em estudos sobre o assédio sexual no trabalho,
o pesquisador pode entrevistar apenas aqueles
que sofreram assédio sexual no trabalho e/ ou
pessoas que trabalham e desenvolvem
pesquisas sobre este assunto.
 Antes de lançar um novo produto no mercado,
algumas empresas o testam entre seus
funcionários. Isso porque acredita-se que os
funcionários terão reações mais favoráveis em
relação ao novo produto do que o público.
Dessa forma, se o produto não passar por esse
grupo, não tem perspectiva de sucesso no
mercado em geral.
 Amostragem por cotas o pesquisador procura
obter uma amostra que seja similar à população
sob determinado(s) aspecto(s) ou dimensão
(ões) considerando as características da
população, como sexo, idade, classe social,
entre outras. A amostra deve possuir proporções
similares de pessoas com as mesmas
características na população. Se acreditarmos
que a resposta a uma pergunta pode variar
dependendo do sexo da pessoa, então
devemos buscar respostas proporcionais de
homens e mulheres.
 Podemos achar também que as pessoas da
classe média têm opinião diferente das
pessoas da classe baixa sobre determinado
assunto, então isso seria um outro aspecto a ser
considerado na coleta da amostra. Portanto,
podemos pedir ao entrevistador para
encontrar pessoas da classe média, sexo
feminino e de determinada faixa etária.
 Pesquisas de opinião de mercado e
pesquisas de marketing.
Tipo Descrição
Conveniência Os elementos são selecionados
com base na sua semelhança
presumida com a população e
na sua disponibilidade imediata.
Julgamento Pesquisador usa o seu julgamento
para escolher intencionalmente
os indivíduos ou elementos que
ele considera representativos da
população.
Quotas O pesquisador entrevista um
número predefinido de pessoas
segundo determinados aspectos.
Tipo Descrição
Aleatória simples A seleção pode ser feita por uma
lista aleatória de elementos ou por
sorteio.
Sistemática População organizada sob algum
critério. Começa com um início
aleatório e depois a amostragem
é realizada por intervalos fixos.
Estratificada A população é dividida em
estratos homogêneos e amostras
aleatórias são selecionadas de
cada estrato.
Agrupamento A população é dividida em seções
ou grupos e é obtida uma amostra
aleatória dos grupos. Todos os
elementos de cada grupo são
analisados.
 Definimos como variável a característica
que cada indivíduo, objeto ou produto
assume (p. ex. , sexo, idade, peso) e dados
estatísticos os diferentes valores ou
categorias que cada variável pode assumir
(ex., masculino e feminino). As variáveis
podem ser :

 Qualitativas
 Quantitativas
 As variáveis qualitativas ou categóricas podem ser
separadas em diferentes categorias que se
distinguem por alguma característica não –
numérica. Podem ser do tipo nominal ou ordinal.
Em uma variável qualitativa nominal, os dados
observados são meramente classificados em várias
categorias distintas, usando-se nomes, marcas ou
qualidades – ex.,cores, religião, disciplinas.
 Uma variável qualitativa ordinal envolve dados,
que podem ser classificados em categorias
distintas, podendo ser arranjados em ordem, como,
por exemplo, classe sociais, grau de instrução,
opinião do usuário.
 As variáveis quantitativas ou numéricas
consistem em números que representam
contagens ou medidas. Podem ser do tipo
discreta ou contínua. Em uma variável
quantitativa discreta os dados observados
assumem apenas valores inteiros, como, por
exemplo, número de livros, número de
passageiros. Em uma variável quantitativa
contínua os dados observados podem assumir
qualquer valor num certo intervalo, por
exemplo, altura, peso, temperatura do ar.
Variável Tipo Exemplos
Qualitativa Nominal Sexo: masculino e feminino
Disciplina; geomatemática, petrologia,
topografia
Ordinal Notas: A,B, C, D, E
Quantitativa Discreta Número de peças produzidas, número
de alunos, número de erros em faturas.
Contínua Altura de pessoas, temperatura do ar,
peso
Notas variando de 0 a 10.
 O objetivo de um estudo estatístico é coletar dados
para subsidiar a tomada de decisões. Se o processo
for planejado de forma inadequada, as conclusões
não serão confiáveis.
 Um bom planejamento fornece respostas para
questões como:
 Por quê
 Quem
 Quando
 O quê
 Onde
 Como
 Um bom estudo geomatemático também depende
da correta execução e finalização, que devem
seguir as seguintes etapas:

 Coletas de dados.
 Organização e apresentação dos dados em tabelas
ou gráficos que facilitem sua visualização. Resumo
dos dados através de medidas estatísticas como
média, desvio-padrão, coeficiente de variação etc.
 Análise e interpretação dos dados.
 Elaboração de um relatório de forma que seja
facilmente compreendido por quem for fazer uso
dos resultados da pesquisa na tomada de decisões.
4. Medidas Descritivas de uma série de
números

 Medidas de tendência central:

- média aritmética;
- média aritmética ponderada;
- média geométrica;
- média harmônica;
- mediana;
- moda.
 Medidas de dispersão:

- amplitude total
- desvio médio
- desvio padrão
- variância
- coeficiente de variação
Medidas de Tendência Central

 São medidas, isto é, ESTATÍSTICAS, cujos valores


próximos do centro de um conjunto de dados.

 As medidas de Tendência Central são:

- Média Aritmética

- Mediana

- Moda
Média
 Média Aritmética ou Média

 Média aritmética ou média

 Centro do conjunto de dados –


ponto de equilíbrio

 A mais importante medida de


tendência central

 Média = Σ(x)/n
Notações

 Σ: somatório de um conjunto de valores


 x: valores individuais dos dados
 n: número de valores da amostra
 N: número de valores de uma população
 x = Σ(x)/n: média de um conjunto de valores
amostrais
 μ= Σ(x)/N: média de todos os valores de uma
população
Mediana
 Valor do meio do conjunto de dados, quando os
valores estão dispostos em ordem crescente ou
decrescente; divide um conjunto de dados em
duas partes iguais.

› Para calcular:Disponha os valores em ordem


(crescente ou decrescente)

› Se o número de valores é ímpar, a mediana é o


número localizado no meio da lista

› Se o número é par, a mediana é a média dos


dois valores do meio
Conjunto de dados
› Encontre a mediana:Liste em ordem crescente
os valores
› Encontre a posição da mediana: (n+1)/2
› Se n é ímpar, mediana é o número da posição;
› Se n é par, mediana é a média entre os dois
números em torna da posição.

› No exemplo:n=18 (par);
› Posição: (n+1)/2 = 9,5
› Mediana 􀃆 média entre o 9oe o 10ovalor =
(1,75+1,75)/2 = 1,75
Moda

 É o valor que ocorre com maior freqüência.


 Quando dois valores ocorrem com a mesma
freqüência, cada um deles é chamado de
uma moda, e o conjunto se diz BIMODAL
 Se mais de dois valores ocorrem com a mesma
freqüência máxima, cada um deles é uma
moda e o conjunto é MULTIMODAL.
 Quando nenhum valor é repetido o conjunto
não tem moda
Conjunto de dados

 Moda = 1,75
Ponto Médio

 Valor que está a meio caminho


entre o maior e o menor valor
Medidas de posição
 Medidas de Posição
› Seja o seguinte conjunto de valores:

5 7 8 10 12 15 20

média = 11 mediana = 10 ponto médio = 12,5

› Se alterarmos significativamente o último valor:


5 7 8 10 12 15 200

média = 36,7 !! mediana = 10 ponto médio = 102,5!!


Medidas de Posição

› Devemos ter cuidados ao escolhermos uma medida de


posição para representar um conjunto de dados, pois:
“Média”e “Ponto Médio” são muito afetados por valores
extremo

› Em geral, a melhor política é utilizar os dois parâmetros:


“média” e “mediana”Valores de “Média”e “Mediana”
muito próximos é uma indicação que o conjunto de valores
é razoavelmente simétrico em relação à posição central
(média / mediana)
Média ponderada

 Cálculo da média, atribuindo pesos


diferentes para cada valor
Exemplo:

 A tabela de freqüência
a seguir resume os
tempos gastos em
estudo extra- classe por
calouros em uma
universidade brasileira.
 Geral·

 CHILÈS, J.P. 1999. Geostatistics: Modeling Spatial Uncertainty.


Wiley-Interscience, New York (USA), 695 p.

 DAVIS, J.C. 2002. Statistics and Data Analysis in Geology.


John Wiley & Sons, New York 638 p.

 WEBSTER, R.;OLIVER, M. A. 2007. Geostatistics for


Environmental Scientists. John Wiley & Sons, Chichester (UK),
315 p.

 LANDIM, P.M.B.;YAMAMOTO,J.K.2013. Geoestatística


conceitos e aplicações. São Paulo, Oficina de Textos 216 p.

Você também pode gostar