Você está na página 1de 41

Como a estatística pode ajudar

... Porque ter a mente boa não é o bastante; o


principal é aplicá-la bem. As maiores almas são
capazes tanto das maiores virtudes quanto dos
maiores vícios, e aqueles que marcham
lentamente podem avançar muito mais, se
seguirem o caminho certo, do que os que correm
porém dele se afastam.

Descartes, Discurso sobre o método, parte I

Referência: Benício de Barros Neto, Ieda Spacino Scarminio, Roy Edward Bruns.
“Como fazer experimentos: Pesquisa e desenvolvimento na ciência e na indústria”.
Bookman, 4ª edição, 2010.
Exemplo prático
Um químico deseja obter o rendimento máximo
em uma reação que é controlada apenas por
duas variáveis:

- a temperatura

- a concentração de um determinado reagente


Nomenclatura
- RESPOSTA: é a propriedade de interesse
rendimento
- FATORES: variáveis que influencia a resposta
temperatura
concentração
- SUPERFÍCIE DE RESPOSTA: função que
descreve a influência dos fatores na resposta
resposta = f(temperatura, concentração)
- NÍVEIS: o pesquisador deve escolher quais
valores dos fatores dão maior resposta
Como descobrir o nível para cada fator
- fixa um fator e varia-se o outro fator

- Varia-se todos os fatores ao mesmo tempo

INTERAÇÃO: as variáveis podem-se influenciar


mutuamente.
A estatística pode ajudar

- A resolver problemas em que é necessário

estudar várias propriedades aos mesmo tempo

sendo que estas são afetadas por um grande

número de fatores experimentais


- Como estudar o efeito de todos esses fatores
sobre todas as propriedades, minimizando o
trabalho e o custo dos experimentos?

- Como melhorar a qualidade do produto


resultante?

- Que fatores experimentais devem-se controlar


para que a qualidade do produto seja
assegurada?
Pesquisas para essas respostas
- Levam tempo
- Envolvem pessoal qualificado
- Custo alto
- Gastos com reagentes
- Gastos com pessoal
- Analises química
- Análises físicas
O conhecimento da estatística
proporciona
- Resolver esses problemas de forma racional e
econômica

- Usar planejamento experimental

- Extrair o máximo de informação útil

- Minimizar o número de experimentos


Diferença entre modelo empírico e
modelo mecanístico

- Modelo mecanístico ou global


Ex. mecânica newtoniana

- Modelo empírico ou local


Ex. As variáveis investigadas influenciam no
sistema.
Estatística

- Analisar dados

- Planejar os experimentos para obter os


dados
Erros - Considere o exemplo:
Para determinar a [ácido acético] no vinagre:
- Preparar a solução do padrão primário;
- Utilizá-la para padronizar a solução de
hidróxido de sódio;
- Realizar a titulação.

Não se pode esquecer que cada uma dessas


etapas evolve várias operações básicas, como
pesagens, diluições e leitura de volume.
Suponha duas amostras com teor
esperado de 4%:
- Teor encontrado na amostra A: 3,80%
- Teor encontrado na amostra B: 4,20%

Erro grosseiro: esquecer de colocar o indicador

Erro sistemático: indicador impróprio, padrão


adulterado, balança descalibrada, pipeta mal
aferida, paralaxe, etc.
Tente identificar e eliminar todos
os erros sistemáticos
Para quaisquer duas ou mais
medidas é de se esperar que
tenhamos resultados idênticos?

Observe 20 medidas obtidas para esse


sistema na Tabela 01:
Tabela 01 - Resultados obtidos para vinte titulações realizadas
para um mesmo lote de vinagre

Número da Titulação Concentração / % Número da Titulação Concentração / %


1 3,91 11 3,96
2 4,01 12 3,85
3 3,61 13 3,67
4 3,83 14 3,83
5 3,75 15 3,77
6 3,91 16 3,51
7 3,82 17 3,85
8 3,70 18 4,04
9 3,50 19 3,74
10 3,77 20 3,97
Figura 01 - Utilizando um gráfico observe a distribuição
das medidas
Figura 02 - Utilizando um gráfico observe a
concentração da distribuição das medidas em torno de
um valor central
O que se percebe?
1 - Os valores não são idênticos mas flutuam em
torno de um valor intermediário.

2 – A flutuação em torno do valor central ocorre


aparentemente ao acaso.

3 – Parece que a amostra está mesmo fora da


especificação, já que a maioria dos valores
determinados encontra-a abaixo de 4%.
Erros aleatórios

São erros devidos a causas não


justificadas e difíceis de se
determinar, ou seja aqueles que
ocorrem ao acaso.
Esta é uma características que temos que conviver e para a qual
utilizamos a estatística como ferramenta de avaliação.
EXERCÍCIO 1:

Pense num experimento simples e procure identificar alguns dos


fatores que impedem que se obtenham resultados
rigorosamente sem erros.
Como tratar estatisticamente os erros
aleatórios:
Admita a hipótese que se trata de uma
distribuição gaussiana, ou normal.

Quantos caroços há em um quilo de feijão?

Para resolver esta questão você pode:


- Contar um a um
- Usar a estatística (por exemplo, pese um feijão
e divida o quilo pelo peso de um feijão)
EXERCÍCIO 2:

Tente adivinhar quantos caroços existem em um quilo de feijão


preto. É óbvio que este não é o método recomendado para
resolver nosso problema (a não ser que você tenha poderes
parapsicológicos), mas seu palpite servirá para um teste
estatístico, mais adiante.
Experimento 1
Pesou-se de forma aleatória dois feijões retirados de um pacote
de um quilo de feijão preto:

- Peso do primeiro feijão: 0,1188 g


- Peso do segundo feijão: 0,2673 g
- Se todos os caroços de feijão fossem iguais ao primeiro, em
1000 g
um quilo de feijão haveria: n = ≅ 8.418 caroços
0,1188 g

- Se todos os caroços de feijão fossem iguais ao segundo, em


1000 g
um quilo de feijão haveria: n = ≅ 3.741 caroços
0,2673 g

Qual desses valores seria possível aceitar?


O correto seria usar a média
- Que seria possível dividindo o peso do quilo
de feijão pelo número de feijões contido nele,
mas não conhecemos o número de feijões em
um quilo.

- Se examinarmos os feijões contidos em um


quilo concluiremos que há caroços maiores e
caroços menores, mas a maioria tem mais ou
menos o mesmo tamanho.
Assim, podemos restringir o número de feijões
para o nosso cálculo considerando um intervalo
de tamanho e definindo o tamanho de nossa
população.
POPULAÇÃO – em estatística é o conjunto de
todos os valores possíveis numa dada situação.

- Com o conhecimento de todos os pesos


individuais de cada um dos feijões contidos no quilo
seria possível conhecer a média populacional
verdadeira, mas isto é inviável. Dessa forma,
podemos considerar fazer uma estimativa. Isto é a
partir de uma amostra da população.
POPULAÇÃO
Qualquer coleção de indivíduos ou valores, finita ou infinita

AMOSTRA
Uma parte da população, normalmente selecionada com o
objetivo de se fazer inferência sobre a população.
EXERCÍCIO 3:

O conjunto de todas as concentrações que podem, em princípio,


ser obtidas na titulação de uma amostra constitui uma
população finita ou infinita?
Para que a amostra seja uma
representação realista, não
tendenciosa, da população completa,
é necessário que seus elementos
sejam escolhidos de forma
rigorosamente aleatória.
AMOSTRA REPRESENTATIVA

Apresenta as características relevantes da população na


mesma proporção em que ela ocorrem na própria população

AMOSTRA ALEATÓRIA

Apresenta N valores ou indivíduos obtidos de tal forma que


todos os possíveis conjuntos de N valores na população
tenham a mesma chance de ser escolhidos
Tabela 02 - Pesos de 140 caroços extraídos aleatoriamente
de um pacote de um quilo de feijão preto
Tabela 03 - Distribuição em intervalos dos pesos de 140 caroços
extraídos aleatoriamente de um pacote de um quilo de feijão preto.
FREQUÊNCIA RELATIVA

Corresponde ao número de unidades ou indivíduos contidos

em certo um intervalo dividido pelo número total de unidades

ou indivíduos numa amostra.


É preferível analisar a distribuição dos pesos dos dados ou
indivíduos em termos de frequência, porque as distribuições
estatísticas teóricas são distribuições de frequência, não de
número absoluto de investigações.

Conhecendo-se as frequências, pode-se determinar as


probabilidades de que certos valores de interesse venham a
ser observados.

Com essas probabilidades pode-se então testar hipóteses


sobre a população.
EXERCÍCIO 4:

Use os dados da Tabela 03 para confirmar que 54,3%


dos caroços observados têm peso entre 0,18 e 0,24 g.
Figura 03 – Histograma dos pesos de 140 caroços
extraídos aleatoriamente de um pacote de 1 Kg de
feijão preto
Quando temos um conjunto de dados para analisar, desenhar
um gráfico é uma das primeiras coisas que devemos fazer. Esta
é uma regra geral da estatística, equivale ao velho ditado que
diz que uma imagem vale mais que mil palavras.

As principais características de um histograma são:

- localização do conjunto de observações numa certa região.


- dispersão, ou espalhamento, ao longo dessa região.
EXERCÍCIO 5:

Construa um histograma para os dados da Tabela 1. A literatura


em geral recomenda que o número de barras seja
aproximadamente igual a raiz quadrada do número total de
observações. Prefira um número ímpar, o que permitirá observar
possíveis simetrias.
Média aritmética:
É uma medida da localização ou tendência central.

Soma total dos valores do conjunto dividida pelo número


total dos valores.

Média amostral:
Desvio padrão
Medida do espalhamento das observações em torno da média.

Calcula-se a diferença de cada valor individual em relação à média.


Dividindo-se a soma dos quadrados de todos os desvios por N-1 obtém-
se a variância.
Variância amostral

Desvio padrão amostral


EXERCÍCIO 6:

Calcule a média e o desvio padrão dos dez primeiros valores da


Tabela 2. (de 0,1188 a 0,1409)
Na amostra de 140 caroços de feijão, os limites do intervalo definido por
um desvio padrão em torno da média são 0,2024 +/- 0,0363, ou 0,1661 g e
0,2387 g. A região compreendida entre esses dois valores corresponde a
66,6% da área total do histograma, o que significa que nela caem dois
terços de todas as observações.

A região definida por dois desvios padrão, tendo como limites 0,1298 g e
0,2750 g detém 96,6% da área total.

Dentro de certas suposições, que serão discutidas adiante, esses


intervalos podem ser utilizados para testar hipóteses a respeito da
população.
EXERCÍCIO 7:

Calcule a média e o desvio padrão do conjunto de valores da


Tabela 2 e determine os limites do intervalo definido por dois
desvios padrão em torno da média. Compare o intervalo de
confiança dado no texto para os valores da titulação.