Você está na página 1de 13

Conceitos

introdutóri
os sobre
estatística
PIBIC-EM 2021/2022
O que é média e
desvio padrão?

Porque eu devo calcular estas


coisas?

O resultado de um mesmo experimento


não deve ser sempre igual?
Tipos de erros
• Erros grosseiros: devido ao operador/pesquisador
• Exemplo: não zerar a balança antes de pesar algo
• Erros sistemáticos: afetam sempre na mesma direção
• Exemplo: algo descalibrado ou visualização do menisco
• Erros aleatórios: devido ao acaso
• Alguma gota a mais, um pouco de diferença na luz, o clima
mais seco...
Como REDUZIR a interferência dos
erros aleatórios?
• Réplicas! Repetições do
experimento
• Traz maior confiança
• Mostra para qual valor a
resposta tende
• Definir bem o meu grupo
amostral
População e amostra
• População: coleção de dados com alguns parâmetros em
comum, é o conjunto de elementos que será estudado.
• Amostra: membros da população que são efetivamente
analisados na pesquisa/estudo.
• Para que minha amostra seja representativa a chance de
qualquer elemento da população ser coletado deve ser igual!
Caso contrário será um estudo tendencioso.
Exemplo do saco de feijões
• Como saber quantos grãos de feijão
tem em um saco de 1kg de feijão?

• Qual a população neste caso?

• Qual a(s) amostra(s) neste caso?


Exemplo do saco de feijões
• 1º grão: 0,1188g
• 2º grão 0,2673g
• Quantidade de grãos com base nos dados:
• Considerando apenas o 1º grão: 1.000/0,1188 = 8418 grãos
• Considerando apenas o 2º grão: 1.000/0,2673 = 3741 grãos
• Há uma variação muito grande, é necessário um grupo
amostral maior
Exemplo do saco de
feijões

• Ao lado são apresentados 140


valores de pesagens de grãos de
feijões
• Como podemos organizar estes
dados para facilitar nossa
análise?
Frequência
• Podemos organizar nossos dados
em intervalos pré definidos e
verificar a frequência de
amostras que se enquadram em
cada intervalo.
• Frequência é a quantidade de
amostra no intervalo dividido
pela quantidade total de
amostras
Histograma
• Podemos organizar
os dados da tabela
de frequência em
gráficos de barra
que representam
cada intervalo,
estes são chamados
de histogramas.
Distribuição dos dados
• Uma distribuição estatística S: desvio padrão
é uma função que define
uma curva, e a área sob essa
curva determina a
probabilidade de ocorrer o
evento por ela
correlacionado.
• A distribuição mais
utilizada é a gaussiana, ou
normal.
Nível de confiança
• O nível de confiança determina a probabilidade de uma amostra representar o
parâmetro populacional.
• Este nível é baseado na distribuição dos dados, em geral na distribuição
normal.
• O nível de confiança é estabelecido pelo pesquisador para cada estudo,
geralmente utiliza-se 95 % de confiança
• No caso dos feijões, podemos dizer que há 95 % de confiança que 1kg de
feijão tenha 4566-6313 grãos. Assim, caso sejam contados todos os grãos do
saco de feijão, há 95 % de probabilidade deste número estar entre 4566-6313
grãos.
Próxima aula:

Você também pode gostar