Escolar Documentos
Profissional Documentos
Cultura Documentos
Aula 1
Conteúdo:
Conceitos básicos
Noções de amostragem
Organização de dados (gráficos e tabelas)
Breve histórico da estatística
Desde a antiguidade, os homens faziam registros:
1. Número de habitantes;
2. Nascimentos e óbitos;
3. Avaliavam bens e riquezas do povo, para cobrar impostos;
4. Estoque de alimentos, dentre outros.
No século XVI, surgiram as primeiras tábuas de registro de
batizados, casamentos, nascimentos, etc.
No século XVIII, Godofredo Achenwall denominou Estatística o
estudo matemático de catalogação de dados numéricos coletivos.
Verificou-se que a estatística poderia ser utilizada para tirar
conclusões e tomar decisões.
Bioestatística Básica
COMO DEFINIR ESTATÍSTICA?
• Parte da matemática em que se investigam os processos de
obtenção, organização e análise de dados sobre uma
população ou sobre uma coleção de seres quaisquer, e os
métodos de tirar conclusões e fazer predições com base
nesses dados.
• Qualquer parâmetro de uma amostra, como, p. ex., a sua
média, o seu desvio-padrão, a sua variância.
Bioestatística Básica
Os testes estatísticos são utilizados para:
¤ Comparar amostras
(houve modificação dos grupos inicialmente
semelhantes após o início da intervenção)
• Definição de um problema
• Planejamento
• Coleta de dados
» Crítica dos dados
• Apresentação dos dados
» Tabelas
» Gráficos
• Descrição dos dados
Estatística inferencial
Teste Estatístico
Hipótese estatística
Pressuposições no teste de hipótese
Regras de decisão
Erros tipo I e II
Teste Uni ou bilateral
Conceitos básicos
• Populações- População estatística representa o
conjunto da totalidade em uma área amostral limitada
no espaço e no tempo.
• Ex.: Todos os alunos da UEFS ou Todos os alunos da sala de aula
• Amostras- é um subconjunto de uma população, que
atendendo as premissas como aleatoriedade e
independência podem ser utilizadas para inferir
parâmetros para as populações,
• Pode se dizer que amostras são as observações ou medições
realizadas na menor unidade amostral.
• Ex.: Medidas de 200 alunos da UEFS ou medições de 15 alunos da
sala de aula
Conceitos básicos
DADOS BRUTOS
Qualquer pesquisa é baseada em levantamento ou coleta de dados. Os
dados são obtidos diretamente da pesquisa, sem terem passados por nenhum
processo de síntese ou análise.
58,0 62,5 65,0 67,0 68,3 65,0 66,4 58,0 67,0 67,0
62,5 62,5 66,4 66,4 65,0 65,0 60,2 60,2 60,2 60,2
59,5 59,5 59,5 65,0 66,4 66,4 66,4 60,2 62,5 67,0
67,0 67,0 70,1 70,1 71,9 70,1 67,0 66,4 66,4 68,3
68,3 68,3 65,0 65,0 62,5 62,5 65,0 65,0 68,3 71,9
Organização de dados
ROL
A mão, ou com auxílio de computador, pode-se classificar os
dados x1, x2,...,xn em ordem crescente.
Amplitude amostral
Maior valor- menor valor da amostra/nº de classes
4.600-1.570/7= 0,433 ≈0,5
Classe Ponto Médio Frequência
1,5Ι— 2,0 1,75 3
2,0Ι— 2,5 2,25 16
2,5Ι— 3,0 2,75 31
3,0Ι— 3,5 3,25 34
3,5Ι— 4,0 3,75 11
4,0 Ι— 4,5 4,25 4
4,5Ι—I 5,0 4,75 1
Organização de dados
• Distribuição de frequência
» Quando amostramos uma população de pesos de bebês recém-
nascidos , podemos representar cada medição como um ponto ao
longo de um eixo que referencia a magnitude do valor peso.
Distribuição de frequência
Histograma
Tabulação de variáveis quantitativas
Histograma
Um histograma mostra a distribuição de frequências para os dados
discretos ou contínuos. O eixo horizontal exibe os limites verdadeiros dos
vários intervalos
30
25
Recém-nascidos (%)
20
15
10
0
600 800 1000 1200 1400 1600
peso (g)
Gráficos em barras ou colunas
São os mais comuns para exibir uma distribuição de frequências para dados
nominais e ordinais.
Gráfico de polígono de frequências
Semelhante ao histograma, mas construído a partir dos pontos médios das
classes.
Gráfico de ogiva ou polígono de frequência acumulada
Apresenta uma distribuição de frequências acumuladas, utiliza uma poligonal
ascendente utilizando os pontos extremos.
Ponto Médio Freq. Ac 100
90
500 1,94 80
Freq. Acumulada
70
700 12,04 60
50
900 27,74 40
30
1100 50,11 20
10
1300 76,13 0
500 700 900 1100 1300 1500
1500 100 Peso prématuros
Gráfico de linha ou sequência
Adequados para apresentar observações medidas ao longo do tempo, enfatizando
sua tendência ou periodicidade.
Gráfico de linha ou sequência
100 600
TEMP(ºC) UMID (%) Pluv. (mm)
500
Temperatura ºC / Umidade %
80
may/08 24,5 75,0 22,2
Pluviosidade mm
jun 22,8 78,0 43,1 400
60
jul 22,0 75,0 8,1 300
aug 23,9 74,0 3,5 40
200
sep 23,1 74,0 63,8
oct 25,0 80,0 60 20
100
nov 24,9 82,0 526,2
0 0
dec 25,6 82,0 379,1
jan/09 27,3 79,0 136,8
feb 28,8 74,0 51,6
mar 28,4 76,0 114,7
TEMP(ºC) UMID (%) PRECIP (mm)
apr 25,9 79,0 120,0
Box plot
Esse tipo de gráfico exibe somente um resumo dos dados.
A linha vertical dentro da caixa representa a mediana (Q2). A caixa representa os intervalos
interquartis (Q1 e Q3), enquanto as barras externas à caixa representam valores máximo e
mínimo.
Esses limites são determinados em função da distância entre os dois quartis (Q3 e
Q1), isto é, do desvio inter-quartílico:
DQ = Q3 – Q1* 1,5.
Observações com afastamento superior a 1,5 desvio inter-quartílico, para
cima ou para baixo, são consideradas atípicas, ou possíveis outliers.
Acima desse desvio são chamados pontos extremos.
Gráficos de dispersão
Adequado para descrever o comportamento conjunto de duas
variáveis quantitativas. Cada ponto do gráfico representa um
par de valores observados.
Medidas de tendência central ou de
posição e variabilidade
Nossos dados podem ser apresentados de
diferentes formas
45, 48, 52, 55, 56, 59, 62, 62, 62, 67, 78, 78, 78,
80, 80, 81, 81, 82, 82, 84, 85, 90, 94, 94, 95.
Nossos dados podem ser apresentados de diferentes formas
µ
µ µ µ
µ
62,8
5
62,8
4
15,7 = 3,96
µ
µ µ µ µ
Calcule o desvio padrão