Você está na página 1de 5

Introdução à Bioestatística • amostra (n): subconjunto da

população – estamos fazendo uma


- ela pode ser dividida em 2 grandes áreas: amostragem;
• descritiva: descrição das situações - técnicas de amostragem:
– gráficos, tabelas, medidas de
dispersão e de tendência central → • sorteio = amostra casual simples/
retrato da situação; aleatória;
• inferência / indutiva: podemos • cria-se um critério e observo quem
concluir resultados e realizar da população está incluído nesse
generalizações usando as critério para aplicar a pesquisa =
informações que a estatística amostra sistemática → cuidado:
descritiva obteve; não posso conhecer a população
em relação à esse critério, para não
- variável: meios de obter resultados que criar erros de generalização;
respondam à minha pergunta de pesquisa • divide a população em
→ cada variável se torna uma pergunta nos subconjuntos e utilizo para a
instrumentos de coleta de dados para pesquisa uma pessoa de cada
atingir os objetivos da nossa pesquisa → estrato = amostra estratificada →
essas perguntas devem ser bem claras para para selecionar a pessoa de cada
que possamos obter exatamente o que estrato podemos usar a amostra
queremos para a pesquisa; aleatória ou sistemática;
- as variáveis podem ser: • utilizo a população que for
conveniente para mim = amostra
a) qualitativas – qualidades de conveniência → é melhor ser
- nominais: as respostas são nomes, não evitada, porque precisa de uma
tendo uma hierarquia entre elas; justificativa científica grande para
poder ser usada;
- ordinais: as respostas têm,
obrigatoriamente, uma ordem natural de - apuração dos dados: contagem dos
resposta como, por exemplo, escolaridade; resultados das respostas obtidas com o
instrumento de coleta de dados aplicado na
b) quantitativa – quantidades amostra → essa apuração pode ser:
- discretas: as opções de resposta são • pontual: sabemos exatamente a
números inteiros – ex: número de filhos; frequência de cada resposta →
fazemos uma tabela → é um
- contínuas: pode apresentar respostas com
método bom para quando as
número quebrados e, por isso, devemos
opções de resposta são poucas;
sempre informar a unidade de medida – ex:
idade; • intervalar: usada quando as opções
de resposta podem ser muitas (ex:
- após definir as variáveis e o instrumento idade de cada um) e, por isso,
de coleta de dados, eles devem ser dividimos essas respostas em
aplicados em: classes para facilitar a apuração;
• população: conjunto de elementos - ex de desenho dos intervalos de idade:
que tenham, pelo menos, 1
➢ 0 I----- 10: significa que as pessoas
característica comum – nesse caso
com 0 anos entram nesse intervalo
temos um recenseamento/censo;
e as de 10 não;
➢ 10 I----- 20: nesse intervalo, as observadas 500 crianças, das quais 280
pessoas com 10 anos são incluídas e eram do sexo masculino e, dentro deste
as de 20 não; grupo, 196 apresentaram sinais de
verminose. Entre as crianças do sexo
- devemos expressar a apuração através da
feminino, 50% apresentavam sinais de
escrita de texto contínuo, tabela ou gráfico;
verminose. Construa uma tabela de
- ex: contingência para esses dados.

Distribuição em número e porcentagem - como eu fiz:


da idade dos visitantes do Museu do
Prevalência de sinais de verminoses
Ipiranga, São Paulo, 15 de agosto de
entre escolares, local, data.
2020.
Sexo + - TOTAL
Idade Frequência Frequência
(anos) absoluta relativa (%) Masculino 196 84 280
Feminino 110 110 220
0 I----- 10 7 38,9
10 I----- 20 8 44,4 TOTAL 306 194 500
20 I----- 30 3 16,7
TOTAL 18 100 - resolução da professora:
Fonte: _____________________________
+ - TOTAL
➢ linhas obrigatórias estão contínuas; Gênero FA FR FA FR FA FR
➢ título conforme ABNT contendo Feminino 110 35,9 110 56,7 220 44,0
local, data e objetivo da pesquisa de Masculino 196 64,0 84 43,3 280 56,0
forma concisa; TOTAL 306 100 194 100 500 100
➢ se eu coletei os dados não precisa
de fonte, já que o dono do trabalho
é o responsável pelas informações; Medidas de Tendência
➢ devemos deixar sempre as Central
frequências com a mesma
quantidade de casas decimais, - maneiras de resumir o conjunto de dados;
podendo arredondar; - é o “tratamento” dos dados;
- gráficos: deve conter título e fonte, tentar - são medidas fracas, porque passam uma
manter uma linha de cores monocromáticas informação genérica do conjunto, mas não
e discretas, manter as escalas do mesmo permite a obtenção dos dados brutos da
tamanho; amostra;
• barra/coluna: variáveis discretas, 𝑠𝑜𝑚𝑎 𝑑𝑜𝑠 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠
- média = 𝑋̅ = 𝑞𝑢𝑎𝑛𝑡𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠
nominais e ordinais;
• setor circular (pizza): variáveis ➢ pode ser aritmética ou ponderada;
nominais e ordinais (qualitativas); ➢ não dá para determinar a
• histograma (barras grudadas umas quantidade de pessoas da amostra,
nas outras): variáveis contínuas; nem a resposta específica de cada
um;
- exceção: variável tempo (série histórica)
➢ não necessariamente a média é um
– é contínua, mas usamos um gráfico de
dos elementos do conjunto, pode
linha;
ser um valor diferente;
- exercício: um levantamento foi realizado
- moda = Mo = elementos que aparecem
com o objetivo de estimar a prevalência de
com maior frequência na amostra, sendo
verminose entre escolares. Foram
essa frequência maior que a de outros 80 + 50 / 5 = 26 → a nova média de idade
elementos da amostra; é 26 anos

➢ ex: 2 – 2 – 3 – 3 – 1 → Mo = 2 e 3 - em intervalos utilizamos o intervalo modal


➢ ex: 2 – 2 – 3 – 3 → conjunto amodal, para a moda e, o número que aparece em
pois todos os elementos aparecem maior frequência, deve estar nesse
com a mesma frequência e não intervalo;
estão em uma frequência maior
que qualquer outro elemento; - em relação às medianas nos intervalos
➢ ex: 2 – 2 – 2 → conjunto amodal; devemos fazer a frequência absoluta
➢ obrigatoriamente o elemento acumulada para identificar em qual
modal está no conjunto amostral; intervalo estará a mediana;

- mediana = Md = é o valor que ocupa a vamos somando os


posição central no conjunto de dados; intervalos 2 a 2 → nesse
caso, como o total de
➢ medida menos fraca, fornecendo
elementos é 50, a mediana
informações mais consistentes; está entre o 25º e o 26º
➢ metade dos elementos é menor ou elemento → através da
igual a mediana e a outra metade é frequência acumulada,
maior ou igual a ela; observamos que esse
➢ PRECISAMOS COLOCAR OS elemento se encontra no
NÚMEROS EM ORDEM CRESCENTE; intervalo de 50 a 55 anos
➢ nos casos de conjuntos com nº par
de elementos devemos fazer a
média entre os dois valores que
cercam a posição central;
Medidas de Dispersão
- exercício: a partir das medidas centrais,
construa um conjunto de n = 4 - são medidas que dão mais força às
medidas de tendência central, sendo
̅ = 30 anos / Mo = 15 anos / Md = 25 anos
𝑿 também uma forma de resumir os
15 – 15 – X – Y → 15 – 15 – 35 – 55 resultados da pesquisa;

15 + X / 2 = 25 - medem a dispersão dos dados;

15 + X = 50 - dispersão: é a distância do conjunto de


dados em relação à média → os conjuntos
X = 35 podem estar:
15 + 15 + 35 + Y / 4 = 30 • concentrados – quando seus
65 + Y = 120 valores estão próximos da média;
• dispersos – quando seus valores
Y = 55 estão muito distantes da média;

- exercício 2: Quatro pessoas reunidas - amplitude (a): diferença entre o maior e o


numa sala têm, em média, 20 anos. Se uma menor número do conjunto → não é
pessoa com 50 anos entrar na sala, qual suficiente para mostrar a dispersão em
passa a ser a idade média do grupo? todos os casos → a melhor amplitude é 0,
mostrando uma uniformidade no conjunto;
4 x 20 = 80
- variância (S2);
- desvio padrão (S): quanto, em média, os (-1)2 = 1
valores do conjunto de dados se afastam da
(2)2 = 4
média do conjunto → quanto menor o
desvio padrão, mais concentrados estão os (1)2 = 1
dados e, quanto maior, mais dispersos;
- em seguida, devemos somar os quadrados
- coeficiente de variação (CV): é uma das dos desvios:
medidas mais usadas, pois permite a
comparação entre os desvios padrões de 2 4 + 1 + 4 + 1 = 10
grupos de elementos com unidades de - depois, devemos pegar o quadrado da
medida diferentes → também mede a soma dos desvios e dividir por n-1, sendo n
dispersão dos dados em relação à média; a quantidade de elementos do conjunto:
- ex: notas de 4 alunos em 4 provas: ̅ )𝟐
∑(𝑿 − 𝑿
𝑺𝟐 =
ALUN NOTA 𝑋̅ a S2 S CV% 𝒏−𝟏
O S - no caso de Luís:
Antôni 555 5 0 0 0 0
o 5 S2 = 10 / 4-1 = 10 / 3 = 3,33
Luís 347 5 4 3,33 1,8 36
6 - a variância tem a unidade de medida ao
Pedro 055 5 1 16,6 4,0 81,6 quadrado e, por isso temos que encontrar a
10 0 6 8 raiz desse número = desvio padrão;
Lucca 0 10 5 1 33,3 5,7 115,
0 10 0 3 7 4
𝑺 = √𝑺𝟐
- no caso de Luís:
- desvios dos dados em relação à média =
̅ √3,33 = 1,8
X-𝑿
- observe que nos casos de conjuntos com
➢ X corresponde à cada elemento;
elementos iguais, tanto a, quanto S, quanto
- olhando para as notas de Luís: S2 será 0;
𝑺
3 – 5 = -2 - CV (%) = × 𝟏𝟎𝟎
̅
𝑿
4 – 5 = -1 - quartil: a mediana corresponde ao 2º
7–5=2 quartil (Q2) → a metade dos números
anteriores à ela corresponde ao 1º quartil
6–5=1 (Q1) e a metade dos números após a
- depois devemos somar os desvios: mediana equivale ao 3º quartil (Q3) → ou
seja, divide o conjunto de dados em 4 partes
-2 + (-1) + 2 + 1 = 0 → essa diferença deve iguais;
ser 0, mostrando que a média é o ponto de
equilibro entre os valores; ➢ ex: se o 1º quartil é 8, significa de
25% dos elementos do conjunto são
- como essa diferença sempre dará 0, menores ou iguais a 8 e que 75%
devemos desaparecer com os números dos elementos são maiores ou
negativos e, para isso elevamos as iguais a 8;
diferenças ao quadrado:

(-2)2 = 4
- distância interquartílica (DIQ): é
importante porque mostra que nesse
intervalo, estão 50% dos elementos do
conjunto;

DIQ = 3º quartil – 1º quartil

- percentil: corresponde à divisão do


conjunto em 100 partes;

➢ percentil 50 = 50 / 100 = 2º quartil;


➢ percentil 25 = 25 / 100 = 1º quartil;
➢ percentil 75 = 75 / 100 = 3º quartil;

- diagrama Box Plot: diagrama de 5 pontos


→ marca os valores mínimo e máximo do
conjunto, além de Q1, Q2 e Q3 → permite
ter uma visão geral do conjunto sem ter
todos os dados brutos;

➢ com os valores mínimo e máximo,


enxergamos a amplitude;
➢ podemos encontrar a DIQ;

Você também pode gostar