1) O documento introduz os conceitos básicos de bioestatística, dividindo-a em estatística descritiva e inferencial.
2) A estatística descritiva descreve a situação através de gráficos, tabelas e medidas, enquanto a inferencial permite generalizações usando essas informações.
3) São definidos os conceitos de amostra, variável, população, técnicas de amostragem e apuração de dados.
1) O documento introduz os conceitos básicos de bioestatística, dividindo-a em estatística descritiva e inferencial.
2) A estatística descritiva descreve a situação através de gráficos, tabelas e medidas, enquanto a inferencial permite generalizações usando essas informações.
3) São definidos os conceitos de amostra, variável, população, técnicas de amostragem e apuração de dados.
1) O documento introduz os conceitos básicos de bioestatística, dividindo-a em estatística descritiva e inferencial.
2) A estatística descritiva descreve a situação através de gráficos, tabelas e medidas, enquanto a inferencial permite generalizações usando essas informações.
3) São definidos os conceitos de amostra, variável, população, técnicas de amostragem e apuração de dados.
Introdução à Bioestatística • amostra (n): subconjunto da
população – estamos fazendo uma
- ela pode ser dividida em 2 grandes áreas: amostragem; • descritiva: descrição das situações - técnicas de amostragem: – gráficos, tabelas, medidas de dispersão e de tendência central → • sorteio = amostra casual simples/ retrato da situação; aleatória; • inferência / indutiva: podemos • cria-se um critério e observo quem concluir resultados e realizar da população está incluído nesse generalizações usando as critério para aplicar a pesquisa = informações que a estatística amostra sistemática → cuidado: descritiva obteve; não posso conhecer a população em relação à esse critério, para não - variável: meios de obter resultados que criar erros de generalização; respondam à minha pergunta de pesquisa • divide a população em → cada variável se torna uma pergunta nos subconjuntos e utilizo para a instrumentos de coleta de dados para pesquisa uma pessoa de cada atingir os objetivos da nossa pesquisa → estrato = amostra estratificada → essas perguntas devem ser bem claras para para selecionar a pessoa de cada que possamos obter exatamente o que estrato podemos usar a amostra queremos para a pesquisa; aleatória ou sistemática; - as variáveis podem ser: • utilizo a população que for conveniente para mim = amostra a) qualitativas – qualidades de conveniência → é melhor ser - nominais: as respostas são nomes, não evitada, porque precisa de uma tendo uma hierarquia entre elas; justificativa científica grande para poder ser usada; - ordinais: as respostas têm, obrigatoriamente, uma ordem natural de - apuração dos dados: contagem dos resposta como, por exemplo, escolaridade; resultados das respostas obtidas com o instrumento de coleta de dados aplicado na b) quantitativa – quantidades amostra → essa apuração pode ser: - discretas: as opções de resposta são • pontual: sabemos exatamente a números inteiros – ex: número de filhos; frequência de cada resposta → fazemos uma tabela → é um - contínuas: pode apresentar respostas com método bom para quando as número quebrados e, por isso, devemos opções de resposta são poucas; sempre informar a unidade de medida – ex: idade; • intervalar: usada quando as opções de resposta podem ser muitas (ex: - após definir as variáveis e o instrumento idade de cada um) e, por isso, de coleta de dados, eles devem ser dividimos essas respostas em aplicados em: classes para facilitar a apuração; • população: conjunto de elementos - ex de desenho dos intervalos de idade: que tenham, pelo menos, 1 ➢ 0 I----- 10: significa que as pessoas característica comum – nesse caso com 0 anos entram nesse intervalo temos um recenseamento/censo; e as de 10 não; ➢ 10 I----- 20: nesse intervalo, as observadas 500 crianças, das quais 280 pessoas com 10 anos são incluídas e eram do sexo masculino e, dentro deste as de 20 não; grupo, 196 apresentaram sinais de verminose. Entre as crianças do sexo - devemos expressar a apuração através da feminino, 50% apresentavam sinais de escrita de texto contínuo, tabela ou gráfico; verminose. Construa uma tabela de - ex: contingência para esses dados.
Distribuição em número e porcentagem - como eu fiz:
da idade dos visitantes do Museu do Prevalência de sinais de verminoses Ipiranga, São Paulo, 15 de agosto de entre escolares, local, data. 2020. Sexo + - TOTAL Idade Frequência Frequência (anos) absoluta relativa (%) Masculino 196 84 280 Feminino 110 110 220 0 I----- 10 7 38,9 10 I----- 20 8 44,4 TOTAL 306 194 500 20 I----- 30 3 16,7 TOTAL 18 100 - resolução da professora: Fonte: _____________________________ + - TOTAL ➢ linhas obrigatórias estão contínuas; Gênero FA FR FA FR FA FR ➢ título conforme ABNT contendo Feminino 110 35,9 110 56,7 220 44,0 local, data e objetivo da pesquisa de Masculino 196 64,0 84 43,3 280 56,0 forma concisa; TOTAL 306 100 194 100 500 100 ➢ se eu coletei os dados não precisa de fonte, já que o dono do trabalho é o responsável pelas informações; Medidas de Tendência ➢ devemos deixar sempre as Central frequências com a mesma quantidade de casas decimais, - maneiras de resumir o conjunto de dados; podendo arredondar; - é o “tratamento” dos dados; - gráficos: deve conter título e fonte, tentar - são medidas fracas, porque passam uma manter uma linha de cores monocromáticas informação genérica do conjunto, mas não e discretas, manter as escalas do mesmo permite a obtenção dos dados brutos da tamanho; amostra; • barra/coluna: variáveis discretas, 𝑠𝑜𝑚𝑎 𝑑𝑜𝑠 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 - média = 𝑋̅ = 𝑞𝑢𝑎𝑛𝑡𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 nominais e ordinais; • setor circular (pizza): variáveis ➢ pode ser aritmética ou ponderada; nominais e ordinais (qualitativas); ➢ não dá para determinar a • histograma (barras grudadas umas quantidade de pessoas da amostra, nas outras): variáveis contínuas; nem a resposta específica de cada um; - exceção: variável tempo (série histórica) ➢ não necessariamente a média é um – é contínua, mas usamos um gráfico de dos elementos do conjunto, pode linha; ser um valor diferente; - exercício: um levantamento foi realizado - moda = Mo = elementos que aparecem com o objetivo de estimar a prevalência de com maior frequência na amostra, sendo verminose entre escolares. Foram essa frequência maior que a de outros 80 + 50 / 5 = 26 → a nova média de idade elementos da amostra; é 26 anos
➢ ex: 2 – 2 – 3 – 3 – 1 → Mo = 2 e 3 - em intervalos utilizamos o intervalo modal
➢ ex: 2 – 2 – 3 – 3 → conjunto amodal, para a moda e, o número que aparece em pois todos os elementos aparecem maior frequência, deve estar nesse com a mesma frequência e não intervalo; estão em uma frequência maior que qualquer outro elemento; - em relação às medianas nos intervalos ➢ ex: 2 – 2 – 2 → conjunto amodal; devemos fazer a frequência absoluta ➢ obrigatoriamente o elemento acumulada para identificar em qual modal está no conjunto amostral; intervalo estará a mediana;
- mediana = Md = é o valor que ocupa a vamos somando os
posição central no conjunto de dados; intervalos 2 a 2 → nesse caso, como o total de ➢ medida menos fraca, fornecendo elementos é 50, a mediana informações mais consistentes; está entre o 25º e o 26º ➢ metade dos elementos é menor ou elemento → através da igual a mediana e a outra metade é frequência acumulada, maior ou igual a ela; observamos que esse ➢ PRECISAMOS COLOCAR OS elemento se encontra no NÚMEROS EM ORDEM CRESCENTE; intervalo de 50 a 55 anos ➢ nos casos de conjuntos com nº par de elementos devemos fazer a média entre os dois valores que cercam a posição central; Medidas de Dispersão - exercício: a partir das medidas centrais, construa um conjunto de n = 4 - são medidas que dão mais força às medidas de tendência central, sendo ̅ = 30 anos / Mo = 15 anos / Md = 25 anos 𝑿 também uma forma de resumir os 15 – 15 – X – Y → 15 – 15 – 35 – 55 resultados da pesquisa;
15 + X / 2 = 25 - medem a dispersão dos dados;
15 + X = 50 - dispersão: é a distância do conjunto de
dados em relação à média → os conjuntos X = 35 podem estar: 15 + 15 + 35 + Y / 4 = 30 • concentrados – quando seus 65 + Y = 120 valores estão próximos da média; • dispersos – quando seus valores Y = 55 estão muito distantes da média;
- exercício 2: Quatro pessoas reunidas - amplitude (a): diferença entre o maior e o
numa sala têm, em média, 20 anos. Se uma menor número do conjunto → não é pessoa com 50 anos entrar na sala, qual suficiente para mostrar a dispersão em passa a ser a idade média do grupo? todos os casos → a melhor amplitude é 0, mostrando uma uniformidade no conjunto; 4 x 20 = 80 - variância (S2); - desvio padrão (S): quanto, em média, os (-1)2 = 1 valores do conjunto de dados se afastam da (2)2 = 4 média do conjunto → quanto menor o desvio padrão, mais concentrados estão os (1)2 = 1 dados e, quanto maior, mais dispersos; - em seguida, devemos somar os quadrados - coeficiente de variação (CV): é uma das dos desvios: medidas mais usadas, pois permite a comparação entre os desvios padrões de 2 4 + 1 + 4 + 1 = 10 grupos de elementos com unidades de - depois, devemos pegar o quadrado da medida diferentes → também mede a soma dos desvios e dividir por n-1, sendo n dispersão dos dados em relação à média; a quantidade de elementos do conjunto: - ex: notas de 4 alunos em 4 provas: ̅ )𝟐 ∑(𝑿 − 𝑿 𝑺𝟐 = ALUN NOTA 𝑋̅ a S2 S CV% 𝒏−𝟏 O S - no caso de Luís: Antôni 555 5 0 0 0 0 o 5 S2 = 10 / 4-1 = 10 / 3 = 3,33 Luís 347 5 4 3,33 1,8 36 6 - a variância tem a unidade de medida ao Pedro 055 5 1 16,6 4,0 81,6 quadrado e, por isso temos que encontrar a 10 0 6 8 raiz desse número = desvio padrão; Lucca 0 10 5 1 33,3 5,7 115, 0 10 0 3 7 4 𝑺 = √𝑺𝟐 - no caso de Luís: - desvios dos dados em relação à média = ̅ √3,33 = 1,8 X-𝑿 - observe que nos casos de conjuntos com ➢ X corresponde à cada elemento; elementos iguais, tanto a, quanto S, quanto - olhando para as notas de Luís: S2 será 0; 𝑺 3 – 5 = -2 - CV (%) = × 𝟏𝟎𝟎 ̅ 𝑿 4 – 5 = -1 - quartil: a mediana corresponde ao 2º 7–5=2 quartil (Q2) → a metade dos números anteriores à ela corresponde ao 1º quartil 6–5=1 (Q1) e a metade dos números após a - depois devemos somar os desvios: mediana equivale ao 3º quartil (Q3) → ou seja, divide o conjunto de dados em 4 partes -2 + (-1) + 2 + 1 = 0 → essa diferença deve iguais; ser 0, mostrando que a média é o ponto de equilibro entre os valores; ➢ ex: se o 1º quartil é 8, significa de 25% dos elementos do conjunto são - como essa diferença sempre dará 0, menores ou iguais a 8 e que 75% devemos desaparecer com os números dos elementos são maiores ou negativos e, para isso elevamos as iguais a 8; diferenças ao quadrado:
(-2)2 = 4 - distância interquartílica (DIQ): é importante porque mostra que nesse intervalo, estão 50% dos elementos do conjunto;