Você está na página 1de 22

Bioestatística Aplicada à Saúde

UNIDADE I
Prof. Luiz Felix

Conceitos gerais

Estatística e parte da matemática que trata da:

 Coleta;
 Organização;
 Tabulação;
 Análise de dados colhidos em um levantamento de dados (pesquisa). Conceitos gerais
 Descritiva: envolve a organização, o resumo e a representação dos dados, por meio de
gráficos e tabelas.

 Inferencial ou indutiva: utiliza as informações de uma amostra para chegar a conclusões


sobre um grupo maior, ao qual não temos acesso. Nesse sentido, uma ferramenta muito
utilizada na estatística inferencial é a probabilidade.

Bioestatística: conceitos da Estatística aplicados à:

 Nutrição;
 Enfermagem;
 Farmácia;
 Medicina Veterinária, entre outras áreas.
População, amostra e amostragem

 População: é uma coleção completa de todos os elementos a serem estudados que possuem
uma característica em comum.

 Amostra: é um subconjunto da população.

 Amostragem: técnicas para selecionar amostras, que garantem, tanto quanto possível,
caráter de representatividade.

Amostragem
 Amostragem probabilística: todos os participantes da população estatística devem ter a
chance de ser escolhidos. Caso isso não ocorra, a amostra pode não demonstrar a realidade da
população.

 Amostragem não probabilística: utilizada quando não há possibilidade de se obter amostras


probabilísticas, isto é, ao invés de se sortear os elementos da amostra, estes são selecionados
por algum critério escolhido pelo pesquisador.

Variáveis

 Conjunto de resultados possíveis de um fenômeno a ser avaliado.

Coleta de dados

 A coleta de dados é o passo mais importante para o pesquisador.

 A partir da coleta, ele iniciará a apuração dos dados que o levará às conclusões do seu
trabalho.

 O questionário deve estar de acordo com os objetivos da pesquisa.

Dados brutos e rol

 Dados brutos: conjunto de dados que ainda não foram organizados.

 Rol: é um arranjo dos dados brutos em ordem crescente ou decrescente.

 Exemplo: em um consultório, obtivemos a altura (em cm) dos 7 pacientes que aguardavam
para serem atendidos.

 As alturas foram: 137, 140, 135, 133, 138, 145, 142.

 Dados brutos: 137, 140, 135, 133, 138, 145, 142.

 Rol: 133, 135, 137, 138, 140, 142, 145 (ascendente) 145, 142, 140, 138, 137, 135, 133
(descendente).

Interatividade
O que representa uma coleção completa de todos os elementos a serem estudados que
possuem uma característica em comum?

a) Amostra.
b) População.
c) Amostragem.
d) Estatística descritiva.
e) Estatística indutiva.

Tabelas
 Tabela é uma forma de apresentar informações.
 Distribuição de frequências é o nome dado à tabela gerada a partir dos dados. Uma tabela
deve conter: título, cabeçalho, coluna indicadora e corpo.

Distribuição de frequências sem intervalo de classe


 Para dados qualitativos (tipo sanguíneo, escolaridade etc.), devemos gerar uma tabela de
dados chamada distribuição de frequências sem intervalos de classe, pois as classes são
geradas pelas próprias variáveis (respostas) da questão.

Distribuição de frequências sem intervalo de classe Nível de escolaridade de 30 funcionários


do Hospital Baruch de Toulouse

Distribuição de frequências com intervalo de classe


 Para dados quantitativos contínuos (peso, nível de colesterol etc.), devemos gerar uma
tabela de dados chamada distribuição de frequências com intervalos de classe. Temos que
determinar:
 quantas linhas a distribuição de frequência terá,
 como os dados estarão dispostos nessas linhas. Distribuição de frequências com intervalo de
classe Exemplo: Uma pesquisa para se determinar a idade de 30 idosos que residem na Casa
de Repouso Cayro apresenta o rol da figura a seguir. Apresentar a distribuição de frequências.
A tabela abaixo apresenta o resultado final:

Passo 1: determinar quantas linhas terá a tabela. Para isso, devemos utilizar a fórmula:

 i = número de linhas que a tabela deve ter.


 n = quantidade de elementos na tabela.

 A tabela terá 5 linhas em que serão distribuídas as 30 idades.


 Passo 2: determinar a amplitude do intervalo de classe. Para isso, devemos:
 selecionar o menor valor do rol, limite mínimo de dados: Lmín = 65;
 selecionar o maior valor do rol, limite máximo de dados: Lmáx = 89;
 determinar a amplitude do intervalo de classe com a fórmula:

Portanto, devemos ter uma tabela com 5 linhas e amplitude de 5 anos.

Elementos de uma distribuição de frequência


 Classes: são intervalos de variação da variável. As classes são representadas simbolicamente
por i.
 Limites de classe: são os extremos de uma classe. O menor número é o limite inferior da
classe (Li) e o maior número é o limite superior da classe (Ls).
 Amplitude de intervalo de classe: é a medida do intervalo que define a classe. É obtida pela
diferença entre os limites superior e inferior dessa classe e indicada por Hi:
 Hi = Ls – Li

 Amplitude total da distribuição (AT): é a diferença entre o limite superior da última classe
(limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo): AT =
Ls(máx) – Li(mín). No exemplo: 90 – 65 = 25.
 Amplitude amostral (AA): é a diferença entre o valor máximo e o valor mínimo da amostra:
AA = L(máx) – L(mín). No exemplo: 89 – 65 = 24.
 Ponto médio de uma classe (xi): é o ponto que divide o intervalo de classe em duas partes
iguais (média aritmética) .
Na classe 1 do exemplo: 65 + 70 = 67,5
2
Tipos de frequência
 Frequência simples ou absoluta (Fi).
 Frequência percentual (Fri%).
 Frequência acumulada (Fa).
 Frequência acumulada relativa (Fra%).
 A maioria dos idosos tem idade maior ou igual a 75 anos e menor que 80 anos.
 20% dos idosos, ou seja, 6 idosos, têm idade menor que 75 anos.

Interatividade
Com base na distribuição de frequências apresentada, qual o percentual de pessoas com idade
maior ou igual a 80 anos e menor que 85?
a) 82,5%.
b) 23%.
c) 8%.
d) 27%.
e) 77%.
Gráficos
 Gráficos são representações visuais utilizadas para exibir dados, sejam eles sobre
determinada informação ou valores numéricos.
Medidas de tendência central

Média aritmética para dados não agrupados


 A média aritmética simples de dados não agrupados, isto é, de números que não se
encontram agrupados em tabelas, é dada pela soma de todos os valores dividida pela
quantidade de valores.

 Exemplo: Um professor deseja saber a nota média de seus alunos na prova, para tanto
separa as notas:

Média aritmética para dados agrupados

 Dados agrupados são aqueles resultantes de uma ordenação, isto é, tabulação de dados.
Portanto, apresentam-se em tabelas e podem ser variáveis quantitativas contínuas ou
discretas.

 Exemplo: Calcular a média das idades dos idosos residentes na Casa de Repouso Cayro.

Exemplo: A maternidade Athena de Toulouse pretende saber a quantidade média de filhos que
suas pacientes já tiveram em suas instalações, vai aos seus arquivos, colhe os dados e os
apresenta na seguinte tabela:
Mediana para dados não agrupados
 A mediana é o valor que se encontra exatamente no centro da distribuição que esteja
ordenada de forma crescente ou decrescente. Exemplo 1: O gestor do Hospital Baruch de
Toulouse tem intenção de saber qual a idade mediana dos pacientes que gastam acima de R$
300,00 em exames de sangue. Para tanto, separa as idades de 11 desses pacientes: 65, 60, 45,
32, 55, 55, 65, 78, 92, 94, 50. Em primeiro lugar, vamos fazer o rol crescente:

 Exemplo 2: O gestor do Hospital Baruch de Toulouse tem intenção de saber qual a idade
mediana dos pacientes que gastam acima de R$ 300,00 em exames de sangue. Para tanto,
separa as idades de 10 desses pacientes:
 65, 60, 45, 32, 55, 55, 65, 78, 92, 94. Em primeiro lugar, vamos fazer o rol crescente:

Interatividade
Os pesos em kg dos pacientes que se consultaram em uma clínica na tarde de ontem estão
apresentados abaixo. Determine qual é o peso mediano dos pacientes.

Mediana para dados agrupados


 Exemplo 1: Utilizando os dados da pesquisa da Maternidade Athena de Toulouse, conforme
tabela abaixo, determine a mediana.
 Exemplo 2: Determinar a mediana das idades dos idosos residentes na Casa de Repouso
Cayro.

Moda para dados não agrupados


 Moda é o valor que ocorre com maior frequência em uma série de valores.
 Exemplo: O gestor do Hospital Baruch de Toulouse tem intenção de saber qual a moda de
idade dos pacientes que gastam acima de R$ 300,00 em exames de sangue. Para tanto, separa
as idades de 11 desses pacientes: 65, 60, 45, 32, 55, 55, 65, 78, 92, 94, 50. Mo = 55 e Mo = 65
 Exemplo: Determine a moda da seguinte sequência de dados: 7, 8, 6, 8, 7, 6.
 Não há moda, pois nenhum valor ocorre com maior frequência que outro.

Moda para dados agrupados


 Exemplo: A seguinte tabela apresenta os dados que demonstram a quantidade de filhos que
as pacientes da maternidade Athena de Toulouse já tiveram em suas instalações. Determinar o
valor modal da quantidade de filhos dessas pacientes.
A moda da quantidade de filhos das pacientes da maternidade Athena de Toulouse é de 2
filhos. Mo = 2 filhos
 Exemplo: Determinar a moda das idades dos idosos residentes na Casa de Repouso Cayro.

A classe modal é 3, pois a maior frequência absoluta é 9. Então, a moda da distribuição é o


ponto médio dessa classe, que é 77,5 anos. Mo = 77,5 anos.
Medidas de dispersão

 As medidas de tendência central – média, mediana e moda descrevem bem um conjunto de


dados, desde que a sua variabilidade em torno da média não seja muito grande.
 Para calcularmos a variabilidade em relação à média, utilizamos as medidas de dispersão
variância e desvio padrão.

Variância e desvio padrão

Variância e desvio padrão para dados não agrupados


Variância e desvio padrão para dados agrupados

Coeficiente de variação

Interatividade
Bioestatística Aplicada à Saúde
UNIDADE II
Prof. Luiz Felix

Probabilidade

 A Teoria da Probabilidade estuda as possibilidades da ocorrência de um experimento


aleatório, ou seja, eventos que, mesmo quando repetidas inúmeras vezes, nas mesmas
condições, podem apresentar resultados diferentes.
 Espaço amostral ou Universo (U): é o conjunto de todos os resultados possíveis de um
experimento aleatório.
 Quando jogamos um dado, há seis resultados possíveis: 1, 2, 3, 4, 5 ou 6; portanto, o espaço
amostral é U = {1, 2, 3, 4, 5, 6}.
 Probabilidade da ocorrência de um evento A: P(A)

 Considerando o lançamento de uma moeda, determine a probabilidade de se obter cara.


Evento A “obter cara”
Eventos independentes (e)
 Dois eventos são independentes quando a realização ou não de um não afeta a
probabilidade da realização do outro. A fórmula para seu cálculo é dada por: P = P1 x P2 .
Exemplo: No lançamento de dois dados, simultaneamente, qual a probabilidade de ocorrer 3
no primeiro dado e 5 no segundo dado?

Eventos mutuamente exclusivos (ou)


 Dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a
realização do(s) outro(s).
 Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize
é igual à soma das probabilidades de que cada um deles se realize: P = P1 + P2 .
 Exemplo: No lançamento de dois dados, simultaneamente, qual a probabilidade de ocorrer
2 no primeiro ou 4 no segundo dado?

Distribuições teóricas de probabilidade


 Para uma amostra de observações, a distribuição de frequências exibe os resultados
observados e quantas vezes aparecem no conjunto de dados.
 Exemplo: O Hospital e Maternidade Baruch de Toulouse realizará concurso para preencher
alguns cargos administrativos para os quais 100 candidatos se inscreveram. O gestor do
hospital deseja saber qual a proporção do grau de instrução dos candidatos.
 Basta encontrar a frequência relativa das classes e teremos a proporção.

Distribuição normal de probabilidade


Distribuição normal reduzida
 A distribuição normal reduzida, ou padronizada, tem média 0 e desvio padrão 1.
 É indicada pela letra Z. Vamos fazer a padronização, ou seja, transformar uma variável X em
uma variável Z, utilizando as fórmulas:

Distribuição normal reduzida


 Uma vez calculado Z, podemos usar a Tabela de Distribuição Normal Reduzida.
 A tabela fornece o valor de uma área, de uma probabilidade.

Tabela de distribuição normal reduzida


 Primeira coluna: parte inteira e primeira casa decimal de Z.
 Primeira linha: segunda casa decimal de Z.

Interatividade
Distribuição normal de probabilidade
 Exemplo: Admitindo que a distribuição de QI dos funcionários do Hospital e Maternidade
Baruch de Toulouse seja normal, com média 100 pontos e desvio padrão 10 pontos, qual a
probabilidade de um funcionário, tomado ao acaso, apresentar QI superior a 120 pontos?
 Para utilizar a tabela de distribuição Z, devemos transformar o valor do QI em Z. Temos
média = 100, desvio padrão(s) = 10 e desejamos saber P(X) > 120.

Conceito de hipótese
 Hipótese estatística: suposição quanto a um valor populacional ou quanto à natureza da
distribuição de probabilidade de uma variável populacional. Exemplos: O peso médio da
população brasileira é 78 kg.
 A proporção de fumantes em certa cidade é de 45%.
 Testar uma hipótese nada mais é do que generalizar um pressuposto e, assim, chegar a uma
conclusão.
Teste de hipóteses
 Teste de hipótese é uma regra de decisão para aceitar ou rejeitar uma hipótese estatística
com base nos elementos amostrais.
 Para testar um parâmetro populacional, devemos estabelecer um par de hipóteses
(chamadas de hipótese nula e hipótese alternativa), uma que represente a afirmação e outra
que represente seu complemento.
 Quando uma dessas hipóteses for falsa, a outra deve ser verdadeira.
 Por exemplo: Hipótese nula: Valor ≥ 5 Hipótese alternativa: Valor < 5
 Hipótese nula (H0): a hipótese a ser testada.
 Hipótese alternativa (H1): a hipótese a ser considerada como uma alternativa à hipótese
nula.
 Hipótese nula (H0 ): utilizar símbolos ≤, = ou ≥.
 Hipótese alternativa (H1 ): utilizar símbolos .
 Após a definição das duas hipóteses, nula e alternativa, utilizar cálculos que nos permitam
determinar qual das duas é verdadeira ou qual das hipóteses iremos rejeitar e qual iremos
aceitar.
 Podemos tomar uma destas duas decisões: Aceitar H0 e rejeitar H1 ou Rejeitar H0 e aceitar
H1
 Como a decisão é tomada com base em uma amostra e não em uma população, há sempre
a possibilidade de tomarmos uma decisão errada.
 Sempre que desejamos confirmar ou rejeitar hipóteses, devemos determinar o nível de
significância. Normalmente, varia entre 1% e 10%.
 Se o nível de significância é de 5% (α = 0,05) significa que há uma confiança de 95% de que a
decisão tomada foi acertada.

Etapas do teste de hipótese


1. Escrever as hipóteses nula (≤, = ou ≥) e alternativa ().
2. Obter o valor crítico de acordo com o nível de significância chamado zα conforme a tabela a
seguir:

3. Calcular o valor da estatística do teste: Zcalc.


Etapas do teste de hipótese
4. Fazer um gráfico da distribuição normal que depende da hipótese alternativa (região crítica).

5. Marcar no gráfico o valor crítico Zα e Zcalc.


6. Concluir o teste: Se Zcalc pertence à região crítica, então, rejeitar H0 (aceitar H1 ). Se Zcalc
não pertence à região crítica, então, aceitar H0 (rejeitar H1 ).
7. Interpretar e escrever a conclusão.

Zcalc
Interatividade

Teste de hipótese
 O gestor do Hospital Baruch Toulouse verificou que o valor das refeições, em 2014, no
restaurante que serve funcionários e clientes, que é terceirizado, teve preço médio de R$
28,44 das refeições. Fez, então, uma pesquisa em 40 restaurantes aleatoriamente escolhidos
na cidade e foi obtida a média de R$ 31,75 e desvio padrão de R$ 7,35. Os dados fornecidos
proporcionam evidência suficiente para concluir que o preço médio pesquisado nos
restaurantes da cidade é maior em relação ao restaurante que serve o hospital? Utilize nível de
significância de 1%.
 Passo 1: escrever as hipóteses.
 Passo 7: interpretar e escrever a conclusão: os dados fornecidos proporcionam evidência
suficiente para concluir que o preço médio pesquisado nos restaurantes da cidade é maior em
relação ao restaurante que serve o hospital, podendo, assim, o gestor manter os mesmos
comerciantes da terceirização.

Teste T de Student
 Uma amostra é considerada pequena quando apresenta n < 30 e grande quando apresenta
n > 30.
 Até agora trabalhamos com amostras > 30.
 Vamos trabalhar com o teste T de Student utilizado com amostras pequenas.
 A média de gastos com plano de saúde de todas as famílias de certa região é de R$ 1123,00
em um determinado ano. Nesse mesmo ano, coletando-se uma amostra aleatória de 15
famílias de classe média alta obteve-se média de R$ 1344,27 e desvio padrão de R$ 231,00.
Com um nível de significância de 5%, os dados indicam que famílias da classe média alta
gastam, em média, com plano de saúde, mais do que a média da região? Assuma que a
distribuição de gastos com planos de saúde das famílias de classe média seja normalmente
distribuída.

Passo 1: escrever as hipóteses.

Passo 3: calcular o valor da estatística do teste: t.


Interatividade

Teste de hipótese qui-quadrado


 Letra grega
 É utilizado para testar a significância entre duas variáveis qualitativas ou comparar duas ou
mais amostras, quando os resultados da variável de resposta estão dispostos em categorias.
 O teste x2 é utilizado para comparar os valores observados e os esperados.
Foi feita uma pesquisa com uma amostra de 95 funcionários do Hospital e Maternidade Baruch
de Toulouse, com a intenção de investigar o impacto da utilização dos cursos promovidos pelo
método de ensino a distância nas gerações x e y desses funcionários. Uma das questões da
pesquisa era: “O curso promovido pelo método de ensino a distância é mais adequado do que
o presencial?” As opções de respostas foram formuladas em escala Likert, contemplando cinco
categorias, com cinco graus de importância em 1, 2, 3, 4 e 5; sendo:
1: não concordo totalmente
2: não concordo parcialmente
3: indiferente
4: concordo parcialmente
5: concordo totalmente
 O gestor do hospital não achou que a opção três seja uma boa opção para essa resposta,
então, decidiu testar com o teste qui-quadrado essa opção, utilizando nível de confiança de
5%.
 Portanto, o valor do x2 = 2,73 é menor que o valor crítico da tabela, com 4 graus de
liberdade e ao nível de 5% de significância, que é de 9,49. Nesse caso, não se rejeita H0 . H0 : a
opção de resposta “3: Indiferente” deve ser considerada válida como qualquer outra resposta.
 Então, o gestor do Hospital Baruch de Toulouse pode considerar as respostas com a opção
“3: indiferente”, que deve ser válida como qualquer outra resposta.

Correlação

 Correlação é uma medida estatística que testa a relação entre duas variáveis. Talvez seja
uma das medidas mais importantes, pois variáveis próximas podem ser correlacionadas para
que possamos fazer previsões a seu respeito.
 Exemplo: existe relação entre o fumo e as doenças cardíacas?
 Para sabermos se as variáveis fumo e a variável doenças cardíacas estão relacionadas,
fazemos a correlação entre elas.

Diagrama de dispersão

 É a representação gráfica da relação entre duas variáveis.


 Se as variáveis crescem no mesmo sentido, a correlação é positiva, se variam em sentidos
opostos, existe correlação negativa entre as variáveis.

Coeficiente de correlação de Pearson


 É uma medida para analisar o grau de correlação linear entre duas variáveis numéricas e
representada pela letra r.
 Os valores limites de R são -1 e +1, isto é, valor de r pertence ao intervalo numérico [-1,1]. A
correlação pode ser:
 Perfeita e positiva: se a correlação entre duas variáveis for: r = 1.
 Perfeita e negativa: se a correlação entre duas variáveis for: r = -1.
 Não há correlação entre as variáveis, se r = 0.

Coeficiente de correlação de Pearson


 O gestor do Hospital Baruch de Toulouse deseja avaliar o curso que está proporcionando a
seus colaboradores no sistema de educação a distância. Para os alunos estudarem, existem
questionários que valem nota. Os colaboradores acessam a plataforma, podem estudar e fazer
os questionários.
 Após fazer o questionário, o colaborador obtém a nota relativa aos seus erros ou acertos. Ao
final do curso, o colaborador faz a sua prova. O gestor deseja saber se existe correlação entre a
nota dos questionários e a nota da prova, para tanto, colheu uma amostra, por amostragem
aleatória simples, de 10 colaboradores e obteve os resultados da tabela a seguir:

Coeficiente de correlação de Pearson

Você também pode gostar