Você está na página 1de 51

Unidade II

BIOESTATÍSTICA
APLICADA À SAÚDE

Prof. Celso Guidugli


Medidas de tendência central

 A análise sobre o estudo da frequência


mostra ser possível interpretar os
grupos dos dados/valores que uma
variável pode assumir.
 Dentro de uma determinada distribuição
de valores, é possível saber como seus
grupos de valores se distribuem.
 Tais grupos podem estar localizados no
início, no meio ou no fim ou se existe
uma distribuição homogênea dos
valores.
 Como traduzir essas tendências.
Elementos típicos da distribuição

 Medidas de Posição >


 Média aritmética
 Mediana
 Moda
 Medidas de Variabilidade ou Dispersão >
 Amplitude total
 Variância
 Desvio-padrão
 Coeficiente de variação
 Medidas de Assimetria e Curtose
Média Aritmética Simples e
Ponderada - X

 Média: valor equidistante (intermediário)


entre os valores de todos os elementos
da amostra. Imagine uma gangorra: é o
ponto de equilíbrio dos valores dos
dados de uma amostra.
 Média simples: quando a frequência de
todos os elementos é igual a 1.
 Média ponderada: quando o peso de
cada elemento (ou a frequência) da
amostra possui mais de um elemento.
Média Aritmética Simples - MAS

Cálculo: somatório dos valores de todos os


elementos dividido pelo número de
elementos.
Exemplo: qual é a média da amostra abaixo?
 S = {8;2; 10; 6 e 4} ROL=2;4;6;8;10.
 Mas= ∑xi ÷ n , em que xi são os
valores dos dados da série e n o número
(qtd) dos dados.
2 + 4 + 6 + 8 + 10 30
X = ⇒X = X =6
5 5
Desvio em relação à média

 É a diferença entre cada elemento de um


conjunto de valores e a média aritmética.
 Exemplo: a idade das crianças atendidas
diariamente num posto de vacinação –
6,9,11,7,5 e 4 > Rol > 4,5,6,7,9,11.
 Média=4+5+6+7+9+11÷6= 42÷6= Média=7.
 Desvio médio:
d1= x1-m= 4-7=-3
d2= x2-m= 5-7=-2
d3= x3-m= 6-7=-1
d4= x4-m= 7-7= 0
d5= x5-m= 9-7= 2
d6= x6-m= 11-7= 4
Soma dos desvios = 0
Propriedades da média

1ª – A soma algébrica dos desvios tomados


em relação à média é nula. Veja o exemplo.
2ª – Somando-se ou subtraindo-se uma
constante (c) de todos os valores de uma
variável, a média do conjunto fica
aumentada ou diminuída dessa constante.
3ª – Caso multiplique-se ou divida-se todos
os valores de uma variável por uma
constante (c), a média do conjunto fica
multiplicada ou dividida por essa
constante.
Média para dados agrupados sem
intervalo de classe peso/frequência

Cálculo: somatório da multiplicação de cada


dado pela respectiva frequência dividido pelo
somatório das frequências.
Mp =Ʃxi.fi ÷ Ʃfi. Exercício: qual a média?
VALOR FREQUÊNCIA
=xi SIMPLES = fi xi.fi

2 20 40 378
X= ⇒ X = 4,966292
4 25 100 78
6 18 108 X ⇒5
8 10 80
10 5 50

Ʃfi=78 Ʃxi.fi=378
TOTAL
Média para dados com
intervalo de classe

 Todos os valores incluídos em um


determinado intervalo de classe tendem
a coincidir com seu ponto médio da
classe (pmi), e é a partir daí que se
calcula a média aritmética ponderada.
 Fórmula para o cálculo da média para
dados com intervalo de classe:
 M= Ʃxi.fi ÷ Ʃfi , em que xi é o ponto
médio (pmi) de cada intervalo.
Média para dados com
intervalo de classe

Exemplo: calcular a média da distribuição.

A B C D E=(C+D)/2 F=D x E

Ponto
Frequência Frequência x
Limites de classe
simples
médio de ponto médio
Classe classe

li ls fi pmi fi x pmi
1 0 |---- 10 25 5 125
2 10 |---- 20 32 15 480
3 20 |---- 30 40 25 1000
4 30 |---- 40 19 35 665
5 40 |---| 50 7 45 315
∑fi 123 ∑f1.pmi 2585
Média para dados agrupados
com intervalo de classe

2585
X= ⇒= 21,01626
123
X = 21
Interatividade

Em uma prova de estatística, três alunos


obtiveram a nota 8,2; outros três obtiveram
a nota 9,0; cinco obtiveram a nota 8,6;
um obteve a nota 7,0 e um a nota 8,9.
Calculando-se a média, esta será:
a) Uma média aritmética com valor 8,0.
b) Uma média aritmética com valor 8,5.
c) Uma média aritmética simples com valor 7,0.
d) Uma média ponderada com valor 8,0.
e) Uma média aritmética simples com valor 8,3.
Resposta

Em uma prova de estatística, três alunos


obtiveram a nota 8,2; outros três obtiveram
a nota 9,0; cinco obtiveram a nota 8,6;
um obteve a nota 7,0 e um a nota 8,9. Calculando-
se a média, esta será:
a) Uma média aritmética com valor 8,0.
b) Uma média aritmética com valor 8,5.
c) Uma média aritmética simples com valor 7,0.
d) Uma média ponderada com valor 8,0.
e) Uma média aritmética simples com valor 8,3.
Ou seja, em ROL:
 Notas: 7,0; 8,2; 8,2; 8,2; 8,9; 9,0; 9,0; 9,0
 M =7,0 + (3 . 8,2) + (5 . 8,6) + 8,9 + (3 . 9) ÷ 13 =
 = 110,5 ÷ 13 = 8,5
Moda - Mo

É o valor que mais vezes se repete na


amostra; o valor de maior frequência.
Exercício:
 S = {2;2;3;3;3;4;5;5;6}  Mo = 3
 S = {2;2;2;3;3;3;4;5;6}  Mo = 2 e 3 >
Bimodal.
 S = {2;3;5;6;7;9;10;11}  Mo não existe >
Amodal. Frequência
Valor
simples
xi Fi
2 26
4 24
6 18
8 12
10 9  Mo = 2
Moda (dados agrupados)

Limites de classe Frequência simples


Classe
li ls fi
1 1000 |---- 1500 8
2 1500 |---- 2000 10
3 2000 |---- 2500 14
4 2500 |---- 3000 8
5 3000 |---| 3500 4

A classe modal é a 3ª (maior frequência).

 f post 
Mo = liMo +  ×h ⇒
 ant
f + f 
post 

 8 
Mo = 2000 +  × 500 ⇒ Mo = 2222,2
10 + 8 
Mediana - Md

É o valor que divide um conjunto de valores


ordenados exatamente em duas metades.
Exemplo:
1. Calcular a mediana do conjunto abaixo:
S = {2;4;6;8;10}

N +1 5 +1
Emd ⇒ Emd = =3
2 2 Md = 6
2. Calcular a mediana do conjunto abaixo:
S = {2;4;6;8;10;12}
Md = 7
N +1 6 +1
Emd = ⇒ Emd = = 3,5
2 2
Mediana (dados não agrupados)

3. Calcular a mediana da distribuição.


A classe da mediana é:
Frequência Frequência
Valor
simples acumulada
xi fi fac
2 26 26
4 24 50
6 18 68
8 12 80
10 9 89

N + 1 90
Emd = = = 45 ∴ Md = 4
2 2
Mediana (dados agrupados)

4. Calcular a classe da mediana da


distribuição:
Frequência Frequência
Limites de classe
Classe simples acumulada
li ls fi fac

1 250 |---- 300 8 8

2 300 |---- 350 10 18

3 350 |---- 400 14 32

4 400 |---- 450 8 40

5 450 |---| 500 4 44

44 + 1 45
Eme = = = 22,5
2 2
A classe da mediana é a de número 3.
Mediana (dados agrupados)

Frequência Frequência
Limites de classe
Classe simples acumulada
li ls fi fac

1 250 |---- 300 8 8

2 300 |---- 350 10 18

3 350 |---- 400 14 32

4 400 |---- 450 8 40

5 450 |---| 500 4 44

 E − f acant   22,5 − 18 
Me = liMe +  me  × h Me = 350 +   × 50
 f Me   14 

O valor da mediana, portanto, é: Me = 366,1


Emprego da mediana

 Na obtenção de um ponto referencial


que divide a distribuição em duas
partes iguais.
 A média pode estar afetada por
valores extremos que, até certo
ponto, mascaram a própria média.
 Geralmente, a variável em estudo
é salário.
Posição relativa da média

 Simétrica > é a posição de uma


distribuição em que as 3 medidas –
média, moda e mediana coincidem.
 Assimetria > acontece quando não há
coincidência numa distribuição em
nenhuma das três medidas.
 Numa distribuição em forma de sino:
M=Md=Mo <> curva simétrica.
Mo<Md<M <> curva assimétrica positiva.
M<Md<Mo <> curva assimétrica negativa.
Separatrizes

 Mediana <> trata-se de uma medida de


tendência central que define exatamente
dois grupos com os mesmos números
de valores.
 Quartis (Q) <> são valores de uma série
que a dividem em 4 partes iguais:
Primeiro Quartil (Q1) é a parte (25%) menor.
Segundo Quartil (Q2=Md) é justamente a
parte que coincide com a mediana.
Terceiro Quartil (Q3) é o valor (25%) da
distribuição situado na parte superior.
Percentis <> são os 99 valores que separam
a distribuição em 100 partes iguais.
Interatividade

 Calcular a média, a moda e a mediana da


distribuição (rol é importante):
 32,9,9,13,17,12, 10,15,23.
 Média—Moda—Mediana
a) 15,5 9 13
b) 13,8 13 9
c) 18,3 17 17
d) 17,7 9 14
e) 15,5 13 14
Resposta

 Calcular a média, a moda e a mediana da


distribuição (rol é importante):
 32,9,9,13,17,12, 10,15,23.
 Média—Moda—Mediana
a) 15,5 9 13
b) 13,8 13 9
c) 18,3 17 17
d) 17,7 9 14
e) 15,5 13 14

Média = 15,55
Moda = 9
Mediana = 13
Medidas de dispersão ou de
variabilidade

 Medidas de dispersão absolutas:


 Amplitude Total = diferença entre os
extremos dos valores coletados; a
diferença entre o limite superior e o
inferior dos elementos da amostra.
 Desvio Médio = é o somatório das
diferenças entre o valor de cada dado e
a média apurada, dividida pelo número
de elementos.
 Variância = S²
 Desvio-padrão = √variância = S
 Medidas de dispersão relativas:
 Coeficiente de Variação.
Desvios (revisão)

 Conceito de desvio: a diferença (positiva


ou negativa) entre o valor de um
determinado elemento e a medida de
posição da amostra, no caso da média.
 Por exemplo: você tirou nota 7,5 numa
prova em que a nota média dos alunos
foi 4,5. Significa que você tem um desvio
positivo, em relação à amostra, de 3
pontos:
d i = xi − X ⇒ d i = 7,5 − 4,5 ⇒ d i = 3,0
 Medidas de dispersão são tratamentos
estatísticos dados a todos os desvios
da amostra.
Desvio-padrão

 É a mais importante das medidas de


dispersão.
 É a raiz quadrada da soma de todos os
desvios ao quadrado dividida pelo
número de elementos menos um.
Exemplo: calcular o desvio-padrão de:
 S = {2;4;6;8;10}, cuja média é 6.
Desvios: di = {-4;-2;0;2;4}
Desvios ao quadrado: di2 = {16;4;0;4;16} =
Soma dos desvios = 40 ÷ amostra = 5 – 1,
portanto:
40
S= ⇒ S = 10 ⇒ S = 3,2
5 −1
Desvio-padrão
(dados não agrupados)

Exemplo: calcular o desvio-padrão.


Desvios ao
Frequência Valor x Desvios ao
Valor Desvios quadrado x
simples frequência quadrado
frequência
xi fi xi x fi di di2 fi x di2
1 20 20 -3,3 10,6 213,0
3 30 90 -1,3 1,6 47,9
5 20 100 0,7 0,5 10,9
7 15 105 2,7 7,5 112,4
9 10 90 4,7 22,4 224,4
Somas 95 405 608,4
Média: 4,3 Desvio-padrão 2,5

S=
∑d × f
i i
⇒S=
608,4
⇒ S = 2,5
N −1 95 − 1
Desvio-padrão (dados agrupados)

Exemplo: calcular o desvio-padrão.


Ponto Desvios
Frequên Valor x Desvios ao
Limites de médio ao
cia frequên Desvios quadrado x
Classe classe de quadra
simples cia frequência
classe do
li ls fi xi xi x fi di di2 fi x di2
1 10 |---- 20 10 15 150 -16,8 281,1 2810,6
2 20 |---- 30 20 25 500 -6,8 45,8 915,2
3 30 |---- 40 25 35 875 3,2 10,5 261,7
4 40 |---- 50 8 45 360 13,2 175,2 1401,4
5 50 |---| 60 5 55 275 23,2 539,9 2699,4
Som 68 2160 8088,2
Média: 31,8 Desvio-padrão 11,0

S=
∑d × f
i i
⇒S=
8088,2
⇒ S = 11,0
N −1 68 − 1
Variância

 Variância (S²):
 é o quadrado do desvio-padrão;
 mesmo cálculo, interrompido antes de
se extrair a raiz quadrada.
 Assim sendo:
 se a variância de uma amostra for
625, o desvio-padrão é √625 = 25;
 se o desvio-padrão de uma amostra
for 13, a variância é 13² = 169.
Medidas de dispersão relativas

 Coeficientes de Variação - CV
 Consideram simultaneamente a
medida de posição e a medida
de dispersão absoluta.
 Qualquer divisão entre uma medida de
dispersão e uma medida de posição
produz um Coeficiente de Variação.
 Os mais usados são o de Pearson
(divisão do desvio-padrão pela média)
e o de Thorndike (divisão do desvio-
padrão pela mediana).
Medidas de dispersão relativas

 Exemplo: a produção horária média de


determinado processo industrial é de
250 toneladas, com desvio-padrão de
84 toneladas. Calcular o CV (%):
 Pelo CV de Pearson: = 33,6%.
S 84
Cv p = ⇒ Cv p = ⇒ Cv p = 0,336
X 250
Interatividade

Para oito funcionários de uma empresa foi


perguntado qual era o seu tempo de casa
em anos. As respostas foram as seguintes:
 ROL:{8;12;14;15;18;20;20;21}
Pergunta-se: qual é o desvio-padrão do
tempo médio de casa desses funcionários?
a) 4,27 anos.
b) 18,25 anos.
c) 16 anos.
d) 4 anos.
e) 4,57 anos.
Resposta

A resposta correta é: e) 4,57 anos. Passos:

8 + 12 + 14 + 15 + 18 + 20 + 20 + 21
1. Média: X= ⇒ X = 16 anos
8

2. Desvios: di = {−8;−4;−2;−1;2;4;4;5}

3. Desvios ao quadrado: di = {64;16;4;1;4;16;16;25}

Raiz quadrada da soma dos desvios


dividida pelo número de dados
menos um:
64 + 16 + 4 + 1 + 4 + 16 + 16 + 25 146
S= ⇒S= ⇒ S = 4,57
8 −1 7
Probabilidade

 Um espaço amostral U (finito) é


equiprovável quando seus eventos
elementares têm probabilidades
iguais de ocorrência.
 Num espaço amostral equiprovável U
(finito), a probabilidade de ocorrência
de um evento A é sempre:
 P(A) = nº de elementos de A ÷ nº de
elementos de U.
 P(A) = n(A) ÷ n(U), em que U(finito) é o
espaço amostral equiprovável e
A é a probabilidade de ocorrência
de um evento.
Probabilidade - propriedades

1ª. A probabilidade de uma amostra é sempre


representada por um número
racional, entre 0 e 1, imediato e da
própria definição ou simbolicamente:
0 ≤ P(A/U) ≤1 ou P(A/U) € [0,1].
Será 0 se for amostra impossível e 1 se A = U
ou a amostra certa.
2ª. Probabilidade de uma amostra complementar
quando Ac = U - A.
3ª. É derivada da união de conjuntos, o que é
útil. Quando num conjunto universo se trabalha
com duas amostras, e/ou com eventos
independentes ou mutuamente exclusivos.
4ª. A soma de todas a probabilidades
de um espaço amostral é igual à unidade.
Números índices

 Índice é a relação entre dois estados de


uma variável ou de um grupo de variáveis
que podem variar no tempo ou no
espaço. Vale também de grupo para
grupo de indivíduos (Crespo).
 Permite uma avaliação da variação
percentual relativa (%), apurada
entre dois dados da mesma
natureza da variável.
 Números índices estão associados aos
negócios e à economia nos ramos da
física, química e ciências sociais.
 Cálculos sobre o comportamento dos
preços, IDH etc. são exemplos de índices.
Números índices

 Facilitam o estudo da evolução de dados


quantitativos ao longo do tempo,
assumindo diferentes formas.
Estes últimos são empregados na
análise conjunta de diferentes dados.
Internação-Hospital Nenê - 1º trimestre/2013
DEZ/12—JAN/13—FEV/13—MARÇO/13
712 888 960 1.070
100,0 1,247 1,348 1,503=Índice100,
100,0% 24,7% 34,8% 50,3%= -1 ÷100
Números índices

Exemplos de aplicação:
 eficácia de medicamentos e/ou
tratamentos: obesidade, vitamínicos,
comparação com placebos, dosagem e
efeitos colaterais;
 evolução de doenças, por região, país,
atividade exercida: periculosidade,
dengue, gripe suína;
 avaliar resultados de campanhas
públicas de erradicação de doenças:
influenza, pólio, tuberculose, meningite;
 participação em vacinação: tétano, gripe.
Números índices

A área da saúde serve para avaliar e


comparar dados de períodos diversos,
de mesma natureza:
 de internação em um setor do hospital;
 dados de pesquisas médicas;
 consumo de medicamentos;
 campanhas de saúde pública preventiva
e de erradicação, como vacinação em
massa, propagação da dengue etc.
Qui Quadrado – X²

 Simbolizado por X², é um teste


de hipóteses que se destina a
encontrar um valor da dispersão
para duas variáveis nominais
e avaliar a associação existente
entre variáveis qualitativas.
 É um teste não paramétrico, ou seja,
não depende de parâmetros
populacionais, como média e variância.
 O princípio básico deste método é
comparar proporções, isto é, as
possíveis divergências entre as
frequências observadas e esperadas
para um certo evento.
Qui Quadrado – X²

O teste é utilizado para:


 verificar se a frequência com que um
determinado acontecimento observado
em uma amostra se desvia ou não da
frequência com que ele é esperado;
 comparar a distribuição de diversos
acontecimentos em diferentes amostras,
para avaliar se as proporções
observadas destes eventos mostram ou
não diferenças significativas.
Qui Quadrado – X²

Condições necessárias para o teste:


 os grupos devem ser independentes;
 os itens de cada grupo são selecionados
aleatoriamente;
 as observações devem ser frequências
ou contagens (lembre-se: não há
média/variância, pois estamos tratando
com variáveis nominais e qualitativas);
 cada observação pertence a uma e
somente uma categoria;
 a amostra deve ser relativamente grande
(pelo menos 5 observações em cada
célula e, no caso de poucos grupos, pelo
menos 10. Exemplo: em tabelas 2 x 2).
Qui Quadrado – X²

Como calcular:
 Karl Pearson propôs a seguinte fórmula
para medir possíveis discrepâncias entre
proporções observadas e esperadas:
 = [(o - e)2 /e] , em que:
 o = frequência observada para cada
classe;
e = frequência esperada para aquela
classe.
 Note-se que (o - e) = desvio (d). Portanto,
a fórmula também pode ser escrita como
 X²=∑(d² /e)
Qui Quadrado – X²

 Percebe-se que as frequências


observadas são obtidas diretamente
dos dados das amostras, enquanto
que as frequências esperadas são
calculadas a partir destas.
 Quando as frequências observadas são
muito próximas às esperadas, o valor
de X² é pequeno. Mas se as divergências
são grandes, (o - e) passa a ser também
grande e, por isso, X² assume
valores altos.
Qui Quadrado – X²

Hipóteses a serem testadas - apenas duas:


 Hipótese nula: as frequências observadas
não são diferentes das frequências
esperadas. Não existe diferença entre
as frequências (contagens) dos grupos.
Portanto, não há associação entre
os grupos.
 Hipótese alternativa: as frequências
observadas são diferentes da frequências
esperadas. Existe diferença entre as
frequências. Portanto, há associação
entre os grupos.
Qui Quadrado – X²

 De modo geral, o teste do QUI Quadrado


analisa a Ho - hipótese nula de não
existir discrepância entre as frequências
observadas de um determinado
evento e as frequências esperadas.
 A Há - hipótese alternativa alega a
existência de discrepância entre
frequências observadas e esperadas.
 Nos testes do Qui Quadrado há:
 teste de dependência - analisar apenas
uma característica;
 teste para independência/associação -
analisar duas características.
Utilização dos recursos de
informática e da internet
aplicados à saúde
O final do livro-texto apresenta uma relação
de ferramentas da:
 área da informática e para usos da
internet na área da saúde. Sucesso!
Interatividade

Em uma lista de 6 prontuários de


acidentados de motos, numerados de 1 a 6,
qual a probabilidade de ocorrer a retirada
do prontuário do paciente nº 3?
a) 1/3
b) ¼
c) 1/5
d) 1/6
e) 1/7
Resposta

Em uma lista de 6 prontuários de


acidentados de motos, numerados de 1 a 6,
qual a probabilidade de ocorrer a retirada
do prontuário do paciente nº 3?
a) 1/3
b) ¼
c) 1/5
d) 1/6
e) 1/7
Alternativa correta “d”: 1/6 de chance, ou 0,17%.
ATÉ A PRÓXIMA!