Você está na página 1de 21

Ana Afonso 2020/2021 Estatística laboratorial CBL

Tipos de variáveis
❖ Qualitativas:
▪ Nominais → não há ordem entre amostras.
Ex: sexo, cor dos olhos, doente/saudável.
▪ Ordinais → há ordem entre amostras.
Ex: grau de escolaridade, mês de observação, níveis de glicose, classificação na UC.

❖ Quantitativas:
▪ Contínua → características mensuráveis que assumem valores numa escala real e
para as quais os valores fazem sentido.
Ex: peso, altura, tempo, idade.
▪ Discreta → sempre numéricas e finitas. Só fazem sentido números inteiros.
Ex: nº de filhos, nº de cigarros por dia.

❖ Escala de intervalos → usa-se um ponto arbitrário não um absoluto. Não se pode calcular o
quociente. É possível quantificar a distância entre medidas, mas não há um zero absoluto.
Ex: na escala da temperatura não se diz que 0°C é ausência de temperatura nem que 40°C
são o dobro de 20°C.

❖ Escala de razão → há um zero absoluto. Pode-se calcular o quociente e a diferença entre 2


amostras.
Ex: idade.

Tipos de estatísticas
❖ Localização:
▪ Moda (mode)
▪ Média (mean)
▪ Mediana (median)
▪ Quantis (quartis, decis, percentis)
❖ Assimetria:
▪ Erro padrão (standard error)
▪ Coeficiente de assimetria (SPSS) (asymmetry coefficient)
❖ Dispersão:
▪ Amplitude dos dados (range)
▪ Amplitude inter-quartis (interquartile range)
▪ Desvio padrão (standard deviation)
▪ Variância (variance)
▪ Coeficiente de variação/desvio padrão relativo
❖ Achatamento:
▪ Coeficiente de achatamento (SPSS)
▪ Erro padrão (standard error)

1
Ana Afonso 2020/2021 Estatística laboratorial CBL

▪ Moda = valor com maior frequência.


x1 + x2 + x3 + (...)
▪ Média =
nº de amostras

▪ Mediana = ordenar valores por ordem crescente ou decrescente e ver o(s) central(is).
▪ Quantis:
Weighed average: Tuckey:
O = (n+1) x p O = n x p + 0,5
Qp = x0 Qp = x0

O → ordem do quantil de ordem p


P → proporção de observações de valor inferior ou igual à ordem do quantil

p = ¼ → quartil
p = 1/10 → decil
p = 1/100 → percentil

Exemplo:
1 2 3 4 5 6 7 8 9 10
48 50 50 52 54 55 55 57 58 121

50+50 54+55 57+58


Q1 = = 50 Q2= = 54,5 Q3= = 57,5
2 2 2

▪ Amplitude dos dados = Valor máximo – Valor mínimo


▪ Amplitude interquartis = 3º quartil – 1º quartil
▪ Desvio padrão: distância média a que cada uma das observações está da média do conjunto de
dados.
(xi − x̅)2
s = √ xi → observação; 𝑥̅ → média; n → dimensão da amostra
n

▪ Variância:
(x −x̅)2 (xi −x̅)2
s2 = (√ i n ) 2 = n

▪ Coeficiente de variação:
2
̅)
(xi −x
𝑠 n
CV =

× 100 = x̅
× 100

2
Ana Afonso 2020/2021 Estatística laboratorial CBL

Exemplo: qual das variáveis tem um comportamento mais homogéneo?

n Mean Std. deviation


Peso (kg) 47 58,67 9,770
Altura (cm) 47 163,83 8,404
Valid n 47

CV (peso) = (9,770 / 58,67) x 100 = 16,65%


CV (altura) = (8,404 / 163,83) x 100 = 5,13%
R: Em termos relativos, a variável com maior dispersão é a variável peso. Assim, a variável altura é
a que tem um comportamento mais homogéneo.

Assimetria

𝑒𝑠𝑡𝑎𝑡í𝑠𝑡𝑖𝑐𝑎 𝑑𝑒 𝑎𝑠𝑠𝑖𝑚𝑒𝑡𝑟𝑖𝑎
−1,96 ≤ ≤ 1,96
𝑠𝑡𝑑 𝑒𝑟𝑟𝑜𝑟

Achatamento/curtose

3
Ana Afonso 2020/2021 Estatística laboratorial CBL

Coeficiente de correlação de Pearson


- Mede o grau de associação linear entre x e y (quantitativas)
- Amostras grandes OU se são amostras pequenas com distribuição normal.
Classificação da intensidade da associação/correlação:
▪ r ≈ -1 → negativa muita alta
▪ r ≈ 0 → não há associação linear entre variáveis
▪ 0 ≤ | coeficiente | ≤ 0,2 → muito fraca
▪ 0,2 < | coeficiente | ≤ 0,5 → fraca
▪ 0,5 < | coeficiente | ≤ 0,7 → moderada
▪ 0,7 < | coeficiente | ≤ 0,9 → forte
▪ 0,9 < | coeficiente | ≤ 1 → muito forte
Exemplo:

0,812 → valor p
Nº pulsações Nº pulsações
antes depois

Corr. Pearson 1 ,812


Nº pulsações Há uma correlação positiva forte, o
Sig. (2-tailed) ,001
antes que significa que para valores mais
N 12 12
elevados do nº de pulsações antes,
Corr. Pearson ,812 1
Nº pulsações corresponde em média um nº mais
Sig. (2-tailed) ,001 elevado de pulsações depois.
depois
N 12 12

Coeficiente de correlação de Spearman


- Mede o grau de associação entre x e y qualitativas (escala ordinal) OU quantitativas se forem
amostras pequenas sem distribuição normal.
Classificação da intensidade da associação/correlação:
▪ rs ≈ -1 → negativa muito alta
▪ rs ≈ 0 → não há associação entre ordenações das variáveis
▪ 0 ≤ | coeficiente | ≤ 0,2 → muito fraca
▪ 0,2 < | coeficiente | ≤ 0,5 → fraca
▪ 0,5 < | coeficiente | ≤ 0,7 → moderada
▪ 0,7 < | coeficiente | ≤ 0,9 → forte
▪ 0,9 < | coeficiente | ≤ 1 → muito forte

4
Ana Afonso 2020/2021 Estatística laboratorial CBL

Variável A
n11 e n22 → categorias concordantes
Categoria 1 Categoria 2 das variáveis
Categoria 1 n11 n12 n12 e n21 → categorias discordantes
Variável B
Categoria 2 n21 n22 das variáveis

Boxplot – caixa de bigodes

No SPSS: graphs → legacy dialogs → boxplot

Outliers
▪ Mínimo = ponto adjacente inferior → menor valor na barreira inferior (BI)
BI = Q1 – 1,5 x (Q3 – Q1)
▪ Máximo = ponto adjacente superior → maior valor na barreira superior (BS)
BS = Q3 + 1,5 x (Q3 – Q1)

- (*) Severos inferiores: x < Q1 – 3(Q3 – Q1)


- (•) Moderados inferiores: Q3 – 3(Q3 – Q1) < x < Q1 – 1,5(Q3 – Q1)
- (•) Moderados superiores: Q3 + 1,5(Q3 – Q1) < x < Q3 + 3(Q3 – Q1)
- (*) Severos superiores: x > Q3 + 3(Q3 – Q1)

5
Ana Afonso 2020/2021 Estatística laboratorial CBL

Boxplots e assimetria

Sobre os outliers:
- São dados muito diferentes do resto
- Trazem informação adicional
1. Verifica-se a qualidade dos dados recolhidos
2. Se não há erros na introdução dos dados → deve ser feito um estudo com outliers e outro
sem outliers:
a. Se forem concordantes então os outliers não são influentes
b. Se forem diferentes então o estudo é inconclusivo.

Dragon Dreaming
- Abordagem específica ao processo coletivo de construção de projetos que promove o seu
sucesso e que se baseia nos seguintes princípios éticos:
o Crescimento pessoal → compromisso com o seu próprio equilíbrio e empoderamento
o Construção da comunidade → o reforço das comunidades nas quais se é uma parte
o Ao serviço da Humanidade/Terra → o reforço do bem-estrar e prosperidade de toda a
vida

6
Ana Afonso 2020/2021 Estatística laboratorial CBL

Distribuição normal

𝑋−μ
Se X ∩ N (μ , σ) então Z = ∩ 𝑁 (0,1) μ → média; σ → desvio padrão
𝜎

Exemplo: Considere a variável aleatória X com distribuição N (μ = 10; σ2 = 16).


a. P (X ≤ 10)
10−10
P (X ≤ 10) = P (z ≤ ) = P ( z ≤ 0 ) = 0,5
4

b. P (X > 12)
12−10
P (X > 12) = P (z > ) = P ( z > 2/4) = P ( z > 0,5) = 1 – P ( z < 0,5) = 1 – 0,6915 = 0,3085
4

c. P (8 < x < 12)

7
Ana Afonso 2020/2021 Estatística laboratorial CBL

8−10 12−10
P (8 < x < 12) = P ( < 𝑧 < ) = P (-0,5 < z < 0,5) = P ( z < 0,5) – P ( z < -0,5) =
4 4
= 0,6915 – [ 1 – P ( z < 0,5) ] = 0,6915 – (1 – 0,6915) = 0,6915 – 0,3085) = 0,3820

Definição das hipóteses estatísticas em testes de hipóteses para μ

Hipótese nula Hipótese alternativa Tipo de teste

H0: μ = μ0 H1: μ ≠ μ0 Teste bilateral

H0: μ = μ0 H1: μ > μ0 Unilateral à direita

H0: μ = μ0 H1: μ < μ0 Unilateral à esquerda

▪ H0 é sempre uma hipótese simples (só assume 1 valor)


▪ H1 é sempre uma hipótese composta (assume um intervalo de valores)
Como fazer um teste de hipóteses:
1. Recolha dos dados do problema
2. Identificação do teste, definição das hipóteses e escolha do nível de significância.
3. Verificação das condições de aplicabilidade do teste indicado.
4. Identificação e cálculo da estatística de teste (se for preciso).
5. Definição da regra de decisão e cálculo do valor p (se for preciso).
6. Decisão (baseada no valor p)
7. Conclusão.

X ∩ N (μ ; σ) X ∩ N (μ ; σ) X ∩ N (μ ; σ)
σ conhecido σ desconhecido σ desconhecido

n qualquer n ≥ 30 n < 30

σ σ σ
̅ ∩ N (μ ;
X ) ̅ ∩ N (μ ;
X ) ̅ ∩ N (μ ;
X )
√n √n √n

̅−μ
X ̅−μ
X ̅−μ
X
Z= σ ∩ N (0;1) Z= 𝑠 ∩ N (0;1) T= 𝑠′ ∩ t(n – 1)
√n √n √n

(xi − x̅)2 8
s′ = √
n − 1
∀ - população desconhecida; ∩̇ - aproximadamente

Ana Afonso 2020/2021 Estatística laboratorial CBL


X ∩ ∀ (μ ; σ) X ∩ ∀ (μ ; σ) X ∩ ∀ (μ ; σ) X ∩ ∀ (μ ; σ)
σ conhecido σ conhecido σ desconhecido σ desconhecido

n ≥ 30 n < 30 n ≥ 30 n < 30

σ σ
̅ ∩̇ N (μ ;
X ) Métodos não ̅ ∩̇ N (μ ;
X ) Métodos não
√n √n
paramétricos paramétricos
Pelo T.L.C Pelo T.L.C

̅−μ
X ̅−μ
X
Z= σ ∩ N (0;1) ------ Z= 𝑠 ∩ N (0;1) ------
√n √n

O teorema do limite central (TLC) diz que quando o tamanho da amostra aumenta, a
distribuição da sua média aproxima-se cada vez mais de uma distribuição normal.

▪ Z e T são variáveis fulcrais → são a base para estimar intervalos de confiança


▪ Z0 e T0 são estatísticas de teste!
̅ − μ0
X ̅ − μ0
X
Z0 = s ∩ N (0;1) T0 = s′ ∩ t(n – 1)
√n √n

Regras de decisão em testes de hipóteses:

I. Teste bilateral:
▪ Se | z0 | ≥ z1 – α/2 → rejeita-se H0
▪ Se | t0 | ≥ tn – 1; 1 – α/2 → rejeita-se H0

II. Unilateral direita:


▪ Se z0 ≥ z1 – α/2 → rejeita-se H0
▪ Se t0 ≥ tn – 1; 1 – α → rejeita-se Ho

III. Unilateral esquerda:


▪ Se z0 ≤ – z1–α → rejeita-se H0
▪ Se t0 ≤ – tn – 1; 1 – α → rejeita-se H0

9
Ana Afonso 2020/2021 Estatística laboratorial CBL

Se valor p ≤ α → rejeita-se H0

Teste de Shapiro-Wilk → para menos de 50 observações, dados quantitativos.


Teste de Kolmogorov-Smirnov → 50 ou mais observações

Fórmula final do intervalo de confiança


𝛼 𝑠 𝛼 𝑠
̅
X − z (1 − ) × ≤ 𝜇 ≤ ̅
X + z (1 − ) ×
2 √𝑛 2 √𝑛

Testes de hipóteses para 𝛍

Condição da hipótese nula

H0 verdadeira H0 falsa

Decisão correta
Erro tipo I (α) Potência do teste (1 – β)
Rejeito H0 Falso positivo Probabilidade de o teste ter
Nível de significância resultados estatisticamente
Decisão significativos

Decisão correta Erro tipo II (β)


Não rejeito H0
Nível de confiança (1 – α) Falso negativo

Valores de referência para α: 0,05 e 0,01


Valores de referência para (1 – β): [0,7 ; 1]

10
Ana Afonso 2020/2021 Estatística laboratorial CBL

Estimação e testes de hipóteses em 2 amostras INDEPENDENTES

EXEMPLO 1: num hospital foi feito um estudo onde se pretendeu saber se o nível médio de ferro
no sangue era significativamente diferente entre mulheres grávidas e não grávidas. Foram
recolhidas 2 amostras aleatórias, uma de grávidas e outra de não grávidas, e foram recolhidos os
níveis de ferro no sangue. α = 0,05.

11
Ana Afonso 2020/2021 Estatística laboratorial CBL

Regra do valor p Regra clássica

se valor p ≤ α então rejeita-se H0 com α = 5% (se | t0 | ≥ tr; 1 – α/2 então rejeita-se H0 com α = 5%)
Decisão: Decisão: como
como v.p = 0,002 < α = 0,05 → rejeito H0 t0 = | -3,303 | > t38; o,975 ≈ t40; 0,975 = 2,021 → rejeito H0

Conclusão: posso afirmar, para um nível de Conclusão: posso afirmar, para um nível de
significância de 5%, que o nível médio de ferro no significância de 5%, que o nível médio de ferro no
sangue é significativamente diferente entre o grupo sangue é significativamente diferente entre o grupo de
de grávidas e não grávidas. grávidas e não grávidas.

EXEMPLO 2: 2 grupos de recém-nascidos com pesos aprox. iguais foram sujeitos a 2 esquemas de
alimentação diferentes (A e B). Ao fim de 6 meses registaram-se os ganhos em peso (kg) nos 2
grupos e os resultados obtidos foram:

12
Ana Afonso 2020/2021 Estatística laboratorial CBL

Regra do valor p Regra clássica

se valor p ≤ α → rejeita-se H0 com α = 1% (se | t0 | ≥ tn1 + n2 – 2 → rejeita-se H0 com α = 1%)

Decisão: Decisão:
v.p = 0,332/2, então v.p > α → não rejeito H0 t0 = -1,006 > -t14;0,99 = -2,624 → não rejeito H0

Conclusão: não posso afirmar, para um nível de Conclusão: não posso afirmar, para um nível de
significância de 1%, que se verifique um ganho médio significância de 1%, que se verifique um ganho médio
de peso no grupo 2 significativamente superior ao de peso no grupo 2 significativamente superior ao
ganho médio de peso no grupo 1. ganho médio de peso no grupo 1.

13
Ana Afonso 2020/2021 Estatística laboratorial CBL

Estimação e testes de hipóteses em 2 amostras EMPARELHADAS


EXEMPLO 1: 5 doentes internados numa unidade hospitalar com psoríase foram submetidos a 2
tratamento com 2 pomadas (A e B). A variável X corresponde ao tempo em dias até sem ficarem
sintomas. Com base nos dados disponíveis pode concluir-se que a pomada B é mais eficaz que a
pomada A? α = 0,05.
Doente Pomada A Pomada B Diferença (D = A – B)
1 12 14 -2
2 10 11 -1
3 13 10 3
4 9 8 1
5 11 7 4

H0: D ⋂ N Como v.p > α → não rejeito H0 → afirma-se que D ⋂ N


H1: D ⋂ N
Hipóteses estatísticas:
H0: μd = 0
H1: μd > 0
Estatística de teste:
̅ − μ0
d
T0 = s′ ∩ t(n – 1)
√n

Decisão: v.p > α → não rejeito H0


Conclusão: não posso afirmar que a pomada B seja mais eficaz do que a pomada A

14
Ana Afonso 2020/2021 Estatística laboratorial CBL

Cartas de controlo
▪ Objetivo → estudar a variabilidade de um processo
▪ Gera limites de controlo → LSC e LIC

Gráfico de Levey-Jennings:
▪ Carta de controlo em que os resultados são apresentados em função do tempo e têm os limites
de 2 desvios-padrão.
▪ Foi melhorada por Henry e Segalove, passando a incluir os limites de 3 desvios-padrão, para
análise de longo prazo.

Escolha da carta de controlo:

n ≥ 10 => média, desvio-padrão

Variáveis
(informação n < 10 => média, amplitude
quantitativa)

n=1 => indivíduos, amplitude móvel

Proporção ou nº • n constante => carta p ou np


peças defeituosas • n variável => carta p
Atributos
(informação
qualitatitva)
n constante => carta c ou n
nº defeitos

n variável => carta u

Dimensão das amostras e frequência de amostragem:


▪ Dimensão das amostras (n) → nº elementos dentro de cada amostra. Depende do tipo de
processo. Normalmente entre 4 a 6 elementos.
▪ Frequência de amostragem (g) → nº amostras usadas no estudo. Depende da dimensão
das amostras. Normalmente entre 15 a 15 amostras.

15
Ana Afonso 2020/2021 Estatística laboratorial CBL

▪ Há uma relação inversa entre g e n.

Determinação dos limites de controlo:


𝑅̅
Amplitude relativa: 𝜎̂ =
𝑑2

𝑆̅
Desvio padrão amostral: 𝜎̂ =
𝑐4

Desvio padrão amostral: 𝜎̂ = 𝑆′

16
Ana Afonso 2020/2021 Estatística laboratorial CBL

Análise de capacidade
▪ Objetivo → estudo e melhoria da eficiência do processo
▪ Especificação → valor de referência obtido legalmente ou por opção da instituição
▪ A análise de capacidade só pode ser feita em processos estáveis, ou seja, sob controlo
estatístico
▪ Gera limites de especificação → LSE e LIE

Localização, variabilidade e limites de especificação


(𝐋𝐒𝐄 + 𝐋𝐈𝐄)
alvo: m =
𝟐

Caso 1 Caso 2 Caso 3


• amplitude do processo < • Amplitude do processo = • Amplitude do processo >
amplitude da especificação amplitude da especificação amplitude da especificação

• situação mais desejável porque • O processo é aceitável ou • Situação não desejável


dá maior garantia de que o adequado • Mesmo que o processo esteja
processo é capaz de cumprir os • Desde que o processo esteja centrado, ele não é capaz
requisitos, desde que esteja centrado, não haverá produção porque produz produtos fora
centrado ou que a sua não conforme dos limites de especificação
descentragem seja
compensada pela precisão.

17
Ana Afonso 2020/2021 Estatística laboratorial CBL

Índice de capacidade (Cp) (processo estável e centrado):


▪ Mostra relação entre o espaço disponível para a variação de acordo com as especificações e
o espaço ocupado pela variação do processo.

Especificações bilaterais Especificações unilaterais

LSE − LIE LSE − LIE


̂=
Cp Ĉp =
6 .σ 6.s
LSE − ̅X
̂s =
Cp
3 .σ

LSE − LIE LSE − LIE


̂=
Cp Ĉp = ̅ − LIE
X
̅
R S̅ ̂i =
Cp
6 (d ) 6 (d ) 3.σ
2 4

Rácio de capacidade (Cr) (processo estável e centrado):


1 6 .σ
Cr = ̂=
× 100, 𝑜𝑢 𝑠𝑒𝑗𝑎, Cr × 100
Cp LSE − LIE

Índice de capacidade Cpk (processo estável):


▪ Avalia a distância da média do processo aos limites de especificação
▪ Relação Cp e Cpk: Cpk = Cp(1 – k)
 Se o processo é centrado, k = 0 e Cpk = Cp

LSE − X̅ ̅X − LIE
Cpk = min { ; } = min { ̂ ̂i }
Cps ; Cp
3 .σ
̂ 3 .σ
̂
̅|
|m−X
Medida do desvio do processo relativamente ao alvo: k = LSE−LIE
2

Índice de capacidade Cpm (processo estável):


▪ Quantifica o desvio do processo relativamente ao alvo

𝐿𝑆𝐸 − 𝐿𝐼𝐸
𝐶𝑝𝑚 = 𝜏 2 = 𝜎 2 + (𝜇 − 𝑚)2
6 .𝜏

18
Ana Afonso 2020/2021 Estatística laboratorial CBL

Índices de capacidade – valores de referência (válidos para Cp, Cpm e Cpk):


▪ Superior a 1 → processo bastante capaz
▪ Igual a 1 → processo razoavelmente capaz (a proporção de itens não conformes dependerá
da centragem do processo)
▪ Inferior a 1 → processo incapaz

Especificações bilaterais:

▪ Cp > 1,33 → para processos em curso


▪ Cp > 1,50 → para processos novos não críticos em termos de segurança OU já em curso
mas críticos em termos de segurança
▪ Cp > 1,67 → para processos novos e críticos em termos de segurança

Especificações unilaterais:

▪ Cp > 1,25 → para processos em curso


▪ Cp > 1,45 → para processos novos não críticos em termos de segurança OU já em curso
mas críticos em termos de segurança
▪ Cp > 1,60 → para processos novos e críticos em termos de segurança

Exemplo 1: a humidade relativa num dado local é esperada situar-se entre 65% e 85%. Amostras
aleatórias recolhidas durante uma semana permitiram registar os seguintes valores em
percentagem: 60, 78, 70, 84, 81, 80, 85, 60, 88, 75.
Determina e interpreta o índice de capacidade do processo. O alvo corresponde ao ponto médio da
amplitude de especificação, ou seja, 75%.

𝑥̅ = 76,1
s = 9,905
LSE − LIE 0,85 − 0,65 0,20
̂ =
𝐶𝑝 = = = 0,337
6×s 6 × 9,905 59,43
R: como o índice de capacidade tem um valor inferior a 1, então conclui-se que o processo não é
potencialmente capaz de funcionar bem dentro das especificações. Como está descentrado à
direita, sabe-se que este índice está a sobrevalorizar a capacidade potencial do processo, não
sendo o mais adequado para avaliação da situação.

19
Ana Afonso 2020/2021 Estatística laboratorial CBL

Tabelas de contingência
▪ Tabelas de dupla entrada com 2 variáveis

20
Ana Afonso 2020/2021 Estatística laboratorial CBL

Testes do Qui-Quadrado

Independência Homogeneidade
• 1 amostra • 2 ou mais amostras independentes
• 2 variáveis qualitativas com: • 1 variável qualitativa com:
o Categorias exaustivas → o Categorias exaustivas
permitem que qualquer observação o Mutuamente exclusivas
seja incluída em qualquer categoria • Dados na forma de frequências
o Mutuamente exclusivas → não • Não mais de 20% de células com eij < 5
podem ocorrer ao mesmo tempo
• Dados na forma de frequências
• Não mais de 20% de células com eij < 5

H0: as variáveis são independentes H0: as populações são homogéneas

H1: as variáveis não são independentes H1: as populações não são homogéneas

Se a última regra não for respeitada, então usa-se o teste exato de Fisher !

Regra de decisão clássica Regra de decisão usando o valor p

χ02 → obtido diretamente dos dados das amostras


χn2 → depende do nº graus de liberdade e do nível de significância (α)

Se χ02 ≥ χ2(r – 1).(c – 1); 1 - α => rejeita-se H0 Valor p = P (χ02 ≥ χn2) = 1 – P (χ02 < χn2)

Se χ02 < χ2(r – 1).(c – 1); 1 - α => não se rejeita H0 Se valor p ≤ α => rejeita-se H0

r → nº linhas da tabela
c → nº colunas da tabela

21

Você também pode gostar