Escolar Documentos
Profissional Documentos
Cultura Documentos
Tipos de variáveis
❖ Qualitativas:
▪ Nominais → não há ordem entre amostras.
Ex: sexo, cor dos olhos, doente/saudável.
▪ Ordinais → há ordem entre amostras.
Ex: grau de escolaridade, mês de observação, níveis de glicose, classificação na UC.
❖ Quantitativas:
▪ Contínua → características mensuráveis que assumem valores numa escala real e
para as quais os valores fazem sentido.
Ex: peso, altura, tempo, idade.
▪ Discreta → sempre numéricas e finitas. Só fazem sentido números inteiros.
Ex: nº de filhos, nº de cigarros por dia.
❖ Escala de intervalos → usa-se um ponto arbitrário não um absoluto. Não se pode calcular o
quociente. É possível quantificar a distância entre medidas, mas não há um zero absoluto.
Ex: na escala da temperatura não se diz que 0°C é ausência de temperatura nem que 40°C
são o dobro de 20°C.
Tipos de estatísticas
❖ Localização:
▪ Moda (mode)
▪ Média (mean)
▪ Mediana (median)
▪ Quantis (quartis, decis, percentis)
❖ Assimetria:
▪ Erro padrão (standard error)
▪ Coeficiente de assimetria (SPSS) (asymmetry coefficient)
❖ Dispersão:
▪ Amplitude dos dados (range)
▪ Amplitude inter-quartis (interquartile range)
▪ Desvio padrão (standard deviation)
▪ Variância (variance)
▪ Coeficiente de variação/desvio padrão relativo
❖ Achatamento:
▪ Coeficiente de achatamento (SPSS)
▪ Erro padrão (standard error)
1
Ana Afonso 2020/2021 Estatística laboratorial CBL
▪ Mediana = ordenar valores por ordem crescente ou decrescente e ver o(s) central(is).
▪ Quantis:
Weighed average: Tuckey:
O = (n+1) x p O = n x p + 0,5
Qp = x0 Qp = x0
p = ¼ → quartil
p = 1/10 → decil
p = 1/100 → percentil
Exemplo:
1 2 3 4 5 6 7 8 9 10
48 50 50 52 54 55 55 57 58 121
▪ Variância:
(x −x̅)2 (xi −x̅)2
s2 = (√ i n ) 2 = n
▪ Coeficiente de variação:
2
̅)
(xi −x
𝑠 n
CV =
x̅
× 100 = x̅
× 100
2
Ana Afonso 2020/2021 Estatística laboratorial CBL
Assimetria
𝑒𝑠𝑡𝑎𝑡í𝑠𝑡𝑖𝑐𝑎 𝑑𝑒 𝑎𝑠𝑠𝑖𝑚𝑒𝑡𝑟𝑖𝑎
−1,96 ≤ ≤ 1,96
𝑠𝑡𝑑 𝑒𝑟𝑟𝑜𝑟
Achatamento/curtose
3
Ana Afonso 2020/2021 Estatística laboratorial CBL
0,812 → valor p
Nº pulsações Nº pulsações
antes depois
4
Ana Afonso 2020/2021 Estatística laboratorial CBL
Variável A
n11 e n22 → categorias concordantes
Categoria 1 Categoria 2 das variáveis
Categoria 1 n11 n12 n12 e n21 → categorias discordantes
Variável B
Categoria 2 n21 n22 das variáveis
Outliers
▪ Mínimo = ponto adjacente inferior → menor valor na barreira inferior (BI)
BI = Q1 – 1,5 x (Q3 – Q1)
▪ Máximo = ponto adjacente superior → maior valor na barreira superior (BS)
BS = Q3 + 1,5 x (Q3 – Q1)
5
Ana Afonso 2020/2021 Estatística laboratorial CBL
Boxplots e assimetria
Sobre os outliers:
- São dados muito diferentes do resto
- Trazem informação adicional
1. Verifica-se a qualidade dos dados recolhidos
2. Se não há erros na introdução dos dados → deve ser feito um estudo com outliers e outro
sem outliers:
a. Se forem concordantes então os outliers não são influentes
b. Se forem diferentes então o estudo é inconclusivo.
Dragon Dreaming
- Abordagem específica ao processo coletivo de construção de projetos que promove o seu
sucesso e que se baseia nos seguintes princípios éticos:
o Crescimento pessoal → compromisso com o seu próprio equilíbrio e empoderamento
o Construção da comunidade → o reforço das comunidades nas quais se é uma parte
o Ao serviço da Humanidade/Terra → o reforço do bem-estrar e prosperidade de toda a
vida
6
Ana Afonso 2020/2021 Estatística laboratorial CBL
Distribuição normal
𝑋−μ
Se X ∩ N (μ , σ) então Z = ∩ 𝑁 (0,1) μ → média; σ → desvio padrão
𝜎
b. P (X > 12)
12−10
P (X > 12) = P (z > ) = P ( z > 2/4) = P ( z > 0,5) = 1 – P ( z < 0,5) = 1 – 0,6915 = 0,3085
4
7
Ana Afonso 2020/2021 Estatística laboratorial CBL
8−10 12−10
P (8 < x < 12) = P ( < 𝑧 < ) = P (-0,5 < z < 0,5) = P ( z < 0,5) – P ( z < -0,5) =
4 4
= 0,6915 – [ 1 – P ( z < 0,5) ] = 0,6915 – (1 – 0,6915) = 0,6915 – 0,3085) = 0,3820
X ∩ N (μ ; σ) X ∩ N (μ ; σ) X ∩ N (μ ; σ)
σ conhecido σ desconhecido σ desconhecido
n qualquer n ≥ 30 n < 30
σ σ σ
̅ ∩ N (μ ;
X ) ̅ ∩ N (μ ;
X ) ̅ ∩ N (μ ;
X )
√n √n √n
̅−μ
X ̅−μ
X ̅−μ
X
Z= σ ∩ N (0;1) Z= 𝑠 ∩ N (0;1) T= 𝑠′ ∩ t(n – 1)
√n √n √n
(xi − x̅)2 8
s′ = √
n − 1
∀ - população desconhecida; ∩̇ - aproximadamente
n ≥ 30 n < 30 n ≥ 30 n < 30
σ σ
̅ ∩̇ N (μ ;
X ) Métodos não ̅ ∩̇ N (μ ;
X ) Métodos não
√n √n
paramétricos paramétricos
Pelo T.L.C Pelo T.L.C
̅−μ
X ̅−μ
X
Z= σ ∩ N (0;1) ------ Z= 𝑠 ∩ N (0;1) ------
√n √n
O teorema do limite central (TLC) diz que quando o tamanho da amostra aumenta, a
distribuição da sua média aproxima-se cada vez mais de uma distribuição normal.
I. Teste bilateral:
▪ Se | z0 | ≥ z1 – α/2 → rejeita-se H0
▪ Se | t0 | ≥ tn – 1; 1 – α/2 → rejeita-se H0
9
Ana Afonso 2020/2021 Estatística laboratorial CBL
Se valor p ≤ α → rejeita-se H0
H0 verdadeira H0 falsa
Decisão correta
Erro tipo I (α) Potência do teste (1 – β)
Rejeito H0 Falso positivo Probabilidade de o teste ter
Nível de significância resultados estatisticamente
Decisão significativos
10
Ana Afonso 2020/2021 Estatística laboratorial CBL
EXEMPLO 1: num hospital foi feito um estudo onde se pretendeu saber se o nível médio de ferro
no sangue era significativamente diferente entre mulheres grávidas e não grávidas. Foram
recolhidas 2 amostras aleatórias, uma de grávidas e outra de não grávidas, e foram recolhidos os
níveis de ferro no sangue. α = 0,05.
11
Ana Afonso 2020/2021 Estatística laboratorial CBL
se valor p ≤ α então rejeita-se H0 com α = 5% (se | t0 | ≥ tr; 1 – α/2 então rejeita-se H0 com α = 5%)
Decisão: Decisão: como
como v.p = 0,002 < α = 0,05 → rejeito H0 t0 = | -3,303 | > t38; o,975 ≈ t40; 0,975 = 2,021 → rejeito H0
Conclusão: posso afirmar, para um nível de Conclusão: posso afirmar, para um nível de
significância de 5%, que o nível médio de ferro no significância de 5%, que o nível médio de ferro no
sangue é significativamente diferente entre o grupo sangue é significativamente diferente entre o grupo de
de grávidas e não grávidas. grávidas e não grávidas.
EXEMPLO 2: 2 grupos de recém-nascidos com pesos aprox. iguais foram sujeitos a 2 esquemas de
alimentação diferentes (A e B). Ao fim de 6 meses registaram-se os ganhos em peso (kg) nos 2
grupos e os resultados obtidos foram:
12
Ana Afonso 2020/2021 Estatística laboratorial CBL
Decisão: Decisão:
v.p = 0,332/2, então v.p > α → não rejeito H0 t0 = -1,006 > -t14;0,99 = -2,624 → não rejeito H0
Conclusão: não posso afirmar, para um nível de Conclusão: não posso afirmar, para um nível de
significância de 1%, que se verifique um ganho médio significância de 1%, que se verifique um ganho médio
de peso no grupo 2 significativamente superior ao de peso no grupo 2 significativamente superior ao
ganho médio de peso no grupo 1. ganho médio de peso no grupo 1.
13
Ana Afonso 2020/2021 Estatística laboratorial CBL
14
Ana Afonso 2020/2021 Estatística laboratorial CBL
Cartas de controlo
▪ Objetivo → estudar a variabilidade de um processo
▪ Gera limites de controlo → LSC e LIC
Gráfico de Levey-Jennings:
▪ Carta de controlo em que os resultados são apresentados em função do tempo e têm os limites
de 2 desvios-padrão.
▪ Foi melhorada por Henry e Segalove, passando a incluir os limites de 3 desvios-padrão, para
análise de longo prazo.
Variáveis
(informação n < 10 => média, amplitude
quantitativa)
15
Ana Afonso 2020/2021 Estatística laboratorial CBL
𝑆̅
Desvio padrão amostral: 𝜎̂ =
𝑐4
16
Ana Afonso 2020/2021 Estatística laboratorial CBL
Análise de capacidade
▪ Objetivo → estudo e melhoria da eficiência do processo
▪ Especificação → valor de referência obtido legalmente ou por opção da instituição
▪ A análise de capacidade só pode ser feita em processos estáveis, ou seja, sob controlo
estatístico
▪ Gera limites de especificação → LSE e LIE
17
Ana Afonso 2020/2021 Estatística laboratorial CBL
LSE − X̅ ̅X − LIE
Cpk = min { ; } = min { ̂ ̂i }
Cps ; Cp
3 .σ
̂ 3 .σ
̂
̅|
|m−X
Medida do desvio do processo relativamente ao alvo: k = LSE−LIE
2
𝐿𝑆𝐸 − 𝐿𝐼𝐸
𝐶𝑝𝑚 = 𝜏 2 = 𝜎 2 + (𝜇 − 𝑚)2
6 .𝜏
18
Ana Afonso 2020/2021 Estatística laboratorial CBL
Especificações bilaterais:
Especificações unilaterais:
Exemplo 1: a humidade relativa num dado local é esperada situar-se entre 65% e 85%. Amostras
aleatórias recolhidas durante uma semana permitiram registar os seguintes valores em
percentagem: 60, 78, 70, 84, 81, 80, 85, 60, 88, 75.
Determina e interpreta o índice de capacidade do processo. O alvo corresponde ao ponto médio da
amplitude de especificação, ou seja, 75%.
𝑥̅ = 76,1
s = 9,905
LSE − LIE 0,85 − 0,65 0,20
̂ =
𝐶𝑝 = = = 0,337
6×s 6 × 9,905 59,43
R: como o índice de capacidade tem um valor inferior a 1, então conclui-se que o processo não é
potencialmente capaz de funcionar bem dentro das especificações. Como está descentrado à
direita, sabe-se que este índice está a sobrevalorizar a capacidade potencial do processo, não
sendo o mais adequado para avaliação da situação.
19
Ana Afonso 2020/2021 Estatística laboratorial CBL
Tabelas de contingência
▪ Tabelas de dupla entrada com 2 variáveis
20
Ana Afonso 2020/2021 Estatística laboratorial CBL
Testes do Qui-Quadrado
Independência Homogeneidade
• 1 amostra • 2 ou mais amostras independentes
• 2 variáveis qualitativas com: • 1 variável qualitativa com:
o Categorias exaustivas → o Categorias exaustivas
permitem que qualquer observação o Mutuamente exclusivas
seja incluída em qualquer categoria • Dados na forma de frequências
o Mutuamente exclusivas → não • Não mais de 20% de células com eij < 5
podem ocorrer ao mesmo tempo
• Dados na forma de frequências
• Não mais de 20% de células com eij < 5
H1: as variáveis não são independentes H1: as populações não são homogéneas
Se a última regra não for respeitada, então usa-se o teste exato de Fisher !
Se χ02 ≥ χ2(r – 1).(c – 1); 1 - α => rejeita-se H0 Valor p = P (χ02 ≥ χn2) = 1 – P (χ02 < χn2)
Se χ02 < χ2(r – 1).(c – 1); 1 - α => não se rejeita H0 Se valor p ≤ α => rejeita-se H0
r → nº linhas da tabela
c → nº colunas da tabela
21