Escolar Documentos
Profissional Documentos
Cultura Documentos
E DISTRIBUIÇÃO NORMAL
Estatística Descritiva
• Organizar, classificar, descrever e
comunicar dados
• Medidas de tendência central ou de
posição
• Média
• Mediana
• Quartil
• Moda
Estatística Descritiva
• Média
• Moda
• Mediana
• Quartis
Box Plot
Estatística Descritiva
• Histograma
Medidas de Dispersão
• Variância
• Desvio Padrão
• A variância não pode ser apresentada com a mesma unidade que
a variável medida (é quadrática).
• Raiz quadrada da variância.
plot e hist
• plot: plota vetores de pontos em um plano cartesiano (x,y)
> hist(y)
> hist(barcodes$bar_01)
> hist(log2(barcodes$bar_01))
Exercício
1. Leia o arquivo “barcodes.txt”, que está separado por
tab, com cabeçalho, sinalizando que o nome das linhas
está na 1ª linha do arquivo e que o valor
stringAsFactors é falso, atribua à variável barcodes.
2. Normalize os dados da tabela pra um milhão
3. Calcule média e desvio padrão da quantidade de reads
das amostras 7 e 8.
4. Faça dois boxplots indicando como está a distribuição
dos reads nos barcodes 7 e 8. Refaça os boxplots
utilizando escala Log
5. Faça os histogramas das duas amostras.
Distribuição Normal
1. A curva normal tem a forma de um sino, com caudas
assintóticas ao eixo x.
2. A curva é simétrica em relação à perpendicular que passa
pela média (μ).
3. A média, a mediana e a moda são coincidentes.
4. A curva tem dois pontos de inflexão, que correspondem a
valores de x situados, respectivamente, à distância de um
desvio padrão (σ) acima e abaixo da média
5. A área sob a curva totaliza 1.
6. Aproximadamente 68% (~2/3) dos valores de x situam-se
entre os pontos (μ - σ) e (μ + σ).
7. Aproximadamente 95% dos valores de x estão entre (μ-2σ) e
(μ+2σ).
8. Aproximadamente 99,7% dos valores de x estão entre (μ-3σ)
e (μ+3σ).
Distribuição Normal
• Fórmula
• Em R
x = seq(-6,6,by=0.01)
s = 1
m = 0
y = exp(-((x-m)^2)/(2*s^2))/(s*sqrt(2*pi))
help (dnorm)
dnorm(x, mean = 0, sd = 1) #Densidade - pdf
pnorm(q, mean = 0, sd = 1) #Cumulative - cdf
qnorm(p, mean = 0, sd = 1) #quantil
rnorm(n, mean = 0, sd = 1) #números aleatórios da dist
Distribuição Normal
• Na prática:
• Área da curva em q
pnorm(q, mean = 0, sd = 1) #Cumulative - cdf
pnorm(m, mean = m, sd = s)
qnorm(0.5, mean = m, sd = s)
v = rnorm(1000, mean = m, sd = s)
hist(v)
par(new = T)
plot(x,y, type = 'l')
Transformar x em z
• X – variável que representa o valor observado
• Z – conversão do valor observável para a normal teórica
(μ = 0; σ = 1)
• Converter x em z
z = (180 – 175)/6 à z = 0,83
• A reposta será:
1 – (0,5+0,2967) = 0,2033 ou 20,33%
Em R:
pnorm(180,mean=175,sd=6,lower.tail = F)
OU
1 - pnorm(180,mean = 175, sd = 6)
Exemplo 2
• No desenvolvimento da mosca-das-frutas, Drosophila melanogaster,
o tempo decorrido entre a ovoposição e a emergência do adulto na
sequência ovo-larva-pupa-adulto, é de 273 horas em medial, com
desvio padrão de 20 horas. Suponha que um geneticista deseje
selecionar 10% da população, correspondendo aos indivíduos que
emergem por primeiro, para desenvolver uma população precoce.
Qual o tempo-limite a partir do qual os indivíduos que nascem não
interessam mais ao pesquisador?
• Livro: Bioestatística
• Pag.: 187 – Ex.: 10; 11; 12; 13; 14
Distribuição Amostral das Médias
• Amostras grandes, de igual tamanho, retiradas
aleatoriamente de uma população, distribuem-se
segundo uma curva normal, não importando como se
distribuem os dados na população original.
• O erro padrão da média estima a variabilidade entre
médias. Ele leva em consideração o tamanho amostral e
é dado por:
• Livro Bioestatística
• 15; 16; 18.
• Livro Bioestatística
• 15; 16; 18.