Você está na página 1de 38

BIOESTATÍSTICA

Adan Lucio Pereira

adanlucio@gmail.com

https://sites.google.com/site/adanluciop/

Vitória - ES
Bibliografia Básica e Complementar
Objetivos da Aula

Apresentar os o Conceito de
Correlação e Regressão .
Estudos Estatísticos
Mineração: Etapa central do Análise do
processo de Descoberta de Resultado
Conhecimento
Mineração
Pré-preocessamento

Transformação

Limpeza

Seleção

Banco de
Dados 4
Diagrama de Dispersão

Então cada unidade da amostra fornece dois valores numéricos, um


referente à variável X, outro referente à variável Y.

X: 25 28 31 34 37 Y: 17 23 30 39 46

• a) Existe relação entre as variáveis X e Y?


• b) Que tipo de relação existe entre elas?
• c) Qual é o grau da relação?
Diagrama de Dispersão

Variável: características ou itens de interesse de cada elemento de uma população


ou amostra. Também chamada parâmetro, posicionamento, condição.

Duas variáveis estão relacionadas se a mudança de uma provoca a mudança na


outra. Exemplo: velocidade x consumo combustível

6
Diagrama de Dispersão

Variável: características ou itens de interesse de cada elemento de uma população


ou amostra. Também chamada parâmetro, posicionamento, condição.

Duas variáveis estão relacionadas se a mudança de uma provoca a mudança na


outra. Exemplo: velocidade x consumo combustível

7
Diagrama de Dispersão

• Um diagrama de dispersão mostra a relação entre duas variáveis quantitativas,


medidas sobre os mesmos indivíduos.
• Os valores de uma variável aparecem no eixo horizontal, e os da outra, no eixo
vertical.
• Comumente, coloca-se no eixo x um parâmetro
• Cada indivíduo aparece como o ponto do gráfico definido pelos valores de ambas
as variáveis para aquele indivíduo

8
Diagrama de Dispersão

1. Trace um sistema de eixos cartesianos e represente uma variável em cada eixo.


2. Estabeleça as escalas de maneira a dar ao diagrama o aspecto de um quadrado.
3. Escreva os nomes das variáveis nos respectivos eixos e faça, depois, as graduações.
4. Desenhe um ponto para representar cada par de valores das variáveis.

O gráfico assim obtido é chamado diagrama de dispersão. O diagrama de dispersão permite visualizar
a relação entre duas variáveis. Se X e Y crescem no mesmo sentido, existe uma correlação positiva
entre as variáveis. Se X e Y variam em sentidos contrários, existe correlação negativa entre as
variáveis.

9
Diagrama de Dispersão

Exemplo: Vinte e cinco pacientes


são atendidos em uma clínica
oftalmologica e os seguintes valores
são registrados para pressão intra-
ocular (PIO) e idade:

10
Diagrama de Dispersão

Exemplo: Vinte e cinco pacientes


são atendidos em uma clínica
oftalmologica e os seguintes valores
são registrados para pressão intra-
ocular (PIO) e idade:

11
Diagrama de Dispersão
Através do diagrama de dispersão é
possível observar que, em geral,
valores de idade mais altos são
associados com valores de pressão
intra-ocular mais altos (as
variáveis parecem relacionadas).

I. Qual o tipo da relação entre as variáveis Idade e


PIO?
II. Qual a forca desta relação?
III. Esta relação e estatisticamente significativa?

12
Diagrama de Dispersão

• Um diagrama de dispersão mostra a relação entre duas variáveis quantitativas,


medidas sobre os mesmos indivíduos.
• Os valores de uma variável aparecem no eixo horizontal, e os da outra, no eixo
vertical.
• Comumente, coloca-se no eixo x um parâmetro
• Cada indivíduo aparece como o ponto do gráfico definido pelos valores de ambas
as variáveis para aquele indivíduo

13
Correlação

A correlação será

tanto maior
quanto menor
for a dispersão
dos pontos.

14
Correlação

15
Correlação
Correlação
Pode acontecer, no entanto, de a variação
de Y não estar relacionada com a variação
de X. Nesses casos, o diagrama de
dispersão mostra que X cresce e Y varia
ao acaso. Dizemos, então, que a
correlação entre as variáveis é nula ou, o
que é o mesmo, que não existe correlação
entre as variáveis.

17
Correlação

• O coeficiente de correlação (r) representa a relação entre duas ou mais variáveis. O


valor de r está sempre entre –1 e +1.
• Quando r = 0 não há correlação entre as variáveis. correlação positiva quando r > 0;
• correlação negativa quando r < 0. Em geral, um coeficiente maior que 0,3 é suficiente
para indicar correlação.

18
Correlação

19
Correlação

20
Correlação

21
Correlação

22
Correlação

23
Correlação

24
Correlação

Existe Correlação
entre X e Y !

25
Correlação

Para calcular o coeficiente de correlação, é preciso que algumas pressuposições estejam


satisfeitas.

1. As unidades medidas foram selecionadas ao acaso - ou, pelo menos - são


representativas de uma grande população.

2. Cada unidade deve fornecer tanto valores de X como de Y.

3. As variáveis X e Y devem ser medidas independentemente. Se os valores de Y foram


obtidos por uma fórmula que inclui X, o coeficiente de correlação nunca será zero.

26
Correlação

O diagrama de dispersão dá ideia da relação entre duas variáveis. O coeficiente de


correlação de Pearson mede apenas a relação linear entre duas variáveis numéricas. Mas
para que o valor de r, estudado aqui, tenha significado, é preciso que, no diagrama de
dispersão, os pontos estejam espalhados em tomo de uma linha reta. Portanto, antes de
calcular o valor de r, convém desenhar um diagrama de dispersão: se a relação não for
linear, o valor de r não mede a relação entre as variáveis

correlação não implica causa. Uma correlação positiva entre duas variáveis mostra que essas
variáveis crescem no mesmo sentido, mas não indica que aumentos sucessivos em uma das
variáveis causam aumentos sucessivos na outra variável

27
Gráfico de Linhas

Quando se estuda a variação da variável Y em função da variável X, diz –se que Y é a


variável dependente e que X é a variável explanatória.

Por exemplo, altura de criança varia em função da idade. Então altura é a variável
dependente e idade é a variável explanatória.

28
Gráfico de Linhas

Colete valores da variável Y nos tempos que você quer estudar.


• Trace um sistema de eixos cartesianos; represente o tempo (X) no eixo
das abscissas e a variável Y no eixo das ordenadas.
• Estabeleça as escalas e faça, em cada eixo, as necessárias graduações.
• Escreva os nomes das variáveis nos respectivos eixos.
• Desenhe um ponto para representar cada par de valores (X, Y).
• Una os pontos por segmentos de reta.
• Escreva o titulo.

29
Gráfico de Linhas

1940 41.236.315
1950 51.944.397
1960 70.191.370
1970 93.139.037
1980 119.002.706
1991 145.815.796
2000 169.799.170

30
Reta de Regressão

• A Análise de Regressão é o processo matemático para calcular os


parâmetros “a” e “b” de uma função f (X).

Y=a+bX
• Estes parâmetros determinam as características da função que
relaciona ‘Y’ com ‘X’.

• No caso do modelo linear esta função é representada por uma reta


chamada de reta de regressão.

31
Reta de Regressão

No sistema de eixos cartesianos, a equação Y = a + bX é uma reta. O coeficiente linear da


reta, indicado neste livro por a, dá a altura em que a reta corta o eixo das ordenadas. Se a
for um número:
• positivo, a reta corta o eixo das ordenadas acima da origem;
• negativo, a reta corta o eixo das ordenadas abaixo da origem.
• zero, a reta passa na origem do sistema de eixos cartesianos

32
Reta de Regressão

O coeficiente angular da reta b, dá a inclinação


da reta. Se b for um número:
• positivo, a reta é ascendente;
• negativo, a reta é descendente;
• zero, a reta é paralela aos eixos das abscissas.

33
Reta de Regressão

O coeficiente angular da reta é obtido por meio da fórmula:

E o coeficiente linear é obtido por meio da fórmula, considerando Xbarra e Ybarra como unidades de X e Y:

34
Reta de Regressão

35
Reta de Regressão

Para traçar a reta de regressão é


preciso dar valores arbitrários para
X e depois calcular os valores de· Y.
Reta de Regressão
Reta de Regressão

O coeficiente de determinação é a proporção da variação de Y explicada pela variação de X.

O coeficiente de determinação é dado pelo quadrado do coeficiente de correlação. Não


pode, portanto, ser negativo. Varia entre zero e 1, inclusive. Para interpretar o coeficiente
de determinação, é melhor transformá-lo em porcentagem, multiplicando o resultado
obtido em seu cálculo por 100.

Você também pode gostar