Correlação e Regressão

UNIVERSIDADE ABERTA ISCED
Faculdade de Ciências de Educação
Curso de Licenciatura em Ensino de Biologia
Resumo
Nome do aluno: Código do estudante
Xai-xai, Abril, 2022

UNIVERSIDADE ABERTA ISCED
Faculdade de Ciências de Educação
Curso de Licenciatura em Ensino deBiologia
Resumo
Trabalho de Campo a ser submetido na

Coordenação do Curso de Licenciatura
em Ensino de Ensino de Biologiaa da
UnISCED.
Tutor: (Nome do Tutor)
Nome do aluno: Código do estudante
Xai-xai, Abril, 2022

Índice
1.0 Introdução.............................................................................................................................2
1.1. Objectivos............................................................................................................................2
1.1.1. Geral..................................................................................................................................2
1.1.2. Específicos........................................................................................................................2
2.0 Metodologia..........................................................................................................................2
3.0 Distribuições Bidimensionais...............................................................................................3
3.1. Correlação............................................................................................................................3
3.2. Diagrama de Dispersão........................................................................................................3
3.3. Correlação Linear.................................................................................................................4
3.4. Coeficiente de Correlação Linear........................................................................................5
3.5. Regressão Linear Simples....................................................................................................7
3.7. Estimação dos Parâmetros – Método dos Mínimos Quadrados...........................................8
3.8. Coeficiente De Determinação Ou Explicação...................................................................11
4.0 Probabilidade......................................................................................................................12
4.1. Modelos..............................................................................................................................12
4.2. Modelo Determinístico......................................................................................................12
4.3. Modelo Não-Determinístico Ou Probabilístico.................................................................12
4.4. Experimento Aleatório (Não-Determinístico)...................................................................12
4.5. Características Dos Experimentos Aleatórios....................................................................13
4.6. O Espaço Amostral............................................................................................................13
4.7. Classificação De Um Espaço Amostral.............................................................................13
4.8. Conceitos De Probabilidade...............................................................................................14
4.9. Definição Clássica De Probabilidade.................................................................................14
4.10. Definição de probabilidade como frequência relativa.....................................................15
4.11. Definição Axiomática De Probabilidade.........................................................................15
4.13. Teorema Da Multiplicação..............................................................................................18
4.14. Independência De Dois Eventos......................................................................................18
4.17. Teorema de Bayes............................................................................................................19
5.0 Conclusão............................................................................................................................21
6.0 Referências Bibliográficas..................................................................................................22
2
1.0 Introdução
O nosso cotidiano é repleto de escolhas e decisões que melhor se adequam à situação a qual
estamos. Sejam essas decisões e escolhas empíricas assim como não.
Assim, o trabalho faz a síntese de alguns tipos de escolhas que fazemos no dia-a-dia
(probabilísticas ou casuais) que em estatística faz parte do ramo probabilidade ao qual
norteará o trabalho bem como a correlação e regressão, as quais a primeira estuada a relação
de duas ou mais variáveis e a correlação faz o estudo do quão é eficiente ou significativa a
referida correlação através da recta de melhor ajuste chamada de recta de regressão.
1.1. Objectivos
1.1.1. Geral
 Desenvolver os tópicos Distribuições Bidimensionais e Probabilidade;
1.1.2. Específicos
 Descrever Distribuições Bidimensionais;
 Conceituar Probabilidade e a lei de grandes números;
 Mencionar os axiomas de probabilidades
2.0 Metodologia
Para a realização do presente trabalho recorreu-se á pesquisa bibliográfica que consiste na
consulta de informação em material já publicado e analisado.
3
3.0 Distribuições Bidimensionais

3.1. Correlação
Segundo UNIPAN (2001), uma correlação é uma relação entre duas variáveis.
Assim, os dados podem ser representados por pares ordenados (x , y ) , sendo x a variável
independente (ou explanatória) e y a variável dependente (ou resposta).
Sendo a relação entre as variáveis de natureza quantitativa, a correlação é o instrumento
adequado para descobrir e medir essa relação.
3.2. Diagrama de Dispersão

Consideremos uma amostra aleatória, formada por dez dos 98 alunos de uma classe do
Instituto Superior de Gestão de Negócios, curso de biologia, e pelas notas obtidas por eles em
Matemática e Estatística.
Representando, em um sistema coordenado cartesiano ortogonal, os pares ordenados (x i ; y i )

Obtemos uma nuvem de pontos que denominamos diagrama de dispersão. Esse diagrama nos
fornece uma ideia grosseira, porém útil, da correlação existente:
4
3.3. Correlação Linear

Os pontos obtidos, vistos em conjunto, formam uma elipse em diagonal.
Podemos imaginar que, quanto mais fina for a elipse, mais ela se aproximará de uma recta.
Dizemos, então, que a correlação de forma elíptica tem como imagem uma recta, sendo, por
isso, denominada correlação linear (Morettin, 2010).
É possível verificar que a cada correlação está associada como imagem uma relação
funcional. Por esse motivo, as relações funcionais são chamadas relações perfeitas.
Como a correlação em estudo tem como imagem uma recta ascendente, ela é chamada
correlação linear positiva.
Isto é, as relações do tipo perímetro de uma figura e seu respectivo lado são conhecidas como
relações funcionais e as do tipo peso-estatura, como relações estatísticas.
Quando duas variáveis estão ligadas por uma relação estatística, dizemos que existe
correlação entre elas.
Assim, de acordo com UNIPAN (2001), uma correlação é: linear positiva se os pontos do
diagrama têm como imagem uma recta ascendente;
a) Linear negativa se os pontos têm como imagem uma recta descendente;
b) Não-linear se os pontos têm como imagem uma curva.
Se os pontos apresentam-se dispersos, não oferecendo uma imagem definida, concluímos que
não há relação alguma entre as variáveis em estudo.
5
Figura 1: Ilustração da correlação e não correlação
Fonte: UNIPAN (2001)
3.4. Coeficiente de Correlação Linear

O instrumento empregado para a medida da correlação linear é o coeficiente de correlação.
Esse coeficiente deve indicar o grau de intensidade da correlação entre duas variáveis e,
ainda, o sentido dessa correlação (positivo ou negativo).
Faremos o uso do coeficiente de correlação de Pearson, que é dado por:
Onde n é o número de observações.

Os valores limites de r são – 1 e +1, isto é, o valor de r pertence ao intervalo [-1, +1].
Assim:
a) Se a correlação entre duas variáveis é perfeita e positiva, então r = +1;
b) Se a correlação é perfeita e negativa, então r = -1;
c) Se não há correlação entre as duas variáveis, então r = 0.
Logicamente, na óptica de UNIPAN (2001):
a) Se r = +1, há uma correlação perfeita e positiva entre as variáveis;
b) Se r = -1, há uma correlação perfeita e negativa entre as variáveis;
c) Se r = 0, ou não há correlação entre as variáveis, ou a relação que porventura exista
não é linear.
6
O modo mais prático para obtermos ré abrir, na tabela, colunas correspondentes aos valores
de , e
Logo
Daí r = 0,91, resultando que indica uma correlação linear positiva altamente significativa
entre as duas variáveis.
Para que uma relação possa ser descrita por meio do coeficiente de correlação de Pearsoné
imprescindível que ela se aproxime de uma função linear.
Uma maneira prática de verificarmos a linearidade da relação é a inspeção do diagrama de
dispersão: se a elipse apresenta saliências ou reentrâncias muito acentuadas, provavelmente
trata-se de correlação curvelínea.
Para podermos tirar algumas conclusões significativas sobre o comportamento simultâneo das
variáveis analisadas, é necessário que:
Se ≤1
Se <0,6 há correlação relativamente fraca entre as variáveis.
Se 0,3< <0,3, a correlação é muito fraca e, praticamente, nada podemos concluir sobre a
relação entre as variáveis em estudo.
7
3.5. Regressão Linear Simples

Segundo UNIPAN (2001), o termo regressão foi introduzido em fins do século 19, por Sir
Francis Galton, provavelmente interessado em responder à seguinte indagação: é possível
prever a altura de filhos com base nas alturas dos pais? Após colectar pares de alturas de pais
e respectivos filhos, ele verificou que pais altos têm filhos altos, mas em média não tão altos,
o mesmo acontecendo com pais baixos, o que deu a ele a impressão de que havia uma
“regressão” das alturas para um valor médio de altura.
Este termo ficou então de uso corrente, embora provavelmente não seja o mais adequado.
A análise de regressão é uma das técnicas mais utilizadas para investigar e modelar o
relacionamento existente entre as diversas variáveis de um processo.
Sua utilização vem se aplicando a cada dia, principalmente devido ao fato de a análise de
regressão ser baseada na ideia relativamente simples de se empregar uma equação para
expressar o relacionamento entre as variáveis de interesse.
A análise de regressão processa as informações contidas em um conjunto de dados de forma a
gerar um modelo que represente o relacionamento existente entre as variáveis de interesse de
um processo.
De maneira geral, a análise de regressão pode ser utilizada com vários objectivos, dentre os
quais é possível destacar: descrição, predição, controle e estimação.
3.6. O Modelo de Regressão Linear Simples

O modelo de regressão linear simples é aquele que contém apenas uma variável explicativa.
Sua forma básica é a seguinte:
Onde:
Yi é a variável dependente;
Xi é a variável independente ou explicativa;
ei é o erro aleatório;
β0 é o coeficiente linear e β1 é o coeficiente de regressão ou coeficiente declividade), ambos
são parâmetros desconhecidos e a serem estimados;
n indica o tamanho da amostra e o índice refere-se à unidade de observação dos valores das
variáveis.
Os parâmetros β0 e β1 da equação poderão ser estimados a partir de valores amostrais das
variáveis Yi e Xi
8
3.7. Estimação dos Parâmetros – Método dos Mínimos Quadrados

Seja o modelo estatístico de regressão linear
Onde os β0 e β1 são parâmetros desconhecidos. Este modelo será estimado por ,
onde e são estimadores de β0 e β1 e é o valor predito de (dado Xi).
O erro estimado é a diferença entre um valor observado e valor correspondente ,
estimado pela recta ajustada e é definido por: .

A soma dos quadrados dos erros é:
O método de mínimos quadrados consiste em estimar e de forma tal que minimiza a

soma do quadrado dos erros (ou soma do quadrado dos resíduos), isto é, minimizar SQE =
minimizar:
Que significa derivar esta expressão parcialmente com respeito a cada um dos parâmetros β 0 e
β1. As estimativas e e que tornam mínima a SQE, são aquelas que anulam as
derivadas parciais, ou seja:
Desenvolvendo a somatória obtemos o seguinte sistema de equações, chamado de equações

normais:
9
Resolvendo-se este sistema de equações para β0 e β1, obtém-se os seguintes estimadores de

mínimos quadrados dos parâmetros β0 e β1.
Assim, a equação de regressão linear fica da forma:
Exemplo: Desejamos estudar a relação entre a variável Preço de um determinado produto e a

quantidade do produto vendida.
Neste exemplo, temos X: Preço (variável independente) e Y: Quantidade vendida (variável

dependente).
Vamos, então, construir o diagrama de dispersão para as variáveis X e Y.
Observando o diagrama de dispersão, para os dados do exemplo, percebemos que uma recta
parece ajustar-se bem aos dados; sendo assim, tentaremos ajustar um modelo de regressão
linear para os mesmos.
Identifiquemos, agora, o modelo a ser ajustado para as variáveis X e Y.
Onde: Yi é a variável dependente (Quantidade vendida);

Xi é a variável independente ou explicativa (preço);
10
ei é o erro aleatório;
β0 é o coeficiente linear;
β1 é o coeficiente de regressão ou coeficiente declividade ou coeficiente angular.
Os parâmetros β0, β1 da equação acima poderão ser estimados a partir de valores amostrais das
variáveis Yi e Xi, dados na tabela de dados do exemplo.
Logo a recta ajustada para dos dados tem a forma
O diagrama de dispersão, com a recta ajustada, é apresentado abaixo

11
3.8. Coeficiente De Determinação Ou Explicação
Podemos estimar a qualidade de um modelo ajustado através do coeficiente de determinação

(R2). Este coeficiente pode ser calculado através da seguinte equação.
Onde n é o número de observações realizadas.
Exemplo: Calcule o coeficiente de determinação (R2) para os dados do exemplo. Para

calcularmos o coeficiente de determinação utilizamos o seguinte dispositivo prático.
12
O coeficiente R2 pode ser expresso em termos percentuais. Portanto, o modelo ajustado no

exemplo apresenta um coeficiente de determinação R2 = 84,64%. Ou seja, o modelo ajustado
conseguiu explicar 84,64% da variabilidade da variável dependente Y.
13
4.0 Probabilidade
4.1. Modelos
Segundo Morettin (2010), toda a vez que se emprega Matemática com a finalidade de estudar
algum fenómeno deve-se começar por construir um modelo matemático. Estes modelos
podem ser: determinísticos ou então probabilísticos.
4.2. Modelo Determinístico
Neste modelo as condições sob as quais o experimento é executado, determinam o resultado

do experimento. Tome-se, por exemplo, a lei de Ohm, V = R.I. Se R e I forem conhecidos,
então V estará precisamente determinado.
4.3. Modelo Não-Determinístico Ou Probabilístico
É um modelo em que de antemão não é possível explicitar ou definir um resultado particular.

Este modelo é especificado através de uma distribuição de probabilidade. É utilizado quando
se tem um grande número de variáveis influenciando o resultado e estas variáveis não podem
ser controladas. Tome-se por exemplo, o lançamento de um dado onde se tenta prever o
número da face que irá sair, a retirada de uma carta de um baralho, etc.
O modelo estocástico é caracterizado como um modelo probabilístico que depende ou varia

com o tempo.
4.4. Experimento Aleatório (Não-Determinístico)
Não existe uma definição satisfatória de Experimento Aleatório.
Por isto é necessário ilustrar o conceito um grande número de vezes para que a ideia fique
bem clara. Convém lembrar que os exemplos dados são de fenómenos para os quais modelos
probabilísticos são adequados e que por simplicidade, são denominados de experimentos
aleatórios quando, de fato, o que deveria ser dito é “modelo não-determinístico aplicado a um
experimento”.
Ao descrever um experimento aleatório deve-se especificar não somente que operação ou

procedimento deva ser realizado, mas também o que é que deverá ser observado.
14
4.5. Características Dos Experimentos Aleatórios
As características comuns são:
 Podem ser repetidos indefinidamente sob as mesmas condições;
 Não se pode adiantar um resultado particular, mas pode-se descrever todos os

resultados possíveis;
 Se repetidos muitas vezes apresentarão uma regularidade em termos de frequência de

resultados.
4.6. O Espaço Amostral
Definição
Segundo Morettin (2010), é o conjunto de todos os resultados possíveis de um experimento

aleatório. Anota-se por S, E ou W, .
Exemplo: Determinar o espaço amostral dos experimentos abaixo:
a) Joga-se um dado e observa-se o número obtido na face superior.
S ={1, 2, 3, 4, 5, 6};
b) Joga-se uma moeda 4 vezes e observa-se a sequência de caras e coroas;
= {cccc, ccck, cckc, ckcc, kccc, cckk, kkcc, ckck, kckc, kcck, ckkc, ckkk, kckk, kkck, kkkc,
kkkk};
Ao descrever um espaço amostral de um experimento, deve-se ficar atento para o que se está
observando ou mensurando. Deve-se falar em “um” espaço amostral associado a um
experimento e não de “o” espaço amostral. Deve-se observar ainda que nem sempre os
elementos de um espaço amostral são números.
4.7. Classificação De Um Espaço Amostral
O espaço amostral pode ser classificado em:
a) Finito. Quanto tem fim;
b) Infinito. Quando não tem fim e este por sua vez pode ser:
i) Enumeráveis (ou contáveis)

15
ii) Não-enumeráveis (ou não contáveis)
Eventos
Qualquer subconjunto de um espaço amostral S é denominado um evento.
Assim tem-se que:
S é o evento certo;
{a} é o evento elementar;
∅ é o evento impossível.
4.8. Conceitos De Probabilidade
Existem três formas de se definir probabilidade. A definição clássica, a definição freqüencial

e a definição axiomática (Morettin, 2010).
4.9. Definição Clássica De Probabilidade
Seja E um experimento aleatório e S um espaço amostral associado formado por “n”
resultados igualmente prováveis. Seja um evento com “m” elementos. A probabilidade
de A, anotada por P (A), lê-se pe de A, e é definida como sendo Isto é,a

probabilidade do evento A é o quociente entre o número “m” de casos favoráveis e o número
“n” de casos possíveis.
Exemplo: Calcular a probabilidade de, no lançamento de um dado equilibrado, obter-se:
a) Um resultado igual a 4;
b) Um resultado ímpar.
16
4.10. Definição de probabilidade como frequência relativa
Na prática acontece que nem sempre é possível determinar a probabilidade de um evento.

Neste caso é necessário ter um método de aproximação desta probabilidade. Um dos métodos
utilizados é a experimentação que objectiva estimar o valor da probabilidade de um evento A
com base em valores reais. A probabilidade avaliada através deste processo é denominada de
probabilidade empírica.
Frequência relativa de um evento: Seja E um experimento e A um evento de um espaço

amostral associado ao experimento E. Suponha-se que E seja repetido “n” vezes e seja “m” o
número de vezes que A ocorre nas “n” repetições de E. Então a frequência relativa do evento
A, anotada por frA, é o quociente:
Exemplo
i) Uma moeda foi lançada 200 vezes e forneceu 102 caras. Então a frequência
relativa de “caras” é:
ii) Um dado foi lançado 100 vezes e a face 6 apareceu 18 vezes. Então a frequência
relativa do evento A = {face 6} é:
4.11. Definição Axiomática De Probabilidade
Seja E um experimento aleatório com um espaço amostral associado S. A cada evento

associa-se um número real, representado por P (A) e denominado “probabilidade de A”, que
satisfaz as seguintes propriedades (axiomas):
17
4.12. Probabilidade Condicionada E Independência
Suponha-se que se quer extrair duas peças ao acaso de um lote que contém 100 peças das
quais 80 peças são boas e 20 defeituosas, de acordo com os critérios (a) com reposição e (b)
sem reposição. Define-se os seguintes eventos: A = {A primeira peça é defeituosa} e B = {A
segunda peça é defeituosa}.
18
Definição
Na óptica de Morettin (2010), dado A e B dois eventos de um espaço amostral S, associado a

um experimento E, onde P (A)> 0. A probabilidade de B ocorrer condicionada a A ter
ocorrido, será representada por P (B|A), e lida como: “probabilidade de B dado A” ou
“probabilidade de B condicionada a A”, e calculada por:
19
No exemplo acima então P (B I A) = , Pois se A ocorreu (isto é, se saiu defeituosa na
99
primeira retirada) existirão na urna 99 peças das quais 19 são defeituosas.
Sempre que se calcular P (B|A) está se calculando a probabilidade de ocorrência do evento B

em relação ao espaço amostral reduzido A, ao invés de faze-lo em relação ao espaço amostral
original S.
Quando se calcula P (B) está se calculando a probabilidade de estar em B, sabendo-se que se

está em S, mas quando se calcula P (B|A) está calculando a probabilidade de B, sabendo-se
que se está em A agora e não mais em S, isto é, o espaço amostral fica reduzido de S para A.
É simples verificar as seguintes propriedades de P (B|A) para A fixado:

19
4.13. Teorema Da Multiplicação
Com o conceito de probabilidade condicionada é possível apresentar uma maneira de se

calcular a probabilidade da intersecção de dois eventos A e B em função destes eventos. Esta
expressão é denominada de teorema da multiplicação.
4.14. Independência De Dois Eventos
Sejam A e B dois eventos de um espaço amostral S. A e B são ditos independentes se a

probabilidade de um deles ocorrer não afectar a probabilidade do outro ocorrer, isto é, se:
4.1.5. Teoremas Da Probabilidade Total E De Bayes
O conceito de probabilidade condicionada pode ser utilizado para calcular a probabilidade de

um evento simples A ao invés da probabilidade da intersecção de dois eventos A e B. Para
tanto é necessário o conceito de partição de um espaço amostral.
Definição: Segundo Morettin (2010), diz-se que os conjuntos A1, A2, ..., An eventos de um
mesmo espaço amostral S, formam uma partição deste espaço se
4.16. Teorema da probabilidade total

Considere-se um espaço amostral S e A 1, A2, ..., An uma partição deste espaço amostral. Seja
B um evento de S. Então B, pode ser escrito como (A figura acima ilustra a partição com n =
8):
20
Exemplo: Uma determinada peça é manufaturada por 3 fábricas: A, B e C. Sabe-se que A

produz o dobro de peças que B e que B e C produzem o mesmo número de peças.
Sabe-se ainda que 2% das peças produzidas por A e por B são defeituosas, enquanto que 4%
das produzidas por C são defeituosas. Todas as peças produzidas são misturadas e colocadas
em um depósito. Se do depósito for retirada uma peçaao acaso, qual a probabilidade de que
ela seja defeituosa? Solução:
Considerem-se os seguintes eventos:
D = {A peça é defeituosa}, A = {A peça provém da fábrica A}, B = {A peça provém da
máquina B} e C = {A peça provém da máquina C}.
Tem-se então que: P (A) = 50%, P (B) = P (C) = 25%, uma vez que só existem as 3 fábricas e
que A produz o dobro de B e esta por sua vez produz a mesma quantidade que C. Sabe-se
também que P (D|A) = P (D|B) = 2% e que P (D|C) = 4%.
Pela teorema da probabilidade total pode-se escrever que: P (D) = P (A).P (D|A) + P (B).P (D|
B) + P (C).P (D|C) = 0,5.0,02 + 0,25.0,02 + 0,25.0,04 = 2,50% pois A, B e C formam uma
partição do espaço amostral S.
4.17. Teorema de Bayes

Suponha-se que no exemplo 2.7 i), uma peça é retirada do depósito e se verifica que é
defeituosa. Qual a probabilidade de que tenha sido produzida pela fábrica A? ou B? ou ainda
C?
Neste caso, o que se quer calcular é a probabilidade condicionada P (A|D). Pela notação já
vista acima, e generalizando a questão o que se está interessado em obter é a probabilidade de
ocorrência de um dos Ai dado que B ocorreu, isto é, o que se quer é saber o valor de P (Ai|B),
onde os eventos A1, A2, ..., An formam uma partição de S e B é um evento qualquer de S.
Aplicando a definição de probabilidade condicionada segue que:
21
22
5.0 Conclusão
Durante a realização do trabalho, constatei que Uma correlação é uma relação entre duas
variáveis e esta pode ser correlação linear negativa se os pontos têm como imagem uma recta
descendente, não-linear se os pontos têm como imagem uma curva. De tal forma que:
 Se r = +1, há uma correlação perfeita e positiva entre as variáveis;
 Se r = -1, há uma correlação perfeita e negativa entre as variáveis;
 Se r = 0, ou não há correlação entre as variáveis, ou a relação que porventura exista
não é linear.
A análise de regressão é uma das técnicas mais utilizadas para investigar e modelar o
relacionamento existente entre as diversas variáveis de um processo.
Nas probabilidades constatou-se que existem três formas de se definir probabilidade. A

definição clássica, a definição frequência e a definição axiomática.
23
6.0 Referências Bibliográficas

União Pan-Americana de Ensino- UNIPAN. (2001). Probabilidade e Estatística., Cascavel:
PR.
Morettin, L. G. (2010). Estatística Básica: Probabilidade e Inferência Estatística, volume
único. São Paulo:Person Prentice Hall.

Correlação e Regressão

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Correlação e Regressão

Enviado por

Direitos autorais:

Formatos disponíveis

UNIVERSIDADE ABERTA ISCED

Faculdade de Ciências de Educação

Curso de Licenciatura em Ensino de Biologia

Nome do aluno: Código do estudante

Xai-xai, Abril, 2022

Faculdade de Ciências de Educação

Curso de Licenciatura em Ensino deBiologia

Trabalho de Campo a ser submetido na

Tutor: (Nome do Tutor)

Nome do aluno: Código do estudante

Xai-xai, Abril, 2022

3.0 Distribuições Bidimensionais

3.2. Diagrama de Dispersão

Representando, em um sistema coordenado cartesiano ortogonal, os pares ordenados (x i ; y i )

3.3. Correlação Linear

Figura 1: Ilustração da correlação e não correlação

Fonte: UNIPAN (2001)

3.4. Coeficiente de Correlação Linear

Onde n é o número de observações.

Se <0,6 há correlação relativamente fraca entre as variáveis.

3.5. Regressão Linear Simples

3.6. O Modelo de Regressão Linear Simples

3.7. Estimação dos Parâmetros – Método dos Mínimos Quadrados

Onde os β0 e β1 são parâmetros desconhecidos. Este modelo será estimado por ,

onde e são estimadores de β0 e β1 e é o valor predito de (dado Xi).

O erro estimado é a diferença entre um valor observado e valor correspondente ,

estimado pela recta ajustada e é definido por: .

O método de mínimos quadrados consiste em estimar e de forma tal que minimiza a

Desenvolvendo a somatória obtemos o seguinte sistema de equações, chamado de equações

Resolvendo-se este sistema de equações para β0 e β1, obtém-se os seguintes estimadores de

Assim, a equação de regressão linear fica da forma:

Exemplo: Desejamos estudar a relação entre a variável Preço de um determinado produto e a

Neste exemplo, temos X: Preço (variável independente) e Y: Quantidade vendida (variável

Onde: Yi é a variável dependente (Quantidade vendida);

Logo a recta ajustada para dos dados tem a forma

O diagrama de dispersão, com a recta ajustada, é apresentado abaixo

3.8. Coeficiente De Determinação Ou Explicação

Podemos estimar a qualidade de um modelo ajustado através do coeficiente de determinação

Onde n é o número de observações realizadas.

Exemplo: Calcule o coeficiente de determinação (R2) para os dados do exemplo. Para

O coeficiente R2 pode ser expresso em termos percentuais. Portanto, o modelo ajustado no

4.2. Modelo Determinístico

Neste modelo as condições sob as quais o experimento é executado, determinam o resultado

4.3. Modelo Não-Determinístico Ou Probabilístico

É um modelo em que de antemão não é possível explicitar ou definir um resultado particular.

O modelo estocástico é caracterizado como um modelo probabilístico que depende ou varia

4.4. Experimento Aleatório (Não-Determinístico)

Não existe uma definição satisfatória de Experimento Aleatório.

Ao descrever um experimento aleatório deve-se especificar não somente que operação ou

4.5. Características Dos Experimentos Aleatórios

As características comuns são:

 Podem ser repetidos indefinidamente sob as mesmas condições;

 Não se pode adiantar um resultado particular, mas pode-se descrever todos os

 Se repetidos muitas vezes apresentarão uma regularidade em termos de frequência de

4.6. O Espaço Amostral

Segundo Morettin (2010), é o conjunto de todos os resultados possíveis de um experimento

Exemplo: Determinar o espaço amostral dos experimentos abaixo:

a) Joga-se um dado e observa-se o número obtido na face superior.

b) Joga-se uma moeda 4 vezes e observa-se a sequência de caras e coroas;

4.7. Classificação De Um Espaço Amostral

O espaço amostral pode ser classificado em:

a) Finito. Quanto tem fim;

i) Enumeráveis (ou contáveis)