Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatística II
Estatística II
1. Introdução.............................................................................................1
1.1. Delimitação do Estudo...................................................................2
1.2. Objectivo geral..............................................................................2
1.3. Objectivos específicos....................................................................2
1.4. Metodologia..................................................................................2
2. Correlação............................................................................................3
2.1. Coeciente de Correlação......................................................................3
2.2. Cálculo do coeciente de correlação de Pearson ................................3
2.3. Cálculo do coeciente de correlação de Spearman..............................4
2.4. Regressão Linear..................................................................................5
2.5. Regressão linear simples......................................................................6
2.6. Como serve a regressão linear simples...............................................6
2.7. Regressão múltipla...............................................................................6
2.8. Objetivos da regrassão múltipla.........................................................7
2.9. Coeficiente de determinação Múltiplo...............................................8
3. Conclusão..............................................................................................9
3.1. Bibliografia...........................................................................................10
1. Introdução
O presente trabalho visa falar do estudo da correlação e regreçao, tendo em conta que Ao se
estudar uma variável o interesse eram as medidas de tendência central, dispersão, Assimetria.
Com duas ou mais variáveis além destas medidas individuais também é de interesse conhecer
se elas tem algum relacionamento entre si, isto é, se valores altos (baixos) de uma das
variáveis implicam em valores altos (ou baixos) da outra variável.
Regressão é uma técnica que permite explorar e inferir a relação de uma variável dependente
(variável de resposta) com variáveis independentes específicas (variáveis explicatórias). A
análise da regressão pode ser usada como um método descritivo da análise de dados (como,
por exemplo, o ajustamento de curvas) sem serem necessárias quaisquer suposições acerca
dos processos que permitiram gerar os dados. Regressão designa também uma equação
matemática que descreva a relação entre duas ou mais variáveis. O método de estimação mais
amplamente utilizado é o método dos mínimos quadrados ordinários. Os principais problemas
que devem ser enfrentados em uma regressão são: multicolinearidade, heteroscedasticidade,
autocorreção, endogeneizado e atipicidade.
A associação entre duas variáveis poder ser de dois tipos: correlacional e experimental. Numa
relação experimental os valores de uma das variáveis são controlados pela atribuição ao acaso
do objeto sendo estudado e observando o que acontece com os valores da outra variável. Por
exemplo,pode-se atribuir dosagens casuais de uma certa droga e observar a resposta do
organismo; pode-seatribuir níveis de fertilizante ao acaso e observar as diferenças na
produção de uma determinada cultura. No relacionamento correlacional, por outro lado, não
se tem nenhum controle sobre as variáveis sendo estudadas. Elas são observadas como
ocorrem no ambiente natural, sem nenhuma interferência, isto é, as duas variáveis são
aleatórias
1.1. Delimitação do Estudo
O presente trabalho limitar-se-á a apresentar Correlação e regressão linear
1.4. Metodologia
A metodologia é a parte mais pertinente da pesquisa, uma vez que providência com detalhes,
os caminhos, procedimentos, técnicas e métodos seguidos para o alcance dos objectivos da
pesquisa. Falar da pesquisa científica, é falar de um conjunto de caminhos sistémicos e
racionais do ponto de vista.
2. Correlação
Signica uma semelhança ou relação entre duas coisas, pessoas ou ideias. É uma semelhança
ou equivalência que existe entre duas hipóteses, situações ou objetos diferentes.
A palavra correlação pode ser substituída por sinônimos como: relação, equiparação, nexo,
correspondência, analogia e conexão.
Para interpretar o coeciente é preciso saber que 1 signica que a correlação entre as variáveis é
perfeita positiva e -1 signica que é perfeita negativa. Se o coeciente for igual a 0 signica que
as variáveis não dependem uma da outra.
Na estatística também existe o coeciente de correlação Spearman, que tem esse nome em
homenagem ao estatístico Charles Spearman. A função desse coeciente é medir a intensidade
da relação entre duas variáveis, sendo elas lineares ou não.
A correlação Spearman serve para avaliar se a intensidade da relação entre as duas variáveis
analisadas pode ser medida por uma função monótona (função matemática que preserva ou
inverte a relação de ordem inicial
S xy
∑ (xi −x)( y i− y)
i=1
r= = ¿
√∑ √∑
Sx S y n
2
n
2
(x i−x ) y i− y ¿
i=1 i=1
Onde:
S xy é a covariância;
Neste caso, o cálculo passa por achar primeiro a covariância entre as variáveis, e o desvio
padrão de cada uma delas. Depois, divide-se a covariância pela multiplicação dos desvios
padrões.
Por exemplo.
4. Na coluna “d” colocamos a diferença entre as duas Classificaçoes (A e B). Aqui o sinal
não importa.
5. Elevar ao quadrado cada um dos valores da coluna “d” e registrar na coluna d²:
6. Somar todos os dados da coluna "d²". Esse valor é Σd². No nosso exemplo Σd² = 0+1+0+1
=2
1−¿
No nosso caso, n é igual a 4, pois olhamos para quantidade de linhas de dados (que
corresponde ao número de observações).
É chamada "linear" porque se considera que a relação da resposta às variáveis é uma função
linear de alguns parâmetros. Os modelos de regressão que não são uma função linear dos
parâmetros se chamam modelos de regressão não- linear. Sendo uma das primeiras formas de
análise regressiva a ser estudada rigorosamente, é usada extensamente em aplicações práticas.
Isso acontece porque modelos que dependem de forma linear dos seus parâmetros
desconhecidos, são mais fáceis de ajustar que os modelos não-lineares aos seus parâmetros, e
porque as propriedades estatísticas dos estimadores resultantes são fáceis de determinar.
A relação parte de uma variável de interesse (dependente) com outras que a possam
inuenciar. Por exemplo: analisar a venda de um produto relacionada ao crescimento
populacional de um país.
Com os resultados obtidos, a regressão linear visualiza as maiores tendências que as variáveis
analisadas apresentam. A regressão consiste em modelar, estatisticamente, os valores que se
quer observar.
10
9
*Dados observados
8
Regressão Linear
7
0 0 1 2 3 4
A análise de regressão é mais útil quando apresentada em um diagrama de dispersão, muito
utilizados na economia, administração de empresas, ou também para os dados de um país.
Quando os acontecimentos não estão combinados em forma linear cam conhecidos como
regressão não-linear e, gracamente, a tendência se apresenta em outros formatos.
A regressão linear é simples quando são analisadas apenas duas variáveis, normalmente X e
Y, sendo que uma é dependente (Y) e será a função de outra que se comporta independente
(X).
Y= α + βX
Este cálculo pode ser feito apenas se existir uma relação linear entre X e Y e conterem a
mesma quantidade de elementos que se relacionam.
Nos casos em que existem mais do que duas variáveis passa a se chamar regressão linear
múltipla e a demonstração visual a partir de um gráfico se torna mais complexa.
Um exemplo muito conhecido na Economia para regressão linear é a Lei de Okun, que
relaciona negativamente o crescimento do PIB de um país com as suas taxas de desemprego.
Conheça este exemplo em nosso artigo sobre Econometria.
O modelo de regressão serve para prever comportamentos com base na associação entre duas
variáveis que geralmente possuem uma boa correlação.
Se você quisesse apenas saber qual o grau de relação entre as variáveis, calcular o coeficiente
de Pearson seria suficiente
A regressão múltipla é uma generalização da regressão simples, visto que, há mais de uma
variável explicativa no modelo.
Estudar a relação funcional entre variáveis, sendo uma resposta e duas ou mais explicativas.
Fazer predições como o modelo ajustado principalmente para valores que não foram
observados na amostra.
No entanto, utilizamos o maiúsculo para representar tal eficiência, uma vez que, não tem
relação direta com o coeficiente de correlação
3. Conclusão
https://www.respondeai.com.br/conteudo/probabilidade-e-estatistica/estatistica/regressao-
linear/1226
https://pt.khanacademy.org/math/statistics-probability/describing-relationships-quantitative-
data/introduction-to-trend-lines/a/linear-regression-review
https://oestatistico.com.br/regressao-linear-simples/