Escolar Documentos
Profissional Documentos
Cultura Documentos
AVALIAÇÃO IMOBILIÁRIA
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
Parabéns por ter tomado a decisão de participar deste curso de Inferência Estatística
para Avaliação Imobiliária. Espero que eu possa ajudar na sua jornada para desenvolver
competência em aplicar as técnicas aqui apresentadas e, com isso, engrandecer suas
avaliações mercadológicas de bens imóveis.
Este curso de Inferência Estatística para Avaliação Imobiliária foi estruturado com
momentos conceituais e diversos momentos práticos, nos quais, a partir de vídeos,
mostramos o uso dos recursos, fórmulas e funções no software Excel, para que você possa
facilmente reproduzir em seu equipamento e desenvolver a habilidade necessária.
O conteúdo desta apostila está formatado de modo que sejam apresentados os assuntos na
mesma sequência que são disponibilizados nas aulas. Desta forma, a apostila será útil para
acompanhamento das aulas, assim como poderá servir para consultas futuras.
2
Inferência Estatística para Direitos Autorais
Avaliação Imobiliária
AUTOR
Andersom Bontorim
Bontorim, Anderson
Inferência estatística para avaliação imobiliária
[livro eletrônico] / Andersom Bontorim. –- São Paulo:
IBRESP, 2021
12,2 mb
Formato: PDF
ISBN: 978-65-88399-27-9
SUMÁRIO
INTRODUÇÃO...................................................................................................... 06
ATIVANDO O SUPLEMENTO DE FERRAMENTA
DE ANÁLISE DO MICROSOFT EXCEL................................................................... 07
4
AULA 3 – REGRESSÃO LINEAR - CONCEITOS
• DEFINIÇÃO.......................................................................................................................... 46
• ANÁLISE DE REGRESSÃO................................................................................................. 48
• MODELO DE REGRESSÃO LINEAR..................................................................................51
• REPRESENTAÇÃO GRÁFICA DO MODELO DE REGRESSÃO LINEAR....................... 52
• EQUAÇÃO DE REGRESSÃO LINEAR SIMPLES E MÚLTIPLA..................................... 55
• OS COEFICIENTES NA REGRESSÃO............................................................................... 58
• PRESSUPOSTOS BÁSICOS PARA VALIDAÇÃO DO MODELO...................................... 60
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
INTRODUÇÃO
Este material é parte integrante do curso de Inferência Estatística para Avaliação Imobiliária
oferecido pelo IBRESP.
Após as introduções conceituais sobre o conteúdo abordado, será apresentado como realizar os
cálculos e análises estatísticas utilizando a planilha eletrônica Microsoft Excel. Muitas das análises
realizadas demandam que esteja habilitado, no Excel, o Suplemento de Ferramenta de Análise. É
por isso que, neste material, já apresentamos de início como habilitar esse suplemento.
6
ATIVANDO O SUPLEMENTO DE FERRAMENTA DE
ANÁLISE DO MICROSOFT EXCEL
Neste material apresentamos como fazer todos os cálculos utilizando a planilha eletrônica
Microsoft Excel.
Quando este suplemento está ativado, no menu Dados, aparecerá a opção Análise de dados na
extrema esquerda. Caso o Microsoft Excel não apresente esta opção de menu, basta ativá-lo. Como
a maioria dos usuários desse software não utiliza este recurso, a instalação padrão não ativa esse
recurso.
Para ativar Suplemento de Ferramentas de análise do Microsoft Excel, realize os seguintes passos:
2 Clique em Arquivo.
8
4 No quadro que abrir, escolha Suplementos.
10
1
AULA
Introdução e Conceitos
fundamentais
INTRODUÇÃO E CONCEITOS
AULA 1 FUNDAMENTAIS
INFERÊNCIA é resultado de um processo intelectual, ou seja, o raciocínio, pelo qual se obtém uma
conclusão a partir de indícios ou premissas, de modo que a proposição é considerada verdadeira
pela comparação com outras já tidas como verdadeiras.
Indícios são sinais que indicam aquilo que ocorreu ou existiu. Portanto, os indícios servem de
prova da existência de algo.
Premissas são fatos iniciais de um raciocínio ou estudo, com os quais é possível obter conclusões.
Portanto, a partir de dados iniciais que sejam verdadeiros, é possível realizar um processo lógico
para alcançar, como resultado, uma conclusão final, a qual pode ser comprovada.
ESTATÍSTICA é o ramo das matemáticas aplicadas que se fundamenta na teoria das probabilidades
com o objetivo de estudar uma série de dados numéricos.
Dentre os ramos da Estatística, destacamos os dois seguintes, que são usados, conjuntamente, na
avaliação imobiliária para determinação do valor de um bem imóvel:
Estatística Descritiva: Ramo da estatística que descreve resumos quantitativos, ou seja, resultados
de mensurações, referentes a uma coleção de um conjunto de dados numéricos.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
INFERÊNCIA ESTATÍSTICA
Conjunto de ferramentas estatísticas que objetiva, a partir de um conjunto de dados numéricos,
fazer proposições consideradas verdadeiras, devido à comparação com outras já tidas como
verdadeiras.
Realização de inferências
Lembrando, em resumo, inferir é deduzir e, portanto, concluir algo a partir de dados verdadeiros.
Exemplo 1: Imagine uma lista de imóveis, sendo que o mais barato tenho o preço de R$ 150.000,00
e o mais caro de R$ 890.000,00. Neste caso, podemos inferir que qualquer imóvel que colhermos
desta lista terá um preço entre estes dois valores. Apesar de óbvio, este é um exemplo de inferência.
Atenção!
Quando usamos um valor médio, não sabemos qual é o menor valor nem qual é o maior valor. Se
o menor valor for R$ 1.000,00 e o maior valor for R$ 10.000,00, é possível que a média seja de R$
5.000,00. Da mesma forma, se o menor valor for R$ 4.000,00 e o maior valor for R$ 6.000,00,
igualmente podemos ter uma média de R$ 5.000,00. Então, neste caso, temos uma faixa de
variabilidade do provável preço do imóvel em questão.
Portanto...
12
1
AULA
Introdução e Conceitos
fundamentais
População: Conjunto de todos os elementos que tenham, pelo menos, uma característica em
comum. É comum usarmos o termo “população” para nos referirmos ao conjunto de pessoas
de uma região. No entanto, em estatística, “população” não se restringe somente às pessoas,
estendendo-se a qualquer elemento. Por isso, ao se referir ao conjunto de algo, dizemos a
população desse algo. Por exemplo, a população de apartamentos de 3 dormitórios do município, é
o conjunto de todos os apartamentos que tenham essa característica, em específico (3 dormitórios)
de uma cidade específica.
EXPLICANDO...
Imagine se pudéssemos ter a descrição e o preço de todos os imóveis existentes numa região. Neste
caso, teríamos os dados de toda a população de imóveis. Agora, imagine que todos os imóveis são
idênticos. Se fosse assim, então, determinar o valor de um imóvel seria muito fácil. Se todos são
iguais, o valor de um seria igual ao do outro. Determinar o valor de um imóvel não dependeria de
qualquer raciocínio, pois seria o mesmo valor que de qualquer outro. Talvez tivéssemos alguma
pequena variação por causa da localização, mas, ainda assim, seria muito fácil definir o valor de
um imóvel. No entanto, a realidade não é essa.
Os imóveis não são idênticos e, por isso, seus preços variam tanto. Mesmo assim, se tivéssemos, em
mãos, todos os preços de todos os imóveis, poderíamos dividi-los em grupos por características
específicas e, com isso, teríamos o preço de todos os imóveis de uma determinada característica.
Da mesma forma, teríamos os dados de toda a população de um tipo de imóvel específico. Por
exemplo, poderíamos ter os dados de todas as casas de 2 dormitórios com 1 vaga na garagem.
Neste caso, também seria bem fácil determinar o valor de uma outra casa, desde que, neste
exemplo, ela tivesse 2 dormitórios e 1 vaga na garagem. Seria algo em torno da média dos preços
da população. Claro que essa descrição da casa foi muito rasa e, na realidade, existem várias outras
características num imóvel que podem distinguir o seu preço. Mas, valeu para ilustrar o conceito.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
No entanto, sequer temos os preços de todos os imóveis específicos de uma região. Mas,
conseguimos obter os preços de alguns imóveis que possam ser similares ao imóvel que estivermos
avaliando. A esta lista de imóveis similares dá-se o nome de lista de imóveis referenciais, pois
servirão de referência para compor o valor do imóvel em questão. Essa lista, por ser composta de
alguns imóveis e não todos, é uma amostra.
Enfim, cada um dos imóveis referenciais é um elemento, tanto da amostra, quanto da população
de imóveis. Assim como o imóvel que se esteja avaliando também é um elemento da população de
imóveis.
Aquilo que mais se repete é, em estatística, a moda. Perceba que o mercado de vestimenta se
apoderou desse termo para definir aquilo que é (ou que se pretende que seja) mais usado. Então, se
estiver na moda usar calça jeans, estatisticamente, significaria dizer que ao analisar um conjunto
de pessoas, teremos mais pessoas usando calça jeans do que usando cada um dos outros tipos de
calças.
Por exemplo, vejamos o seguinte conjunto de dados, referentes a preços de imóveis do tipo
apartamento, de 3 dormitórios, com 2 vagas na garagem.
14
1
AULA
Introdução e Conceitos
fundamentais
R$ 750.000,00
R$ 820.000,00
R$ 680.000,00
R$ 750.000,00
R$ 800.000,00
R$ 720.000,00
R$ 810.000,00
R$ 680.000,00
R$ 750.000,00
Para facilitar a visualização, vamos apresentar esses mesmos elementos em ordem crescente:
R$ 680.000,00
R$ 750.000,00
R$ 750.000,00
R$ 750.000,00
R$ 800.000,00
R$ 810.000,00
R$ 820.000,00
R$ 850.000,00
R$ 875.000,00
R$ 890.000,00
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
Perceba que temos 1 imóvel com o preço de R$ 680.000,00, 3 imóveis com o preço de R$ 750.000,00,
1 com o preço de R$ 800.000,00, 1 com o preço de R$ 810.000,00, 1 com o preço de R$ 820.000,00,
1 com o preço de R$ 850.000,00, 1 com o preço de R$ 875.000,00 e o último com o preço de R$
890.000,00. Neste caso, portanto, o preço que mais se repete é o de R$ 750.000,00. Este preço é a
moda neste conjunto de preços de imóveis.
Veja que não se calcula a moda, já que é o resultado da observação dos dados. Aquele que mais se
repete é a moda.
As idades dos imóveis, é um bom exemplo de dados em que podemos observar a moda.
Normalmente essas idades variam de 0 anos a uns 70 anos (salvo casos raros de edificações
históricas). Como trata-se de uma variação relativamente pequena, pois entre os números 0 e
70, temos apenas 71 possibilidades, caso tenhamos uma amostra de 900 imóveis, ainda assim,
teremos apenas 71 possibilidades de idades. Portanto, é bem fácil obtermos a moda. Basta que
tenhamos todas as idades dos imóveis de uma amostra, por exemplo, e poderemos contar quantas
vezes aparece cada idade. A idade que aparecer mais vezes será a moda.
Diferente disso, são os preços dos imóveis que variam muito. Caso tenhamos a mesma amostra
de 900 imóveis, sendo que o preço do mais barato seja R$ 680.000,00 e do mais caro seja R$
890.000,00, teremos aqui uma quantidade enorme de possibilidades de preços. Entre os números
680 mil e 890 mil temos mais de 200.000 possibilidades. Um imóvel, por exemplo, pode ter o
preço de R$ 710.000,00, enquanto outro tenha o preço de R$ 710.500,00 e serão valores diferentes.
Então, neste caso, torna-se difícil encontrar a moda, pois teremos uma quantidade enorme de
possibilidades. Por isso, é comum que sejam atribuídas faixas de preços e seja obtida a moda da
faixa de preço. É comum essa prática em questionários que nos perguntam a faixa salarial. É muito
raro que seja perguntado o salário das pessoas, já que este igualmente varia muito. Mas, a faixa
salarial se torna um dado mais fácil de se tratar para se obter a moda.
Então, agora, para a mesma lista de preços de imóveis do exemplo anterior, vamos criar as
seguintes faixas de preços:
16
1
AULA
Introdução e Conceitos
fundamentais
Neste segundo caso, veja que temos 1 imóvel na faixa 1, temos 3 imóveis na faixa 2 e temos 6
imóveis na faixa 3.
Portanto, por faixas de preços, a moda é a faixa 3. Perceba que a faixa 3 nem sequer contempla a
moda anteriormente obtida.
Então, é sempre muito importante, ao usar a moda, em estatística, definir claramente do que é
que se deseja saber a moda.
MÉDIA: valor resultante da soma dos valores de um conjunto de dados, dividida pela quantidade
de dados desse conjunto. É chamada de média aritmética, por ser aritmética a ciência que estuda
as propriedades elementares dos números racionais.
Média Aritmética Simples: usada quando os valores são relativamente uniformes. Por exemplo,
se temos 5 imóveis no mesmo edifício, cada um com um preço, podemos obter a média do valor
de um imóvel desse edifício. Basta somarmos os preços de cada um e dividirmos o resultado por 5.
VEJAMOS:
(R$ 240.000,00 + R$ 245.000,00 + R$ 250.000,00 + R$ 255.000,00 + R$ 260.000,00) / 5
R$ 1.250.000,00 / 5 = R$ 250.000,00
A média aritmética simples, neste caso, é de R$ 250.000,00.
Média Aritmética Ponderada: usada quando os dados têm pesos diferentes. Por exemplo, um
aluno de um curso que se distribui em 4 estágios, sendo que o estágio 1 tem peso 1, o estágio 2 tem
peso 2, o estágio 3 tem peso 3 e o estágio 4 tem peso 4. Neste exemplo, a soma dos pesos é igual a
10 (1+2+3+4). Neste caso, multiplica-se a nota de cada estágio pelo seu respectivo peso, soma-se
os resultados e o total é dividido pela soma dos pesos.
VEJAMOS:
Nota do estágio 1: 10
Nota do estágio 2: 9
Nota do estágio 3: 8
Nota do estágio 4: 7
[(10 x 1) + (9 x 2) + (8 x 3) + (7 x 4)] / 10
[10 + 18 + 24 + 28] / 10
80 / 10 = 8
MEDIANA: medida de localização do centro da distribuição dos dados. Para descobrir a mediana,
basta ordenar o conjunto de dados numéricos, sendo que a mediana dividirá essa lista ao meio,
de modo que a quantidade de elementos com valores menores que a mediana será a mesma
quantidade de elementos com valores maiores que a mediana. Por exemplo, se usarmos a mesma
lista de preços de imóveis usada no exemplo da média aritmética simples, visto anteriormente, já
em ordem crescente, temos:
R$ 240.000,00
R$ 245.000,00
R$ 250.000,00
R$ 255.000,00
R$ 260.000,00
Perceba que o preço R$ 250.000,00 se encontra exatamente no meio da lista, restando 2 elementos
com preços menores e outros 2 elementos com preços maiores. Sempre que tivermos uma lista
com uma quantidade ímpar de elementos, deve-se ordenar a lista e a mediana será o elemento
que estiver no meio da lista.
Mas, quando a lista contiver uma quantidade par de elementos, não haverá um elemento no meio.
Neste caso, a mediana será a média aritmética simples dos 2 elementos que estiverem no meio da
lista. Por exemplo, adotemos a lista de preços de imóveis do tipo apartamento, de 3 dormitórios,
com 2 vagas na garagem, já em ordem crescente, que foi usada anteriormente no exemplo da
moda, sendo:
R$ 680.000,00
R$ 750.000,00
R$ 750.000,00
R$ 750.000,00
R$ 800.000,00
R$ 810.000,00
R$ 820.000,00
R$ 850.000,00
R$ 875.000,00
R$ 890.000,00
Esta lista contém 10 elementos e, por isso, não haverá um elemento ao meio, mas, diferente
disso, temos 2 elementos, sendo o preço R$ 800.000,00 e o preço R$ 810.000,00. Temos 4 preços
menores que R$ 800.000,00 e outros 4 preços maiores que R$ 810.000,00. Portanto, a mediana,
neste caso, será igual à média aritmética simples entre R$ 800.000,00 e R$ 810.000,00, ou seja,
R$ 805.000,00.
18
1
AULA
Introdução e Conceitos
fundamentais
Preços de imóveis
750.000,00
750.000,00
750.000,00
780.000,00
800.000,00
810.000,00
820.000,00
880.000,00
890.000,00
900.000,00
910.000,00
920.000,00
Estimadores de dispersão
20
1
AULA
Introdução e Conceitos
fundamentais
160.000,00
280.000,00
350.000,00
480.000,00
500.000,00
650.000,00
720.000,00
A distância entre esses valores é grande. Trata-se de um conjunto pouco homogêneo de preços de
imóveis. Portanto, temos uma grande dispersão de dados.
AMPLITUDE: Distância entre o menor e o maior valor num conjunto de dados numéricos. A
amplitude demonstra o tamanho total da dispersão de uma série de números e é obtida pela
diferença entre seus dois extremos.
Para encontrar a amplitude, no exemplo apresentado acima, basta subtrair o menor preço do
maior preço, sendo:
Quanto menor a amplitude, menos dispersos são os valores e mais homogêneos serão os dados.
Quanto maior a amplitude, mais dispersos são os valores e menos homogêneos serão os dados.
Existem outros 2 estimadores de dispersão que são largamente utilizados em estatística: variância
e desvio padrão.
e, portanto...
Para os cálculos referentes à AMOSTRA usa-se:
S (letra latina S em itálico) para o desvio padrão
S2 (letra latina S em itálico elevado ao quadrado) para a variância.
Para os cálculos referentes à POPULAÇÃO usa-se:
σ (letra grega sigma) para o desvio padrão
σ2 (letra grega sigma elevada ao quadrado) para a variância
A variância de um conjunto de dados é calculada pela média dos quadrados das diferenças entre os
valores em relação à média. Veja a fórmula:
Onde:
S2: Variância amostral (variância de uma amostra e não da população);
∑ni=1: Letra grega sigma maiúscula que representa somatória, tratando-se aqui
da soma de uma quantidade n de elementos, iniciando pelo elemento 1. Caso a
lista contenha 20 elementos, deve-se realizar o cálculo entre parênteses após
esse símbolo para todos os 20 elementos da lista;
Xi: Valor de um elemento da lista de elementos;
X: Valor médio calculado referente à lista de elementos;
n: quantidade de elementos.
22
1
AULA
Introdução e Conceitos
fundamentais
Para exemplificar, usaremos a seguinte lista de 10 imóveis referenciais obtidos para a determinação
do valor mercadológico de um imóvel avaliando.
Sabemos que a fórmula da variância usará a média aritmética simples desses preços, a qual já
sabemos calcular (soma dos preços dividida pela quantidade de elementos). A média é igual a
523.000,00.
Vamos realizar os cálculos de dentro dos parênteses da fórmula, para cada imóvel referencial.
Então, faremos o preço menos a média e o resultado elevaremos ao quadrado, sendo:
Imóveis
referenciais PREÇO (Xi - X)2
R1 511.000,00 (511.000 – 523.000,00)² = (- 12.000,00)² = 144.000.000,00
R2 513.000,00 (513.000,00 – 523.000,00)² = (- 10.000,00)² = 100.000.000,00
R3 516.000,00 (516.000,00 – 523.000,00)² = (- 7.000,00)² = 49.000.000,00
R4 518.000,00 (518.000,00 – 523.000,00)² = (- 5.000,00)² = 25.000.000,00
R5 521.000,00 (521.000,00 – 523.000,00)² = (- 2.000,00)² = 4.000.000,00
R6 525.000,00 (525.000,00 – 523.000,00)² = 2.000,00² = 4.000.000,00
R7 528.000,00 (528.000,00 – 523.000,00)² = 5.000,00² = 25.000.000,00
R8 530.000,00 (530.000,00 – 523.000,00)² = 7.000,00² = 49.000.000,00
R9 533.000,00 (533.000,00 – 523.000,00)² = 10.000,00² = 100.000.000,00
R10 535.000,00 (535.000,00 – 523.000,00)² = 12.000,00² = 144.000.000,00
Agora eleva-se
(Xi - X)2 ao quadrado Resultados
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
Veja que para os 5 primeiros imóveis, ao subtrair o valor médio de seus preços, obtemos um valor
negativo, já que seus preços são menores que o preço médio. Mas, isso não importa, pois quando
elevamos ao quadrado o valor volta a ficar positivo.
Agora, somamos todos esses resultados, para obtermos o valor da somatória, sendo:
144.000.000,00
100.000.000,00
49.000.000,00
25.000.000,00
4.000.000,00
4.000.000,00
25.000.000,00
49.000.000,00
100.000.000,00
144.000.000,00
Resultado da soma:
644.000.000,00
Seguindo a fórmula, o passo final é dividir esse valor da somatória por (n – 1), ou seja, pela
quantidade de elementos menos 1. Neste caso, temos 10 valores (10 – 1 = 9). Portanto, dividiremos
esse resultado da somatória por 9.
644.000.000,00 / 9 = 71.555.555,56
Vejamos na fórmula:
24
1
AULA
Introdução e Conceitos
fundamentais
Perceba que, como mencionado anteriormente, esse valor de variância não nos emite perceber a
realidade dos dados deste conjunto de preços. Mas, é extremamente útil para diversas aplicações
estatísticas. Entre elas, a obtenção do desvio padrão.
DESVIO PADRÃO: Num conjunto de dados numéricos o desvio padrão indica a regularidade (grau
de variação) de um conjunto de dados em função da média aritmética. O desvio padrão é utilizado
para identificar o quanto os valores são próximos ou distantes da média.
Mas, como já sabemos calcular a variância, então, podemos simplificar a fórmula apenas pela
seguinte:
Utilizando o mesmo exemplo dos 10 imóveis referenciais, facilmente calculamos o desvio padrão,
sendo:
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
Exercícios Aula 1
QUESTÃO 1
A) Conjunto de alguns elementos que tenham, pelo menos, uma característica em comum.
C) Conjunto de todos os elementos que tenham, pelo menos, uma característica em comum.
QUESTÃO 2
B) Conjunto formado a partir do subconjunto de uma população, com elementos que não tenham
características em comum.
C) Conjunto maior que a população, formado de todos os elementos que tenham características
próprias.
E) Conjunto formado por apenas um dos elementos que não tenha características da população
que ele faça parte.
QUESTÃO 3
A) Moda, em estatística, é o valor que aparece com menor frequência no conjunto de dados.
B) Média, em estatística, é o valor resultante da soma dos valores de um conjunto de dados,
dividida pela quantidade de dados desse conjunto.
C) Os estimadores de dispersão são úteis para identificar a significância do conjunto de dados.
26
1
AULA
Exercícios
D) Amplitude, em estatística, é a distância entre a média e o maior valor num conjunto de dados
numéricos.
E) O Suplemento de Ferramentas de análise do Microsoft Excel é opcional e totalmente
desnecessário para as análises de inferência estatística.
QUESTÃO 4
A) Verdadeiro.
B) Falso.
QUESTÃO 5
PREPARAÇÃO DA TABELA
AULA 2 DE DADOS
Nas análises estatísticas que serão realizadas para determinação do valor mercadológico de um
imóvel (seja para venda ou para locação), usaremos 2 tipos de variáveis, chamadas de variáveis
dependente e variáveis independentes.
Variável é algo que varia, ou seja, que pode mudar. Diferente disso seria uma constante, cujo valor
não muda. Um exemplo de constante, em matemática, é o valor do PI, cujo valor, arredondado, é
de 3,14.
Numa lista de imóveis, temos um dado extremamente importante em nossos cálculos: o preço.
Cada imóvel apresentará um preço diferente. Ainda que possamos ter alguns imóveis com o
mesmo preço, este é um dado que varia e, portanto, é uma variável.
Algo dependente é aquilo que, para existir, depende de outra coisa. O contrário também é válido,
ou seja, algo independente é aquilo que não precisa de outro elemento para existir. Portanto, uma
variável dependente somente existe por causa de outro dado. Se este outro dado não precisa de
outra coisa para existir, então, será um dado independente.
Variável dependente: algo que varia por causa de outros elementos. No nosso caso, o preço
dos imóveis é uma variável dependente pois varia dependendo da quantidade de dormitórios,
localização, tamanho e outros elementos, por exemplo.
28
2
AULA
Preparação da tabela
de dados
Variável independente: algo que varia sem depender de outros elementos. A quantidade de
dormitórios, numa lista de imóveis é algo que varia sem depender de outro fator. Cada imóvel,
simplesmente, tem uma quantidade específica de dormitórios.
Num estudo estatístico, o que se pretende explicar sempre será uma variável dependente, pois
dependerá dos demais dados que explicarão sua existência. Os dados usados para explicarem a
variável dependente poderão ser variáveis independentes ou dependentes.
Para determinarmos o valor de imóvel que se esteja avaliando, usaremos uma lista de imóveis que
será confeccionada a partir de uma busca de imóveis similares no mercado. Essa lista, com os preços
dos imóveis transacionados ou anunciados para serem transacionados, servirá de referência para
a determinação do valor do imóvel avaliando. Por isso, dá-se o nome a esses imóveis de imóveis
referenciais. O preço dos imóveis referenciais é uma variável dependente. Exemplos de variáveis
independentes: quantidade de dormitórios, quantidade de vagas de garagem, tamanho (em m²),
quantidade de banheiros etc. Neste exemplo, temos:
m2
quantidade de
dormitórios PREÇO
Variável
quantidade DEPENDENTE
vagas de
garagem
Variáveis
INDEPENDENTES
Portanto, numa avaliação imobiliária, o preço sempre será nossa variável dependente e
as características dos imóveis serão nossas variáveis independentes.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
Para determinarmos o valor do imóvel em avaliação, usaremos uma lista de imóveis criada a
partir de uma busca de imóveis referenciais. A questão, agora, é determinar a quantidade mínima
de imóveis que essa lista deverá conter para que possa proporcionar um resultado adequado nas
análises inferenciais que serão realizadas. Isso pode ser calculado.
Em todos os casos, para calcular a quantidade mínima de imóveis referenciais, basta somar a
quantidade de variáveis independentes que serão usadas. A fórmula é extremamente simples:
n=3(k+1)
Sendo:
n=3(k+1)
n=3(5+1)
n=3(6)
n=18
30
2
AULA
Preparação da tabela
de dados
Neste exemplo, teremos que obter uma lista de 18 apartamentos com características comparáveis
às do imóvel avaliando, na região onde este imóvel estiver.
Numa avaliação imobiliária, já sabemos qual elemento será explicado: o preço dos imóveis. Se
soubermos como esse preço é formado, poderemos determinar o valor mercadológico do imóvel
que se esteja avaliando.
Resta, portanto, definirmos quais são as variáveis independentes, ou seja, quais elementos
explicam esse preço.
Quando soubermos quais elementos determinam o preço dos imóveis, poderemos buscar imóveis
no mercado que tenham esses elementos e que tenham sido transacionados recentemente ou
ainda que estejam anunciados para serem transacionados.
Caso a avaliação do imóvel objetive determinar o valor de venda do imóvel, então, deve-se buscar
imóveis vendidos ou anunciados para venda.
Caso a avaliação do imóvel objetive determinar o valor de locação do imóvel, então, deve-se buscar
imóveis locados ou anunciados para locação.
Temos que lembrar que estes imóveis, que servirão de referência, devem ser similares ao imóvel
que se esteja avaliando.
As variáveis independentes que nos importam são aquelas que existam no imóvel avaliando.
Determinando isso, poderemos fazer a busca por imóveis que tenham essas variáveis. Com isso,
estaremos buscando imóveis referenciais que sejam similares ao imóvel avaliando.
O ideal seria buscar imóveis referenciais idênticos ao imóvel avaliando. Isso seria possível no caso
de um condomínio, cujos imóveis tenham a mesma planta baixa, e que hajam outros imóveis à
venda (ou locação) ou vendidos (ou alugados) recentemente. Contudo, normalmente não é o que
acontece. Por isso, buscamos imóveis referenciais comparáveis ao avaliando, ou seja, que sejam
os mais parecidos possível com o imóvel que se esteja avaliando.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
Portanto, para compor os elementos fundamentais para esta comparação, deve-se realizar uma
vistoria no imóvel avaliando, visando identificar aquilo que efetivamente descreva este imóvel (as
variáveis independentes).
É possível, por exemplo, usarmos a área útil (m²) e a quantidade de dormitórios para o caso de um
apartamento, mas isso não seria relevante para o caso de estarmos avaliando um terreno. No caso
do terreno, neste exemplo, sua dimensão (m²) importa, mas a quantidade de dormitórios não.
A quantidade de dormitórios também não interessaria no caso de um conjunto comercial, mas a
quantidade de vagas de garagem sim.
Enfim, precisamos realizar uma vistoria no imóvel a ser avaliado, para determinar quais serão
nossas variáveis independentes, as quais potencialmente determinam o preço deste imóvel.
Dica!
É importante que durante a vistoria sejam realizados registros fotográficos para
comprovação dos dados.
Feita a vistoria, teremos a sua localização (e os aspectos dessa região), o tipo de imóvel, seu estado
de conservação e as suas características.
Portanto, deveremos buscar imóveis próximo a esse local, para que tenham acesso aos mesmos
recursos da região. Na inexistência de imóveis potencialmente referenciais na região, podemos
buscar outras regiões que tenham as mesmas características em termos de infraestrutura e
recursos, de modo que isso poderia justificar terem potencialmente preços similares.
32
2
AULA
Preparação da tabela
de dados
É fundamental que os imóveis referenciais sejam do mesmo tipo. Não será possível fazer
qualquer comparação entre um apartamento (imóvel avaliando) com casas ou sobrados (imóveis
referenciais), pois são de tipos diferentes e isso certamente influenciará nos seus preços. Seria
muito mais absurdo usar imóveis rurais como referenciais para a determinação do preço de um
imóvel urbano. Assim como se estivermos avaliando um imóvel comercial, não poderemos usar,
como referenciais, imóveis residenciais ou industriais.
Também é importante que os imóveis referenciais tenham o mesmo estado de conservação que o
imóvel avaliando. Quando temos uma variável que não varia, ela deixa de ser uma variável e passa
a ser uma constante. Dados constantes não são explicativos para demonstrar a variação de preços
dos imóveis. Então, se todos os imóveis referenciais tiverem o mesmo estado de conservação, este
elemento não precisará ser considerado nas análises que serão realizadas.
Portanto, basta incluirmos os dados no Microsoft Excel. Mas, existe uma sequência lógica para
as colunas, por causa dos recursos que usaremos. Por isso, veja o vídeo do curso que explica a
sequência correta a ser usada, de modo que você tenha menos trabalho futuramente. Usaremos
a tabela com 24 imóveis referenciais e as 7 variáveis independentes (m², dormitório, banheiro,
piscina, Sala de jogos, Salão de festas e condomínio).
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
Sala de Salão de
Imóvel m² dormitório banheiro piscina jogos festas condomínio preço
R1 75 1 1 1 1 1 350,00 480.000,00
R2 75 2 1 0 0 1 320,00 490.000,00
R3 78 2 2 0 0 1 320,00 485.000,00
R4 78 2 2 0 0 1 340,00 495.000,00
R5 78 2 2 1 1 1 350,00 500.000,00
R6 80 2 2 1 1 1 350,00 505.000,00
R7 80 2 2 1 1 1 370,00 508.000,00
R8 80 2 2 1 1 1 370,00 510.000,00
R9 82 2 2 1 1 1 400,00 512.000,00
R10 82 2 2 1 1 1 400,00 515.000,00
R11 82 2 2 1 1 1 400,00 515.000,00
R12 85 2 2 1 1 1 400,00 520.000,00
R13 85 2 2 1 1 1 400,00 525.000,00
R14 85 3 2 1 1 1 430,00 528.000,00
R15 88 3 2 1 1 1 430,00 530.000,00
R16 88 3 3 1 1 1 450,00 532.000,00
R17 88 3 3 1 1 1 450,00 535.000,00
R18 88 3 3 1 1 1 450,00 540.000,00
R19 90 3 3 1 1 1 480,00 545.000,00
R20 90 3 3 1 1 1 480,00 550.000,00
R21 92 3 3 1 1 1 490,00 550.000,00
R22 92 3 3 1 1 1 490,00 555.000,00
R23 95 3 3 1 1 1 500,00 560.000,00
R24 95 4 3 1 1 1 500,00 565.000,00
R25 95 4 4 1 1 1 500,00 568.000,00
34
2
AULA
Preparação da tabela
de dados
Agora, vamos ver como calcular isso no Microsoft Excel. Você verá que é extremamente fácil.
Sala de Salão de
Imóvel m² dormitório banheiro piscina jogos festas condomínio preço
R1 75 1 1 1 1 1 350,00 480.000,00
R2 75 2 1 0 0 1 320,00 490.000,00
R3 78 2 2 0 0 1 320,00 485.000,00
R4 78 2 2 0 0 1 340,00 495.000,00
R5 78 2 2 1 1 1 350,00 500.000,00
R6 80 2 2 1 1 1 350,00 505.000,00
R7 80 2 2 1 1 1 370,00 508.000,00
R8 80 2 2 1 1 1 370,00 510.000,00
R9 82 2 2 1 1 1 400,00 512.000,00
R10 82 2 2 1 1 1 400,00 515.000,00
R11 82 2 2 1 1 1 400,00 515.000,00
R12 85 2 2 1 1 1 400,00 520.000,00
R13 85 2 2 1 1 1 400,00 525.000,00
R14 85 3 2 1 1 1 430,00 528.000,00
R15 88 3 2 1 1 1 430,00 530.000,00
R16 88 3 3 1 1 1 450,00 532.000,00
R17 88 3 3 1 1 1 450,00 535.000,00
R18 88 3 3 1 1 1 450,00 540.000,00
R19 90 3 3 1 1 1 480,00 545.000,00
R20 90 3 3 1 1 1 480,00 550.000,00
R21 92 3 3 1 1 1 490,00 550.000,00
R22 92 3 3 1 1 1 490,00 555.000,00
R23 95 3 3 1 1 1 500,00 560.000,00
R24 95 4 3 1 1 1 500,00 565.000,00
R25 95 4 4 1 1 1 500,00 568.000,00
36
2
AULA
Preparação da tabela
de dados
Perceba que, coincidentemente, quanto mais dormitórios um imóvel tem, mais banheiros ele
igualmente tem. Salvo algumas exceções, parece ser um padrão.
A linha vermelha apresenta a tendência dessa correlação. Portanto, se esta correlação continua
existindo, mesmo para apartamentos com mais dormitórios, então, é provável que apartamentos
de 5 dormitórios tenham 5 banheiros.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
Perceba que nesta correlação, todos os imóveis referenciais aparecem numa mesma coluna, pois
todos têm 1 Salão de festas. Sequer podemos traçar uma linha de tendência, pois inexiste qualquer
tendência. Se a relação continuar a mesma, baseando-se nesta amostra, qualquer outro imóvel
similar teria, tendenciosamente, a mesma quantidade de Salão de festas, apesar da variação no
valor do condomínio.
Portanto, temos 1 dado que não exerce influência no preço, pois, na verdade, a quantidade de
Salão de festas é constante. Neste caso, esta variável, que não varia, pode ser descartada.
Então vejamos um outro caso de uma lista diferente, com 2 dados que, apesar de variarem, acabam
variando na mesma proporção:
38
2
AULA
Preparação da tabela
de dados
Perceba que todos os pontos estão absolutamente alinhados. Isso significa que estas duas variáveis
são colineares, ou seja, coexistem linearmente.
Portanto, neste caso, ambas afetam a variação de preços da mesma forma. Para efeito da nossa
análise, considerar uma ou a outra, é exatamente a mesma coisa, de modo que podemos usar
apenas uma delas. Na verdade, deveremos usar apenas uma delas e nunca as duas. Os cálculos
que veremos futuramente poderão apresentar severos problemas caso utilizemos variáveis tão
colineares assim.
Nos exemplos usados, poderíamos perceber a colinearidade apenas pela observação. Mas, é
possível medir essa correlação. Usamos o coeficiente de correlação para fazer isso.
• Resultados negativos (entre -1 e 0): indica uma correlação negativa. Trata-se de uma
relação em que quando uma variável aumenta, a outra diminui e vice-versa. Pode-se observar
isso, por exemplo, na relação entre valor de condomínio e preço da locação. Se compararmos 2
imóveis muito parecidos, em 2 edifícios igualmente muito parecidos. É comum que aquele que
tenha o condomínio mais caro tenha o preço do aluguel um pouco mais barato do que o preço
de aluguel daquele que tem o condomínio mais barato. No final das contas, como são imóveis
parecidos, o valor somado do condomínio com o aluguel, de ambos os imóveis, seria quase que o
mesmo. Outro exemplo é o índice de periculosidade de uma região e o preço dos imóveis. Quanto
mais a periculosidade, menor será o preço dos imóveis.
• Resultados positivos (entre 0 e 1): indica uma correlação positiva. Trata-se de uma relação
em que quando uma variável aumenta, a outra igualmente aumenta. Observamos isso no caso da
área útil e o valor do imóvel. Quanto maior sua área útil, maior será o preço tanto de venda quanto
de locação do imóvel.
40
2
AULA
Preparação da tabela
de dados
Em ambos os casos, se a relação for absoluta entre duas variáveis independentes, para efeito
das análises que faremos numa avaliação imobiliária para determinação do valor do imóvel,
descartaremos uma das duas variáveis. Pode-se escolher, por pura conveniência, a variável a ser
descartada. Por exemplo, numa relação que for absoluta entre dormitórios e banheiros, poderíamos
descartar a variável banheiros, já que é mais comum falarmos em termos de quantidade de
dormitórios de um imóvel do que na quantidade de banheiros.
Desvio Padrão dos valores da variável X multiplicado pelo Desvio Padrão dos valores da
variável Y, cuja fórmula é
Mas, não faremos esses cálculos, pois o Microsoft Excel tem uma função que calcula
automaticamente isso.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
PEARSON ou CORREL
Obs.: A função Pearson foi incluída na versão do Microsoft Excel em meados dos anos 90, tendo
sido nomeada em homenagem ao estatístico Karl Pearson. Nas versões seguintes deste software,
passou-se a usar nomes mais intuitivos para as suas funções e, por isso, criou-se a função Correl
(do termo Correlação). A Microsoft decidiu não remover a função Pearson. Atualmente, ambas
existem e têm o mesmo funcionamento.
sendo:
matriz2: Um segundo intervalo de valores de célula (do mesmo tamanho que o anterior).
Atenção!
• Se uma matriz contiver dados que não sejam numéricos (texto ou células vazias), esses
valores serão ignorados (o número zero é considerado).
• Se matriz1 e matriz2 têm tamanhos diferentes (quantidade diferente de elementos),
CORREL retorna um erro #N/A.
• Se matriz1 ou matriz2 estiver vazia ou se o desvio padrão de seus valores for igual a zero,
CORREL retornará um erro #DIV/0!.
42
2
AULA
Preparação da tabela
de dados
Para determinarmos o uso dos dados, usaremos análises baseadas em Estatística Descritiva, assim
como usaremos os Estimadores de Dispersão.
Agora, veremos como fazer esses cálculos no Microsoft Excel e para o que eles podem nos ser
úteis.
Exercícios Aula 2
QUESTÃO 1
QUESTÃO 2
QUESTÃO 3
A) n = 6(k + 1)
B) n = 3(k -1)
C) n = 3k + 1
D) n = 3(k + 1)
E) n = 3k . 1)
QUESTÃO 4
“Na criação da tabela no Microsoft Excel, para que possamos realizar as análises de inferência
estatística, existe uma sequência lógica para as colunas, por causa dos recursos que usaremos.”
A) Verdadeiro
B) Falso
44
2
AULA
Exercícios
QUESTÃO 5
REGRESSÃO LINEAR -
AULA 3 CONCEITOS
Definição
A Regressão Linear será uma grande ferramenta para realizarmos as análises necessárias para a
determinação do valor do imóvel que se esteja avaliando.
Matematicamente falando, o termo “regressão” é usado para se referir a uma equação que
descreve a relação entre duas ou mais variáveis.
Já em estatística, sendo mais específico, pelo termo “regressão” quer-se dizer uma técnica para
analisar a relação de uma variável dependente com variáveis independentes, de modo a analisar o
quanto estas variáveis independentes realmente explicam a variável dependente.
No nosso caso, tratando-se de avaliações mercadológicas de imóveis, já vimos que o preço dos
imóveis é a nossa variável dependente, sendo que as demais variáveis, que potencialmente
explicariam a variação desse preço, são as nossas variáveis independentes.
O termo foi usado pela primeira vez, no contexto estatístico, pelo primo de Charles Darwin, Francis
Galton. Este antropólogo, matemático e estatístico, viveu de 1822 a 1911 e dedicou grande parte da
sua vida ao estudo das medidas do corpo humano, conhecido por Antropometria. Durante 6 anos
Galton coletou mais de 9 mil registros de famílias, nos quais foram anotados dados quantitativos
sobre o corpo das pessoas. Entre diversos dados estava a estatura. Foram 10 anos analisando esses
46
3
AULA
Regressão Linear
conceitos
A regressão pode ser simples quando houver apenas uma variável independente, ou pode ser
múltipla quando houver mais de uma variável independente.
De fato, na aplicação da regressão para avaliação imobiliária, usaremos a regressão para realizar
seleção de variáveis e inferências, até termos as variáveis adequadas para explicar a variação do
preço, assim como faremos a predição do valor do imóvel avaliando.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
Análise de regressão
Para entendermos claramente as análises que são feitas pela regressão, considere a seguinte lista
de imóveis referenciais.
O preço é a nossa variável dependente, ou seja, aquela que pretendemos explicar, e 5 variáveis
independentes que potencialmente explicam o preço (m², dormitório, banheiro, piscina e
condomínio).
48
3
AULA
Regressão Linear
conceitos
Quando incluirmos esses dados nos cálculos da regressão, teremos um modelo de regressão,
sendo, portanto, o modo de representação do contexto em dimensões estatísticas.
DICA
No Microsoft Excel, a indicação das variáveis X deve ser feita num único intervalo. Por isso,
colocamos as colunas todas juntas, sem espaço entre elas e sem outras colunas que não
sejam variáveis independentes.
Itens importantes a serem analisados no resultado da Regressão obtido pelo Microsoft Excel:
• R-QUADRADO E R-QUADRADO AJUSTADO: Dentre as Estatísticas de regressão, o Microsoft
Excel apresenta o resultado do R-quadrado e do R-quadrado ajustado. Estes são Coeficientes de
determinação, medidas de ajuste de um modelo estatístico linear. O R-quadrado mede o nível de
explicação da variável Y pelas variáveis X. No caso da avaliação imobiliária, significa o quanto
que os dados da lista de imóveis referenciais explicam os seus respectivos preços. Este é um
número que varia de 0 a 1. Quanto maior o R-quadrado, tanto maior será o nível de explicação. Ao
multiplicar esse número por 100, obteremos o percentual de explicação desse modelo de regressão.
Por exemplo, o resultado 0,9735 significa que este modelo explica 97,35% da variação dos preços
dos imóveis. Neste caso, temos 2,65% da variação do preço que não estão sendo explicadas por
este modelo, sendo elementos que, então, não conhecemos. É comum pensar que quanto mais
variáveis independentes forem usadas, maior será o potencial explicativo e, portanto, maior será
o R-quadrado. Por outro lado, em estatística, existe o princípio da parcimônia que estabelece
que a explicação para qualquer fenômeno deve pressupor a menor quantidade possível de
premissas. Por isso, temos o R-quadrado ajustado que é uma medida alternativa do coeficiente de
determinação, que penaliza a inclusão de variáveis independentes. Assim, quanto mais variáveis
não significativas forem incluídas, menor será o R-quadrado ajustado. É por isso que muitos
preferem verificar o R-quadrado ajustado ao invés do R-quadrado.
Caso o R-quadrado ajustado for menor que 0,7 teremos que executar a regressão novamente
desconsiderando a variável menos significativa (ver valor-P para saber qual das variáveis é menos
significativa).
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
Caso o F de significação for maior que 0,05 teremos que rever as variáveis e, eventualmente,
escolher outras variáveis para compor o modelo.
Quando o valor é muito baixo, o Microsoft Excel apresenta o valor em notação científica. Por
exemplo: 3,94E-8.
A letra “E” é a notação exponencial que significa ‘vezes 10 elevado a’, sendo o valor seguinte o
quanto se deve elevar. No exemplo temos E-8, ou seja, vezes 10 elevado a -8. Portanto, 3,94E-8
significa 3,94 vezes 10 elevado a -8. Quando elevamos 10 a um valor negativo, bastará colocar à
esquerda a quantidade de zeros igual ao valor que se está elevando, sendo que entre o primeiro
zero e os demais colocamos uma vírgula. Veja como fica:
3,9E-8
3,9 x 10-8
0,000000039
oito zeros
• valor-P: Resultado do Teste de significação para cada variável. Tal qual o F de significação do
modelo, o valor-P é um número que varia entre 0 e 1. É a partir destes resultados que podemos
identificar o quanto cada variável é significante. Quanto mais significante for uma variável
independente, mais ela explica a variação da variável independente. Quanto menor for esse valor,
maior é a significância da variável.
Caso o valor-P de alguma variável independente for maior que 0,10 teremos que executar a
regressão novamente desconsiderando essa variável menos significativa.
A retirada de variáveis menos significativas promovem o potencial aumento do R-quadrado
ajustado.
50
3
AULA
Regressão Linear
conceitos
Quando for executada uma nova regressão, após a remoção de alguma variável independente,
devemos realizar novamente a análise dos itens importantes (listados acima) no resultado da nova
Regressão obtido pelo Microsoft Excel. Na nova regressão, se houver a necessidade de remover
outra variável independente, deve-se executar nova regressão, sem esta outra variável, e analisar
tudo novamente. Faz-se isso até que tenhamos um modelo adequado.
Portanto, a variável dependente é aquela cujo comportamento pretende ser explicado pela(s)
variável(is) independente(s). É por isso que uma variável independente também é chamada de
variável explicativa.
Como a variável independente é aquela que será regredida à média, também é conhecida como
variável regressora, ou simplesmente regressor.
No eixo vertical está a variável Y, ou seja, a variável dependente e no eixo X está a variável
independente.
Os pontos vermelhos são os dados da relação entre X e Y.
A reta azul apresenta a tendência geral de variação desses dados, sendo a média.
As linhas pretas verticais que ligam os pontos vermelhos (dados) à reta azul (tendência)
representam as diferenças (ou resíduos) entre a média e os dados observados.
Consideremos a lista abaixo de imóveis referenciais para vermos um exemplo na nossa realidade.
Imóvel m² preço
R1 62 700.000,00
R2 75 705.000,00
R3 78 706.000,00
R4 85 720.000,00
R5 88 723.000,00
R6 90 725.000,00
R7 95 748.000,00
R8 98 750.000,00
52
3
AULA
Regressão Linear
conceitos
Neste caso, temos 8 imóveis referenciais e queremos determinar, a partir desta amostra, o valor
de um imóvel avaliando. Ainda que saibamos quantos m² tenha o imóvel avaliando, obviamente,
não sabemos o seu preço. Portanto, o preço é a nossa variável dependente, a qual, neste exemplo,
pretendemos explicar pela variação do m² (nossa variável independente).
Da mesma maneira que no exemplo anterior, no eixo Y (vertical) está a nossa variável dependente
(preço do imóvel) e no eixo X (horizontal) está a nossa variável independente (m²).
Os pontos vermelhos são os dados da relação entre X e Y, ou seja, da relação entre m² e preço de
cada imóvel referencial. O R1 tem 62 m² com preço de R$ 700.000,00, sendo o ponto no canto
inferior esquerdo. Já o R8 tem 98 m² e seu preço é R$ 750.000,00, sendo o ponto no canto superior
direito.
A reta azul apresenta a tendência geral de variação desses dados, sendo a média. Veja que no canto
superior direito do gráfico, é exibida a equação desta reta. Neste caso hipotético, a reta é definida
por:
y=598.488+1.474,1x
Dessa forma, podemos predizer o preço de um imóvel, desde que tenha as condições e
características destes imóveis da amostra. Supondo que o imóvel a estimarmos o preço tenha 82,5
m². Qual seria seu preço? Seguindo a equação, considerando que o m² seja o x (na equação) e o y
seja o preço a ser determinado, vamos resolver esta questão:
y=598.488+1.474,1x
y=598.488+1.474,1∙82,5
y=598.488+121.613,30
y=720.101,25
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
Então, neste exemplo, usando apenas uma variável independente, é possível observar no gráfico
o resultado desta equação ilustrado pelas linhas verdes. Um imóvel com 82,5m² teria o preço de
R$ 720.101,25.
Z
X
Veja que temos um eixo Y vertical, um eixo X horizontal e um eixo Z diagonal. Esta poderia ser a
representação gráfica de um modelo com a variável preço, como dependente e as variáveis m² e
quantidade de dormitórios, como independentes.
Os pontos vermelhos seriam os dados, formado pela intersecção do preço, do m² e da quantidade
de dormitórios.
Perceba que a linha de tendência (azul nos gráficos anteriores) deu lugar para um plano amarelo.
Ligando cada ponto vermelho ao plano amarelo encontram-se linhas pretas que representam as
diferenças (ou resíduos) entre a média (o plano) e os dados observados.
No caso de 4 ou mais variáveis, teremos 4 ou mais eixos, tornando-se muito difícil de se representar
graficamente.
54
3
AULA
Regressão Linear
conceitos
Sendo:
Variável dependente
Coeficiente de Interseção
Perceba que o (erro) somente é usado na equação do modelo matemático da regressão, mas
não usado na equação para estimar o valor médio de Y. O propósito da avaliação imobiliária é o
de estimar o valor do imóvel que se esteja avaliando. É justamente por isso que a equação a ser
usada é a segunda, ou seja, a equação para estimar o valor médio de Y.
Vamos entender essa importante equação que usaremos nas avaliações imobiliárias, para
estimar o valor do imóvel avaliando:
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
Valor médio da variável independente que desejamos estimar (ou seja, o preço do imóvel
avaliando).
(lê-se beta zero): Coeficiente de Interseção. Ao traçar uma reta de tendência numa
representação gráfica, o valor deste coeficiente é o ponto onde esta reta corta o eixo (por isso
interseção).
(lê-se beta 1 xis 1): Coeficiente da variável independente 1 multiplicado pelo valor
para a variável independente 1. Refere-se à primeira variável da lista de variáveis independentes
usadas. No caso, por exemplo, de um imóvel avaliando de 2 dormitórios sendo que, na regressão,
o coeficiente da variável dormitórios seja 420, para resolver este trecho da fórmula bastaria
multiplicar o coeficiente pela quantidade de dormitórios, ou seja, multiplicar 420 por 2.
Coeficiente da variável independente n multiplicado pelo valor para a variável
independente n (sendo n igual a cada uma das demais variáveis independentes). Portanto, o
mesmo cálculo feito no trecho anterior deverá ser feito para cada variável independente usada.
Portanto, feitos os cálculos de multiplicação de cada trecho da fórmula, para cada variável
independente existente no modelo, para resolver a equação, bastará somar os resultados das
multiplicações com o coeficiente de interseção e, o resultado, será o preço estimado do imóvel
avaliando.
56
3
AULA
Regressão Linear
conceitos
Agora que temos mais conhecimento sobre a equação da regressão linear, vamos entender
melhor esta equação da reta, comparando-a com o modelo de equação da regressão:
O Y na equação da reta azul é o da equação da regressão para estimar o valor médio da nossa
incógnita que, no nosso caso, o preço do imóvel avaliando que se deseja estimar.
O valor 598.488 na equação da reta azul é o da equação da regressão para estimar o valor
médio de Y, ou seja, o coeficiente de interseção.
O valor 1.474,1 na equação da reta azul é o da equação da regressão para estimar o valor médio
de Y, ou seja, o coeficiente para a primeira variável independente usada no modelo de regressão
linear.
Temos que lembrar que serão somadas as multiplicações dos coeficientes pelos respectivos
valores de cada variável independente adicional que existir no modelo de regressão linear.
Neste caso do exemplo em questão, trata-se de uma regressão linear simples, ou seja, temos
apenas uma única variável independente (o m²), e nenhuma outra. Portanto, já realizamos a
multiplicação do coeficiente da variável independente ( ) pelo seu respectivo valor (X1). Desta
forma, numa regressão linear simples (com apenas 1 variável independente), a equação é por
uma simples equação de reta, sendo:
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
Os Coeficientes na regressão
Quando realizamos a regressão usando o Microsoft Excel, uma série de dados são apresentados,
como já mencionado anteriormente.
Para analisarmos um exemplo quanto aos coeficientes, usaremos a seguinte lista de imóveis
referenciais:
58
3
AULA
Regressão Linear
conceitos
Perceba que temos uma variável dependente (o preço) e 3 variáveis independentes (m², dormitórios
e condomínio).
Coeficientes
Interseção 264.577,34
m² 2.260,27
dormitório 3.355,68
condomínio 141,97
Na primeira coluna à esquerda, temos a identificação de cada a ser usado na equação de regressão
linear para estimar o valor médio de Y. A segunda coluna apresenta seus respectivos valores.
Na primeira linha de dados da coluna da esquerda temos o termo Interseção, de modo que o dado
numérico à sua direita é o valor do coeficiente de Interseção, ou seja, o 0.
Na segunda linha de dados da coluna da esquerda temos o termo m², sendo uma das variáveis
independentes usadas neste modelo de regressão. O dado numérico à sua direita é o coeficiente
desta primeira variável independente, ou seja, o 1.
Na terceira linha de dados da coluna da esquerda temos o termo dormitórios, sendo a segunda
variável independente usada neste modelo de regressão. O dado numérico à sua direita é o
coeficiente desta segunda variável independente, ou seja, o 2.
Por fim, na quarta linha de dados da coluna da esquerda temos o termo condomínio, sendo a
terceira e última variável independente usada neste modelo de regressão. O dado numérico à sua
direita é o coeficiente desta variável independente, ou seja, o 3.
Portanto, neste caso, como temos 3 variáveis independentes, trocamos o da fórmula por
, lembrando que o n subscrito representa que este cálculo deve ser feito para as n
variáveis independentes existentes.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
Neste caso, a equação de regressão linear completa para estimar o valor médio de Y, ficaria assim:
Seguem os passos de resolução desta equação, com os dados do resultado (exemplo) dos
coeficientes apresentados quando realizada a regressão no Microsoft Excel:
Coeficientes
Interseção 264.577,34
m² 2.260,27
dormitório 3.355,68
condomínio 141,97
Para que no modelo de regressão a ser usado, as variáveis independentes realmente possam
explicar satisfatoriamente a variação da variável dependente, deve-se seguir alguns pressupostos
que apresentaremos aqui como regras básicas.
A primeira regra essencial é que se tenha uma amostra com, pelo menos, a quantidade mínima,
conforme explicado quando abordado o Tamanho da amostra.
60
3
AULA
Regressão Linear
conceitos
Igualmente essencial é que todos os elementos devem apresentar todas as variáveis. Em outras
palavras, cada um dos imóveis referenciais deve conter algum dado para cada variável determinada
a ser usada. Por exemplo, vamos supor o caso em que tenha sido definida a utilização das variáveis
m², quantidade de dormitórios e valor do condomínio. Sabemos que precisaremos de 12 imóveis
referenciais (ver a fórmula de definição do Tamanho da amostra). Mas, para 2 imóveis não temos
o valor do condomínio e para um outro imóvel não temos a quantidade de dormitórios. Neste caso,
não será possível considerar esses 3 imóveis referenciais, pois não é possível realizar a regressão
com dados faltantes. Portanto, eliminando os 3 imóveis, restaram apenas 9 imóveis referenciais.
Como precisamos de, no mínimo, 12 imóveis para compor a amostra, precisaremos buscar outros
3 imóveis, ou obter os dados faltantes desses 3.
Além disso, é preciso respeitar rigorosamente os valores limites (mínimo ou máximo) dos
resultados, mencionados quando abordada a Análise da regressão. Caso esses limites não sejam
respeitados, o resultado final estará comprometido e, certamente será questionado (ou, pior,
refutado).
Devemos ter igual atenção à existência de colinearidades, conforme mencionado quando abordada
a Análise de correlação entre variáveis independentes.
Exercícios Aula 3
QUESTÃO 1
A) Uma técnica para analisar a relação de uma variável independente com diversas variáveis
dependentes, de modo a analisar o quanto esta variável dependente realmente explica as variáveis
independentes.
B) Uma técnica para analisar a relação de uma variável dependente com variáveis independentes,
de modo a analisar o quanto estas variáveis independentes realmente explicam a variável
dependente.
C) Uma técnica para analisar a correlação de variáveis independentes, de modo a analisar o quanto
estas variáveis realmente explicam suas existências.
D) Uma técnica para analisar a relação de uma variável dependente com variáveis independentes, de
modo a analisar o quanto elas se correlacionam e realmente explicam as variáveis independentes.
E) Uma técnica para analisar a correlação entre as variáveis dependentes, de modo a analisar o
quanto estas variáveis dependentes realmente explicam a variável independente.
QUESTÃO 2
QUESTÃO 3
62
3
AULA
Exercícios
QUESTÃO 4
QUESTÃO 5
A)
B)
C)
D)
E)
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
REGRESSÃO LINEAR NA
AULA 4 PRÁTICA – USANDO EXCEL
A regressão linear
Para realizar a regressão linear, serão usados os seguintes dados:
64
4
AULA
Regressão Linear na
prática – usando Excel
• área (m²)
• quantidade de dormitório
• quantidade de banheiro
• quantidade de piscina
• valor do condomínio
No Microsoft Excel, para realizar a Regressão, escolha no menu DADOS, a opção Análise de Dados.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
66
4
AULA
Regressão Linear na
prática – usando Excel
• F de significação: o resultado foi 9,048E-15. Este número está em notação científica e significa
0,000000000000009048 (um valor bem pequeno). Lembrando, este valor deve ser menor que 0,05.
Neste caso, devido ao resultado ser extremamente menor que o limite máximo, aparentemente,
existe relação entre as variáveis e, pelo menos, uma das variáveis independentes explica a variação
da variável dependente.
• valor-P de cada variável: Temos 5 variáveis e, portanto, devemos analisar cada uma delas
(lembrando que o valor-P deve ser menor que 0,10), sendo:
o valor-P de m² = 0,004: este valor-P está adequado por ser menor que 0,10;
o valor-P de dormitório = 0,090: este valor-P está adequado por ser menor 0,10;
o valor-P de banheiro = 0,701: este valor-P está inadequado por ser maior que 0,10;
o valor-P de piscina = 0,248: este valor-P está inadequado por ser maior que 0,10;
o valor-P de condomínio = 0,160: este valor-P está inadequado por ser maior que 0,10;
A variável que tem o maior valor-P é banheiro. Portanto, executaremos a regressão novamente,
com um novo conjunto de dados, composto de todos os mesmos dados que anteriormente
apresentados, mas, sem a coluna da variável banheiro.
68
4
AULA
Regressão Linear na
prática – usando Excel
Segue o resultado da regressão desta nova tabela, feita no Microsoft Excel, (com os números
apresentando 2 casas decimais):
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
• R-quadrado e R-quadrado ajustado: quase os mesmos valores que no modelo anterior (apenas
o R-quadrado ajustado aumentou de 0,975 para 0,976), continuando maiores que 0,7 e, portanto,
satisfatórios.
• F de significação: o resultado foi 5,8524E-16, menor que o resultado no modelo anterior (que foi
de 9,048E-15). Veja:
70
4
AULA
Regressão Linear na
prática – usando Excel
• valor-P de cada variável: Agora, temos 4 variáveis e, novamente, devemos analisar cada uma
delas (lembrando que o valor-P deve ser menor que 0,10), sendo:
o valor-P de m² = no modelo anterior foi 0,004 e neste modelo é 0,002 (menor que 0,10);
o valor-P de dormitório = no modelo anterior foi 0,090 e neste modelo é 0,055 (menor que
0,10);
o valor-P de piscina = no modelo anterior foi 0,248 e neste modelo é 0,240 (maior que 0,10);
o valor-P de condomínio = no modelo anterior foi 0,160 e neste modelo é 0,145 (maior que
0,10);
COMO RESOLVER ISSO?
A variável que tem o maior valor-P, desta vez, é Piscina. Vamos executar a regressão pela
terceira vez, agora, sem a variável piscina e sem a variável banheiro que já havíamos removido
anteriormente.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
Segue o resultado desta outra regressão, feita no Microsoft Excel, (com os números apresentando
2 casas decimais):
72
4
AULA
Regressão Linear na
prática – usando Excel
• R-quadrado e R-quadrado ajustado: o valor do R-quadrado ajustado não foi alterado e o valor
do R-quadrado ficou um pouco menor que no modelo anterior, mas, continuam satisfatórios.
• F de significação: o resultado, desta vez, foi ainda menor: 6,1150E-17, que significa
0,000000000000000061150, continuando satisfatório.
• valor-P de cada variável: Desta vez, temos 3 variáveis analisaremos cada uma delas (lembrando
que o valor-P deve ser menor que 0,10), sendo:
74
4
AULA
Regressão Linear na
prática – usando Excel
Segue o resultado da regressão, feita no Microsoft Excel, com apenas 2 variáveis independentes
(m² e condomínio):
• valor-P de cada variável (lembrando que o valor-P deve ser menor que 0,10), sendo:
4. Ambas variáveis apresentam valor-P menor que 0,10, sendo ambas satisfatórias.
PORTANTO, ESTE MODELO É SATISFATÓRIO!
Agora, sim, chegamos a um modelo que nos permitirá, para este caso, baseado na amostra usada,
estimar o valor do imóvel avaliando.
Importa lembrar que, neste caso, apenas as variáveis m² e condomínio foram usadas no modelo
satisfatório. Mas, em outros casos, é possível que, de acordo com a amostra, as variáveis dormitório
e vagas de garagem, por exemplo, se tornem mais significativas, ou mesmo outras variáveis que
sequer usamos ou citamos aqui. Tudo dependerá da escolha de variáveis e da obtenção dos dados
de mercado.
Agora, vamos nos basear no modelo de regressão que acabamos de ver para criar a equação de
regressão, utilizando o Microsoft Excel, com isso, calcular o valor de Y ̂, o valor do imóvel avaliando.
Segue o resultado da regressão, feita no Microsoft Excel, cujo modelo se demonstrou significativo:
76
4
AULA
Regressão Linear na
prática – usando Excel
Serão usados os coeficientes de interseção e das variáveis independentes que, neste caso, são m²
e condomínio.
Supondo que o imóvel avaliando tenha 98 m² e seu condomínio seja de R$ 485,00, segue a equação:
Caso tenhamos usado uma amostra com preços de locação, teremos um valor de locação para o
imóvel avaliando.
Caso tenhamos usado uma amostra com preços de venda, teremos um valor de venda para o imóvel
avaliando.
Mas, este valor é uma probabilidade estatística, já que estamos trabalhando com uma amostra
da população. Caso estivéssemos usando toda a população, poderíamos obter a verdadeira média
e, com isso, o valor médio exato. Mas, como não é possível obter os dados de toda a população
de imóveis similares ao imóvel avaliando, trabalhamos com uma amostra (alguns imóveis que
servem de referência). Isso significa que o verdadeiro valor do imóvel avaliando pode ser esse
mesmo, ou pode estar um pouco acima ou ainda um pouco abaixo desse valor que acabamos de
calcular.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
Portanto:
Esse intervalo de confiança não é simplesmente escolhido, mas, diferente disso, é calculado
estatisticamente e varia conforme definimos o nível de confiança e de significância na realização
da regressão.
• Intervalo de Confiança: Uma faixa de valores que tem ao centro o valor da média da nossa amostra.
Este intervalo se estende de um limite inferior, calculado pela média menos um determinado
valor, até o limite superior, calculado pela média mais esse mesmo determinado valor. Esse valor
é calculado a partir do Nível de Confiança.
78
4
AULA
Regressão Linear na
prática – usando Excel
e trabalhamos com apenas um único conjunto amostral. Por isso, determinamos, em percentual,
um nível de confiança referente a esses dados, para realizar todos os demais cálculos. Caso, por
exemplo, for determinado um percentual de 95%, isso significará dizer que se forem colhidas
diversas amostras aleatórias e calculada a média de todas elas, em 95% das vezes a verdadeira
média da população estaria na faixa de médias amostrais obtidas.
O Microsoft Excel oferece um recurso que apresenta diversos dados referentes à Estatística
Descritiva, com os quais podemos calcular o Intervalo de Confiança.
No Microsoft Excel, para realizar a Regressão, escolha no menu DADOS, a opção Análise de Dados.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
No quadro para entrada de dados da Estatística descritiva, entre com os seguintes dados:
Utilizando os mesmos dados usados anteriormente para criar a equação da regressão do modelo
de regressão que se demonstrou significativo, teremos o seguinte resultado quanto à Estatística
descritiva:
80
4
AULA
Regressão Linear na
prática – usando Excel
Preço
Média 525.125,00
Erro padrão 5.250,02
Mediana 526.500,00
Modo 550.000,00
Desvio padrão 25.719,75
Variância da amostra 661.505.434,78
Curtose - 0,98
Assimetria - 0,02
Intervalo 88.000,00
Mínimo 480.000,00
Máximo 568.000,00
Soma 12.603.000,00
Contagem 24,00
Nível de confiança(95,0%) 10.860,50
Usando o Microsoft Excel também é possível calcular o intervalo de confiança a partir de uma
função.
Funções do Microsoft Excel:
• INT.CONFIANÇA.NORM()
• INT.CONFIANÇA.T()
Apesar de existirem 2 funções para isso, usaremos apenas uma delas.
Vamos entender:
Sintaxe: INT.CONFIANÇA.T(alfa,desv_padrão,tamanho)
sendo:
• alfa: O nível de significância usado para calcular o nível de confiança. O nível de confiança
é igual a 100*(1 - alfa)% ou, em outras palavras, um alfa de 0,05 indica um nível de confiança de
95%.
• desv_padrão: O desvio padrão para o intervalo de dados, o qual pode ser calculado usando
a função DESVPAD.A() para o intervalo dos dados da variável dependente (o preço).
• tamanho: O tamanho da amostra, ou seja, a quantidade de elementos, que pode ser contado
usando a função CONT.NÚM() para o intervalo dos dados da variável dependente (o preço).
Caso sejam usados os mesmos dados da Estatística descritiva acima, o resultado será o mesmo:
10.860,50
82
4
AULA
Exercícios
Exercícios Aula 4
QUESTÃO 1
QUESTÃO 2
QUESTÃO 3
A) É uma estimativa intervalar referente aos valores exatos de uma faixa desconfiável.
B) É uma estimativa fixa referente aos valores exatos de uma faixa confiável.
C) É uma estimativa intervalar referente aos valores aproximados de uma faixa confiável.
D) É um dado fixo e exato do intervalo referente aos valores aproximados de uma faixa desconfiável.
E) É uma estimativa intervalar escolhida referente aos valores exatos de uma faixa confiável.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
QUESTÃO 4
A) Percentual de chance em que a verdadeira média da população estaria dentre as diversas médias
obtidas em infinitos conjuntos amostrais eventualmente colhidos.
B) Uma faixa de valores que tem ao centro o valor da média da nossa amostra.
C) Percentual de confiabilidade daquilo que se esteja tratando, sendo o limite que determina
se o resultado de um estudo pode ser considerado estatisticamente significativo depois de se
realizarem os testes estatísticos planejados.
D) É uma estimativa intervalar referente aos valores aproximados de uma faixa confiável.
E) É uma probabilidade estatística, já que estamos trabalhando com uma amostra da população.
QUESTÃO 5
Se somarmos o Nível de confiança com o Nível de significância, qual o valor deve resultar?
A) 0,05
B) 95%
C) 5%
D) 100%
E) 70%
84
5
AULA
Realizando uma avaliação
imobiliária inteira
3. Criar a tabela (com variáveis independentes e variável dependente) com os dados dos
imóveis referenciais.
5. Descartar:
a. uma das variáveis independentes totalmente colineares;
b. todas as variáveis cujos dados não variam (são constantes).
Exercícios Aula 5
QUESTÃO 1
Assinale a alternativa que apresenta um dos passos que devem ser realizados referentes à inferência
estatística para uma avaliação imobiliária.
QUESTÃO 2
Ao analisar a correlação entre duas variáveis independentes e perceber que sejam colineares (ou
seja, o coeficiente de correlação é igual a 1), o que devemos fazer?
QUESTÃO 3
Numa avaliação imobiliária utilizando inferências estatísticas, quando é o melhor momento para
calcular o Intervalo de confiança?
86
5
AULA
Exercícios
QUESTÃO 4
Dentre os resultados de uma regressão, o que devemos fazer caso o valor-P da variável Elevador
tenha resultado em 0,1037 e o valor-P da variável Piscina tenha resultado 0,23E-2?
A) Descartar a variável Piscina, pois apresenta o maior valor-P e realizar a regressão novamente.
B) Descartar a variável Elevador, pois apresenta o maior valor-P e realizar a regressão novamente.
C) Como o valor-P de ambas as variáveis é superior ao limite máximo para que uma variável
independente seja significativa, deve-se descartar ambas as variáveis e criar a equação da
regressão somente com as outras variáveis restantes.
D) Sendo 0,10 o limite máximo do valor-P para que uma variável independente seja significativa,
deve-se descartar ambas as variáveis e realizar a regressão novamente.
E) Não se deve fazer nada, pois o valor-P das variáveis está abaixo do limite superior e, portanto,
estas variáveis são significativas.
QUESTÃO 5
Analise os seguintes resultados da regressão e assinale a alternativa que apresenta o que deve ser
feito.
Mensagem final
Depois de todo o curso, realmente esperamos que você possa realizar as análises adequadas para
gerar avaliações imobiliárias baseadas em inferências estatísticas e, com isso, apresentar laudos
e pareceres de alto nível de significação.
Sugerimos que utilize este material para consultas futuras, de modo que sempre possa relembrar
conceitos, fórmulas e funções, para nunca apresentar um resultado equivocado.
Enfim, além de esperarmos que tenha desenvolvido entendimento para ser competente nesta
área, desejamos sucesso e boa sorte, já que sorte é um ingrediente muito bem-vindo para ampliar
o potencial de realizações.
Atenciosamente,
Andersom Bontorim
88
Referências Bibliográficas
CORRAR L.J., PAULO E, DIAS FILHO J.M. Análise multivariada para cursos de administração,
ciências contábeis e economia, São Paulo: Atlas, 2007.
DANTAS, Rubens Alves. Engenharia de avaliações: uma introdução a metodologia científica. 2. ed.
rev. de acordo com a NBR-14653-2:2004. São Paulo: PINI, 2005
GUNST, RICHARD F., MASON, ROBERT L., Regression Analysis and its application: A data-Oriented
Approach. Nova York: MARCEL DEKKER, INC., 1980.
LEVINE, DAVID M et al. Estatística – Teoria e aplicações usando o Microsoft Excel em português.
Trad. Eduardo Benedito Curtolo e Teresa Cristina Padilha de Souza. 3ª ed. Rio de Janeiro: LTC,
2005
GABARITO AULA 1
QUESTÃO 1
Comentário: População é o conjunto de todos os elementos que tenham, pelo menos, uma
característica em comum. É comum usarmos o termo “população” para nos referirmos ao conjunto
de pessoas de uma região. No entanto, em estatística, “população” não se restringe somente às
pessoas, estendendo-se a qualquer elemento. Por isso, ao se referir ao conjunto de algo, dizemos a
população desse algo. Por exemplo, a população de apartamentos de 3 dormitórios do município, é
o conjunto de todos os apartamentos que tenha essa característica, em específico (3 dormitórios)
de uma cidade específica.
QUESTÃO 2
QUESTÃO 3
Comentário: Moda é o valor que aparece com maior frequência no conjunto de dados. Os
estimadores de dispersão são úteis para identificar a homogeneidade do conjunto de dados.
Amplitude é a distância entre o menor e o maior valor num conjunto de dados numéricos. É
preciso ter ativado o Suplemento de Ferramentas de análise do Microsoft Excel para as análises
de inferência estatística. Portanto, a única afirmação correta é: Média, em estatística, é o valor
resultante da soma dos valores de um conjunto de dados, dividida pela quantidade de dados desse
conjunto.
90
Gabarito
QUESTÃO 4
Comentário: O resultado do cálculo da variância não é muito intuitivo, ou seja, à primeira vista,
aparentemente nos permite perceber a realidade dos dados. Isso ocorre porque trata-se de um
número elevado ao quadrado. Apesar disso, a variância é bastante utilizada nos demais cálculos
estatísticos.
QUESTÃO 5
Comentário: Se o desvio padrão é igual à raiz quadrada da variância (como visto na fórmula),
então a variância é igual ao desvio padrão elevado ao quadrado. Vejamos as fórmulas:
Fórmula da variância:
GABARITO AULA 2
QUESTÃO 1
Comentário: Variável dependente: algo que varia por causa de outros elementos. No nosso caso, o
preço dos imóveis é uma variável dependente pois varia dependendo da quantidade de dormitórios,
localização, tamanho e outros elementos, por exemplo.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA
QUESTÃO 2
Comentário: Variável independente: algo que varia sem depender de outros elementos. A
quantidade de dormitórios, numa lista de imóveis é algo que varia sem depender de outro fator.
Cada imóvel, simplesmente, tem uma quantidade específica de dormitórios.
QUESTÃO 3
Comentário: Para calcular a quantidade mínima de imóveis referenciais, basta somar a quantidade
de variáveis independentes que serão usadas. A fórmula é extremamente simples:
n = 3(k + 1)
Sendo:
n : o tamanho da amostra (a quantidade mínima de imóveis referenciais);
k : a quantidade de variáveis independentes (as características a serem consideradas).
QUESTÃO 4
92
Gabarito
QUESTÃO 5
Comentário: Nesta correlação, os imóveis NÃO aparecem numa mesma coluna. Se esta correlação
continuar a mesma, baseando-se nesta amostra, imóveis de 5 dormitórios teriam 5 banheiros. A
quantidade de dormitórios e a quantidade de banheiros se correlacionam, sim. A linha diagonal
sólida apresenta, sim, a tendência dessa correlação.
GABARITO AULA 3
QUESTÃO 1
Comentário: Em estatística, sendo mais específico, pelo termo “regressão” quer-se dizer uma
técnica para analisar a relação de uma variável dependente com variáveis independentes, de modo
a analisar o quanto estas variáveis independentes realmente explicam a variável dependente. No
nosso caso, tratando-se de avaliações mercadológicas de imóveis, já vimos que o preço dos imóveis
é a nossa variável dependente, sendo que as demais variáveis, que potencialmente explicariam a
variação desse preço, são as nossas variáveis independentes.
QUESTÃO 2
QUESTÃO 3
Comentário: Regressões lineares apresentam apenas uma variável dependente. A regressão linear
é múltipla, quando apresentar duas ou mais variáveis independentes. E será simples quando
apresentar apenas uma variável independente.
QUESTÃO 4
QUESTÃO 5
Mas, o enunciado da questão pede a equação do modelo de regressão para estimar o valor médio
de Y. Então, temos que lembrar que o (erro) somente é usado na equação do modelo matemático
da regressão, mas não usado na equação para estimar o valor médio de Y. Portanto, a equação para
estimar o valor médio de Y é:
94
Gabarito
GABARITO AULA 4
QUESTÃO 1
QUESTÃO 2
Comentário: Quando calculamos o valor de , temos uma média geral, baseada na regressão
linear, do estimado valor do imóvel avaliando. Este valor é uma probabilidade estatística, já que
estamos trabalhando com uma amostra da população. Caso estivéssemos usando toda a população,
poderíamos obter a verdadeira média e, com isso, o valor médio exato. Mas, não sendo possível
obter os dados de toda a população, trabalhamos com uma amostra. Isso significa que o verdadeiro
valor pode estar um pouco acima ou ainda um pouco abaixo desse valor que acabamos de calcular.
QUESTÃO 3
QUESTÃO 4
diferentes elementos, teríamos outra média. Se continuarmos repetindo essa ação, criaríamos
diversos conjuntos amostrais e, para cada um deles, teríamos uma média diferente. Com isso,
considerando todas as médias que poderíamos ter obtido, seria possível dizer que a média na
população, provavelmente, estaria dentro dessa faixa de valores médios dos diversos conjuntos
de amostras. Mas, diferente disso, não poderemos colher diversos conjuntos amostrais e
trabalhamos com apenas um único conjunto amostral. Por isso, determinamos, em percentual,
um nível de confiança referente a esses dados, para realizar todos os demais cálculos. Caso, por
exemplo, for determinado um percentual de 95%, isso significará dizer que se forem colhidas
diversas amostras aleatórias e calculada a média de todas elas, em 95% das vezes a verdadeira
média da população estaria na faixa de médias amostrais obtidas.
QUESTÃO 5
GABARITO AULA 5
QUESTÃO 1
Comentário: Ainda que possa ser interessante para a avaliação imobiliária, obter registros
fotográficos dos imóveis referenciais, não é um passo referente à inferência estatística. Não é
possível calcular a moda do imóvel avaliando, pois, para calcular a moda, deve-se ter mais de um
elemento. Não criamos a tabela da população, mas apenas da amostra colhida. Não determinamos
o preço dos imóveis referenciais, pois estes são dados que colhemos do mercado. Temos que
executar a regressão linear até obter um modelo significativo e, por isso, descartamos variáveis
independentes que apresentarem o valor-P superior a 0,10.
QUESTÃO 2
Comentário: Para ilustrar este conceito, consideremos a correlação entre a variável piscina e a
variável salão de festas. Se o resultado do coeficiente de correlação destas variáveis for igual a
1, isso significa que estas duas variáveis são colineares, ou seja, variam na mesma proporção.
Então, a quantidade de piscinas e a quantidade de salão de festas varia igualmente. Então, ambas
96
Gabarito
influenciam o preço dos imóveis da mesma forma. Por isso, temos que descartar uma destas duas
variáveis. Podemos descartar piscina ou salão de festas. Tanto faz. Mas, devemos ficar com uma
delas.
QUESTÃO 3
Comentário: Para montar a tabela no Excel, temos que seguir uma regra simples: manter
adjacentes as colunas das variáveis independentes, ou seja, todas juntas, uma ao lado da outra,
sem espaço entre elas.
QUESTÃO 4
Comentário: O limite máximo para o valor-P, resultante em uma regressão, de uma variável
independente, para considerá-lo significativo é de 0,10. O valor-P da variável Elevador está
acima deste limite. Já o valor-P da variável Piscina está adequado, pois seu valor está em notação
científica, que significa 0,23 x 10-2, ou seja, 0,0023, que é o mesmo que 2,3 x 10-3. Então, a variável
Piscina é significativa e a variável Elevador não é significativa. Portanto, descartamos a variável
elevador e realizamos a regressão novamente.
QUESTÃO 5
Comentário: De todas as variáveis cujo valor-P seja maior que o limite máximo (0,10), devemos
destacar a variável que tenha o maior valor-P e realizar a regressão novamente, considerando
apenas as demais variáveis. O valor-P da variável m² está em notação científica e é um valor-P
abaixo do limite máximo. O valor-P da variável dormitório também está abaixo do limite máximo.
O valor-P da variável elevador está em notação científica e é um valor-P abaixo do limite máximo.
O valor-P das variáveis banheiro e vaga estão acima do limite máximo. Devemos descartar apenas
a que apresente o maior valor-P, que, neste caso, é a variável banheiro, e realizar a regressão
novamente, considerando apenas as demais variáveis.