Você está na página 1de 97

INFERÊNCIA ESTATÍSTICA PARA

AVALIAÇÃO IMOBILIÁRIA
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

Olá! Sou Andersom Bontorim,


autor deste curso de Inferência
Estatística para Avaliação
Imobiliária.

Sou graduado em Processamento de Dados, com curso superior de extensão em Gestão e


Planejamento de Marketing e Vendas, bacharelando em Administração, pós-graduado
em Neurociências, mestre em Administração, tendo pesquisado as variações de preços de
imóveis em momentos de recessão econômica, doutorando em Administração, realizando
pesquisas sobre Ciência de Serviços, Mediador e Conciliador Judicial, Corretor de imóveis,
inscrito no CNAI - Cadastro Nacional de Avaliadores Imobiliários, tendo ministrado mais de
180 palestras no CRECISP – Conselho Regional de Corretores de Imóveis, por todo o Estado
de São Paulo, criador do curso de Avaliação Imobiliária e do curso de Ser Perito Judicial para
Corretores de Imóveis, ambos do IBRESP, com experiência em perícias para determinação
de valor mercadológico de bens imóveis.

Parabéns por ter tomado a decisão de participar deste curso de Inferência Estatística
para Avaliação Imobiliária. Espero que eu possa ajudar na sua jornada para desenvolver
competência em aplicar as técnicas aqui apresentadas e, com isso, engrandecer suas
avaliações mercadológicas de bens imóveis.

Este curso de Inferência Estatística para Avaliação Imobiliária foi estruturado com
momentos conceituais e diversos momentos práticos, nos quais, a partir de vídeos,
mostramos o uso dos recursos, fórmulas e funções no software Excel, para que você possa
facilmente reproduzir em seu equipamento e desenvolver a habilidade necessária.

O conteúdo desta apostila está formatado de modo que sejam apresentados os assuntos na
mesma sequência que são disponibilizados nas aulas. Desta forma, a apostila será útil para
acompanhamento das aulas, assim como poderá servir para consultas futuras.

Sinceramente, espero que você tenha sucesso.


Aproveite este conteúdo!

2
Inferência Estatística para Direitos Autorais
Avaliação Imobiliária
AUTOR
Andersom Bontorim

INSTITUTO BRASILEIRO DE EDUCAÇÃO


DIRETOR PRESIDENTE
Arnaldo Manoel Alves PROFISSIONAL DO ESTADO DE SÃO PAULO

Informamos que é de inteira


DIRETORA DE OPERAÇÕES responsabilidade do(s) autor(es) a emissão
Jaqueline Araújo
dos conceitos.

COORDENAÇÃO DE CURSOS Nenhuma parte desta publicação poderá ser


Lisamar Delazeri Castro reproduzida por qualquer meio ou forma
sem prévia autorização do IBRESP.
COORDENAÇÃO DE PRODUÇÃO DE CURSOS
Rosa Maria Simone A violação dos direitos autorais é crime
estabelecido na Lei 9.610/98 e punido de
acordo com o Art. 184 do Código Penal.
PROJETO GRÁFICO E DIAGRAMAÇÃO
Marcos Tadeu Cecone

Dados Internacionais de Catalogação na Publicação (CIP)

Bontorim, Anderson
Inferência estatística para avaliação imobiliária
[livro eletrônico] / Andersom Bontorim. –- São Paulo:
IBRESP, 2021
12,2 mb

Formato: PDF
ISBN: 978-65-88399-27-9

1. Estatística. 2. Inferência estatística.


3. Avaliação imobiliária. I. Título.
CDD-310

Sueli Costa - Bibliotecária - CRB-8/5213


(SC Assessoria Editorial, SP, Brasil)

Índice para catálogo sistemático:


1. Estatística 310
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

SUMÁRIO
INTRODUÇÃO...................................................................................................... 06
ATIVANDO O SUPLEMENTO DE FERRAMENTA
DE ANÁLISE DO MICROSOFT EXCEL................................................................... 07

AULA 1 – CONCEITOS FUNDAMENTAIS


• DEFINIÇÃO E APLICAÇÃO DA ESTATÍSTICA................................................................ 11
• REALIZAÇÃO DE INFERÊNCIAS....................................................................................... 12
• POPULAÇÃO, AMOSTRA E ELEMENTO.......................................................................... 13
• MODA, MÉDIA E MEDIANA.............................................................................................. 14
• ESTIMADORES DE DISPERSÃO........................................................................................ 20

AULA 2 – PREPARAÇÃO DA TABELA DE DADOS


• VARIÁVEIS DEPENDENTE E INDEPENDENTES........................................................... 28
• TAMANHO DA AMOSTRA (QUANTIDADE DE ELEMENTOS)..................................... 30
• PLANEJAMENTO DA PESQUISA E LEVANTAMENTO DOS DADOS........................... 31
• TRATAMENTO DOS DADOS (CRIANDO A TABELA NO MICROSOFT EXCEL)......... 33
• ANÁLISE DE DISPERSÃO DOS DADOS.............................................................................35
• ANÁLISE DE CORRELAÇÃO ENTRE VARIÁVEIS INDEPENDENTES..........................36
• DETERMINAÇÃO INICIAL DOS DADOS A SEREM USADOS.........................................43

4
AULA 3 – REGRESSÃO LINEAR - CONCEITOS
• DEFINIÇÃO.......................................................................................................................... 46
• ANÁLISE DE REGRESSÃO................................................................................................. 48
• MODELO DE REGRESSÃO LINEAR..................................................................................51
• REPRESENTAÇÃO GRÁFICA DO MODELO DE REGRESSÃO LINEAR....................... 52
• EQUAÇÃO DE REGRESSÃO LINEAR SIMPLES E MÚLTIPLA..................................... 55
• OS COEFICIENTES NA REGRESSÃO............................................................................... 58
• PRESSUPOSTOS BÁSICOS PARA VALIDAÇÃO DO MODELO...................................... 60

AULA 4 – REGRESSÃO LINEAR NA PRÁTICA – USANDO EXCEL


• A REGRESSÃO LINEAR...................................................................................................... 64
• ANALISANDO CADA ELEMENTO DOS RESULTADOS OBTIDOS NO EXCEL...........67
• CRIANDO A EQUAÇÃO DE REGRESSÃO......................................................................... 76
• DEFININDO O INTERVALO DE CONFIANÇA.................................................................77

AULA 5 – REALIZANDO UMA AVALIAÇÃO IMOBILIÁRIA INTEIRA


• MENSAGEM FINAL............................................................................................................ 88


INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

INTRODUÇÃO
Este material é parte integrante do curso de Inferência Estatística para Avaliação Imobiliária
oferecido pelo IBRESP.

Após as introduções conceituais sobre o conteúdo abordado, será apresentado como realizar os
cálculos e análises estatísticas utilizando a planilha eletrônica Microsoft Excel. Muitas das análises
realizadas demandam que esteja habilitado, no Excel, o Suplemento de Ferramenta de Análise. É
por isso que, neste material, já apresentamos de início como habilitar esse suplemento.

Lembre-se de reproduzir em seu equipamento os passos apresentados referentes aos cálculos,


uso de fórmula e funções, bem como as análises realizadas no Microsoft Excel para que possa
ampliar seu potencial de assimilação de todo o conteúdo.

Aproveite cada conteúdo apresentado.


Desejamos sucesso nesta sua jornada!

6
ATIVANDO O SUPLEMENTO DE FERRAMENTA DE
ANÁLISE DO MICROSOFT EXCEL

Neste material apresentamos como fazer todos os cálculos utilizando a planilha eletrônica
Microsoft Excel.

Mas, é preciso ter ativado o Suplemento de Ferramentas de análise do Microsoft Excel.

Quando este suplemento está ativado, no menu Dados, aparecerá a opção Análise de dados na
extrema esquerda. Caso o Microsoft Excel não apresente esta opção de menu, basta ativá-lo. Como
a maioria dos usuários desse software não utiliza este recurso, a instalação padrão não ativa esse
recurso.

Para ativar Suplemento de Ferramentas de análise do Microsoft Excel, realize os seguintes passos:

1 Carregue o software Microsoft Excel.


INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

2 Clique em Arquivo.

3 Na tela que abrir, escolha o item Opções.

8
4 No quadro que abrir, escolha Suplementos.

Em Gerenciar, dentre as opções da lista, escolha


5 Suplementos do Excel e clique no botão Ir...
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

Aparecerá um quadro com vários suplementos disponíveis. Dentre eles, as


6 Ferramentas de Análise, que é o que nos interessa. Clique na caixa de seleção
ao lado esquerdo de Ferramentas de Análise para selecionar esse suplemento
e clique no botão OK.

Com isso, o suplemento foi ativado e estará disponível para o uso.

10
1
AULA
Introdução e Conceitos
fundamentais

INTRODUÇÃO E CONCEITOS
AULA 1 FUNDAMENTAIS

NESTA AULA CONTEXTUALIZAREMOS A INFERÊNCIA ESTATÍSTICA


E APRESENTAREMOS OS CONCEITOS BÁSICOS E FUNDAMENTAIS.

Definição e aplicação da estatística

O QUE É INFERÊNCIA ESTATÍSTICA?

INFERÊNCIA é resultado de um processo intelectual, ou seja, o raciocínio, pelo qual se obtém uma
conclusão a partir de indícios ou premissas, de modo que a proposição é considerada verdadeira
pela comparação com outras já tidas como verdadeiras.

Indícios são sinais que indicam aquilo que ocorreu ou existiu. Portanto, os indícios servem de
prova da existência de algo.

Premissas são fatos iniciais de um raciocínio ou estudo, com os quais é possível obter conclusões.
Portanto, a partir de dados iniciais que sejam verdadeiros, é possível realizar um processo lógico
para alcançar, como resultado, uma conclusão final, a qual pode ser comprovada.

ESTATÍSTICA é o ramo das matemáticas aplicadas que se fundamenta na teoria das probabilidades
com o objetivo de estudar uma série de dados numéricos.

Dentre os ramos da Estatística, destacamos os dois seguintes, que são usados, conjuntamente, na
avaliação imobiliária para determinação do valor de um bem imóvel:

Estatística Descritiva: Ramo da estatística que descreve resumos quantitativos, ou seja, resultados
de mensurações, referentes a uma coleção de um conjunto de dados numéricos.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

Estatística Inferencial: Ramo da estatística que busca deduzir conclusões a respeito de um


conjunto específico de dados, de modo a explicar propriedades ou características referentes a
esses dados.

INFERÊNCIA ESTATÍSTICA
Conjunto de ferramentas estatísticas que objetiva, a partir de um conjunto de dados numéricos,
fazer proposições consideradas verdadeiras, devido à comparação com outras já tidas como
verdadeiras.

Realização de inferências
Lembrando, em resumo, inferir é deduzir e, portanto, concluir algo a partir de dados verdadeiros.

Exemplo 1: Imagine uma lista de imóveis, sendo que o mais barato tenho o preço de R$ 150.000,00
e o mais caro de R$ 890.000,00. Neste caso, podemos inferir que qualquer imóvel que colhermos
desta lista terá um preço entre estes dois valores. Apesar de óbvio, este é um exemplo de inferência.

Exemplo 2: Imagine que valor médio do m² de imóveis numa determinada região é de R$


5.000,00 e que existe um imóvel à venda nesta região com 150 m². Pode-se afirmar que seu preço,
provavelmente, seja de R$ 750.000,00. Esta é uma conclusão baseada em 2 dados verdadeiros,
sendo um constante (dimensão do imóvel) e um variável (valor médio do m²).

Atenção!
Quando usamos um valor médio, não sabemos qual é o menor valor nem qual é o maior valor. Se
o menor valor for R$ 1.000,00 e o maior valor for R$ 10.000,00, é possível que a média seja de R$
5.000,00. Da mesma forma, se o menor valor for R$ 4.000,00 e o maior valor for R$ 6.000,00,
igualmente podemos ter uma média de R$ 5.000,00. Então, neste caso, temos uma faixa de
variabilidade do provável preço do imóvel em questão.

Portanto...

Na determinação do valor de um imóvel a partir da inferência estatística será apresentado o valor


determinado do imóvel, o intervalo de variabilidade desse valor e o percentual de chance de que
isso esteja correto.

12
1
AULA
Introdução e Conceitos
fundamentais

População, Amostra e Elemento


Elemento: Um único item. O imóvel a ser avaliado, por exemplo, é um elemento, assim como um
único imóvel de uma lista de imóveis, também é um elemento.

População: Conjunto de todos os elementos que tenham, pelo menos, uma característica em
comum. É comum usarmos o termo “população” para nos referirmos ao conjunto de pessoas
de uma região. No entanto, em estatística, “população” não se restringe somente às pessoas,
estendendo-se a qualquer elemento. Por isso, ao se referir ao conjunto de algo, dizemos a
população desse algo. Por exemplo, a população de apartamentos de 3 dormitórios do município, é
o conjunto de todos os apartamentos que tenham essa característica, em específico (3 dormitórios)
de uma cidade específica.

Amostra: Subconjunto de uma população. Em outras palavras é um conjunto menor, formado


de alguns elementos do conjunto de todos os elementos que tenham características próprias.
Então, por exemplo, quando colhemos uma lista de 10 apartamentos de 3 dormitórios, temos uma
amostra da população de apartamentos de 3 dormitórios. Perceba que esses 10 apartamentos não
são a totalidade de apartamentos da região e, portanto, trata-se de um conjunto menor formado
de alguns elementos da população.

EXPLICANDO...

Imagine se pudéssemos ter a descrição e o preço de todos os imóveis existentes numa região. Neste
caso, teríamos os dados de toda a população de imóveis. Agora, imagine que todos os imóveis são
idênticos. Se fosse assim, então, determinar o valor de um imóvel seria muito fácil. Se todos são
iguais, o valor de um seria igual ao do outro. Determinar o valor de um imóvel não dependeria de
qualquer raciocínio, pois seria o mesmo valor que de qualquer outro. Talvez tivéssemos alguma
pequena variação por causa da localização, mas, ainda assim, seria muito fácil definir o valor de
um imóvel. No entanto, a realidade não é essa.
Os imóveis não são idênticos e, por isso, seus preços variam tanto. Mesmo assim, se tivéssemos, em
mãos, todos os preços de todos os imóveis, poderíamos dividi-los em grupos por características
específicas e, com isso, teríamos o preço de todos os imóveis de uma determinada característica.
Da mesma forma, teríamos os dados de toda a população de um tipo de imóvel específico. Por
exemplo, poderíamos ter os dados de todas as casas de 2 dormitórios com 1 vaga na garagem.
Neste caso, também seria bem fácil determinar o valor de uma outra casa, desde que, neste
exemplo, ela tivesse 2 dormitórios e 1 vaga na garagem. Seria algo em torno da média dos preços
da população. Claro que essa descrição da casa foi muito rasa e, na realidade, existem várias outras
características num imóvel que podem distinguir o seu preço. Mas, valeu para ilustrar o conceito.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

No entanto, sequer temos os preços de todos os imóveis específicos de uma região. Mas,
conseguimos obter os preços de alguns imóveis que possam ser similares ao imóvel que estivermos
avaliando. A esta lista de imóveis similares dá-se o nome de lista de imóveis referenciais, pois
servirão de referência para compor o valor do imóvel em questão. Essa lista, por ser composta de
alguns imóveis e não todos, é uma amostra.

Enfim, cada um dos imóveis referenciais é um elemento, tanto da amostra, quanto da população
de imóveis. Assim como o imóvel que se esteja avaliando também é um elemento da população de
imóveis.

Moda, Média e Mediana

No campo da Estatística Descritiva, temos as chamadas MEDIDAS DE TENDÊNCIA CENTRAL.


São assim chamadas, por apresentarem a centralidade de um dado, conforme um certo conceito
aplicado.

MODA: valor que aparece com maior frequência no conjunto de dados.

Aquilo que mais se repete é, em estatística, a moda. Perceba que o mercado de vestimenta se
apoderou desse termo para definir aquilo que é (ou que se pretende que seja) mais usado. Então, se
estiver na moda usar calça jeans, estatisticamente, significaria dizer que ao analisar um conjunto
de pessoas, teremos mais pessoas usando calça jeans do que usando cada um dos outros tipos de
calças.

Por exemplo, vejamos o seguinte conjunto de dados, referentes a preços de imóveis do tipo
apartamento, de 3 dormitórios, com 2 vagas na garagem.

14
1
AULA
Introdução e Conceitos
fundamentais

R$ 750.000,00
R$ 820.000,00
R$ 680.000,00
R$ 750.000,00
R$ 800.000,00
R$ 720.000,00
R$ 810.000,00
R$ 680.000,00
R$ 750.000,00

Para facilitar a visualização, vamos apresentar esses mesmos elementos em ordem crescente:

R$ 680.000,00
R$ 750.000,00
R$ 750.000,00
R$ 750.000,00
R$ 800.000,00
R$ 810.000,00
R$ 820.000,00
R$ 850.000,00
R$ 875.000,00
R$ 890.000,00
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

Perceba que temos 1 imóvel com o preço de R$ 680.000,00, 3 imóveis com o preço de R$ 750.000,00,
1 com o preço de R$ 800.000,00, 1 com o preço de R$ 810.000,00, 1 com o preço de R$ 820.000,00,
1 com o preço de R$ 850.000,00, 1 com o preço de R$ 875.000,00 e o último com o preço de R$
890.000,00. Neste caso, portanto, o preço que mais se repete é o de R$ 750.000,00. Este preço é a
moda neste conjunto de preços de imóveis.

Veja que não se calcula a moda, já que é o resultado da observação dos dados. Aquele que mais se
repete é a moda.

As idades dos imóveis, é um bom exemplo de dados em que podemos observar a moda.
Normalmente essas idades variam de 0 anos a uns 70 anos (salvo casos raros de edificações
históricas). Como trata-se de uma variação relativamente pequena, pois entre os números 0 e
70, temos apenas 71 possibilidades, caso tenhamos uma amostra de 900 imóveis, ainda assim,
teremos apenas 71 possibilidades de idades. Portanto, é bem fácil obtermos a moda. Basta que
tenhamos todas as idades dos imóveis de uma amostra, por exemplo, e poderemos contar quantas
vezes aparece cada idade. A idade que aparecer mais vezes será a moda.

Diferente disso, são os preços dos imóveis que variam muito. Caso tenhamos a mesma amostra
de 900 imóveis, sendo que o preço do mais barato seja R$ 680.000,00 e do mais caro seja R$
890.000,00, teremos aqui uma quantidade enorme de possibilidades de preços. Entre os números
680 mil e 890 mil temos mais de 200.000 possibilidades. Um imóvel, por exemplo, pode ter o
preço de R$ 710.000,00, enquanto outro tenha o preço de R$ 710.500,00 e serão valores diferentes.
Então, neste caso, torna-se difícil encontrar a moda, pois teremos uma quantidade enorme de
possibilidades. Por isso, é comum que sejam atribuídas faixas de preços e seja obtida a moda da
faixa de preço. É comum essa prática em questionários que nos perguntam a faixa salarial. É muito
raro que seja perguntado o salário das pessoas, já que este igualmente varia muito. Mas, a faixa
salarial se torna um dado mais fácil de se tratar para se obter a moda.

Então, agora, para a mesma lista de preços de imóveis do exemplo anterior, vamos criar as
seguintes faixas de preços:

Faixa 1: de R$ 600.000,00 a R$ 699.999,99

Faixa 2: de R$ 700.000,00 a R$ 799.999,99

Faixa 3: de R$ 800.000,00 a R$ 899.999,99

16
1
AULA
Introdução e Conceitos
fundamentais

Neste segundo caso, veja que temos 1 imóvel na faixa 1, temos 3 imóveis na faixa 2 e temos 6
imóveis na faixa 3.

Portanto, por faixas de preços, a moda é a faixa 3. Perceba que a faixa 3 nem sequer contempla a
moda anteriormente obtida.

Então, é sempre muito importante, ao usar a moda, em estatística, definir claramente do que é
que se deseja saber a moda.

MÉDIA: valor resultante da soma dos valores de um conjunto de dados, dividida pela quantidade
de dados desse conjunto. É chamada de média aritmética, por ser aritmética a ciência que estuda
as propriedades elementares dos números racionais.

Existem dois tipos de média aritmética:

Média Aritmética Simples: usada quando os valores são relativamente uniformes. Por exemplo,
se temos 5 imóveis no mesmo edifício, cada um com um preço, podemos obter a média do valor
de um imóvel desse edifício. Basta somarmos os preços de cada um e dividirmos o resultado por 5.

VEJAMOS:
(R$ 240.000,00 + R$ 245.000,00 + R$ 250.000,00 + R$ 255.000,00 + R$ 260.000,00) / 5
R$ 1.250.000,00 / 5 = R$ 250.000,00
A média aritmética simples, neste caso, é de R$ 250.000,00.

Média Aritmética Ponderada: usada quando os dados têm pesos diferentes. Por exemplo, um
aluno de um curso que se distribui em 4 estágios, sendo que o estágio 1 tem peso 1, o estágio 2 tem
peso 2, o estágio 3 tem peso 3 e o estágio 4 tem peso 4. Neste exemplo, a soma dos pesos é igual a
10 (1+2+3+4). Neste caso, multiplica-se a nota de cada estágio pelo seu respectivo peso, soma-se
os resultados e o total é dividido pela soma dos pesos.

VEJAMOS:
Nota do estágio 1: 10
Nota do estágio 2: 9
Nota do estágio 3: 8
Nota do estágio 4: 7
[(10 x 1) + (9 x 2) + (8 x 3) + (7 x 4)] / 10
[10 + 18 + 24 + 28] / 10
80 / 10 = 8

A média aritmética ponderada, neste caso, é de 8.


INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

MEDIANA: medida de localização do centro da distribuição dos dados. Para descobrir a mediana,
basta ordenar o conjunto de dados numéricos, sendo que a mediana dividirá essa lista ao meio,
de modo que a quantidade de elementos com valores menores que a mediana será a mesma
quantidade de elementos com valores maiores que a mediana. Por exemplo, se usarmos a mesma
lista de preços de imóveis usada no exemplo da média aritmética simples, visto anteriormente, já
em ordem crescente, temos:

R$ 240.000,00
R$ 245.000,00
R$ 250.000,00
R$ 255.000,00
R$ 260.000,00

Perceba que o preço R$ 250.000,00 se encontra exatamente no meio da lista, restando 2 elementos
com preços menores e outros 2 elementos com preços maiores. Sempre que tivermos uma lista
com uma quantidade ímpar de elementos, deve-se ordenar a lista e a mediana será o elemento
que estiver no meio da lista.

Mas, quando a lista contiver uma quantidade par de elementos, não haverá um elemento no meio.
Neste caso, a mediana será a média aritmética simples dos 2 elementos que estiverem no meio da
lista. Por exemplo, adotemos a lista de preços de imóveis do tipo apartamento, de 3 dormitórios,
com 2 vagas na garagem, já em ordem crescente, que foi usada anteriormente no exemplo da
moda, sendo:

R$ 680.000,00
R$ 750.000,00
R$ 750.000,00
R$ 750.000,00
R$ 800.000,00
R$ 810.000,00
R$ 820.000,00
R$ 850.000,00
R$ 875.000,00
R$ 890.000,00

Esta lista contém 10 elementos e, por isso, não haverá um elemento ao meio, mas, diferente
disso, temos 2 elementos, sendo o preço R$ 800.000,00 e o preço R$ 810.000,00. Temos 4 preços
menores que R$ 800.000,00 e outros 4 preços maiores que R$ 810.000,00. Portanto, a mediana,
neste caso, será igual à média aritmética simples entre R$ 800.000,00 e R$ 810.000,00, ou seja,
R$ 805.000,00.

18
1
AULA
Introdução e Conceitos
fundamentais

Exemplo com moda, média e mediana:


Veja a tabela abaixo.

Preços de imóveis
750.000,00
750.000,00
750.000,00
780.000,00
800.000,00
810.000,00
820.000,00
880.000,00
890.000,00
900.000,00
910.000,00
920.000,00

Vejamos estes números num gráfico de barras:


INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

O mesmo gráfico, apresentando a MODA, MÉDIA e MEDIANA:

Estimadores de dispersão

Estimadores de dispersão, em estatística, são resultados de cálculos que indicam o quanto, em


média, os elementos estão espalhados ou separados uns dos outros. Trata-se, então, de cálculos
que demonstram o distanciamento dos elementos

OS ESTIMADORES DE DISPERSÃO SÃO ÚTEIS PARA IDENTIFICAR


A HOMOGENEIDADE DO CONJUNTO DE DADOS.

Mais homogêneo um conjunto de dados = maior proximidade numérica entre os dados

20
1
AULA
Introdução e Conceitos
fundamentais

Por exemplo, veja o seguinte conjunto de preços de imóveis:

160.000,00
280.000,00
350.000,00
480.000,00
500.000,00
650.000,00
720.000,00

A distância entre esses valores é grande. Trata-se de um conjunto pouco homogêneo de preços de
imóveis. Portanto, temos uma grande dispersão de dados.

AMPLITUDE: Distância entre o menor e o maior valor num conjunto de dados numéricos. A
amplitude demonstra o tamanho total da dispersão de uma série de números e é obtida pela
diferença entre seus dois extremos.
Para encontrar a amplitude, no exemplo apresentado acima, basta subtrair o menor preço do
maior preço, sendo:

720.000,00 – 160.000,00 = 560.000,00

Quanto menor a amplitude, menos dispersos são os valores e mais homogêneos serão os dados.
Quanto maior a amplitude, mais dispersos são os valores e menos homogêneos serão os dados.

Existem outros 2 estimadores de dispersão que são largamente utilizados em estatística: variância
e desvio padrão.

Os seus cálculos são muito similares, já que:

• A variância é igual ao desvio padrão elevado ao quadrado.

e, portanto...

• O desvio padrão é igual à raiz quadrada da variância.


INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

Na notação matemática (forma de escrita das fórmulas matemáticas), temos que:


Para os cálculos referentes à AMOSTRA usa-se:
S (letra latina S em itálico) para o desvio padrão
S2 (letra latina S em itálico elevado ao quadrado) para a variância.
Para os cálculos referentes à POPULAÇÃO usa-se:
σ (letra grega sigma) para o desvio padrão
σ2 (letra grega sigma elevada ao quadrado) para a variância

VARIÂNCIA: Num conjunto de dados numéricos (amostra ou população), a variância indica o


quão distante seus valores se encontram de um determinado valor esperado. No nosso caso, o
valor esperado é a média. O resultado do cálculo da variância não é muito intuitivo, ou seja, à
primeira vista, aparentemente nos permite perceber a realidade dos dados. Isso ocorre porque
trata-se de um número elevado ao quadrado. Apesar disso, a variância é bastante utilizada nos
demais cálculos estatísticos.

A variância de um conjunto de dados é calculada pela média dos quadrados das diferenças entre os
valores em relação à média. Veja a fórmula:

Onde:
S2: Variância amostral (variância de uma amostra e não da população);
∑ni=1: Letra grega sigma maiúscula que representa somatória, tratando-se aqui
da soma de uma quantidade n de elementos, iniciando pelo elemento 1. Caso a
lista contenha 20 elementos, deve-se realizar o cálculo entre parênteses após
esse símbolo para todos os 20 elementos da lista;
Xi: Valor de um elemento da lista de elementos;
X: Valor médio calculado referente à lista de elementos;
n: quantidade de elementos.

22
1
AULA
Introdução e Conceitos
fundamentais

Para exemplificar, usaremos a seguinte lista de 10 imóveis referenciais obtidos para a determinação
do valor mercadológico de um imóvel avaliando.

Imóveis referenciais PREÇO


R1 511.000,00
R2 513.000,00
R3 516.000,00
R4 518.000,00
R5 521.000,00
R6 525.000,00
R7 528.000,00
R8 530.000,00
R9 533.000,00
R10 535.000,00

Sabemos que a fórmula da variância usará a média aritmética simples desses preços, a qual já
sabemos calcular (soma dos preços dividida pela quantidade de elementos). A média é igual a
523.000,00.

Vamos realizar os cálculos de dentro dos parênteses da fórmula, para cada imóvel referencial.
Então, faremos o preço menos a média e o resultado elevaremos ao quadrado, sendo:

Imóveis
referenciais PREÇO (Xi - X)2
R1 511.000,00 (511.000 – 523.000,00)² = (- 12.000,00)² = 144.000.000,00
R2 513.000,00 (513.000,00 – 523.000,00)² = (- 10.000,00)² = 100.000.000,00
R3 516.000,00 (516.000,00 – 523.000,00)² = (- 7.000,00)² = 49.000.000,00
R4 518.000,00 (518.000,00 – 523.000,00)² = (- 5.000,00)² = 25.000.000,00
R5 521.000,00 (521.000,00 – 523.000,00)² = (- 2.000,00)² = 4.000.000,00
R6 525.000,00 (525.000,00 – 523.000,00)² = 2.000,00² = 4.000.000,00
R7 528.000,00 (528.000,00 – 523.000,00)² = 5.000,00² = 25.000.000,00
R8 530.000,00 (530.000,00 – 523.000,00)² = 7.000,00² = 49.000.000,00
R9 533.000,00 (533.000,00 – 523.000,00)² = 10.000,00² = 100.000.000,00
R10 535.000,00 (535.000,00 – 523.000,00)² = 12.000,00² = 144.000.000,00

Agora eleva-se
(Xi - X)2 ao quadrado Resultados
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

Veja que para os 5 primeiros imóveis, ao subtrair o valor médio de seus preços, obtemos um valor
negativo, já que seus preços são menores que o preço médio. Mas, isso não importa, pois quando
elevamos ao quadrado o valor volta a ficar positivo.

Agora, somamos todos esses resultados, para obtermos o valor da somatória, sendo:

144.000.000,00
100.000.000,00
49.000.000,00
25.000.000,00
4.000.000,00
4.000.000,00
25.000.000,00
49.000.000,00
100.000.000,00
144.000.000,00
Resultado da soma:
644.000.000,00

Seguindo a fórmula, o passo final é dividir esse valor da somatória por (n – 1), ou seja, pela
quantidade de elementos menos 1. Neste caso, temos 10 valores (10 – 1 = 9). Portanto, dividiremos
esse resultado da somatória por 9.

644.000.000,00 / 9 = 71.555.555,56

Vejamos na fórmula:

Então, a variância da lista de 10 imóveis


referenciais é de 71.555.555,56.

24
1
AULA
Introdução e Conceitos
fundamentais

Perceba que, como mencionado anteriormente, esse valor de variância não nos emite perceber a
realidade dos dados deste conjunto de preços. Mas, é extremamente útil para diversas aplicações
estatísticas. Entre elas, a obtenção do desvio padrão.

DESVIO PADRÃO: Num conjunto de dados numéricos o desvio padrão indica a regularidade (grau
de variação) de um conjunto de dados em função da média aritmética. O desvio padrão é utilizado
para identificar o quanto os valores são próximos ou distantes da média.

O desvio padrão é igual à raiz quadrada da variância.

A fórmula completa é a seguinte:

Mas, como já sabemos calcular a variância, então, podemos simplificar a fórmula apenas pela
seguinte:

Utilizando o mesmo exemplo dos 10 imóveis referenciais, facilmente calculamos o desvio padrão,
sendo:
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

Exercícios Aula 1
QUESTÃO 1

Em estatística, o que se entende por POPULAÇÃO?

A) Conjunto de alguns elementos que tenham, pelo menos, uma característica em comum.

B) Conjunto de todos os elementos que não tenham características em comum.

C) Conjunto de todos os elementos que tenham, pelo menos, uma característica em comum.

D) Conjunto de todos os elementos que não tenham várias características em comum.

E) Conjunto de alguns elementos que não tenham características em comum.

QUESTÃO 2

Em estatística, o que se entende por AMOSTRA?

A) Subconjunto de uma população, sendo um conjunto maior, formado de todos os elementos do


conjunto de todos os elementos que tenham características próprias.

B) Conjunto formado a partir do subconjunto de uma população, com elementos que não tenham
características em comum.
C) Conjunto maior que a população, formado de todos os elementos que tenham características
próprias.

D) Subconjunto de uma população, sendo um conjunto menor, formado de alguns elementos do


conjunto de todos os elementos que tenham características próprias.

E) Conjunto formado por apenas um dos elementos que não tenha características da população
que ele faça parte.

QUESTÃO 3

Assinale a afirmação verdadeira:

A)         Moda, em estatística, é o valor que aparece com  menor  frequência no conjunto de dados.
B)     Média, em estatística, é o valor resultante da soma dos valores de um conjunto de dados,
dividida pela quantidade de dados desse conjunto.
C)      Os estimadores de dispersão são úteis para identificar a significância do conjunto de dados.

26
1
AULA

Exercícios

D)     Amplitude, em estatística, é a distância entre a média e o maior valor num conjunto de dados
numéricos.
E)    O Suplemento de Ferramentas de análise do Microsoft Excel é opcional e totalmente
desnecessário para as análises de inferência estatística.

QUESTÃO 4

Analise se a seguinte afirmação é verdadeira ou falsa:

“O resultado do cálculo da variância é totalmente intuitivo, ou seja, à primeira vista, permite


que possamos perceber a realidade dos dados.”

A) Verdadeiro.
B) Falso.

QUESTÃO 5

Assinale a alternativa com afirmação verdadeira.

A) A variância é igual à raiz quadrada do desvio padrão.

B) O desvio padrão é igual à variância elevada ao quadrado.

C) A variância é igual ao desvio padrão elevado ao quadrado.

D) A diferença entre a variância e o desvio padrão é igual a 1.

E) A variância dividida pelo desvio padrão é igual à mediana.


INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

PREPARAÇÃO DA TABELA
AULA 2 DE DADOS

NESTA AULA VAMOS PREPARAR A TABELA DE DADOS PARA QUE


POSSAM SER REALIZADAS AS ANÁLISES INFERENCIAIS.

Variáveis dependente e independentes

Nas análises estatísticas que serão realizadas para determinação do valor mercadológico de um
imóvel (seja para venda ou para locação), usaremos 2 tipos de variáveis, chamadas de variáveis
dependente e variáveis independentes.

Variável é algo que varia, ou seja, que pode mudar. Diferente disso seria uma constante, cujo valor
não muda. Um exemplo de constante, em matemática, é o valor do PI, cujo valor, arredondado, é
de 3,14.

Numa lista de imóveis, temos um dado extremamente importante em nossos cálculos: o preço.
Cada imóvel apresentará um preço diferente. Ainda que possamos ter alguns imóveis com o
mesmo preço, este é um dado que varia e, portanto, é uma variável.

Algo dependente é aquilo que, para existir, depende de outra coisa. O contrário também é válido,
ou seja, algo independente é aquilo que não precisa de outro elemento para existir. Portanto, uma
variável dependente somente existe por causa de outro dado. Se este outro dado não precisa de
outra coisa para existir, então, será um dado independente.

Variável dependente: algo que varia por causa de outros elementos. No nosso caso, o preço
dos imóveis é uma variável dependente pois varia dependendo da quantidade de dormitórios,
localização, tamanho e outros elementos, por exemplo.

28
2
AULA
Preparação da tabela
de dados

Variável independente: algo que varia sem depender de outros elementos. A quantidade de
dormitórios, numa lista de imóveis é algo que varia sem depender de outro fator. Cada imóvel,
simplesmente, tem uma quantidade específica de dormitórios.

Num estudo estatístico, o que se pretende explicar sempre será uma variável dependente, pois
dependerá dos demais dados que explicarão sua existência. Os dados usados para explicarem a
variável dependente poderão ser variáveis independentes ou dependentes.

Para determinarmos o valor de imóvel que se esteja avaliando, usaremos uma lista de imóveis que
será confeccionada a partir de uma busca de imóveis similares no mercado. Essa lista, com os preços
dos imóveis transacionados ou anunciados para serem transacionados, servirá de referência para
a determinação do valor do imóvel avaliando. Por isso, dá-se o nome a esses imóveis de imóveis
referenciais. O preço dos imóveis referenciais é uma variável dependente. Exemplos de variáveis
independentes: quantidade de dormitórios, quantidade de vagas de garagem, tamanho (em m²),
quantidade de banheiros etc. Neste exemplo, temos:

m2

quantidade de
dormitórios PREÇO
Variável
quantidade DEPENDENTE
vagas de
garagem

Variáveis
INDEPENDENTES

Portanto, numa avaliação imobiliária, o preço sempre será nossa variável dependente e
as características dos imóveis serão nossas variáveis independentes.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

Tamanho da amostra (quantidade de elementos)

Para determinarmos o valor do imóvel em avaliação, usaremos uma lista de imóveis criada a
partir de uma busca de imóveis referenciais. A questão, agora, é determinar a quantidade mínima
de imóveis que essa lista deverá conter para que possa proporcionar um resultado adequado nas
análises inferenciais que serão realizadas. Isso pode ser calculado.

Primeiramente, deve-se definir a quantidade de variáveis independentes que serão usadas,


ou seja, a quantidade de características dos imóveis referenciais que serão consideradas e
comparadas com o imóvel avaliando. Obviamente, isso pode ser diferente de acordo com o imóvel
a ser avaliado. As características importantes num apartamento podem ser bem diferente das
características importantes num sítio, por exemplo. Num apartamento, a quantidade de vaga
na garagem costuma exercer forte influência no preço do imóvel, enquanto que isso quase nada
influencia o preço de um sítio.

Em todos os casos, para calcular a quantidade mínima de imóveis referenciais, basta somar a
quantidade de variáveis independentes que serão usadas. A fórmula é extremamente simples:

n=3(k+1)
Sendo:

n : o tamanho da amostra (a quantidade mínima de imóveis referenciais);


k : a quantidade de variáveis independentes (as características a serem consideradas).
Exemplo: Supondo que sejam usadas as seguintes características de um apartamento: dimensão
(m²), quantidade de banheiros, quantidade de dormitórios, quantidade de vagas na garagem,
idade e preço. Temos, então 5 variáveis independentes, sendo que o preço é a variável dependente.
Então, vejamos como fica na fórmula:

n=3(k+1)
n=3(5+1)
n=3(6)
n=18
30
2
AULA
Preparação da tabela
de dados

Neste exemplo, teremos que obter uma lista de 18 apartamentos com características comparáveis
às do imóvel avaliando, na região onde este imóvel estiver.

Planejamento da pesquisa e levantamento dos dados


Para realizar inferências estatísticas precisamos definir qual é a variável dependente e quais serão
as variáveis independentes. Em outras palavras, devemos escolher qual elemento será explicado e
por quais outros elementos.

Numa avaliação imobiliária, já sabemos qual elemento será explicado: o preço dos imóveis. Se
soubermos como esse preço é formado, poderemos determinar o valor mercadológico do imóvel
que se esteja avaliando.

Resta, portanto, definirmos quais são as variáveis independentes, ou seja, quais elementos
explicam esse preço.

Quando soubermos quais elementos determinam o preço dos imóveis, poderemos buscar imóveis
no mercado que tenham esses elementos e que tenham sido transacionados recentemente ou
ainda que estejam anunciados para serem transacionados.

Caso a avaliação do imóvel objetive determinar o valor de venda do imóvel, então, deve-se buscar
imóveis vendidos ou anunciados para venda.

Caso a avaliação do imóvel objetive determinar o valor de locação do imóvel, então, deve-se buscar
imóveis locados ou anunciados para locação.

Temos que lembrar que estes imóveis, que servirão de referência, devem ser similares ao imóvel
que se esteja avaliando.

As variáveis independentes que nos importam são aquelas que existam no imóvel avaliando.
Determinando isso, poderemos fazer a busca por imóveis que tenham essas variáveis. Com isso,
estaremos buscando imóveis referenciais que sejam similares ao imóvel avaliando.

O ideal seria buscar imóveis referenciais idênticos ao imóvel avaliando. Isso seria possível no caso
de um condomínio, cujos imóveis tenham a mesma planta baixa, e que hajam outros imóveis à
venda (ou locação) ou vendidos (ou alugados) recentemente. Contudo, normalmente não é o que
acontece. Por isso, buscamos imóveis referenciais comparáveis ao avaliando, ou seja, que sejam
os mais parecidos possível com o imóvel que se esteja avaliando.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

Portanto, para compor os elementos fundamentais para esta comparação, deve-se realizar uma
vistoria no imóvel avaliando, visando identificar aquilo que efetivamente descreva este imóvel (as
variáveis independentes).

É possível, por exemplo, usarmos a área útil (m²) e a quantidade de dormitórios para o caso de um
apartamento, mas isso não seria relevante para o caso de estarmos avaliando um terreno. No caso
do terreno, neste exemplo, sua dimensão (m²) importa, mas a quantidade de dormitórios não.
A quantidade de dormitórios também não interessaria no caso de um conjunto comercial, mas a
quantidade de vagas de garagem sim.

Enfim, precisamos realizar uma vistoria no imóvel a ser avaliado, para determinar quais serão
nossas variáveis independentes, as quais potencialmente determinam o preço deste imóvel.

ASPECTOS FUNDAMENTAIS DA VISTORIA


• Local: características determinísticas da região onde o imóvel se encontra;
• Tipo do imóvel: definir se o imóvel é rural ou urbano, residencial ou não residencial
(comercial ou industrial), dimensões, quantidade de cômodos e outros elementos que permitam
a identificação de outros imóveis similares baseando-se na descrição;
• Estado de conservação: condições da estrutura do imóvel;
• Características do imóvel: quantidade de cômodos e demais elementos descritivos.

Dica!
É importante que durante a vistoria sejam realizados registros fotográficos para
comprovação dos dados.

BUSCA DE IMÓVEIS COMPARÁVEIS PARA COMPOR A AMOSTRA REFERENCIAL:

Feita a vistoria, teremos a sua localização (e os aspectos dessa região), o tipo de imóvel, seu estado
de conservação e as suas características.

Portanto, deveremos buscar imóveis próximo a esse local, para que tenham acesso aos mesmos
recursos da região. Na inexistência de imóveis potencialmente referenciais na região, podemos
buscar outras regiões que tenham as mesmas características em termos de infraestrutura e
recursos, de modo que isso poderia justificar terem potencialmente preços similares.

32
2
AULA
Preparação da tabela
de dados

É fundamental que os imóveis referenciais sejam do mesmo tipo. Não será possível fazer
qualquer comparação entre um apartamento (imóvel avaliando) com casas ou sobrados (imóveis
referenciais), pois são de tipos diferentes e isso certamente influenciará nos seus preços. Seria
muito mais absurdo usar imóveis rurais como referenciais para a determinação do preço de um
imóvel urbano. Assim como se estivermos avaliando um imóvel comercial, não poderemos usar,
como referenciais, imóveis residenciais ou industriais.

Também é importante que os imóveis referenciais tenham o mesmo estado de conservação que o
imóvel avaliando. Quando temos uma variável que não varia, ela deixa de ser uma variável e passa
a ser uma constante. Dados constantes não são explicativos para demonstrar a variação de preços
dos imóveis. Então, se todos os imóveis referenciais tiverem o mesmo estado de conservação, este
elemento não precisará ser considerado nas análises que serão realizadas.

Enfim, devemos buscar imóveis que potencialmente tenham as características do imóvel


avaliando, mesmo que em quantidade ou proporções diferentes. Por exemplo, caso o imóvel
avaliando tenha 2 dormitórios, podemos buscar imóveis com 1, 2, 3 ou 4 dormitórios. A quantidade
de dormitórios pouco importará, pois, essa variação é que nos mostrará como os preços são
influenciados pela quantidade de dormitórios. A mesma coisa acontece para o tamanho do imóvel
(m²), a quantidade de vagas de garagem e outros elementos. Caso o imóvel avaliando tenha 1 vaga
de garagem, por exemplo, é possível buscarmos imóveis referenciais com 1, 2 ou mesmo nenhuma
vaga de garagem, desde que sejam relativamente similares ao imóvel avaliando. É importante
criar uma lista de imóveis avaliando com quantidades e proporções diferentes entre si. Quanto
maior a quantidade de imóveis referenciais melhor. Lembrando, variáveis que não variam, são
constantes e devem ser descartadas. Se todos os imóveis referenciais tiverem 2 dormitórios, a
variável dormitórios será inútil para explicar a variação de preços. Por isso, é importante que
tenhamos diversidade quanto a cada variável independente.

Tratamento dos dados (Criando a tabela no Microsoft Excel)

Para realizarmos os cálculos, já mencionamos que utilizaremos o software Microsoft Excel.

Portanto, basta incluirmos os dados no Microsoft Excel. Mas, existe uma sequência lógica para
as colunas, por causa dos recursos que usaremos. Por isso, veja o vídeo do curso que explica a
sequência correta a ser usada, de modo que você tenha menos trabalho futuramente. Usaremos
a tabela com 24 imóveis referenciais e as 7 variáveis independentes (m², dormitório, banheiro,
piscina, Sala de jogos, Salão de festas e condomínio).
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

Exemplo de tabela criada no Excel:

Sala de Salão de
Imóvel m² dormitório banheiro piscina jogos festas condomínio preço
R1 75 1 1 1 1 1 350,00 480.000,00
R2 75 2 1 0 0 1 320,00 490.000,00
R3 78 2 2 0 0 1 320,00 485.000,00
R4 78 2 2 0 0 1 340,00 495.000,00
R5 78 2 2 1 1 1 350,00 500.000,00
R6 80 2 2 1 1 1 350,00 505.000,00
R7 80 2 2 1 1 1 370,00 508.000,00
R8 80 2 2 1 1 1 370,00 510.000,00
R9 82 2 2 1 1 1 400,00 512.000,00
R10 82 2 2 1 1 1 400,00 515.000,00
R11 82 2 2 1 1 1 400,00 515.000,00
R12 85 2 2 1 1 1 400,00 520.000,00
R13 85 2 2 1 1 1 400,00 525.000,00
R14 85 3 2 1 1 1 430,00 528.000,00
R15 88 3 2 1 1 1 430,00 530.000,00
R16 88 3 3 1 1 1 450,00 532.000,00
R17 88 3 3 1 1 1 450,00 535.000,00
R18 88 3 3 1 1 1 450,00 540.000,00
R19 90 3 3 1 1 1 480,00 545.000,00
R20 90 3 3 1 1 1 480,00 550.000,00
R21 92 3 3 1 1 1 490,00 550.000,00
R22 92 3 3 1 1 1 490,00 555.000,00
R23 95 3 3 1 1 1 500,00 560.000,00
R24 95 4 3 1 1 1 500,00 565.000,00
R25 95 4 4 1 1 1 500,00 568.000,00

34
2
AULA
Preparação da tabela
de dados

Análise de dispersão dos dados


Quando abordamos os estimadores de dispersão, vimos as fórmulas e os cálculos para se obter a
amplitude, a variância e o desvio padrão.

Agora, vamos ver como calcular isso no Microsoft Excel. Você verá que é extremamente fácil.

Usaremos os seguintes recursos do Microsoft Excel:

OPERAÇÃO FUNÇÃO / FÓRMULA


AMPLITUDE =MÁXIMO(intervalo) – MÍNIMO(intervalo)
VARIÂNCIA =VAR.A(intervalo)
DESVIO PADRÃO =DESVPAD.A(intervalo)
Além de realizar os cálculos, podemos apresentá-los em gráficos. A sugestão é que os gráficos
sejam usados no seu relatório resultante da avaliação imobiliária (Parecer ou Laudo).
Veja um gráfico de dispersão criado a partir de uma tabela de 24 imóveis referenciais, considerando
a coluna de m² e de preço, usando o Microsoft Excel:
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

Análise de correlação entre variáveis independentes


Correlação é a relação entre variáveis. Uma variável tem uma relação com outra e vice-versa.
Para ilustrar este conceito, vamos usar a tabela de imóveis referenciais que já colhemos
anteriormente quando abordamos o planejamento de pesquisa, sem as alterações que fizemos.
Portanto, segue a tabela com 25 imóveis referenciais e 7 variáveis independentes:

Sala de Salão de
Imóvel m² dormitório banheiro piscina jogos festas condomínio preço
R1 75 1 1 1 1 1 350,00 480.000,00
R2 75 2 1 0 0 1 320,00 490.000,00
R3 78 2 2 0 0 1 320,00 485.000,00
R4 78 2 2 0 0 1 340,00 495.000,00
R5 78 2 2 1 1 1 350,00 500.000,00
R6 80 2 2 1 1 1 350,00 505.000,00
R7 80 2 2 1 1 1 370,00 508.000,00
R8 80 2 2 1 1 1 370,00 510.000,00
R9 82 2 2 1 1 1 400,00 512.000,00
R10 82 2 2 1 1 1 400,00 515.000,00
R11 82 2 2 1 1 1 400,00 515.000,00
R12 85 2 2 1 1 1 400,00 520.000,00
R13 85 2 2 1 1 1 400,00 525.000,00
R14 85 3 2 1 1 1 430,00 528.000,00
R15 88 3 2 1 1 1 430,00 530.000,00
R16 88 3 3 1 1 1 450,00 532.000,00
R17 88 3 3 1 1 1 450,00 535.000,00
R18 88 3 3 1 1 1 450,00 540.000,00
R19 90 3 3 1 1 1 480,00 545.000,00
R20 90 3 3 1 1 1 480,00 550.000,00
R21 92 3 3 1 1 1 490,00 550.000,00
R22 92 3 3 1 1 1 490,00 555.000,00
R23 95 3 3 1 1 1 500,00 560.000,00
R24 95 4 3 1 1 1 500,00 565.000,00
R25 95 4 4 1 1 1 500,00 568.000,00

36
2
AULA
Preparação da tabela
de dados

Perceba que, coincidentemente, quanto mais dormitórios um imóvel tem, mais banheiros ele
igualmente tem. Salvo algumas exceções, parece ser um padrão.

Vejamos em gráfico essa relação:

O R1 TEM 1 DORMITÓRIO E 1 BANHEIRO.

JÁ O R2 TEM 2 DORMITÓRIOS E 1 BANHEIRO.

DE R3 A R13, TODOS TÊM 2 DORMITÓRIOS E 2 BANHEIROS.

R14 E R15 TÊM 3 DORMITÓRIOS E 2 BANHEIROS, CADA.

DE R16 A R23, TODOS TÊM 3 DORMITÓRIOS E 3 BANHEIROS.

O R24 TEM 4 DORMITÓRIOS E 3 BANHEIROS.

E, POR FIM, O R25 TEM 4 DORMITÓRIOS E 4 BANHEIROS.

A linha vermelha apresenta a tendência dessa correlação. Portanto, se esta correlação continua
existindo, mesmo para apartamentos com mais dormitórios, então, é provável que apartamentos
de 5 dormitórios tenham 5 banheiros.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

Agora, vejamos a correlação entre Salão de festas e condomínio.


Vejamos em gráfico essa relação:

Perceba que nesta correlação, todos os imóveis referenciais aparecem numa mesma coluna, pois
todos têm 1 Salão de festas. Sequer podemos traçar uma linha de tendência, pois inexiste qualquer
tendência. Se a relação continuar a mesma, baseando-se nesta amostra, qualquer outro imóvel
similar teria, tendenciosamente, a mesma quantidade de Salão de festas, apesar da variação no
valor do condomínio.

Portanto, temos 1 dado que não exerce influência no preço, pois, na verdade, a quantidade de
Salão de festas é constante. Neste caso, esta variável, que não varia, pode ser descartada.

Então vejamos um outro caso de uma lista diferente, com 2 dados que, apesar de variarem, acabam
variando na mesma proporção:

Imóvel m² dormitório banheiro preço


R1 62 2 1 700.000,00
R2 75 2 1 705.000,00
R3 78 2 1 706.000,00
R4 85 3 2 720.000,00
R5 88 3 2 723.000,00
R6 90 3 2 725.000,00
R7 95 4 3 748.000,00
R8 98 4 3 750.000,00

38
2
AULA
Preparação da tabela
de dados

Perceba que as quantidades de dormitórios e de banheiros variam na mesma proporção. Todos os


imóveis com 2 dormitórios têm 1 banheiro, assim como todos os imóveis com 3 dormitórios têm
2 banheiros e os imóveis de 4 dormitórios têm 3 banheiros.
Vejamos em gráfico essa relação:

Perceba que todos os pontos estão absolutamente alinhados. Isso significa que estas duas variáveis
são colineares, ou seja, coexistem linearmente.

Portanto, neste caso, ambas afetam a variação de preços da mesma forma. Para efeito da nossa
análise, considerar uma ou a outra, é exatamente a mesma coisa, de modo que podemos usar
apenas uma delas. Na verdade, deveremos usar apenas uma delas e nunca as duas. Os cálculos
que veremos futuramente poderão apresentar severos problemas caso utilizemos variáveis tão
colineares assim.

Então, qual é o objetivo de se analisar


essa correlação?
Na prática, no nosso caso, referente às avaliações
imobiliárias, trata-se de verificar a existência das
colinearidades para evitar problemas futuros.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

Nos exemplos usados, poderíamos perceber a colinearidade apenas pela observação. Mas, é
possível medir essa correlação. Usamos o coeficiente de correlação para fazer isso.

O coeficiente de correlação é uma forma de exprimir em números a relação entre as variáveis, ou


seja, o coeficiente de correlação quantifica essa relação.

Portanto, a análise de correlação entre as variáveis independentes é realizada pelo cálculo do


coeficiente de correlação.

Na verdade, existem várias formas de se calcular o coeficiente de correlação. Usaremos o


Coeficiente de Correlação de Pearson, também chamado de Coeficiente de Correlação Linear, ou
ainda por R de Pearson. O nome tem origem no pesquisador matemático que o criou.

Este coeficiente varia entre os valores -1 e 1, sendo que:

• Resultados negativos (entre -1 e 0): indica uma correlação negativa. Trata-se de uma
relação em que quando uma variável aumenta, a outra diminui e vice-versa. Pode-se observar
isso, por exemplo, na relação entre valor de condomínio e preço da locação. Se compararmos 2
imóveis muito parecidos, em 2 edifícios igualmente muito parecidos. É comum que aquele que
tenha o condomínio mais caro tenha o preço do aluguel um pouco mais barato do que o preço
de aluguel daquele que tem o condomínio mais barato. No final das contas, como são imóveis
parecidos, o valor somado do condomínio com o aluguel, de ambos os imóveis, seria quase que o
mesmo. Outro exemplo é o índice de periculosidade de uma região e o preço dos imóveis. Quanto
mais a periculosidade, menor será o preço dos imóveis.

• Resultados positivos (entre 0 e 1): indica uma correlação positiva. Trata-se de uma relação
em que quando uma variável aumenta, a outra igualmente aumenta. Observamos isso no caso da
área útil e o valor do imóvel. Quanto maior sua área útil, maior será o preço tanto de venda quanto
de locação do imóvel.

40
2
AULA
Preparação da tabela
de dados

Uma relação absoluta é quando o resultado do R de Pearson for 1 ou -1.

Se o resultado for -1, temos uma relação negativa absoluta.

Se o resultado for 1, temos uma relação positiva absoluta.

Em ambos os casos, se a relação for absoluta entre duas variáveis independentes, para efeito
das análises que faremos numa avaliação imobiliária para determinação do valor do imóvel,
descartaremos uma das duas variáveis. Pode-se escolher, por pura conveniência, a variável a ser
descartada. Por exemplo, numa relação que for absoluta entre dormitórios e banheiros, poderíamos
descartar a variável banheiros, já que é mais comum falarmos em termos de quantidade de
dormitórios de um imóvel do que na quantidade de banheiros.

Fórmula para calcular o R de Pearson:

Onde uma variável é x e a outra variável é y, sendo:

Notação matemática para R de Pearson;



Covariância dos valores das variáveis X e Y, cuja fórmula é


Desvio Padrão dos valores da variável X multiplicado pelo Desvio Padrão dos valores da
variável Y, cuja fórmula é

Mas, não faremos esses cálculos, pois o Microsoft Excel tem uma função que calcula
automaticamente isso.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

Na verdade, podemos usar qualquer uma das duas seguintes funções:

PEARSON ou CORREL

O resultado será o mesmo.

Obs.: A função Pearson foi incluída na versão do Microsoft Excel em meados dos anos 90, tendo
sido nomeada em homenagem ao estatístico Karl Pearson. Nas versões seguintes deste software,
passou-se a usar nomes mais intuitivos para as suas funções e, por isso, criou-se a função Correl
(do termo Correlação). A Microsoft decidiu não remover a função Pearson. Atualmente, ambas
existem e têm o mesmo funcionamento.

Explicação dos atributos da função CORREL:

A função CORREL retorna o coeficiente de correlação de dois intervalos de células.

Sintaxe: CORREL(matriz1, matriz2)

sendo:

matriz1: Um intervalo de valores de célula.

matriz2: Um segundo intervalo de valores de célula (do mesmo tamanho que o anterior).

Atenção!
• Se uma matriz contiver dados que não sejam numéricos (texto ou células vazias), esses
valores serão ignorados (o número zero é considerado).
• Se matriz1 e matriz2 têm tamanhos diferentes (quantidade diferente de elementos),
CORREL retorna um erro #N/A.
• Se matriz1 ou matriz2 estiver vazia ou se o desvio padrão de seus valores for igual a zero,
CORREL retornará um erro #DIV/0!.

42
2
AULA
Preparação da tabela
de dados

Determinação inicial dos dados a serem usados

Para determinarmos o uso dos dados, usaremos análises baseadas em Estatística Descritiva, assim
como usaremos os Estimadores de Dispersão.

Já abordamos a moda, a média e a mediana, assim como já vimos a amplitude, a variância e o


desvio padrão.

Agora, veremos como fazer esses cálculos no Microsoft Excel e para o que eles podem nos ser
úteis.

Segue lista de funções:

OPERAÇÃO FUNÇÃO / FÓRMULA


MÉDIA =MÉDIA(intervalo)
MEDIANA =MED(intervalo)
MODA =MODO.ÚNICO(intervalo)
AMPLITUDE =MÁXIMO(intervalo) – MÍNIMO(intervalo)
VARIÂNCIA =VAR.A(intervalo)
DESVIO PADRÃO =DESVPAD.A(intervalo)
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

Exercícios Aula 2
QUESTÃO 1

Em estatística, o que é uma variável dependente?

A) É uma variável que varia por causa de outros elementos.


B) É uma variável que varia sem depender de outros elementos.

QUESTÃO 2

Em estatística, o que é uma variável independente?

A) É uma variável que varia por causa de outros elementos.


B) É uma variável que varia sem depender de outros elementos.

QUESTÃO 3

Qual é a fórmula para calcular o tamanho da amostra?

A) n = 6(k + 1)
B) n = 3(k -1)
C) n = 3k + 1
D) n = 3(k + 1)
E) n = 3k . 1)

QUESTÃO 4

Assinale verdadeiro ou falso para a seguinte afirmação:

“Na criação da tabela no Microsoft Excel, para que possamos realizar as análises de inferência
estatística, existe uma sequência lógica para as colunas, por causa dos recursos que usaremos.”

A) Verdadeiro
B) Falso

44
2
AULA

Exercícios

QUESTÃO 5

Considere a seguinte correlação entre características de imóveis e assinale a afirmação


verdadeira:

A) Nesta correlação, todos os imóveis aparecem numa mesma coluna.


B) Inexiste qualquer tendência.
C) Se a relação continuar a mesma, baseando-se nesta amostra, qualquer outro imóvel similar
teria 2 dormitórios e 3 banheiros.
D) A linha diagonal sólida apresenta a tendência dessa correlação.
E) A quantidade de dormitórios e a quantidade de banheiros não se correlacionam.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

REGRESSÃO LINEAR -
AULA 3 CONCEITOS

NESTA AULA SERÁ ABORDADO O CONCEITO DA REGRESSÃO LINEAR


PARA QUE POSSAMOS EFETIVAMENTE USAR ESTA TÉCNICA DE
FORMA ADEQUADA.

Definição
A Regressão Linear será uma grande ferramenta para realizarmos as análises necessárias para a
determinação do valor do imóvel que se esteja avaliando.

Matematicamente falando, o termo “regressão” é usado para se referir a uma equação que
descreve a relação entre duas ou mais variáveis.

Já em estatística, sendo mais específico, pelo termo “regressão” quer-se dizer uma técnica para
analisar a relação de uma variável dependente com variáveis independentes, de modo a analisar o
quanto estas variáveis independentes realmente explicam a variável dependente.

No nosso caso, tratando-se de avaliações mercadológicas de imóveis, já vimos que o preço dos
imóveis é a nossa variável dependente, sendo que as demais variáveis, que potencialmente
explicariam a variação desse preço, são as nossas variáveis independentes.

Entendendo o termo “regressão”:

O termo foi usado pela primeira vez, no contexto estatístico, pelo primo de Charles Darwin, Francis
Galton. Este antropólogo, matemático e estatístico, viveu de 1822 a 1911 e dedicou grande parte da
sua vida ao estudo das medidas do corpo humano, conhecido por Antropometria. Durante 6 anos
Galton coletou mais de 9 mil registros de famílias, nos quais foram anotados dados quantitativos
sobre o corpo das pessoas. Entre diversos dados estava a estatura. Foram 10 anos analisando esses

46
3
AULA
Regressão Linear
conceitos

dados. Galton descobriu, explicou e comprovou estatisticamente algo extremamente interessante


para a época. Filhos de pais com estatura baixa em relação à média tendem a ser mais altos que
seus pais. Já os filhos de pais com estatura alta em relação à média tendem a ser mais baixos que
seus pais. Portanto, os filhos tendem voltar à média, ou, como Galton afirmou: as alturas dos
seres humanos, em geral, tendem a regredir à média. Foram mais de 340 artigos científicos de
sua autoria, até que aos 63 anos de idade, Francis Galton publicou o artigo pelo qual cunharia
o termo “regressão” nos estudos estatísticos, ao apresentar um gráfico intitulado “Taxa de
regressão na estatura hereditária”. Surge, portanto, em 1885, o termo “regressão” para explicar
o comportamento médio de uma variável em função da sua relação com outras variáveis. Depois
disso, o método de Galton passou a ser aplicado em diversos campos do estudo estatístico.

A regressão pode ser simples quando houver apenas uma variável independente, ou pode ser
múltipla quando houver mais de uma variável independente.

Possíveis aplicações da equação da regressão:

• SELEÇÃO DE VARIÁVEIS: É possível analisar quais variáveis independentes


realmente afetam a variável dependente e, com isso, definir o que efetivamente
explica a variação da variável dependente.

• INFERÊNCIA: Pode-se testar hipóteses e realizar análises alterando as variáveis e


seus valores.

• PREDIÇÃO: O resultado final da regressão é uma equação matemática que


demonstra como a variável dependente se comporta em função das variáveis
independentes. É possível, portanto, definir valores para as variáveis independentes
nessa equação, e verificar qual será o valor da variável dependente.

• ESTIMAÇÃO DE PARÂMETROS: É possível definir ações ou atividades que se


ajustem ao modelo da regressão, ou mesmo que possibilitem ajustar os resultados
do modelo de regressão (algo muito utilizado para definir ajustes em equipamentos
de um processo de manufatura).

De fato, na aplicação da regressão para avaliação imobiliária, usaremos a regressão para realizar
seleção de variáveis e inferências, até termos as variáveis adequadas para explicar a variação do
preço, assim como faremos a predição do valor do imóvel avaliando.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

Análise de regressão
Para entendermos claramente as análises que são feitas pela regressão, considere a seguinte lista
de imóveis referenciais.

Imóvel m² dormitório banheiro piscina condomínio preço


R1 75 1 1 1 350,00 480.000,00
R2 75 2 1 0 320,00 490.000,00
R3 78 2 2 0 320,00 485.000,00
R4 78 2 2 0 340,00 495.000,00
R5 78 2 2 1 350,00 500.000,00
R6 80 2 2 1 350,00 505.000,00
R7 80 2 2 1 370,00 508.000,00
R8 80 2 2 1 370,00 510.000,00
R9 82 2 2 1 400,00 512.000,00
R10 82 2 2 1 400,00 515.000,00
R11 82 2 2 1 400,00 515.000,00
R12 85 2 2 1 400,00 520.000,00
R13 85 2 2 1 400,00 525.000,00
R14 85 3 2 1 430,00 528.000,00
R15 88 3 2 1 430,00 530.000,00
R16 88 3 3 1 450,00 532.000,00
R17 88 3 3 1 450,00 535.000,00
R18 88 3 3 1 450,00 540.000,00
R19 90 3 3 1 480,00 545.000,00
R20 90 3 3 1 480,00 550.000,00

Variáveis independentes Variável dependente

Esta lista é composta por 20 imóveis.

O preço é a nossa variável dependente, ou seja, aquela que pretendemos explicar, e 5 variáveis
independentes que potencialmente explicam o preço (m², dormitório, banheiro, piscina e
condomínio).

48
3
AULA
Regressão Linear
conceitos

Quando incluirmos esses dados nos cálculos da regressão, teremos um modelo de regressão,
sendo, portanto, o modo de representação do contexto em dimensões estatísticas.

Portanto, no modelo de regressão, o preço (variável dependente) é nossa variável Y e as variáveis


independentes são as variáveis X.

DICA
No Microsoft Excel, a indicação das variáveis X deve ser feita num único intervalo. Por isso,
colocamos as colunas todas juntas, sem espaço entre elas e sem outras colunas que não
sejam variáveis independentes.

Futuramente explicaremos como executar a regressão usando o Microsoft Excel.


Por enquanto, é importante sabermos como interpretar os dados que serão exibidos.

Itens importantes a serem analisados no resultado da Regressão obtido pelo Microsoft Excel:
• R-QUADRADO E R-QUADRADO AJUSTADO: Dentre as Estatísticas de regressão, o Microsoft
Excel apresenta o resultado do R-quadrado e do R-quadrado ajustado. Estes são Coeficientes de
determinação, medidas de ajuste de um modelo estatístico linear. O R-quadrado mede o nível de
explicação da variável Y pelas variáveis X. No caso da avaliação imobiliária, significa o quanto
que os dados da lista de imóveis referenciais explicam os seus respectivos preços. Este é um
número que varia de 0 a 1. Quanto maior o R-quadrado, tanto maior será o nível de explicação. Ao
multiplicar esse número por 100, obteremos o percentual de explicação desse modelo de regressão.
Por exemplo, o resultado 0,9735 significa que este modelo explica 97,35% da variação dos preços
dos imóveis. Neste caso, temos 2,65% da variação do preço que não estão sendo explicadas por
este modelo, sendo elementos que, então, não conhecemos. É comum pensar que quanto mais
variáveis independentes forem usadas, maior será o potencial explicativo e, portanto, maior será
o R-quadrado. Por outro lado, em estatística, existe o princípio da parcimônia que estabelece
que a explicação para qualquer fenômeno deve pressupor a menor quantidade possível de
premissas. Por isso, temos o R-quadrado ajustado que é uma medida alternativa do coeficiente de
determinação, que penaliza a inclusão de variáveis independentes. Assim, quanto mais variáveis
não significativas forem incluídas, menor será o R-quadrado ajustado. É por isso que muitos
preferem verificar o R-quadrado ajustado ao invés do R-quadrado.

IMPORTANTE: DEVEMOS BUSCAR UM R-QUADRADO AJUSTADO MAIOR QUE 0,7.

Caso o R-quadrado ajustado for menor que 0,7 teremos que executar a regressão novamente
desconsiderando a variável menos significativa (ver valor-P para saber qual das variáveis é menos
significativa).
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

• F DE SIGNIFICAÇÃO: Dentre os resultados da ANOVA (do inglês ‘Analysis Of Variance’, que


significa Análise De Variância), que apresenta dados referentes a estimadores de dispersão,
o Microsoft Excel apresenta o F de significação, ou seja, o resultado do Teste de Significância
da Regressão. Ronald Fisher e George Waddel Snedecor desenvolveram a teoria estatística de
distribuição, conhecida por teoria Fisher-Snedecor (origem do F no nome deste dado). Testa-se
a existência de relação linear entre as variáveis, para verificar se, pelo menos, uma das variáveis
X explica a variação do Y, sendo que o resultado é o F de significação. O resultado deste teste é
apresentado por um número que varia entre 0 e 1. Quanto maior a relação linear entre as variáveis,
menor será o F de significação.

IMPORTANTE: DEVEMOS BUSCAR UM F DE SIGNIFICAÇÃO MENOR QUE 0,05.

Caso o F de significação for maior que 0,05 teremos que rever as variáveis e, eventualmente,
escolher outras variáveis para compor o modelo.

Quando o valor é muito baixo, o Microsoft Excel apresenta o valor em notação científica. Por
exemplo: 3,94E-8.

A letra “E” é a notação exponencial que significa ‘vezes 10 elevado a’, sendo o valor seguinte o
quanto se deve elevar. No exemplo temos E-8, ou seja, vezes 10 elevado a -8. Portanto, 3,94E-8
significa 3,94 vezes 10 elevado a -8. Quando elevamos 10 a um valor negativo, bastará colocar à
esquerda a quantidade de zeros igual ao valor que se está elevando, sendo que entre o primeiro
zero e os demais colocamos uma vírgula. Veja como fica:
3,9E-8
3,9 x 10-8
0,000000039

oito zeros
• valor-P: Resultado do Teste de significação para cada variável. Tal qual o F de significação do
modelo, o valor-P é um número que varia entre 0 e 1. É a partir destes resultados que podemos
identificar o quanto cada variável é significante. Quanto mais significante for uma variável
independente, mais ela explica a variação da variável independente. Quanto menor for esse valor,
maior é a significância da variável.

IMPORTANTE: DEVEMOS BUSCAR VARIÁVEIS COM VALOR-P MENOR QUE 0,10.

Caso o valor-P de alguma variável independente for maior que 0,10 teremos que executar a
regressão novamente desconsiderando essa variável menos significativa.
A retirada de variáveis menos significativas promovem o potencial aumento do R-quadrado
ajustado.

50
3
AULA
Regressão Linear
conceitos

Quando for executada uma nova regressão, após a remoção de alguma variável independente,
devemos realizar novamente a análise dos itens importantes (listados acima) no resultado da nova
Regressão obtido pelo Microsoft Excel. Na nova regressão, se houver a necessidade de remover
outra variável independente, deve-se executar nova regressão, sem esta outra variável, e analisar
tudo novamente. Faz-se isso até que tenhamos um modelo adequado.

Modelo de Regressão Linear


Um modelo de regressão linear é o conjunto de variáveis independentes e variável dependente, o
qual busca explicar a variação da variável dependente pelas variáveis independentes.
O Modelo de Regressão Linear se define como a relação linear entre a variável dependente e uma
ou mais variáveis independentes. Caso haja uma variável independente trata-se de um modelo de
Regressão Linear Simples. Quando houverem duas ou mais variáveis independentes, trata-se de
uma Regressão Linear Múltipla.

Um modelo de regressão é um recurso para estimação de relações entre um grupo de dados


numéricos, pelo qual se explora a relação entre as variáveis, identificando suas correlações. Com
isso, é possível aplicar, nas variáveis independentes, dados específicos para prever (ou estimar) o
resultado da variável dependente.

Portanto, a variável dependente é aquela cujo comportamento pretende ser explicado pela(s)
variável(is) independente(s). É por isso que uma variável independente também é chamada de
variável explicativa.

Como a variável independente é aquela que será regredida à média, também é conhecida como
variável regressora, ou simplesmente regressor.

Modelos de regressão são largamente utilizados em diversas áreas do conhecimento, inclusive na


avaliação mercadológica de um bem (no nosso caso: um bem imóvel).

EM RESUMO: O objetivo final da regressão é a obtenção de uma equação matemática que


explica satisfatoriamente a relação entre uma variável dependente e uma ou mais variáveis
independentes. Uma vez que a variável dependente é a resposta e as variáveis independentes
sejam as explicativas, é possível fazer predição de valores da variável de interesse. No caso da
avaliação imobiliária, a variável de interesse é o preço do imóvel que se esteja avaliando.
Esta equação é o modelo de regressão.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

Representação gráfica do Modelo de Regressão Linear


O Modelo de Regressão Linear Simples (com apenas uma variável independente) é facilmente
representado em um gráfico, como segue.

No eixo vertical está a variável Y, ou seja, a variável dependente e no eixo X está a variável
independente.
Os pontos vermelhos são os dados da relação entre X e Y.
A reta azul apresenta a tendência geral de variação desses dados, sendo a média.
As linhas pretas verticais que ligam os pontos vermelhos (dados) à reta azul (tendência)
representam as diferenças (ou resíduos) entre a média e os dados observados.
Consideremos a lista abaixo de imóveis referenciais para vermos um exemplo na nossa realidade.

Imóvel m² preço
R1 62 700.000,00
R2 75 705.000,00
R3 78 706.000,00
R4 85 720.000,00
R5 88 723.000,00
R6 90 725.000,00
R7 95 748.000,00
R8 98 750.000,00

52
3
AULA
Regressão Linear
conceitos

Neste caso, temos 8 imóveis referenciais e queremos determinar, a partir desta amostra, o valor
de um imóvel avaliando. Ainda que saibamos quantos m² tenha o imóvel avaliando, obviamente,
não sabemos o seu preço. Portanto, o preço é a nossa variável dependente, a qual, neste exemplo,
pretendemos explicar pela variação do m² (nossa variável independente).

Agora, vejamos o gráfico dessa relação:

Da mesma maneira que no exemplo anterior, no eixo Y (vertical) está a nossa variável dependente
(preço do imóvel) e no eixo X (horizontal) está a nossa variável independente (m²).
Os pontos vermelhos são os dados da relação entre X e Y, ou seja, da relação entre m² e preço de
cada imóvel referencial. O R1 tem 62 m² com preço de R$ 700.000,00, sendo o ponto no canto
inferior esquerdo. Já o R8 tem 98 m² e seu preço é R$ 750.000,00, sendo o ponto no canto superior
direito.

A reta azul apresenta a tendência geral de variação desses dados, sendo a média. Veja que no canto
superior direito do gráfico, é exibida a equação desta reta. Neste caso hipotético, a reta é definida
por:
y=598.488+1.474,1x

Dessa forma, podemos predizer o preço de um imóvel, desde que tenha as condições e
características destes imóveis da amostra. Supondo que o imóvel a estimarmos o preço tenha 82,5
m². Qual seria seu preço? Seguindo a equação, considerando que o m² seja o x (na equação) e o y
seja o preço a ser determinado, vamos resolver esta questão:
y=598.488+1.474,1x
y=598.488+1.474,1∙82,5
y=598.488+121.613,30
y=720.101,25
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

Então, neste exemplo, usando apenas uma variável independente, é possível observar no gráfico
o resultado desta equação ilustrado pelas linhas verdes. Um imóvel com 82,5m² teria o preço de
R$ 720.101,25.

E SE TIVERMOS DIVERSAS VARIÁVEIS INDEPENDENTES?

No caso de 2 variáveis podemos ter 2 eixos. Já no caso de 3 variáveis (uma dependente e 2


independentes) teremos 3 eixos e, com isso, a linha de tendência, na verdade, deixará de ser uma
linha e passará a ser um plano.
Veja o gráfico abaixo:

Z
X

Veja que temos um eixo Y vertical, um eixo X horizontal e um eixo Z diagonal. Esta poderia ser a
representação gráfica de um modelo com a variável preço, como dependente e as variáveis m² e
quantidade de dormitórios, como independentes.
Os pontos vermelhos seriam os dados, formado pela intersecção do preço, do m² e da quantidade
de dormitórios.
Perceba que a linha de tendência (azul nos gráficos anteriores) deu lugar para um plano amarelo.
Ligando cada ponto vermelho ao plano amarelo encontram-se linhas pretas que representam as
diferenças (ou resíduos) entre a média (o plano) e os dados observados.

No caso de 4 ou mais variáveis, teremos 4 ou mais eixos, tornando-se muito difícil de se representar
graficamente.

54
3
AULA
Regressão Linear
conceitos

Equação de Regressão Linear simples e múltipla


O modelo de regressão pode ser expresso pelas seguintes equações matemáticas:

Equação do modelo matemático da regressão:

Equação para estimar o valor médio de Y:

Sendo:

Variável dependente

Valor médio da variável independente

Coeficiente de Interseção

Coeficiente da variável independente 1 multiplicado pelo valor para a variável


independente 1

Coeficiente da variável independente n multiplicado pelo valor para a variável


independente n (sendo n igual a cada uma das demais variáveis independentes)

Erro equivalente à diferença entre o valor da variável dependente Y e o valor médio da


variável dependente Y

Perceba que o (erro) somente é usado na equação do modelo matemático da regressão, mas
não usado na equação para estimar o valor médio de Y. O propósito da avaliação imobiliária é o
de estimar o valor do imóvel que se esteja avaliando. É justamente por isso que a equação a ser
usada é a segunda, ou seja, a equação para estimar o valor médio de Y.

Vamos entender essa importante equação que usaremos nas avaliações imobiliárias, para
estimar o valor do imóvel avaliando:
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

Valor médio da variável independente que desejamos estimar (ou seja, o preço do imóvel
avaliando).

(lê-se beta zero): Coeficiente de Interseção. Ao traçar uma reta de tendência numa
representação gráfica, o valor deste coeficiente é o ponto onde esta reta corta o eixo (por isso
interseção).

(lê-se beta 1 xis 1): Coeficiente da variável independente 1 multiplicado pelo valor
para a variável independente 1. Refere-se à primeira variável da lista de variáveis independentes
usadas. No caso, por exemplo, de um imóvel avaliando de 2 dormitórios sendo que, na regressão,
o coeficiente da variável dormitórios seja 420, para resolver este trecho da fórmula bastaria
multiplicar o coeficiente pela quantidade de dormitórios, ou seja, multiplicar 420 por 2.

Coeficiente da variável independente n multiplicado pelo valor para a variável
independente n (sendo n igual a cada uma das demais variáveis independentes). Portanto, o
mesmo cálculo feito no trecho anterior deverá ser feito para cada variável independente usada.

Portanto, feitos os cálculos de multiplicação de cada trecho da fórmula, para cada variável
independente existente no modelo, para resolver a equação, bastará somar os resultados das
multiplicações com o coeficiente de interseção e, o resultado, será o preço estimado do imóvel
avaliando.

Resgatando o exemplo anteriormente apresentado quando abordada a representação gráfica,


tínhamos uma regressão linear simples, pois havia apenas uma variável independente. Lembrando,
tratava-se do seguinte gráfico:

56
3
AULA
Regressão Linear
conceitos

A linha azul apresentava a reta de tendência, sendo:

Agora que temos mais conhecimento sobre a equação da regressão linear, vamos entender
melhor esta equação da reta, comparando-a com o modelo de equação da regressão:

O Y na equação da reta azul é o da equação da regressão para estimar o valor médio da nossa
incógnita que, no nosso caso, o preço do imóvel avaliando que se deseja estimar.

O valor 598.488 na equação da reta azul é o da equação da regressão para estimar o valor
médio de Y, ou seja, o coeficiente de interseção.

O valor 1.474,1 na equação da reta azul é o da equação da regressão para estimar o valor médio
de Y, ou seja, o coeficiente para a primeira variável independente usada no modelo de regressão
linear.

O x na equação da reta azul é o X1 da equação da regressão para estimar o valor médio de Y, ou


seja, o valor da primeira variável independente usada no modelo de regressão linear.

MAS, NA EQUAÇÃO DA RETA AZUL NÃO EXISTEM OUTROS ELEMENTOS.


ENTÃO ONDE ESTARIA O ?

A RESPOSTA É MUITO SIMPLES:

Temos que lembrar que serão somadas as multiplicações dos coeficientes pelos respectivos
valores de cada variável independente adicional que existir no modelo de regressão linear.
Neste caso do exemplo em questão, trata-se de uma regressão linear simples, ou seja, temos
apenas uma única variável independente (o m²), e nenhuma outra. Portanto, já realizamos a
multiplicação do coeficiente da variável independente ( ) pelo seu respectivo valor (X1). Desta
forma, numa regressão linear simples (com apenas 1 variável independente), a equação é por
uma simples equação de reta, sendo:
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

Os Coeficientes na regressão
Quando realizamos a regressão usando o Microsoft Excel, uma série de dados são apresentados,
como já mencionado anteriormente.

Os coeficientes de interseção e das variáveis independentes também serão apresentados.

Para analisarmos um exemplo quanto aos coeficientes, usaremos a seguinte lista de imóveis
referenciais:

Imóvel m² dormitório condomínio preço


R1 75 1 350,00 480.000,00
R2 75 2 320,00 490.000,00
R3 78 2 320,00 485.000,00
R4 78 2 340,00 495.000,00
R5 78 2 350,00 500.000,00
R6 80 2 350,00 505.000,00
R7 80 2 370,00 508.000,00
R8 80 2 370,00 510.000,00
R9 82 2 400,00 512.000,00
R10 82 2 400,00 515.000,00
R11 82 2 400,00 515.000,00
R12 85 2 400,00 520.000,00
R13 85 2 400,00 525.000,00
R14 85 3 430,00 528.000,00
R15 88 3 430,00 530.000,00
R16 88 3 450,00 532.000,00
R17 88 3 450,00 535.000,00
R18 88 3 450,00 540.000,00
R19 90 3 480,00 545.000,00
R20 90 3 480,00 550.000,00

58
3
AULA
Regressão Linear
conceitos

Perceba que temos uma variável dependente (o preço) e 3 variáveis independentes (m², dormitórios
e condomínio).

Quando realizamos a regressão no Microsoft Excel, dentre os resultados apresentados, existe


uma coluna de dados numéricos que nos fornece os coeficientes para a elaboração da equação de
regressão.

Portanto, neste exemplo, obteremos as seguintes informações:

Coeficientes
Interseção 264.577,34
m² 2.260,27
dormitório 3.355,68
condomínio 141,97

Na primeira coluna à esquerda, temos a identificação de cada a ser usado na equação de regressão
linear para estimar o valor médio de Y. A segunda coluna apresenta seus respectivos valores.

Na primeira linha de dados da coluna da esquerda temos o termo Interseção, de modo que o dado
numérico à sua direita é o valor do coeficiente de Interseção, ou seja, o 0.

Na segunda linha de dados da coluna da esquerda temos o termo m², sendo uma das variáveis
independentes usadas neste modelo de regressão. O dado numérico à sua direita é o coeficiente
desta primeira variável independente, ou seja, o 1.

Na terceira linha de dados da coluna da esquerda temos o termo dormitórios, sendo a segunda
variável independente usada neste modelo de regressão. O dado numérico à sua direita é o
coeficiente desta segunda variável independente, ou seja, o 2.

Por fim, na quarta linha de dados da coluna da esquerda temos o termo condomínio, sendo a
terceira e última variável independente usada neste modelo de regressão. O dado numérico à sua
direita é o coeficiente desta variável independente, ou seja, o 3.

Portanto, neste caso, como temos 3 variáveis independentes, trocamos o da fórmula por
, lembrando que o n subscrito representa que este cálculo deve ser feito para as n
variáveis independentes existentes.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

Neste caso, a equação de regressão linear completa para estimar o valor médio de Y, ficaria assim:

Seguem os passos de resolução desta equação, com os dados do resultado (exemplo) dos
coeficientes apresentados quando realizada a regressão no Microsoft Excel:

Coeficientes
Interseção 264.577,34
m² 2.260,27
dormitório 3.355,68
condomínio 141,97

Temos, então, que

= 264.577,34 (coeficiente de interseção)

= 2.260,27 (coeficiente para a variável independente m²)

= 3.355,68 (coeficiente para a variável independente dormitório)

= 141,97 (coeficiente para a variável independente condomínio)

Pressupostos Básicos para Validação do Modelo

Para que no modelo de regressão a ser usado, as variáveis independentes realmente possam
explicar satisfatoriamente a variação da variável dependente, deve-se seguir alguns pressupostos
que apresentaremos aqui como regras básicas.

A primeira regra essencial é que se tenha uma amostra com, pelo menos, a quantidade mínima,
conforme explicado quando abordado o Tamanho da amostra.

60
3
AULA
Regressão Linear
conceitos

Igualmente essencial é que todos os elementos devem apresentar todas as variáveis. Em outras
palavras, cada um dos imóveis referenciais deve conter algum dado para cada variável determinada
a ser usada. Por exemplo, vamos supor o caso em que tenha sido definida a utilização das variáveis
m², quantidade de dormitórios e valor do condomínio. Sabemos que precisaremos de 12 imóveis
referenciais (ver a fórmula de definição do Tamanho da amostra). Mas, para 2 imóveis não temos
o valor do condomínio e para um outro imóvel não temos a quantidade de dormitórios. Neste caso,
não será possível considerar esses 3 imóveis referenciais, pois não é possível realizar a regressão
com dados faltantes. Portanto, eliminando os 3 imóveis, restaram apenas 9 imóveis referenciais.
Como precisamos de, no mínimo, 12 imóveis para compor a amostra, precisaremos buscar outros
3 imóveis, ou obter os dados faltantes desses 3.

Além disso, é preciso respeitar rigorosamente os valores limites (mínimo ou máximo) dos
resultados, mencionados quando abordada a Análise da regressão. Caso esses limites não sejam
respeitados, o resultado final estará comprometido e, certamente será questionado (ou, pior,
refutado).

Devemos ter igual atenção à existência de colinearidades, conforme mencionado quando abordada
a Análise de correlação entre variáveis independentes.

Segue quadro resumo:

Fórmula para o cálculo


Item Explicação da amostra:
Tamanho da amostra Ter uma amostra com, pelo menos, a
quantidade mínima de elementos n=3(k+1)

Ter dados para todas


as variáveis Não é possível realizar a regressão com dados faltantes

R-quadrado e Coeficiente de determinação (mede o


R-quadrado ajustado nível de explicação da variável Y pelas Deve ser > 0,7.
variáveis X)

F de significação Resultado do teste quanto a existência


de relação linear entre as variáveis, para
Deve ser < 0,05
verificar se, pelo menos, uma das variáveis
X explica a variação do Y

Valor-P Teste de significação de cada variável Deve ser < 0,10


INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

Exercícios Aula 3
QUESTÃO 1

Estatisticamente, o que se quer dizer pelo termo “regressão”?

A) Uma técnica para analisar a relação de uma variável independente com diversas variáveis
dependentes, de modo a analisar o quanto esta variável dependente realmente explica as variáveis
independentes.
B) Uma técnica para analisar a relação de uma variável dependente com variáveis independentes,
de modo a analisar o quanto estas variáveis independentes realmente explicam a variável
dependente.
C) Uma técnica para analisar a correlação de variáveis independentes, de modo a analisar o quanto
estas variáveis realmente explicam suas existências.
D) Uma técnica para analisar a relação de uma variável dependente com variáveis independentes, de
modo a analisar o quanto elas se correlacionam e realmente explicam as variáveis independentes.
E) Uma técnica para analisar a correlação entre as variáveis dependentes, de modo a analisar o
quanto estas variáveis dependentes realmente explicam a variável independente.

QUESTÃO 2

Assinale a alternativa que apresenta as principais aplicações da equação da regressão.

A) Seleção de parâmetros, Interferência, Preleção e Estimação de variáveis.


B) Seleção de variáveis, Interferência, Preleção e Estimação de parâmetros.
C) Seleção de variáveis, Inferência, Predição e Estilização de parâmetros.
D) Seleção de variáveis, Interferência, Predição e Estilização de parâmetros.
E) Seleção de variáveis, Inferência, Predição e Estimação de parâmetros.

QUESTÃO 3

Numa regressão linear múltipla, podemos ter quantas variáveis?

A) Uma variável dependente e uma variável independente.


B) Duas ou mais variáveis dependentes e uma variável independente.
C) Uma ou mais variáveis dependentes e uma variável independente.
D) Uma variável dependente e duas ou mais variáveis independentes.
E) Uma variável dependente e uma ou mais variáveis independentes.

62
3
AULA

Exercícios

QUESTÃO 4

Nos resultados de uma regressão, o que o R-quadrado mede?

A) O R-quadrado mede o nível de explicação da variável Y (dependente) pelas variáveis X


(independentes).
B) O R-quadrado mede o nível de explicação da variável X (independente) pelas variáveis Y
(dependentes).
C) O R-quadrado é uma medida alternativa do coeficiente de determinação, que penaliza a inclusão
de variáveis independentes.
D) O R-quadrado mede o Resultado do Teste de significação para cada variável.
E) O R-quadrado mede o Coeficiente de determinação para cada variável.

QUESTÃO 5

Qual é a equação do modelo de regressão para estimar o valor médio de Y?

A)

B)

C)

D)

E)
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

REGRESSÃO LINEAR NA
AULA 4 PRÁTICA – USANDO EXCEL

NESTA AULA SERÁ REALIZADA A REGRESSÃO LINEAR, PASSO A PASSO,


PARA QUE SE POSSA REPRODUZIR A ANÁLISE COM OUTROS CONJUNTOS
DE DADOS.

A regressão linear
Para realizar a regressão linear, serão usados os seguintes dados:

Imóvel m² dormitório banheiro piscina condomínio preço


R1 75 1 1 1 350,00 480.000,00
R2 75 2 1 0 320,00 490.000,00
R3 78 2 2 0 320,00 485.000,00
R4 78 2 2 0 340,00 495.000,00
R5 78 2 2 1 350,00 500.000,00
R6 80 2 2 1 350,00 505.000,00
R7 80 2 2 1 370,00 508.000,00
R8 80 2 2 1 370,00 510.000,00
R9 82 2 2 1 400,00 512.000,00
R10 82 2 2 1 400,00 515.000,00
R11 85 2 2 1 400,00 520.000,00
R12 85 2 2 1 400,00 525.000,00
R13 85 3 2 1 430,00 528.000,00
R14 88 3 2 1 430,00 530.000,00
R15 88 3 3 1 450,00 532.000,00
R16 88 3 3 1 450,00 535.000,00
R17 88 3 3 1 450,00 540.000,00
R18 90 3 3 1 480,00 545.000,00
R19 90 3 3 1 480,00 550.000,00
R20 92 3 3 1 490,00 550.000,00
R21 92 3 3 1 490,00 555.000,00
R22 95 3 3 1 500,00 560.000,00

64
4
AULA
Regressão Linear na
prática – usando Excel

Imóvel m² dormitório banheiro piscina condomínio preço


R23 95 4 3 1 500,00 565.000,00
R24 95 4 4 1 500,00 568.000,00

Foram buscados imóveis referenciais, cujos dados disponíveis contemplavam as 5 variáveis


independentes que foram definidas:

• área (m²)
• quantidade de dormitório
• quantidade de banheiro
• quantidade de piscina
• valor do condomínio

Assim como todos apresentam os respectivos preços de venda (variável dependente).


Como foram definidas 5 variáveis independentes, a quantidade mínima da amostra é de 18
elementos. Perceba que a tabela apresenta 24 elementos (imóveis referenciais), superando o
limite mínimo.

No Microsoft Excel, para realizar a Regressão, escolha no menu DADOS, a opção Análise de Dados.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

No quadro que abrir, escolha Regressão e clique OK.

No quadro para entrada de dados da Regressão, entre com os seguintes dados:

• Em Intervalo Y de entrada: selecione a coluna da variável dependente (preços);


• Em Intervalo X de entrada: selecione as colunas das variáveis independentes;
• Selecione a opção Rótulos se nos intervalos foram selecionadas as linhas de títulos;
• Em Intervalo de saída: se preferir, indique uma célula onde serão colocados os
resultados da regressão.
• Clique OK para que o Excel realize os cálculos.

66
4
AULA
Regressão Linear na
prática – usando Excel

Analisando cada elemento dos resultados obtidos no Excel


Analisemos os dados obtidos na realização da regressão feita anteriormente.
Segue o resultado da regressão feita no Microsoft Excel, (com os números apresentando 2 ou 3
casas decimais):

RESUMO DOS RESULTADOS

Os resultados que nos interessam estão destacados em vermelho.

Portanto, vamos às análises:

• R-quadrado e R-quadrado ajustado: os resultados foram, respectivamente 0,981 e 0,975.


Lembrando, ambos estes valores devem ser maiores que 0,7. Como neste caso os valores foram bem
maiores que este limite, significa que neste modelo, aparentemente, as variáveis independentes
explicam a variável dependente.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

• F de significação: o resultado foi 9,048E-15. Este número está em notação científica e significa
0,000000000000009048 (um valor bem pequeno). Lembrando, este valor deve ser menor que 0,05.
Neste caso, devido ao resultado ser extremamente menor que o limite máximo, aparentemente,
existe relação entre as variáveis e, pelo menos, uma das variáveis independentes explica a variação
da variável dependente.

• valor-P de cada variável: Temos 5 variáveis e, portanto, devemos analisar cada uma delas
(lembrando que o valor-P deve ser menor que 0,10), sendo:

o valor-P de m² = 0,004: este valor-P está adequado por ser menor que 0,10;
o valor-P de dormitório = 0,090: este valor-P está adequado por ser menor 0,10;
o valor-P de banheiro = 0,701: este valor-P está inadequado por ser maior que 0,10;
o valor-P de piscina = 0,248: este valor-P está inadequado por ser maior que 0,10;
o valor-P de condomínio = 0,160: este valor-P está inadequado por ser maior que 0,10;

1. Neste caso, temos as variáveis m² e dormitório com valor-P adequados.


Todas as demais variáveis apresentam valor-P acima do limite superior de 0,10.
Portanto, devido aos altos valores do valor-P de 3 variáveis, este modelo de regressão NÃO é
satisfatório, apesar do R-quadrado e do F de significação estarem adequados.

COMO RESOLVER ISSO?

Para resolver isso, devemos eliminar uma variável do modelo.


Apenas uma! Pois, quando eliminamos uma variável, todos os resultados mudam e é possível que
uma outra variável com alto valor-P mude o resultado para um valor-P adequado.

MAS, QUAL VARIÁVEL ELIMINAR?

SIMPLES! ELIMINAMOS A MENOS SIGNIFICATIVA,


OU SEJA, A QUE APRESENTAR O MAIOR VALOR-P.

A variável que tem o maior valor-P é banheiro. Portanto, executaremos a regressão novamente,
com um novo conjunto de dados, composto de todos os mesmos dados que anteriormente
apresentados, mas, sem a coluna da variável banheiro.

68
4
AULA
Regressão Linear na
prática – usando Excel

A nova tabela ficará assim:

Imóvel m² dormitório piscina condomínio preço


R1 75 1 1 350,00 480.000,00
R2 75 2 0 320,00 490.000,00
R3 78 2 0 320,00 485.000,00
R4 78 2 0 340,00 495.000,00
R5 78 2 1 350,00 500.000,00
R6 80 2 1 350,00 505.000,00
R7 80 2 1 370,00 508.000,00
R8 80 2 1 370,00 510.000,00
R9 82 2 1 400,00 512.000,00
R10 82 2 1 400,00 515.000,00
R11 85 2 1 400,00 520.000,00
R12 85 2 1 400,00 525.000,00
R13 85 3 1 430,00 528.000,00
R14 88 3 1 430,00 530.000,00
R15 88 3 1 450,00 532.000,00
R16 88 3 1 450,00 535.000,00
R17 88 3 1 450,00 540.000,00
R18 90 3 1 480,00 545.000,00
R19 90 3 1 480,00 550.000,00
R20 92 3 1 490,00 550.000,00
R21 92 3 1 490,00 555.000,00
R22 95 3 1 500,00 560.000,00
R23 95 4 1 500,00 565.000,00
R24 95 4 1 500,00 568.000,00

Segue o resultado da regressão desta nova tabela, feita no Microsoft Excel, (com os números
apresentando 2 casas decimais):
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

RESUMO DOS RESULTADOS

Os resultados que nos interessam estão destacados em vermelho.

Portanto, vamos novamente fazer as mesmas análises:

• R-quadrado e R-quadrado ajustado: quase os mesmos valores que no modelo anterior (apenas
o R-quadrado ajustado aumentou de 0,975 para 0,976), continuando maiores que 0,7 e, portanto,
satisfatórios.

• F de significação: o resultado foi 5,8524E-16, menor que o resultado no modelo anterior (que foi
de 9,048E-15). Veja:

F de significação deste modelo: 0,00000000000000058524


F de significação do modelo anterior: 0,00000000000000904800
Portanto, continua satisfatório.

70
4
AULA
Regressão Linear na
prática – usando Excel

• valor-P de cada variável: Agora, temos 4 variáveis e, novamente, devemos analisar cada uma
delas (lembrando que o valor-P deve ser menor que 0,10), sendo:

o valor-P de m² = no modelo anterior foi 0,004 e neste modelo é 0,002 (menor que 0,10);
o valor-P de dormitório = no modelo anterior foi 0,090 e neste modelo é 0,055 (menor que
0,10);
o valor-P de piscina = no modelo anterior foi 0,248 e neste modelo é 0,240 (maior que 0,10);
o valor-P de condomínio = no modelo anterior foi 0,160 e neste modelo é 0,145 (maior que
0,10);

2. As variáveis m² e dormitório continuam com valor-P adequados. Mas, apesar da diminuição


dos valores, o valor-P das demais variáveis deste modelo também NÃO é satisfatório.


COMO RESOLVER ISSO?

Novamente, devemos eliminar uma variável do modelo.

E QUAL VARIÁVEL ELIMINAR?

SEGUIMOS O MESMO CONCEITO E, NOVAMENTE,


ELIMINAMOS A MENOS SIGNIFICATIVA.

A variável que tem o maior valor-P, desta vez, é Piscina. Vamos executar a regressão pela
terceira vez, agora, sem a variável piscina e sem a variável banheiro que já havíamos removido
anteriormente.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

A nova tabela ficará assim:

Imóvel m² dormitório condomínio preço


R1 75 1 350,00 480.000,00
R2 75 2 320,00 490.000,00
R3 78 2 320,00 485.000,00
R4 78 2 340,00 495.000,00
R5 78 2 350,00 500.000,00
R6 80 2 350,00 505.000,00
R7 80 2 370,00 508.000,00
R8 80 2 370,00 510.000,00
R9 82 2 400,00 512.000,00
R10 82 2 400,00 515.000,00
R11 85 2 400,00 520.000,00
R12 85 2 400,00 525.000,00
R13 85 3 430,00 528.000,00
R14 88 3 430,00 530.000,00
R15 88 3 450,00 532.000,00
R16 88 3 450,00 535.000,00
R17 88 3 450,00 540.000,00
R18 90 3 480,00 545.000,00
R19 90 3 480,00 550.000,00
R20 92 3 490,00 550.000,00
R21 92 3 490,00 555.000,00
R22 95 3 500,00 560.000,00
R23 95 4 500,00 565.000,00
R24 95 4 500,00 568.000,00

Segue o resultado desta outra regressão, feita no Microsoft Excel, (com os números apresentando
2 casas decimais):

72
4
AULA
Regressão Linear na
prática – usando Excel

RESUMO DOS RESULTADOS

Os resultados que nos interessam estão destacados em vermelho.

Continuamos fazendo as mesmas análises:

• R-quadrado e R-quadrado ajustado: o valor do R-quadrado ajustado não foi alterado e o valor
do R-quadrado ficou um pouco menor que no modelo anterior, mas, continuam satisfatórios.

• F de significação: o resultado, desta vez, foi ainda menor: 6,1150E-17, que significa
0,000000000000000061150, continuando satisfatório.

• valor-P de cada variável: Desta vez, temos 3 variáveis analisaremos cada uma delas (lembrando
que o valor-P deve ser menor que 0,10), sendo:

o valor-P de m² = 0,003 (menor que 0,10);


o valor-P de dormitório = 0,106 (ainda um pouco maior que 0,10);
o valor-P de condomínio = 0,037 (menor que 0,10);
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

3. A variável m² continua com valor-P adequado.


Mas, desta vez, a variável dormitório se tornou insatisfatória, pois apresentou um valor-P maior
que 0,10.
Por outro lado, a variável condomínio passou a ser satisfatória, pois apresentou um valor-P menor
que 0,10.
Devido à variável dormitório estar com o valor-P maior que 0,10 este modelo também NÃO é
satisfatório.
Já sabemos o que deve ser feito: remover a variável com o maior valor-P.
Neste caso, vamos remover a variável dormitório, ficando com a seguinte tabela:

Imóvel m² condomínio preço


R1 75 350,00 480.000,00
R2 75 320,00 490.000,00
R3 78 320,00 485.000,00
R4 78 340,00 495.000,00
R5 78 350,00 500.000,00
R6 80 350,00 505.000,00
R7 80 370,00 508.000,00
R8 80 370,00 510.000,00
R9 82 400,00 512.000,00
R10 82 400,00 515.000,00
R11 85 400,00 520.000,00
R12 85 400,00 525.000,00
R13 85 430,00 528.000,00
R14 88 430,00 530.000,00
R15 88 450,00 532.000,00
R16 88 450,00 535.000,00
R17 88 450,00 540.000,00
R18 90 480,00 545.000,00
R19 90 480,00 550.000,00
R20 92 490,00 550.000,00
R21 92 490,00 555.000,00
R22 95 500,00 560.000,00
R23 95 500,00 565.000,00
R24 95 500,00 568.000,00

74
4
AULA
Regressão Linear na
prática – usando Excel

Segue o resultado da regressão, feita no Microsoft Excel, com apenas 2 variáveis independentes
(m² e condomínio):

RESUMO DOS RESULTADOS

As análises são as mesmas:


• R-quadrado e R-quadrado ajustado: os valores apresentam pouca alteração e continuam
satisfatórios.

• F de significação: o resultado foi o menor de todos os modelos de regressão: 9,8907E-18, que


significa 0,0000000000000000098907, continuando satisfatório.

• valor-P de cada variável (lembrando que o valor-P deve ser menor que 0,10), sendo:

o valor-P de m² = 0,0001 (satisfatório);


o valor-P de condomínio = 0,0639 (satisfatório);
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

4. Ambas variáveis apresentam valor-P menor que 0,10, sendo ambas satisfatórias.
PORTANTO, ESTE MODELO É SATISFATÓRIO!

Agora, sim, chegamos a um modelo que nos permitirá, para este caso, baseado na amostra usada,
estimar o valor do imóvel avaliando.

Importa lembrar que, neste caso, apenas as variáveis m² e condomínio foram usadas no modelo
satisfatório. Mas, em outros casos, é possível que, de acordo com a amostra, as variáveis dormitório
e vagas de garagem, por exemplo, se tornem mais significativas, ou mesmo outras variáveis que
sequer usamos ou citamos aqui. Tudo dependerá da escolha de variáveis e da obtenção dos dados
de mercado.

Criando a equação de regressão


Já foi abordada a equação da regressão para estimar o valor médio de Y. Lembrando:

Agora, vamos nos basear no modelo de regressão que acabamos de ver para criar a equação de
regressão, utilizando o Microsoft Excel, com isso, calcular o valor de Y ̂, o valor do imóvel avaliando.
Segue o resultado da regressão, feita no Microsoft Excel, cujo modelo se demonstrou significativo:

76
4
AULA
Regressão Linear na
prática – usando Excel

Serão usados os coeficientes de interseção e das variáveis independentes que, neste caso, são m²
e condomínio.

Coeficiente de Interseção: 231.353,86

Coeficiente da variável m²: 2.852,27

Coeficiente da variável condomínio: 121,80

Supondo que o imóvel avaliando tenha 98 m² e seu condomínio seja de R$ 485,00, segue a equação:

Definindo o Intervalo de Confiança


Quando calculamos o valor de Y ̂, temos uma média geral, baseada na regressão linear, do estimado
valor do imóvel avaliando.

Caso tenhamos usado uma amostra com preços de locação, teremos um valor de locação para o
imóvel avaliando.

Caso tenhamos usado uma amostra com preços de venda, teremos um valor de venda para o imóvel
avaliando.

Mas, este valor é uma probabilidade estatística, já que estamos trabalhando com uma amostra
da população. Caso estivéssemos usando toda a população, poderíamos obter a verdadeira média
e, com isso, o valor médio exato. Mas, como não é possível obter os dados de toda a população
de imóveis similares ao imóvel avaliando, trabalhamos com uma amostra (alguns imóveis que
servem de referência). Isso significa que o verdadeiro valor do imóvel avaliando pode ser esse
mesmo, ou pode estar um pouco acima ou ainda um pouco abaixo desse valor que acabamos de
calcular.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

A questão aqui é: Quanto acima ou quanto abaixo o valor pode variar?

É isso que vamos calcular.


Após calcularmos os limites superior e inferior, teremos uma faixa de possível variação do valor
estimado.
A essa faixa de possível variação dá-se o nome de Intervalo de Confiança.

Portanto:

O intervalo de confiança é uma estimativa intervalar referente aos valores


aproximados de uma faixa confiável. Ou seja, é a faixa de valores que tem a
probabilidade de conter o verdadeiro valor se esse valor fosse obtido considerando
toda a população ao invés de apenas uma amostra.

Esse intervalo de confiança não é simplesmente escolhido, mas, diferente disso, é calculado
estatisticamente e varia conforme definimos o nível de confiança e de significância na realização
da regressão.

NÃO CONFUNDA “INTERVALO DE CONFIANÇA” COM “NÍVEL DE CONFIANÇA”!


NÃO CONFUNDA “NÍVEL DE CONFIANÇA” COM “NÍVEL DE SIGNIFICÂNCIA”!

Vejamos cada um deles:

• Intervalo de Confiança: Uma faixa de valores que tem ao centro o valor da média da nossa amostra.
Este intervalo se estende de um limite inferior, calculado pela média menos um determinado
valor, até o limite superior, calculado pela média mais esse mesmo determinado valor. Esse valor
é calculado a partir do Nível de Confiança.

• Nível de Confiança: Percentual de chance em que a verdadeira média da população estaria


dentre as diversas médias obtidas em infinitos conjuntos amostrais eventualmente colhidos.
Para explicar esse conceito, temos que lembrar que colhemos alguns elementos, formamos
um único conjunto, o qual é a amostra (um conjunto amostral) e calculamos a média. Esta é a
média da nossa amostra, mas não é a média da população. Caso colhêssemos outro conjunto
amostral com diferentes elementos, teríamos outra média. Se continuarmos repetindo essa ação,
criaríamos diversos conjuntos amostrais e, para cada um deles, teríamos uma média diferente.
Com isso, considerando todas as médias que poderíamos ter obtido, seria possível dizer que a
média na população, provavelmente, estaria dentro dessa faixa de valores médios dos diversos
conjuntos de amostras. Mas, diferente disso, não poderemos colher diversos conjuntos amostrais

78
4
AULA
Regressão Linear na
prática – usando Excel

e trabalhamos com apenas um único conjunto amostral. Por isso, determinamos, em percentual,
um nível de confiança referente a esses dados, para realizar todos os demais cálculos. Caso, por
exemplo, for determinado um percentual de 95%, isso significará dizer que se forem colhidas
diversas amostras aleatórias e calculada a média de todas elas, em 95% das vezes a verdadeira
média da população estaria na faixa de médias amostrais obtidas.

• Nível de Significância: Também chamado de α (alfa), trata-se da confiabilidade daquilo que se


esteja tratando, sendo o limite que determina se o resultado de um estudo pode ser considerado
estatisticamente significativo depois de se realizarem os testes estatísticos planejados. O nível de
significância é igual a 100% menos o Nível de Confiança. Portanto, ao utilizar, por exemplo, um
Nível de Confiança de 95%, estamos definindo um Nível de Significância de 5% (já que 100% -
95% = 5%), ou seja, 0,5.

No nosso caso, referente às avaliações imobiliárias, aceita-se um Nível de Significância de, no


máximo, 30% (ou seja 0,3). Isso significa que o limite mínimo para o Nível de Confiança é de 70%
(ou seja, 0,7).

O Microsoft Excel oferece um recurso que apresenta diversos dados referentes à Estatística
Descritiva, com os quais podemos calcular o Intervalo de Confiança.

No Microsoft Excel, para realizar a Regressão, escolha no menu DADOS, a opção Análise de Dados.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

No quadro que abrir, selecione Estatística descritiva e clique OK.

No quadro para entrada de dados da Estatística descritiva, entre com os seguintes dados:

• Em Intervalo de entrada: selecione a coluna da variável dependente (preços);


• Selecione a opção Rótulos na primeira linha se no intervalo foi selecionada a linha de título;
• Em Intervalo de saída: se preferir, indique uma célula onde serão colocados os resultados
da regressão.
• Clique OK para que o Excel realize os cálculos.

Utilizando os mesmos dados usados anteriormente para criar a equação da regressão do modelo
de regressão que se demonstrou significativo, teremos o seguinte resultado quanto à Estatística
descritiva:

80
4
AULA
Regressão Linear na
prática – usando Excel

Preço
Média 525.125,00
Erro padrão 5.250,02
Mediana 526.500,00
Modo 550.000,00
Desvio padrão 25.719,75
Variância da amostra 661.505.434,78
Curtose - 0,98
Assimetria - 0,02
Intervalo 88.000,00
Mínimo 480.000,00
Máximo 568.000,00
Soma 12.603.000,00
Contagem 24,00
Nível de confiança(95,0%) 10.860,50

Em destaque o valor a ser usado para a determinação do Intervalo de Confiança, sendo:

• Valor estimado = valor determinado pela equação da regressão = 569.950,84


• Limite inferior do intervalo = Valor estimado – 10.860,50 = 559.090,34
• Limite superior do intervalo = Valor estimado + 10.860,50 = 580.811,34
• Percentual de variação = 10.860,50 / Valor estimado = 0,019 = 1,9%

Usando o Microsoft Excel também é possível calcular o intervalo de confiança a partir de uma
função.
Funções do Microsoft Excel:

• INT.CONFIANÇA.NORM()
• INT.CONFIANÇA.T()
Apesar de existirem 2 funções para isso, usaremos apenas uma delas.

Vamos entender:

Um dos parâmetros da função INT.CONFIANÇA.NORM() é o desvio padrão da população. Mas não


temos acesso a todos os dados da população, já que estamos trabalhando com apenas uma amostra
dela. Então esta não é a função que usaremos.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

Já na função INT.CONFIANÇA.T() devemos informar o desvio padrão da amostra, o qual temos


como calcular, pois temos os dados da amostra. É por isso que esta é a função que utilizaremos.
Vejamos como usar esta função:

INT.CONFIANÇA.T (Função INT.CONFIANÇA.T)

Retorna o intervalo de confiança para uma média.

Sintaxe: INT.CONFIANÇA.T(alfa,desv_padrão,tamanho)

sendo:

• alfa: O nível de significância usado para calcular o nível de confiança. O nível de confiança
é igual a 100*(1 - alfa)% ou, em outras palavras, um alfa de 0,05 indica um nível de confiança de
95%.
• desv_padrão: O desvio padrão para o intervalo de dados, o qual pode ser calculado usando
a função DESVPAD.A() para o intervalo dos dados da variável dependente (o preço).
• tamanho: O tamanho da amostra, ou seja, a quantidade de elementos, que pode ser contado
usando a função CONT.NÚM() para o intervalo dos dados da variável dependente (o preço).

Caso sejam usados os mesmos dados da Estatística descritiva acima, o resultado será o mesmo:

10.860,50

Os demais cálculos para determinação do Intervalo de Confiança são os mesmos, sendo:

• Valor estimado = valor determinado pela equação da regressão = 569.950,84


• Limite inferior do intervalo = Valor estimado – 10.860,50 = 559.090,34
• Limite superior do intervalo = Valor estimado + 10.860,50 = 580.811,34
• Percentual de variação = 10.860,50 / Valor estimado = 0,019 = 1,9%

82
4
AULA

Exercícios

Exercícios Aula 4
QUESTÃO 1

Na equação de regressão, o que é o 0 ?

A) Valor médio da variável independente.


B) Coeficiente da variável independente.
C) Coeficiente de significação da variável dependente.
D) Erro equivalente à diferença entre o valor da variável dependente Y e o valor médio da variável
dependente Y.
E) Coeficiente de Interseção.

QUESTÃO 2

O que é o resultado do cálculo do valor de Y na equação da regressão linear?

A) Temos o exato valor do imóvel avaliando.


B) Temos o estimado valor do imóvel avaliando.
C) Temos o intervalo de confiança do valor do imóvel avaliando.
D) Temos a média dos valores das variáveis independentes.
E) Temos a variação do valor do imóvel avaliando.

QUESTÃO 3

O que é o intervalo de confiança?

A) É uma estimativa intervalar referente aos valores exatos de uma faixa desconfiável.
B) É uma estimativa fixa referente aos valores exatos de uma faixa confiável.
C) É uma estimativa intervalar referente aos valores aproximados de uma faixa confiável.
D) É um dado fixo e exato do intervalo referente aos valores aproximados de uma faixa desconfiável.
E) É uma estimativa intervalar escolhida referente aos valores exatos de uma faixa confiável.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

QUESTÃO 4

O que é Nível de Confiança?

A) Percentual de chance em que a verdadeira média da população estaria dentre as diversas médias
obtidas em infinitos conjuntos amostrais eventualmente colhidos.
B) Uma faixa de valores que tem ao centro o valor da média da nossa amostra.
C) Percentual de confiabilidade daquilo que se esteja tratando, sendo o limite que determina
se o resultado de um estudo pode ser considerado estatisticamente significativo depois de se
realizarem os testes estatísticos planejados.
D) É uma estimativa intervalar referente aos valores aproximados de uma faixa confiável.
E) É uma probabilidade estatística, já que estamos trabalhando com uma amostra da população.

QUESTÃO 5

Se somarmos o Nível de confiança com o Nível de significância, qual o valor deve resultar?

A) 0,05
B) 95%
C) 5%
D) 100%
E) 70%

84
5
AULA
Realizando uma avaliação
imobiliária inteira

REALIZANDO UMA AVALIAÇÃO


AULA 5 IMOBILIÁRIA INTEIRA

Seguem os passos, na sequência, referentes à inferência estatística para uma avaliação


imobiliária:

1. Determinar quais variáveis independentes serão usadas, conforme as características do


imóvel avaliando.

2. Calcular o tamanho da amostra, conforme a quantidade de variáveis independentes.

3. Criar a tabela (com variáveis independentes e variável dependente) com os dados dos
imóveis referenciais.

4. Analisar a dispersão e a correlação entre as variáveis, eliminando colinearidades e dados


constantes.

5. Descartar:
a. uma das variáveis independentes totalmente colineares;
b. todas as variáveis cujos dados não variam (são constantes).

6. Executar a regressão linear até obter um modelo significativo:


a. executar a regressão com as variáveis independentes escolhidas;
b. caso haja, descartar a variável independente que apresentar o maior valor-P
(superior 0,10).

7. Executar o passo anterior até que:


a. não haja variável independente com valor-p superior a 0,10;
b. o R-quadrado seja maior que 0,70;
c. o F de significação seja menor que 0,05.

8. Criar a equação do modelo de regressão linear para estimar o valor médio.

9. Determinar o valor do imóvel avaliando aplicando a equação do modelo de regressão


escolhido.

10. Calcular o Intervalo de confiança (limite máximo do Alfa em 0,30).


INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

Exercícios Aula 5
QUESTÃO 1

Assinale a alternativa que apresenta um dos passos que devem ser realizados referentes à inferência
estatística para uma avaliação imobiliária.

A) Obter registro fotográfico dos imóveis referenciais.


B) Calcular a moda do imóvel avaliando.
C) Criar a tabela da população conforme a quantidade de variáveis dependentes.
D) Determinar o preço dos imóveis referenciais aplicando a equação da regressão.
E) Descartar a variável independente que apresentar o valor-P superior a 0,10.

QUESTÃO 2

Ao analisar a correlação entre duas variáveis independentes e perceber que sejam colineares (ou
seja, o coeficiente de correlação é igual a 1), o que devemos fazer?

A) Descartar ambas as variáveis.


B) Descartar uma das duas variáveis, ficando com a outra.
C) Não é preciso fazer nada, pois isso não prejudica a análise de regressão.
D) Descartar o imóvel que provoque a colinearidade.
E) Calcular a dispersão do preço/m² para obter um resultado mais preciso.

QUESTÃO 3

Numa avaliação imobiliária utilizando inferências estatísticas, quando é o melhor momento para
calcular o Intervalo de confiança?

A) Manter separadas as colunas das variáveis independentes.


B) Manter adjacentes as colunas das variáveis dependentes.
C) Manter adjacentes as colunas das variáveis independentes.
D) Destacar os títulos das colunas com cor diferente.
E) Ajustar a largura das colunas para a largura de seus conteúdos.

86
5
AULA

Exercícios

QUESTÃO 4

Dentre os resultados de uma regressão, o que devemos fazer caso o valor-P da variável Elevador
tenha resultado em 0,1037 e o valor-P da variável Piscina tenha resultado 0,23E-2?

A) Descartar a variável Piscina, pois apresenta o maior valor-P e realizar a regressão novamente.
B) Descartar a variável Elevador, pois apresenta o maior valor-P e realizar a regressão novamente.
C) Como o valor-P de ambas as variáveis é superior ao limite máximo para que uma variável
independente seja significativa, deve-se descartar ambas as variáveis e criar a equação da
regressão somente com as outras variáveis restantes.
D) Sendo 0,10 o limite máximo do valor-P para que uma variável independente seja significativa,
deve-se descartar ambas as variáveis e realizar a regressão novamente.
E) Não se deve fazer nada, pois o valor-P das variáveis está abaixo do limite superior e, portanto,
estas variáveis são significativas.

QUESTÃO 5

Analise os seguintes resultados da regressão e assinale a alternativa que apresenta o que deve ser
feito.

A) Descartar a variável vaga e realizar a regressão novamente, considerando apenas as demais


variáveis.
B) Descartar a variável elevador e realizar a regressão novamente, considerando apenas as demais
variáveis.
C) Descartar as variáveis banheiro, vaga e elevador e realizar a regressão novamente, considerando
apenas as demais variáveis.
D) Descartar as variáveis banheiro e elevador e realizar a regressão novamente, considerando
apenas as demais variáveis.
E) Descartar a variável banheiro e realizar a regressão novamente, considerando apenas as demais
variáveis.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

Mensagem final

Depois de todo o curso, realmente esperamos que você possa realizar as análises adequadas para
gerar avaliações imobiliárias baseadas em inferências estatísticas e, com isso, apresentar laudos
e pareceres de alto nível de significação.

Sugerimos que utilize este material para consultas futuras, de modo que sempre possa relembrar
conceitos, fórmulas e funções, para nunca apresentar um resultado equivocado.

Enfim, além de esperarmos que tenha desenvolvido entendimento para ser competente nesta
área, desejamos sucesso e boa sorte, já que sorte é um ingrediente muito bem-vindo para ampliar
o potencial de realizações.

Atenciosamente,
Andersom Bontorim

88
Referências Bibliográficas
CORRAR L.J., PAULO E, DIAS FILHO J.M. Análise multivariada para cursos de administração,
ciências contábeis e economia, São Paulo: Atlas, 2007.

DANTAS, Rubens Alves. Engenharia de avaliações: uma introdução a metodologia científica. 2. ed.
rev. de acordo com a NBR-14653-2:2004. São Paulo: PINI, 2005

GONZÁLEZ, M. A. S. A engenharia de avaliações na visão inferencial. São Leopoldo: Unisinos, 1997.

GONZÁLEZ, M. A. S.; FORMOSO, C. T. Analise conceitual das dificuldades na determinação de


modelos de formação de preço através de análise de regressão. Engenharia Civil – UM (Universidade
do Milho). Portugal, p. p.65-75. 2000.

GUNST, RICHARD F., MASON, ROBERT L., Regression Analysis and its application: A data-Oriented
Approach. Nova York: MARCEL DEKKER, INC., 1980.

LEVINE, DAVID M et al. Estatística – Teoria e aplicações usando o Microsoft Excel em português.
Trad. Eduardo Benedito Curtolo e Teresa Cristina Padilha de Souza. 3ª ed. Rio de Janeiro: LTC,
2005

LEVINE, STEPHAN, KREHBIEL, BERENSON. Estatística: teoria e aplicações usando o Microsoft


Excel, 5a ed. Rio de Janeiro: LTC, 2008.

PEREIRA, R. S. Estatística e suas aplicações. São Paulo: Grafosul, 1970.

SNEDECOR, G. W.; COCHRAN, W. G. Statistical methods. 6. ed., Iowa: Ames, 1972.

TRIOLA, M.F. Introdução à Estatística, Rio de Janeiro: LTC, 2005.


INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

GABARITO AULA 1
QUESTÃO 1

RESPOSTA CORRETA: ALTERNATIVA C.

Comentário: População é o conjunto de todos os elementos que tenham, pelo menos, uma
característica em comum. É comum usarmos o termo “população” para nos referirmos ao conjunto
de pessoas de uma região. No entanto, em estatística, “população” não se restringe somente às
pessoas, estendendo-se a qualquer elemento. Por isso, ao se referir ao conjunto de algo, dizemos a
população desse algo. Por exemplo, a população de apartamentos de 3 dormitórios do município, é
o conjunto de todos os apartamentos que tenha essa característica, em específico (3 dormitórios)
de uma cidade específica.

QUESTÃO 2

RESPOSTA CORRETA: ALTERNATIVA D.

Comentário: Subconjunto de uma população. Em outras palavras é um conjunto menor, formado


de alguns elementos do conjunto de todos os elementos que tenham características próprias.
Então, por exemplo, quando colhemos uma lista de 10 apartamentos de 3 dormitórios, temos uma
amostra da população de apartamentos de 3 dormitórios. Perceba que esses 10 apartamentos não
são a totalidade de apartamentos da região e, portanto, trata-se de um conjunto menor formado
de alguns elementos da população.

QUESTÃO 3

RESPOSTA CORRETA: ALTERNATIVA B.

Comentário: Moda é o valor que aparece com maior frequência no conjunto de dados. Os
estimadores de dispersão são úteis para identificar a homogeneidade do conjunto de dados.
Amplitude é a distância entre o menor e o maior valor num conjunto de dados numéricos. É
preciso ter ativado o Suplemento de Ferramentas de análise do Microsoft Excel para as análises
de inferência estatística. Portanto, a única afirmação correta é: Média, em estatística, é o valor
resultante da soma dos valores de um conjunto de dados, dividida pela quantidade de dados desse
conjunto.

90
Gabarito

QUESTÃO 4

RESPOSTA CORRETA: ALTERNATIVA B.

Comentário: O resultado do cálculo da variância não é muito intuitivo, ou seja, à primeira vista,
aparentemente nos permite perceber a realidade dos dados. Isso ocorre porque trata-se de um
número elevado ao quadrado. Apesar disso, a variância é bastante utilizada nos demais cálculos
estatísticos.

QUESTÃO 5

RESPOSTA CORRETA: ALTERNATIVA C.

Comentário: Se o desvio padrão é igual à raiz quadrada da variância (como visto na fórmula),
então a variância é igual ao desvio padrão elevado ao quadrado. Vejamos as fórmulas:

Fórmula da variância:

Fórmula do desvio padrão:

GABARITO AULA 2

QUESTÃO 1

RESPOSTA CORRETA: ALTERNATIVA A.

Comentário: Variável dependente: algo que varia por causa de outros elementos. No nosso caso, o
preço dos imóveis é uma variável dependente pois varia dependendo da quantidade de dormitórios,
localização, tamanho e outros elementos, por exemplo.
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

QUESTÃO 2

RESPOSTA CORRETA: ALTERNATIVA B.

Comentário: Variável independente: algo que varia sem depender de outros elementos. A
quantidade de dormitórios, numa lista de imóveis é algo que varia sem depender de outro fator.
Cada imóvel, simplesmente, tem uma quantidade específica de dormitórios.

QUESTÃO 3

RESPOSTA CORRETA: ALTERNATIVA D.

Comentário: Para calcular a quantidade mínima de imóveis referenciais, basta somar a quantidade
de variáveis independentes que serão usadas. A fórmula é extremamente simples:

n = 3(k + 1)
Sendo:
n : o tamanho da amostra (a quantidade mínima de imóveis referenciais);
k : a quantidade de variáveis independentes (as características a serem consideradas).

QUESTÃO 4

RESPOSTA CORRETA: ALTERNATIVA A.

Comentário: Para realizarmos os cálculos, utilizaremos o software Microsoft Excel. Portanto,


devemos incluir os dados no Microsoft Excel. Mas, existe uma sequência lógica para as colunas,
por causa dos recursos que usaremos. As colunas das variáveis independentes devem estar
adjacentes entre si (uma ao lado da outra), para que alguns recursos, no Microsoft Excel, possam
ser executados.

92
Gabarito

QUESTÃO 5

RESPOSTA CORRETA: ALTERNATIVA D.

Comentário: Nesta correlação, os imóveis NÃO aparecem numa mesma coluna. Se esta correlação
continuar a mesma, baseando-se nesta amostra, imóveis de 5 dormitórios teriam 5 banheiros. A
quantidade de dormitórios e a quantidade de banheiros se correlacionam, sim. A linha diagonal
sólida apresenta, sim, a tendência dessa correlação.

GABARITO AULA 3

QUESTÃO 1

RESPOSTA CORRETA: ALTERNATIVA B.

Comentário: Em estatística, sendo mais específico, pelo termo “regressão” quer-se dizer uma
técnica para analisar a relação de uma variável dependente com variáveis independentes, de modo
a analisar o quanto estas variáveis independentes realmente explicam a variável dependente. No
nosso caso, tratando-se de avaliações mercadológicas de imóveis, já vimos que o preço dos imóveis
é a nossa variável dependente, sendo que as demais variáveis, que potencialmente explicariam a
variação desse preço, são as nossas variáveis independentes.

QUESTÃO 2

RESPOSTA CORRETA: ALTERNATIVA E.

Comentário: Podemos ter as seguintes aplicações da equação da regressão:


- SELEÇÃO DE VARIÁVEIS: É possível analisar quais variáveis independentes realmente afetam
a variável dependente e, com isso, definir o que efetivamente explica a variação da variável
dependente.
- INFERÊNCIA: Pode-se testar hipóteses e realizar análises alterando as variáveis e seus valores.
- PREDIÇÃO: O resultado final da regressão é uma equação matemática que demonstra como a
variável dependente se comporta em função das variáveis independentes. É possível, portanto,
definir valores para as variáveis independentes nessa equação, e verificar qual será o valor da
variável dependente.
- ESTIMAÇÃO DE PAR METROS: É possível definir ações ou atividades que se ajustem ao modelo da
regressão, ou mesmo que possibilitem ajustar os resultados do modelo de regressão (algo muito
utilizado para definir ajustes em equipamentos de um processo de manufatura).
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

QUESTÃO 3

RESPOSTA CORRETA: ALTERNATIVA D.

Comentário: Regressões lineares apresentam apenas uma variável dependente. A regressão linear
é múltipla, quando apresentar duas ou mais variáveis independentes. E será simples quando
apresentar apenas uma variável independente.

QUESTÃO 4

RESPOSTA CORRETA: ALTERNATIVA A.

Comentário: O R-quadrado é o Coeficientes de determinação, medidas de ajuste de um modelo


estatístico linear. O R-quadrado mede o nível de explicação da variável Y pelas variáveis X, sendo
que a variável Y é a variável dependente e as variáveis X são as variáveis independentes.

QUESTÃO 5

RESPOSTA CORRETA: ALTERNATIVA C.

Comentário: A equação do modelo matemático da regressão é:

Mas, o enunciado da questão pede a equação do modelo de regressão para estimar o valor médio
de Y. Então, temos que lembrar que o (erro) somente é usado na equação do modelo matemático
da regressão, mas não usado na equação para estimar o valor médio de Y. Portanto, a equação para
estimar o valor médio de Y é:

94
Gabarito

GABARITO AULA 4

QUESTÃO 1

RESPOSTA CORRETA: ALTERNATIVA E.

Comentário: é o Coeficiente de Interseção. Ao traçar uma reta de tendência numa representação


gráfica, o valor deste coeficiente é o ponto onde esta reta corta o eixo (por isso interseção).

QUESTÃO 2

RESPOSTA CORRETA: ALTERNATIVA B.

Comentário: Quando calculamos o valor de , temos uma média geral, baseada na regressão
linear, do estimado valor do imóvel avaliando. Este valor é uma probabilidade estatística, já que
estamos trabalhando com uma amostra da população. Caso estivéssemos usando toda a população,
poderíamos obter a verdadeira média e, com isso, o valor médio exato. Mas, não sendo possível
obter os dados de toda a população, trabalhamos com uma amostra. Isso significa que o verdadeiro
valor pode estar um pouco acima ou ainda um pouco abaixo desse valor que acabamos de calcular.

QUESTÃO 3

RESPOSTA CORRETA: ALTERNATIVA C.

Comentário: O intervalo de confiança é uma estimativa intervalar referente aos valores


aproximados de uma faixa confiável. Ou seja, é a faixa de valores que tem a probabilidade de conter
o verdadeiro valor se esse valor fosse obtido considerando toda a população ao invés de apenas
uma amostra. Esse intervalo de confiança não é simplesmente escolhido, mas, diferente disso, é
calculado estatisticamente e varia conforme definimos o nível de confiança e de significância na
realização da regressão.

QUESTÃO 4

RESPOSTA CORRETA: ALTERNATIVA A.

Comentário: Percentual de chance em que a verdadeira média da população estaria dentre


as diversas médias obtidas em infinitos conjuntos amostrais eventualmente colhidos. Para
explicar esse conceito, temos que lembrar que colhemos alguns elementos, formamos um único
conjunto, o qual é a amostra (um conjunto amostral) e calculamos a média. Esta é a média da
nossa amostra, mas não é a média da população. Caso colhêssemos outro conjunto amostral com
INFERÊNCIA ESTATÍSTICA PARA
AVALIAÇÃO IMOBILIÁRIA

diferentes elementos, teríamos outra média. Se continuarmos repetindo essa ação, criaríamos
diversos conjuntos amostrais e, para cada um deles, teríamos uma média diferente. Com isso,
considerando todas as médias que poderíamos ter obtido, seria possível dizer que a média na
população, provavelmente, estaria dentro dessa faixa de valores médios dos diversos conjuntos
de amostras. Mas, diferente disso, não poderemos colher diversos conjuntos amostrais e
trabalhamos com apenas um único conjunto amostral. Por isso, determinamos, em percentual,
um nível de confiança referente a esses dados, para realizar todos os demais cálculos. Caso, por
exemplo, for determinado um percentual de 95%, isso significará dizer que se forem colhidas
diversas amostras aleatórias e calculada a média de todas elas, em 95% das vezes a verdadeira
média da população estaria na faixa de médias amostrais obtidas.

QUESTÃO 5

RESPOSTA CORRETA: ALTERNATIVA D.

Comentário: O nível de significância é igual a 100% menos o Nível de Confiança. Portanto,


somando-se o Nível de confiança com o Nível de significância, o resultado deve ser igual a 100%.

GABARITO AULA 5
QUESTÃO 1

RESPOSTA CORRETA: ALTERNATIVA E.

Comentário: Ainda que possa ser interessante para a avaliação imobiliária, obter registros
fotográficos dos imóveis referenciais, não é um passo referente à inferência estatística. Não é
possível calcular a moda do imóvel avaliando, pois, para calcular a moda, deve-se ter mais de um
elemento. Não criamos a tabela da população, mas apenas da amostra colhida. Não determinamos
o preço dos imóveis referenciais, pois estes são dados que colhemos do mercado. Temos que
executar a regressão linear até obter um modelo significativo e, por isso, descartamos variáveis
independentes que apresentarem o valor-P superior a 0,10.

QUESTÃO 2

RESPOSTA CORRETA: ALTERNATIVA B.

Comentário: Para ilustrar este conceito, consideremos a correlação entre a variável piscina e a
variável salão de festas. Se o resultado do coeficiente de correlação destas variáveis for igual a
1, isso significa que estas duas variáveis são colineares, ou seja, variam na mesma proporção.
Então, a quantidade de piscinas e a quantidade de salão de festas varia igualmente. Então, ambas

96
Gabarito

influenciam o preço dos imóveis da mesma forma. Por isso, temos que descartar uma destas duas
variáveis. Podemos descartar piscina ou salão de festas. Tanto faz. Mas, devemos ficar com uma
delas.

QUESTÃO 3

RESPOSTA CORRETA: ALTERNATIVA C.

Comentário: Para montar a tabela no Excel, temos que seguir uma regra simples: manter
adjacentes as colunas das variáveis independentes, ou seja, todas juntas, uma ao lado da outra,
sem espaço entre elas.

QUESTÃO 4

RESPOSTA CORRETA: ALTERNATIVA B.

Comentário: O limite máximo para o valor-P, resultante em uma regressão, de uma variável
independente, para considerá-lo significativo é de 0,10. O valor-P da variável Elevador está
acima deste limite. Já o valor-P da variável Piscina está adequado, pois seu valor está em notação
científica, que significa 0,23 x 10-2, ou seja, 0,0023, que é o mesmo que 2,3 x 10-3. Então, a variável
Piscina é significativa e a variável Elevador não é significativa. Portanto, descartamos a variável
elevador e realizamos a regressão novamente.

QUESTÃO 5

RESPOSTA CORRETA: ALTERNATIVA E.

Comentário: De todas as variáveis cujo valor-P seja maior que o limite máximo (0,10), devemos
destacar a variável que tenha o maior valor-P e realizar a regressão novamente, considerando
apenas as demais variáveis. O valor-P da variável m² está em notação científica e é um valor-P
abaixo do limite máximo. O valor-P da variável dormitório também está abaixo do limite máximo.
O valor-P da variável elevador está em notação científica e é um valor-P abaixo do limite máximo.
O valor-P das variáveis banheiro e vaga estão acima do limite máximo. Devemos descartar apenas
a que apresente o maior valor-P, que, neste caso, é a variável banheiro, e realizar a regressão
novamente, considerando apenas as demais variáveis.

Você também pode gostar