Você está na página 1de 37

INTRODUÇÃO

Nome do Curso: Especialização em Economia Rural


Nome da Componente Curricular: Métodos Quantitativos Aplicados à
Economia Rural
Nome da/do docente: Prof. Dr. Carlos Alberto Gonçalves Junior
Plano de ensino
• OBJETIVO DA COMPONENTE
• Fornecer aos estudantes a teoria e prática necessárias para a aplicação de ferramentas
estatísticas às variáveis econômicas no meio rural.

• CONTEÚDO PROGRAMÁTICO
• Representação Gráfica e Tabelas de Frequência.
• Medidas de Tendência Central e Dispersão.
• Distribuição Discreta e Contínua.
• Amostragem e Intervalo de Confiança.
• Regressão e Correlação (aplicações)
Introdução
• No conceito comum, estatística se refere à coleta de dados e à apresentação
desses dados em tabelas e gráficos, além de médias e porcentagens;

• Entretanto, o campo da estatística é muito mais amplo, envolvendo, o


delineamento de experimentos, análise e processamento de dados;

• Pode-se dividir estatística em duas partes: (1) a estatística descritiva, que se


refere à maneira de apresentar sucintamente um conjunto de dados e de
descrevê-los, (2) inferência estatística, que trata de generalizações que
podem ser feitas a partir de informações incompletas.
Introdução
• Entretanto, na solução de um determinado problema, é usual que
ambas as partes da estatística sejam utilizadas.

• Isto é, os dados são coletados com determinada finalidade, são


colocados em uma tabela, descrito por meio de estatísticas e
analisados, na tentativa de se fazer inferência.
REPRESENTAÇÃO GRÁFICA E
TABELAS DE FREQUÊNCIA
Tabelas de Frequência
• Muitas vezes é preciso apresentar dados numéricos provenientes de
grande número de indivíduos ou mesmo de toda a população.

• A leitura da tabela torna-se então cansativa ou, até mesmo,


impossível. No entanto, se os dados se referem a uma única variável
como, por exemplo, número de filhos, podem ser apresentados em
uma tabela de distribuição de frequências.

• A apresentação de dados, nesse tipo de tabela, permite apreensão


rápida do assunto em estudo.
Tabelas de Frequência
• Número de filhos vivos, com idade inferior a 18 anos, por empregado da firma “Alpha Ltda.”

• Calcule a tabela de frequência absoluta, relativa e relativa acumulada para cada número de filhos.
Tabelas de Frequência
• Resolução
• - Primeiramente colocar os dados todos em uma única coluna no Excel;
• - Colocá-los em ordem crescente;
• - Criar uma coluna com os números entre o mínimo e máximo de filhos
(inclusive), no caso do exemplo de 0 à 6.
• - Utilizar a função “frequência” para calcular a frequência absoluta.
Como é uma função de
matriz, não se esquecer de
pressionar “Ctrl, Shift,
Enter) para obter o
resultado.
Tabelas de Frequência
• Para calcular a frequência relativa divide-se cada linha da coluna de frequência
absoluta pelo total de elementos da série de dados, no caso 45 dados
Tabelas de Frequência
• O próximo passo é calcular a freqüência relativa acumulada, o
primeiro valor da coluna apenas repete o primeiro da freqüência
relativa, os outros são calculados a partir da seguinte fórmula:
Tabelas de Frequência
A Tabela Final formatada seria:

Tabela 1 – Distribuição do número de filhos vivos, com idade inferior a 18 anos, por
empregado da firma Alpha, em 1985.

Nº Freq Freq Freq relat.


Filhos absol. relat. acum
0 6 13,3% 13,3%
1 11 24,4% 37,8%
2 13 28,9% 66,7%
3 7 15,6% 82,2%
4 5 11,1% 93,3%
5 1 2,2% 95,6%
6 2 4,4% 100,0%
Fonte: Dados da Pesquisa.
Tabelas de Frequência
• Muitas vezes os dados têm precisão maior do que a necessária. Por exemplo, em
pesquisas, a idade das pessoas é declarada em anos completos, mas a referência é
sempre feita em faixas de idade. Pode haver interesse em organizar os dados de
idade por faixas, como, por exemplo, de 0 a 4 anos, de 5 a 9 anos, de 10 a 14 anos
e etc.
• Essas faixas recebem o nome genérico de classes. É conveniente, mas não
obrigatório, estabelecer intervalos iguais para todas as classes. Os valores que
delimitam as classes são chamados de extremos de classe. É importante deixar
claro, quando se escreve um intervalo, se os dados, com valores iguais aos dos
extremos de classe, estão ou não incluídos na classe. É comum escrever as classes
da seguinte forma:
0–4 0 |– 5 [0 – 5) As duas últimas colunas indicam
5–9 5 |– 10 [5 – 10) que o intervalo é fechado à
esquerda e aberto à direita
Tabelas de Frequência
• Conceitos:

• Li é o limite superior e li é o limite inferior.

• Amplitude: é a diferença entre o maior e o menor valor em um conjunto de dados.

• A Amplitude das classes podem ser calculadas pela seguinte expressão:


Máx − Mín
• h=
n

• Em que n é o número de classes que pode ser estabelecido pelo pesquisador (de 5 a 15).
Outra forma de calcular o número de classes é usar: nº classes = 𝑛0 (em que n0 é o
número de observações).
Tabelas de Frequência
• Utilizando os mesmos dados do exercício anterior, porém construindo a tabela utilizando três
classes.


- Note que para o Excel as classes incluem o limite superior e o inferior;
- Utilize a mesma matriz de dados;
• - Na matriz binária não selecione nem a primeira nem a última classe;
• - É sempre necessário selecionar (onde está inserida a fórmula) o número de classes selecionado;
Tabelas de Frequência
• A Tabela completa, já com as frequências relativa e relativa acumulada seria:
REPRESENTAÇÃO GRÁFICA
Representação Gráfica
• O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo
objetivo é o de produzir, no investigador ou no público em geral, uma impressão
mais rápida e viva do fenômeno em estudo, já que os gráficos falam mais rápido à
compreensão que as distribuições de frequência.

• A representação gráfica de um fenômeno deve obedecer a certos requisitos


fundamentais para ser realmente útil:

• Simplicidade: o gráfico deve ser destituído de detalhes de importância secundária,


assim como de traços desnecessários que possam levar o observador a uma análise
morosa ou com erros.
• Clareza: O gráfico deve possibilitar uma correta interpretação dos valores
representativos do fenômeno em estudo.
• Veracidade: O gráfico deve expressar a verdade sobre o fenômeno em estudo.
Histograma de uma variável qualitativa ou
quantitativa discreta.
• HISTOGRAMA: é um conjunto de retângulos com bases sobre um
eixo dividido de acordo com os tamanhos de classe, centros nos pontos
médios das classes e áreas proporcionais às frequências.
• A partir da Tabela 1 (mesma tabela da seção anterior)
Tabela 1 – Distribuição do número de filhos vivos, com idade inferior a 18 anos, por
empregado da firma Alpha, em 1985.
Nº Freq Freq Freq relat.
Filhos absol. relat. acum
0 6 13,3% 13,3%
1 11 24,4% 37,8%
2 13 28,9% 66,7%
3 7 15,6% 82,2%
4 5 11,1% 93,3%
5 1 2,2% 95,6%
6 2 4,4% 100,0%
Fonte: Dados da Pesquisa.
Histograma de uma variável qualitativa ou
quantitativa discreta.
• Torna-se interessante o uso da frequência relativa pelo fato de poder comparar
gráficos diferentes, já que os valores percentuais são relativos e permitem essa
comparação.
35,0%

30,0%

25,0%
frequência
20,0%

15,0%

10,0%

5,0%

0,0%
0 1 2 3 4 5 6
numero de filhos

Fonte: Dados da Pesquisa


Gráfico X: Distribuição de Freqüência do número de filhos vivos menores de 18 anos
dos empregados da empresa Alpha.
Histograma de uma variável qualitativa ou
quantitativa discreta
• Também pode-se fazer o histograma utilizando-se no Excel a função:
dados>análise de dados>histograma. No intervalo de dados, incluir a
série, no intervalo de bloco incluir as classes (sem incluir a primeira e
a última). Marcar um intervalo de saída ou nova planilha e Resultado
do gráfico e OK.

Fonte: Dados da pesquisa.


Gráfico X: Distribuição de Freqüência do número de filhos vivos menores de 18 anos
dos empregados da empresa Alpha.
Histograma de uma variável contínua
• A representação gráfica da distribuição de frequências de uma variável
contínua também é feita através de histogramas.

• O que difere é que no caso de variáveis quantitativas contínuas as barras


devem ser construídas justapostas, devido ao caráter contínuo dos valores
da variável.

• A Tabela X apresenta a distribuição de frequências para o peso dos ursos


fêmeas. Apesar de não haver, neste conjunto de dados, fêmeas com peso
maior de que 175Kg, as três últimas classes foram mantidas para que
pudéssemos comparar machos e fêmeas quanto ao peso.
Histograma de uma variável contínua
• asdfasdfasdfasdf
Tabela X – Distribuição de freqüência dos ursos fêmeas segundo o peso.
20
peso (kg) Freq absol Freq rela. (%) Freq rel acum (%) 18
0 |- 25 3 8,6 8,6 16
25 |- 50 5 14,2 22,8 14

Frequência
50 |- 75 18 51,4 74,2 12

75 |- 100 5 14,3 88,5 10

8
100 |- 125 2 5,7 94,2
6
125 |- 150 1 2,9 97,1 4
150 |- 175 1 2,9 100 2
175 |- 200 0 0 100 0
0 |- 25 25 |- 50 50 |- 75 75 |- 100 100 |- 125 125 |- 150 150 |- 175 175 |- 200 200 |- 225 225 |- 250
200 |- 225 0 0 100 Peso Kg
225 |- 250 0 0 100
Fonte: Dados da Pesquisa.
Ogiva de Galton
• Muitas vezes, a análise da distribuição de frequências acumuladas é mais
interessante do que a de frequências simples representadas pelo Histograma.

• O gráfico utilizado na representação da distribuição de frequências acumuladas de


uma variável contínua é a ogiva.

• Para a construção da Ogiva, são usadas as frequências acumuladas (absolutas ou


relativas) no eixo vertical e os limites superiores de classe no eixo horizontal.

• O primeiro ponto da ogiva é formado pelo limite inferior da primeira classe e o valor
zero, indicando que abaixo do limite inferior da primeira classe não existem
observações.

• Daí por diante, são usados os limites superiores das classes e suas respectivas
frequências acumuladas, até a última classe que acumula todas as observações.

• Assim a Ogiva deve começar de zero e, se for construída com frequências relativas
acumuladas, terminar com o valor 100%.
Ogiva de Galton
• Inserir um gráfico de linha normalmente, o detalhe principal é fazer com que o
gráfico cruze os eixos no ponto “0”, para isso selecione a escala de X, clique o botão
direito do mouse>formatar eixo>nas marcas de escala (em outras versões do excel
existe uma caixa “desabilitar a caixa eixo dos valores de Y cruza entre as
categorias”).
120
frequencia acumulada %

100

80

60

40

20

0
0 25 50 75 100 125 150 175 200 225 250
peso kg
Gráfico Comparativo de Colunas
• Quando temos duas ou mais séries de dados para uma mesma variável, pode ser
interessante fazer uma comparação entre as séries. Para facilitar esta comparação
podemos representar os dados das séries em um mesmo gráfico de colunas, uma
vez que a variável é a mesma.
• Consideremos, por exemplo, um teste com 5 questões que foi aplicado em uma
turma de 50 estudantes (30 alunos e 20 alunas).
Masculino Feminino
acertos absoluta relativa acertos absoluta relativa
1 1 3,33% 1 1 5%
2 4 13,33% 2 3 15%
3 8 26,67% 3 5 25%
4 12 40,00% 4 8 40%
5 5 16,67% 5 3 15%
Total 30 100,00% Total 20 100%
Gráfico Comparativo de Colunas
• É importante utilizar a frequência relativa pelo fato do número de
alunos ser maior do que o de alunas, por isso, em termos de frequência
absoluta a comparação pode ser distorcida. (utilizar gráfico de Barras
Múltiplas) 45,00%

40,00%

35,00%

30,00%
Freq. Relativa (%)

25,00%

20,00%

15,00%

10,00%

5,00%

0,00%
1 2 3 4 5
Acertos

masculino feminino
Gráfico de Linhas para Séries Temporais
• Séries temporais ou séries históricas são conjuntos de observações de uma mesma
variável quantitativa (discreta ou contínua) feitas ao longo do tempo.

• O conjunto de todas as temperaturas medidas diariamente numa região é um


exemplo de série temporal.

• O objetivo principal é conhecer o comportamento da série ao longo do tempo


(aumento, estabilidade ou declínio dos valores), em alguns estudos é possível
fazer previsões utilizando esses valores.

• A representação gráfica de uma série temporal é feita através de um gráfico de


linha. No eixo horizontal está o tempo e no vertical a variável a ser representada.
Gráfico de Linhas para Séries Temporais
• Como, por exemplo, o número de acidentes de trânsito acontecidos na
cidade de Toledo no período de 2005 a 2009.
Tabela X – Número de acidentes de trânsito acontecidos na cidade de Toledo no período
de 2005 a 2009.


Ano acidentes
2005 1286
2006 1270
2007 1301
2008 1465
2009 1561
Fonte: IPARDES.
Gráfico de Linhas para Séries Temporais
1800
1600
1400

nº acidentes
1200
1000
800
600
400
200
0
2005 2006 2007 2008 2009
anos

Fonte: IPARDES.
Gráfico X - Número de acidentes de trânsito acontecidos na cidade de Toledo no
período de 2005 a 2009.
Gráfico de Linhas para Séries Temporais
• Cuidados que se deve ter ao construir um gráfico de linhas para não
distorcer a análise:

• O início do eixo vertical deve ser o valor mínimo possível para evitar a
distorção na análise.

• O final do eixo vertical deve deixar a série (linha) “centralizada”

• A dimensão horizontal deve ser considerada. Quanto mais aberto as


variações serão “aparentemente” menores.
Diagrama de Dispersão
• O diagrama de dispersão é um gráfico onde pontos no espaço
cartesiano XY são usados para representar simultaneamente os
valores de duas variáveis quantitativas medidas em cada elemento do
conjunto de dados.

• O diagrama de dispersão é usado principalmente para visualizar a


relação (associação) entre duas variáveis, mas também para:

• Comparar o efeito de dois tratamentos no mesmo indivíduo;


• Verificar o efeito do tipo antes e depois de um tratamento.
Diagrama de Dispersão
• Exemplo: Um produtor de morangos para exportação deseja produzir frutos
grandes, pois frutos pequenos têm pouco valor mesmo no mercado interno. Além
disso, os frutos, mesmo grandes não devem ter tamanhos muito diferentes entre si.
O produtor suspeita que um dos fatores que altera o tamanho dos frutos é o
número de frutos por planta.
Tabela X – Peso dos frutos e número de frutos por planta em 10 morangueiros na
primeira safra.
planta n frutos Peso dos frutos (gramas)
1 5 15,15 15,45 15,63 15,65 16,38
2 6 14 14,5 15,35 15,86 15,94 16,13
3 7 13,67 13,76 14,06 14,11 14,54 14,89 15,5
4 8 11 11,5 12,39 12,39 12,9 14,5 15,5 16,56
5 9 10,24 11,12 12,05 12,37 13,48 13,8 14,4 15,39 16
6 10 9 9,32 10,67 11,56 11,67 12,56 12,83 12,84 13,43 15,09
7 11 7,82 8,56 8,74 9,57 11,08 11,92 12,13 12,5 14,14 14,2 14
8 12 7,25 9,41 10,15 10,33 10,8 10,95 11,13 11,48 11,49 12,86 13,37 15,04
9 13 6,95 7,61 8,53 10 10,94 11,04 11,43 11,63 11,97 12,02 12,74 13,53 14
10 14 7 8 9 10 10 10,5 11 11,16 11,17 11,7 12,45 12,89 13,47 13,54
Fonte: Dados da Pesquisa.
Diagrama de Dispersão
• O diagrama de dispersão mostra-nos dois fatos. O primeiro, que há
um decréscimo no valor médio do peso do fruto por árvore à medida
que cresce o número de frutos na árvore.

• Também percebe-se que com o aumento no número de frutos nas


árvores, cresce também a variabilidade no peso, gerando tanto frutos
muito grandes, como muito pequenos.
Diagrama de Dispersão
• Exemplo 2 – Captopril é um remédio destinado a baixar a pressão
sistólica. Para testar seu efeito, ele foi ministrado a 12 pacientes, tendo
sido medida a pressão sistólica antes e depois da medicação:
Tabela X – Pressão sistólica (mmHg) medida em 12 pacientes antes e depois do
Captopril
Paciente ANTES DEPOIS
A 200 191
B 174 170
C 198 177
D 170 167
E 179 159
F 182 151
G 193 176
H 209 183
I 185 159
J 155 145
K 169 146
L 210 177
Fonte: Dados da Pesquisa.
Diagrama de Dispersão
• Os mesmos indivíduos foram utilizados nas duas amostras (antes/depois). Assim é
natural compararmos a pressão sistólica para cada indivíduo, comparando a pressão antes
e depois. Para todos os pacientes, a pressão sistólica depois do Captopril é menor do que
antes da medicação. Mas como podemos visualizar essas diferenças?

• Através do diagrama de dispersão.

• O detalhe aqui é saber qual escolher para cada eixo, já que isso influenciará diretamente
na interpretação, em nosso exemplo escolheu-se o depois para o intervalo de Y e o antes
para o intervalo de X.

• Também é importante mudar a escala do gráfico para a melhor visualização, escolhe-se


um arredondamento do menor e do maior valor do intervalo como escala para cada eixo.

• É interessante inserir uma linha diagonal no gráfico representando todos os valores


iguais, ou seja, o Captopril não fez efeito.
Diagrama de Dispersão
220

210

200

190

Depois
180

170

160

150

140
140 150 160 170 180 190 200 210 220
Antes

Gráfico X – Pressão sistólica (mmHg) medida em 12 pacientes antes e depois do


Captopril

• Percebe-se que todos os pontos ficaram abaixo da linha, isso significa que o
Captopril fez efeito. Grande parte dos pontos está bem distante da linha,
mostrando que a redução na pressão sistólica depois do uso do medicamento não
foi pequena.
OBRIGADO

Você também pode gostar