Você está na página 1de 22

FUNDAMENTOS DE TI PARA CLOUD COMPUTING

GRÁFICOS NO AMBIENTE ESTATÍSTICO R


GRÁFICOS NO AMBIENTE ESTATÍSTICO R

AGENDA

 Importação de Arquivos;

 Introdução ao Gráfico;

 Gráfico de Dispersão;

 Conclusão.
GRÁFICOS NO AMBIENTE ESTATÍSTICO R

IIMPORTAÇÃO DE ARQUIVOS

• A importação de arquivos em R pode ser


feita basicamente de duas maneiras:
• a partir da leitura de arquivos;
• a partir da leitura de bases de dados;

• O ambiente R permite também a chamada


de consultas expressas em SQL;

• Vamos foca na leitura de dados


armazenados em arquivos.
GRÁFICOS NO AMBIENTE ESTATÍSTICO R

IIMPORTAÇÃO DE ARQUIVOS

• A forma mais comum é a leitura de


arquivos com valores separados por um
identificador, como os arquivos CSV
(comma separated values);

• O CSV é um formato de exportação


frequentemente presente em ambientes
que armazenam ou exploram dados,
como em SGBD ou em planilhas Excel;
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
IIMPORTAÇÃO DE ARQUIVOS
• Na importação de um arquivo é possível escolher o tipo de separador
a ser usado no arquivo;
• A leitura de um arquivo CSV no ambiente R é feita pela função
read.table( ) que exige três parâmetros de entrada:
• o caminho do arquivo (pode ser um caminho local ou um
endereço na web);
• um indicador (header), de que a primeira linha é um cabeçalho
(TRUE) ou já é um conteúdo de dados (FALSE);
• tipo de separador (sep), refere-se ao caractere usado para
separar os valores contidos no arquivo.
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
IIMPORTAÇÃO DE ARQUIVOS
• Utilizaremos o conjunto de dados da Universidade da Califórnia (UC),
disponivel em http://archive.ics.uci.edu/ml/
GRÁFICOS NO AMBIENTE ESTATÍSTICO R

IIMPORTAÇÃO DE ARQUIVOS

• Dentre o conjunto de dados da


Universidade da Califórnia utilizaremos a
base de dados Iris;

• Esta base foi disponibilizada na UC pelo


estatístico R. A. Fisher em 1988 e tem sido
amplamente utilizada pela comunidade
científica;
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
IIMPORTAÇÃO DE ARQUIVOS
• Iris corresponde a uma classe de plantas
com flor, a qual divide-se em três tipos de
flores (classes):
• Setosa;
• Virginica;
• Versicolor;
• Uma característica importante desse
repositório é que, ao organizar os
agrupamentos, a classe Setosa distingue-se
bem das demais;
GRÁFICOS NO AMBIENTE ESTATÍSTICO R

IIMPORTAÇÃO DE ARQUIVOS

• Desta forma a Setosa possui quatro atributos:


• Comprimento da Sépala;
• Largura da Sépala;
• Comprimento da Pétala;
• Largura da Pétala;

• Esses atributos estão em unidades de centímetros(cm);

• O número de objetos agrupados da Setosa é da ordem de 150;


GRÁFICOS NO AMBIENTE ESTATÍSTICO R
IIMPORTAÇÃO DE ARQUIVOS
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
IIMPORTAÇÃO DE ARQUIVOS

• Segue, abaixo, um exemplo de uma amostra normalizada da base de dados Iris:


GRÁFICOS NO AMBIENTE ESTATÍSTICO R
IIMPORTAÇÃO DE ARQUIVOS
• A leitura do arquivo pode ser feita da seguinte forma:
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
IIMPORTAÇÃO DE ARQUIVOS
• Ou ainda da seguinte forma:
GRÁFICOS NO AMBIENTE ESTATÍSTICO R

INTRODUÇÃO

• A capacidade gráfica representa um componente


muito importante e extremamente versátil do
Ambiente R;

• O ambiente R inclui funções para a criação de


vários tipos de gráficos, como gráficos de barras,
de setores, de linhas, de dispersão, dentre
outros;
GRÁFICOS NO AMBIENTE ESTATÍSTICO R

INTRODUÇÃO

• Essas funções estão disponíveis no pacote graphics, nativo


do ambiente;

• Há ainda outros tipos de gráficos possíveis, mais


sofisticados, cujas funções para criação estão disponíveis no
pacote lattice, por exemplo;
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
INTRODUÇÃO
• A construção dos gráficos deve levar em consideração o tipo de
variável que se pretende representar;
• Na tabela abaixo, apresenta-se um resumo dos tipos de gráficos, mais
comuns, que deve ser feito para cada tipo de variável;
GRÁFICOS NO AMBIENTE ESTATÍSTICO R

INTRODUÇÃO
• Segue tabela abaixo com um resumo das funções para criação de gráficos:
GRÁFICOS NO AMBIENTE ESTATÍSTICO R

GRÁFICO DE DISPERSÃO (SCATTER PLOT) OU ESPALHAMENTO

• Permite a visualização da distribuição


dos exemplares de um conjunto de
dados;

• A função plot( ) constrói esse gráfico a


partir dos valores atribuídos a uma série
de parâmetros, listados na tabela a
seguir;
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
GRÁFICO DE DISPERSÃO (SCATTER PLOT) OU ESPALHAMENTO
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
GRÁFICO DE DISPERSÃO (SCATTER PLOT) OU ESPALHAMENTO
• Para fazer o gráfico utilizando a função
plot( ), vamos criar dois vetores com as
informações da Pétala e da Sépala:
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
GRÁFICO DE DISPERSÃO (SCATTER PLOT) OU ESPALHAMENTO
GRÁFICOS NO AMBIENTE ESTATÍSTICO R

CONCLUSÃO

• Conhecer a importação de arquivos;

• Conheceremos outros tipos de gráficos.

Você também pode gostar