Você está na página 1de 6

Resumo para iniciar a trabalhar no R – Lisbeth Cordani 2012

R – instalar o R 2.15.0 http://www.r-project.org/

Rcmdr – R Commander

No R trabalha-se diretamente com comandos para todas as ações, mas é possível baixar
dentro dele um outro pacote RCOMMANDER (Rcmdr) para obter uma versão com menus (mais
amigável).

Uma vez carregado o R, entrar em Pacotes (barra superior) e depois clicar em


Carregar pacotes (caso não apareça em seu computador significa que você terá
que Instalar – então em Pacotes entre Instalar, escolha o CRAN Mirror que
significa especificar um endereço próximo a você – pode ser São Paulo, por
exemplo. Na lista que aparecer, procurar Rcmdr e clicar para carregar. Carregar
também todos os Rcmdr que estiverem disponíveis para isso. Uma vez carregados
todos, entre na janela Pacotes de novo e escolha Instalar – procure Rcmdr e ative-
o. Vai aparecer uma outra janela dividida em duas partes: script window (para
deixar registrado os comandos que forem pedidos via menu) e Output window
(resultados obtidos com os comandos).

ENTRADA DE DADOS

1 – Você pode digitar seus dados diretamente ao clicar na barra superior do Rcmdr (como no
Quadro 1) em Dados e depois em Novo conjunto de dados – isto faz aparecer uma tela
pedindo o nome a ser dado para este novo conjunto de dados – o nome não pode ter nenhum
espaço entre palavras – pode ter ponto ou _ - assim: teste1, teste.1, teste_1 são válidos mas
teste 1 não é pois tem espaço. Assim que o nome for aceito (vamos usar teste.novo) aparece
uma planilha (Quadro 2) chamada Editor de Dados com colunas para que os valores das
variáveis sejam introduzidos um a um.

Quadro 1 Quadro 2

As colunas podem ter seus nomes modificados. Por exemplo, ao clicar sobre var1 na planilha
aparece uma tela para colocar o novo nome e declarar se é numérica ou não. Idem para as
demais colunas. Os dados podem ser registrados e o Quadro 3 mostra uma entrada simples
com uma variável numérica (X) e outra qualitativa (gênero).

Quadro 3

Para continuar a trabalhar com


estas variáveis introduzidas agora,
você deverá fechar a planilha. Ao
fechar voltará a tela anterior e
você pode verificar que o
Conjunto de dados na barra
superior agora tem o nome de
seu arquivo – neste caso é
teste.novo.

Assim todas as suas ações agora serão executadas para o conjunto de dados ativo. O menu
superior pode ser usado para as funções estatísticas desejadas. Por exemplo: estatísticas
descritivas para os dados recém-colocados. Clicar em Estatísticas – Resumos – Conjunto de
dados ativo. A saída na Janela de Resultados é como no Quadro 4

Quadro 4

> summary(teste.novo)
Min = valor mínimo
X Gênero
1st Qu = 1º. quartil ou quantil
Min. :12.00 F:4
Median = mediana
1st Qu.:14.25 M:6
Mean = média
Median :21.00
3rd Qu = 3º. quartil ou quantil
Mean :23.40
Max. = valor máximo
3rd Qu.:32.00

Max. :42.00

Se clicar em Estatísticas – Resumos – Resumos numéricos aparece uma tela para que se
informe para qual variável numérica queremos as informações estatísticas e quais são elas.
Para a marcação como no Quadro 5 estamos pedindo para X a média(mean), o desvio padrão
(standard deviation sd) , o coeficiente de variação (coeficiente of variation cv) e todos os
quartis (onde 12 é o valor mínimo e 41 o valor máximo).

Quadro 5

A saída na Janela de Resultados é como no Quadro 6

Quadro 6

> numSummary(teste.novo[,"X"], statistics=c("mean", "sd",


"quantiles", "cv"),

+ quantiles=c(0,.25,.5,.75,1))

mean sd cv 0% 25% 50% 75% 100% n

23.4 10.95648 0.4682256 12 14.25 21 32 42 10


Clicando na barra superior em Ver conjunto de dados aparece a tela informativa das variáveis e
seus valores como no Quadro 6.

Quadro 6

Este quadro é meramente informativo


e você pode chamar sempre que
quiser lembrar do seu conjunto de
dados. Fechar depois de usar. Esta é
uma tela estática somente visual –
para alterar algo tem que clicar em
Editar conjunto de dados (aí a planilha
aparece novamente) e valores podem
ser acrescentados, alterados etc.

O conjunto de dados ativo pode exportado (arquivo tipo texto – bloco de notas - com extensão
.csv). Basta entrar em Dados > Conjunto de dados ativo > Exportar, designando o local onde
isto deverá ser feito. Para resgatar os dados em outra oportunidade, veja o item seguinte.

É possível salvar todas as saídas da Janela de resultados (também em formato de texto – bloco
de notas). Basta entrar em Arquivo>Salvar resultados como...

2 – Você pode importar seus dados diretamente de algum arquivo já gravado, por exemplo
do Excel - clicar na barra superior do Rcmdr em Dados e depois em Importar arquivos de
dados e depois em de conjunto de dados do Excel (há outras possibilidades também). Isto faz
aparecer uma tela igual ao do item 1, pedindo o nome do arquivo – pode escolher o nome
mesmo que não seja o do arquivo gravado. Depois de escolhido o nome entra a tela para a
busca de arquivo já gravado – uma vez encontrado, no caso o arquivo Excel, clique para abrir e
a janela do Rcmdr volta a aparecer. Para visualizar, pode entrar tanto em Editar como em Ver
conjunto de dados ativo. As estatísticas descritivas podem ser obtidas como no item 1 e se for
de interesse pode ser feita uma divisão por grupos (mais tarde).

Aqui será aproveitado um conjunto ativo importado do Excel, com dados de aprovação do
curso médio brasileiro disponível pelo INEP, para construir gráficos como Histograma e
Boxplot.
Histograma: Gráficos> Histograma e entra uma tela pedindo a variável de interesse e a escala
do eixo (contagens de frequência = frequência absoluta, percentagens, densidades). Vamos
pedir um histograma com percentagens (deixando a critério do programa o número de
classes) para a taxa de aprovação do curso médio brasileiro em 2007. O resultado será como
no Quadro 7.

Quadro 7
40

A saída apresentada no Quadro 7


não está editada e foi obtida
30

através do botão direito do mouse


sobre o gráfico (copiar como
percent

20

metafile) e depois com ctrl-v sobre


o arquivo word. Agora é possível
editar o histograma, com um
10

possível resultado como no Quadro


8, desde que o salve primeiro como
0

metafile .
60 65 70 75 80 85

INEP$X2007.aprov
Quadro 8

Mais um gráfico que pode ser obtido com o conjunto de dados em questão é o Boxplot – aqui
não vamos colocar vários anos juntos (2007 a 2011) de início pois para isso temos que
reformular a entrada de dados. Mas vamos apresentar o boxplot para os mesmos dados do
histograma: taxa de aprovação de 2007.

Quadro 9

Salvando (como
80

metafile) é possível
X2007.aprov

editar para melhorar a


75

figura do Quadro 9
como feito com o
70

histograma.
65

Esta versão de tutorial é preliminar – à medida que for sendo usada, deve ser aprimorada.

Você também pode gostar