Você está na página 1de 24

LINGUAGEM R

Uma introdução

1
Sumário
Introdução 3

Download do Programa 3

Instalação 5

A Linguagem 7

Ajuda no R 8

Operações matemática básicas 9

Tipos Especiais de Objetos 9

Vetores 9

Listas 10

Matrizes 11

Data Frames 12

Funções no R 13

Bloco IF..THEN..ELSE 14

Comentários 15

Editar Funções 15

Estruturas de repetição 16

Gráficos 17

Função Plot 18

Função Hist 19

Estatística Descritiva 21

Exemplo prático 22

2
Introdução
A linguagem R foi desenvolvida para análises estatísticas de dados e é fruto da
contribuição de milhares de pessoas ao redor do mundo. O projeto da linguagem visa
manter seu código aberto (open source).

A linguagem R em seu pacote básico possui diversas funções para análise de dados,
porém, no site da comunidade é possível baixar diversos pacotes com funções
desenvolvidas por outras pessoas.

Download do Programa
No site é possível fazer o download da linguagem com versões para os Sistemas
operacionais Windows, Linux e MacOS X. O executável para o sistema Windows é
obtido no seguinte endereço web: http://cran-r.c3sl.ufpr.br/. Depois de acessá-lo deve-se
clicar em Download R for Windows e será carregada a página seguinte:

Figura 1 - Site Comunidade R

O texto em destaque install R for the first time é um link que redirecionara-lo para a
página de download vista a seguir:

3
Clicando no texto Download R 2.13 for Windows o navegador pedirá autorização para
iniciar o download. Depois de descarregado basta clicar duas vezes no arquivo para dar
início a instalação.

Instalação
No Windows o processo de instalação segue o padrão de facilidade do sistema
operacional. Após os dois clique no ícone do instalador aparecerá a seguinte mensagem:

Clique em executar. Na tela que irá aparecer escolha a linguagem que deseja trabalhar
com a ferramenta:

4
Nas duas próximas janelas clique em avançar o que levara ao seguinte passo:

Escolha o local onde deseja instalar o programa clicando em Procurar. O recomendado é


que se deixe o caminho que vêem indicado. Clique em avançar novamente e o programa
indicará os módulos que se pode desejar instalar. Deixe todas as opções marcadas e
clique em avançar e nas três próximas janelas também. A instalação começara, ficando
a tela da seguinte maneira:

5
Na última janela que aparecer clique em Finalizar e o software estará pronto para ser
utilizado. Ao executá-lo a aparência deve ser a mesma que esta:

A Linguagem
A linguagem R baseia na construção de objetos os quais recebem as manipulações para
a solução de problemas. A criação de objetos é feita da seguinte forma:

(nome do objeto) <- (valor)

6
Exemplo:

Os objetos podem ser de vários tipos sendo os básicos character(caracteres), numeric


(números) e logical (lógicos). Para descobrir o tipo do objeto basta utilizar a função
mode, como no exemplo:

mode(nome do objeto)

Outra função muito útil do R para a manipulação de objetos é a função length que
retorna a quantidade de elementos do objeto. Utilizada como no exemplo abaixo:

length(nome do objeto)

Exemplo uso do mode e length:

A quantidade de objetos manipulados pode ser muito grande para que o programador
possa averiguar os objetos que já foram utilizados basta-se usar a função ls. Caso o
usuário necessite remover algum objeto que não esteja mais em uso a função rm(nome
do objeto) é apropriada.

Exemplo de uso do ls e rm:

7
Ajuda no R
A linguagem R por receber a contribuição de diversas pessoas possui uma biblioteca
extensa de funções que possuem uma documentação em que se pode esclarecer a sua
utilização. No promot de comando a função help redireciona o programador para a
documentação on-line da função. Como no exemplo:

Utilizando help (nome função) o usuário é redirecionado para a especificação da função


diretamente.

Exemplo:

Operações matemática básicas


Uma linguagem estatística não poderia deixar de contar com as funções aritméticas
básicas: soma, subtração, multiplicação e divisão. Implementadas cada qual pelo
operador padrão:

Soma + Multiplicação *

Subtração - Divisão /

Existe ainda outras operações matemáticas que já estão implementadas:

8
Função Significado

log(x) Logaritmo natural de x.

exp(x) Antilog de x

log(x,n) Log de base n de x

sqrt(x) Raiz quadrada de x

choose(n,x) Combinação de n por x.

cos(x), sin(x), tan(x) Funções trigonométricas.

acos(x), asin(x), atan(x) Funções trigonométricas inversas.

Tipos Especiais de Objetos


Vetores
Vetores são um tipo especial de objeto que podem trabalhar com um conjunto de
dados básicos em um único objeto. Criado a partir da função c(elementos) os vetores
facilitam operações com grande quantidade de dados:

Exemplos:

Existem funções que preenchem vetores de forma automatizada:

Função Significado

seq(x, n, i) Cria um vetor com os elementos de x a n, com o


incremento i.

rep(x,n) Cria um vetor com n repetições de x

9
c(x:n) Cria um vetor com todos os números entre x e n.

Exemplos:

Listas
Diferentemente dos vetores as listas são coleções de objetos primitivos diferentes criada
a partir da função list(objeto1=valor, objeto2=valor,...).

Exemplos:

Algumas funções especiais para listas:

Função Significado

lista$parametro Acessa um objeto específico da lista pelo


nome.

lista[[n]] Acessa um objeto específico da lista pelo


seu índice.

names(lista) Lista o nome de todos os objetos da lista.

Exemplos:

10
Matrizes
As matrizes são como os vetores, porém, trabalham com mais de uma dimensão. A
criação de matrizes é um pouco mais complicada e é feita através de funções especiais.

Função Significado

matrix(vetor, ncol = x) Cria uma matriz a partir de um vetor com


x colunas

Dim(matriz) Retorna as dimensões de uma matriz na


ordem: linhas, colunas.

cbind(m, v) Adiciona uma nova coluna na matriz m


com os valores do vetor v. Obs.: a
quantidade de elementos do vetor tem que
ser igual ao número de linhas da matriz.

rbind(m,v) Adiciona uma nova linha na matriz m com


os valores do vetor v. Obs.: a quantidade
de elementos do vetor tem que ser igual ao
número de colunas da matriz.

Exemplo:

11
Data Frames
Data frames são listas com mais de uma dimensão. Podem ser criados a partir da junção
de vários vetores ou a partir de um arquivo texto. Para serem criados a partir de vetores
usa-se a função data.frame. Como no exemplo a seguir:

Para ler arquivos usa-se a função read.table que contém alguns parâmetros obrigatórios:

12
Parâmetro Signficado

file Caminho do arquivo que será lido.

sep Separador entre as colunas

dec O tipo de separador decimal

Funções no R
Há trechos de códigos que irão se repetir durante a implementação de uma solução. Para
evitar o retrabalho o R implementa funções que são exatamente códigos que se repetem.
Uma função é criada a partir da palavra reservada function que é atribuída a um objeto.
Exemplo:

Para a execução de uma função pode ser necessário a passagem de valores que vão ser
utilizados para um determinado fim dentro dela. Esses valores tem o nome de
parâmetros e são especificados no cabeçalho da função:

Exemplo função com parâmetros:

13
Bloco IF..THEN..ELSE
É desejável que dentro de uma função existam caminhos a serem percorridos segundo
alguma condição. Uma condição pode ser feita através dos operadores: <,> e = ou as
suas combinações: >=,<=. A estrutura IF(condição)THEN é a principal estrutura
condicional de controle. Nesse bloco uma condição é testada se seu valor for verdadeiro
as instruções que estão no seu interior são executadas:

A função IF ainda é estendida para o bloco IF(condição)THEN..ELSE onde uma


condição é testada e se não for atendida o que esta no bloco else é executado:

Comentários
O desenvolvimento de funções pode envolver diversas linhas de código. Para se facilitar
o entendimento de seu funcionamento em uma futura manutenção existe as linhas de
comentário que se iniciam com o símbolo # e não são interpretadas durante a execução
das mesmas.

Editar Funções
Algumas funções precisam ser editadas para modificar o seu funcionamento ou porque
não oferecem o comportamento esperado. A função edit facilita o trabalho de reescrever
todo o código. Como no exemplo:

14
No editor pode-se digitar novos códigos ou se alterar o existe. Para as mudanças serem
efetivadas feche o editor, irá aparecer uma mensagem perguntando se desejar salvar as
alterações clique em sim.

Estruturas de repetição
As estruturas de repetição tem a função de executar um determinado trecho de código até
que uma condição seja alcançada ou por um número de vezes pré-definido. A estrutura for
implementa o segundo caso e é definida da seguinte forma:

for(variável in valor inicial:valor final)

15
O valor inicial e o valor final podem ser definidos por variáveis. O exemplo, a seguir, cria uma
função que percorre todo um vetor e retorna a porcentagem de números que estão dentro do
intervalo determinado pelos parâmetros:

Gráficos
O R permite criar gráficos para análise de dados. Existem dois tipos de importante os de
barra e os histogramas:

Função Significado

plot(vetor) Cria um gráfico de barras com os


elementos do vetor.

hist(vetor) Cria um histograma com os elementos do


vetor.

Cada função possui parâmetros que podem ser definidos para formatar o gráfico.

Função Plot
X Vetor com os valores que estarão no eixo
x da função. Obs.: valores que serão

16
plotados.

Y Vetor com os valores que estarão no eixo


y da função. Obs.: valores que serão
plotados.

xlab Rótulo do eixo x

ylab Rótulo do eixo y

main Título do gráfico

xlim Vetor com os números do eixo x. Obs.: os


valores que aparecem na reta numerada.

ylim Vetor com os números do eixo y. Obs.: os


valores que aparecem na reta numerada.

col Cor dos pontos do gráfico.

pch Altera o formato dos pontos do gráfico.


Tipo numérico que varia de 0 a 18.

bg A cor do preenchimento dos pontos.

tcl Tamanho do traço dos eixos.

las Orientação do texto em y.

cex Tamanho do objeto do ponto.

bty Altera a borda do gráfico.

Exemplo:

17
Função Hist
x Vetor com os valores a serem plotados no
histograma

main Título do gráfico

xlab Legenda do eixo x

18
ylab Legenda do eixo y.

br Intervalo das classes.

xlim Vetor com os números do eixo x. Obs.: os


valores que aparecem na reta numerada.

ylim Vetor com os números do eixo y. Obs.: os


valores que aparecem na reta numerada.

col Cor das colunas.

border Cor das bordas das colunas

prob Mostrar as probabilidades

right Intervalos fechados a direita.

adj Alinhamento dos textos.

col.axis Cor dos textos nos eixos.

Exemplo:

19
Estatística Descritiva

As operações básicas da estatística descritiva já estão implementadas na linguagem:

20
Função Significado

sum(vetor) Soma de todos os elementos do vetor.

prod(vetor) Produtório dos elementos do vetor.

mean(vetor) Média dos elementos do vetor.

median(vetor) Mediana dos elementos do vetor.

var(vetor) Variancia dos elementos do vetor.

sd(vetor) Desvio padrão dos elementos do vetor.

Exemplo prático
A estática descritiva baseia-se na reunião de dados e sua apresentação de forma que se
possa tirar conclusões dos mesmos. Para tornar claro os conhecimentos na linguagem R
será criada uma função que plot o histograma de um conjunto de dados.

Para se construir o histograma é necessário agrupar o conjunto de valores em classes


com intervalos iguais. O intervalo das classes é construído se dividendo o rol da amostra
por sua quantidade de classes. O rol da amostra é dado pelo maior valor da amostra
menos o menor. A quantidade de classes é dada pela seguinte fórmula:

A apresentação dos dados ainda incluí a freqüência acumulada, a freqüência em


porcentagem e a freqüência acumulada em porcentagem.

Primeira parte da função:

A as funções max() e min() são implementadas na linguagem R e pegam o maior e o


menor valor de um vetor respectivamente. A função is.numeric() verifica se o conjunto
de dados que esta sendo passados para a função possuía apenas números. Para
21
transformar um número real em inteiro é utilizada a função as.integer() que aproxima
para o inteiro abaixo do valor passado como argumento.

As freqüências são calculadas a partir do intervalo superior e inferior das classes. Que
são feitos a partir da função seq(). Para a apresentação dos dados é necessário juntar os
intervalos superior e inferior num objeto character.

Segunda parte do código:

A função paste() junta dois objetos character por um separador especificado na


no parâmetro sep. As classes são transformadas em character pela função as.character().

Terceira parte:

22
A função freqüência feita no exemplo de estruturas condicionais é utilizada aqui para
calcular as freqüências de cada intervalo que são passados para a função.

Quarta parte:

23
Nessa parte é mostra no promot de comando alguns dados estatísticos e plotado o
histograma dos dados.

24

Você também pode gostar