Você está na página 1de 10

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/265433022

Conhecendo o R: uma visão mais que Estatística

Book · October 2013

CITATIONS READS

4 3,848

2 authors:

Marcio Pupin Mello Luiz Alexandre Peternelli


The Boeing Company Universidade Federal de Viçosa (UFV)
54 PUBLICATIONS   468 CITATIONS    133 PUBLICATIONS   768 CITATIONS   

SEE PROFILE SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Paper on Soy Moratorium View project

sugarcane breeding for pests resistance View project

All content following this page was uploaded by Luiz Alexandre Peternelli on 11 February 2015.

The user has requested enhancement of the downloaded file.


Marcio Pupin Mello
Luiz Alexandre Peternelli

Conhecendo o R
Uma visão mais que Estatística

Universidade Federal de Viçosa


2013
© 2007 by Luiz Alexandre Peternelli e Marcio Pupin de Mello
1ª edição: 2007 – Caderno Didático
1ª edição: 2011 – Série Didática
1ª reimpressão: 2012
© 2013 by Marcio Pupin de Mello e Luiz Alexandre Peternelli
1ª edição: 2013

Direitos de edição reservados à Editora UFV.


Nenhuma parte desta publicação pode ser reproduzida, apropriada e estocada, por
qualquer forma ou meio, sem autorização do detentor dos seus direitos de edição.
Impresso no Brasil

Ficha catalográfica preparada pela Seção de Catalogação e


Classificação da Biblioteca Central da UFV
Mello, Marcio Pupin, 1983-
M527c Conhecendo o R : uma visão mais que estatística / Marcio Pupin de
2013 Mello, Luiz Alexandre Peternelli. – Viçosa, MG : Ed. UFV, 2013.
222p. : il. ; 22 cm.

Inclui apêndice e índice.


Referências bibliográficas: p. 210-212.
ISBN 978-85-7269-495-7

1. Estatística matemática. 2. R (Linguagem de programação de


computador). 3. Probabilidade. 4. Análise de séries temporais. 5.
Análise de regressão. I. Peternelli, Luiz Alexandre, 1966-. II. Título.

CDD 22.ed. 519.5


Capa: Miro Saraiva
Revisão linguística: Constança Bezerra Albino Chaves
Editoração eletrônica: José Roberto da Silva Lana
Impressão e acabamento: Divisão Gráfica da Editora UFV

Editora UFV Pedidos


Edifício Francisco São José, s/n Tel. (0xx31) 3899-2234
Universidade Federal de Viçosa Tel./Fax (0xx31) 3899-3113
36570-000 Viçosa, MG, Brasil E-mail: editoraorcamento@ufv.br
Tels. (0xx31) 3899-2220/3139 editoravendas@ufv.br
E-mail: editora@ufv.br Livraria Virtual: www.editoraufv.com.br
Este livro foi impresso em papel offset 75 g/m2 (miolo) e cartão supremo 250 g/m2 (capa).
Apresentação
O objetivo deste livro não é tão somente ensinar um software ou
tópicos em Estatística, mas proporcionar um ponto de partida para
pessoas que desejam começar a utilizar o R e suas ferramentas
estatísticas. É dar suporte àqueles que de uma forma ou de outra usam
programas estatísticos em seu dia a dia e tornar acessível aos
interessados alguns conhecimentos acumulados com o emprego
constante deste software livre em estudos e análises estatísticas
desenvolvidas pelos autores ao longo dos anos. É um material de
referência.
Procuramos, nesta obra, valorizar o uso do R em preparação e
manipulação de dados, análises gráficas, desenvolvimento de funções
de aplicação específica e análises estatísticas. Abordamos, de maneira
clara, objetiva e extremamente didática, as informações mais
relevantes a serem consideradas especialmente pelos usuários
iniciantes e intermediários. As explicações do uso de diversos
comandos e argumentos são ilustradas com exemplos e comentários,
facilitando a interpretação e a adaptação para outro problema
semelhante.
Os Capítulos de 1 a 8 abordam desde o entendimento de como
funciona o R, como baixar e instalar o software em diferentes sistemas
operacionais, sua estrutura de arquivos, pacotes, comandos e
argumentos até a manipulação de dados e a elaboração de gráficos. Já
os Capítulos de 9 a 13 focam em ferramentas e análises estatísticas no
R. Nesses capítulos há exemplos aplicados que chamamos de
Resolvendo com o R..., em que são utilizados vários problemas do
cotidiano profissional, nos quais a Estatística está presente.
Os comandos de entrada, assim como os de saída do programa,
estão em formatação diferenciada, o que permite a sua fácil visualização.
Nesta obra, o leitor encontrará diversas figuras ilustrativas, que o ajudarão
a entender o processo de forma visual, além de tabelas que resumem
concisamente várias operações e informações úteis ao uso do software.
Todos os comandos empregados neste obra também se
encontram disponíveis em www.dsr.inpe.br/~mello e
www.det.ufv.br/~peternelli, poupando o usuário de digitá-los ao valer-
se do uso dos recursos “copiar e colar”. A versão do R utilizada no
texto para introdução dos comandos, assim como as saídas e os
resultados, é a 3.0.0 para Windows.
Quaisquer comentários, críticas, sugestões e elogios serão muito
bem-vindos e podem ser enviados a (mello@ieee.org ou
peternelli@ufv.br).

Boa leitura!

Os autores.
Sumário
CAPÍTULO 1 – ALGO SOBRE O R ..................................................................... 15
Introdução ...................................................................................................... 15
O Programa .................................................................................................... 16
Onde Buscar Ajuda? ...................................................................................... 16
Primeiros Passos ............................................................................................ 17
Instalando o R .............................................................................................. 17
Rodando o R ................................................................................................ 18
Como Citar o R em Suas Publicações ......................................................... 19
Sobre os Pacotes .......................................................................................... 20
As Versões do R .......................................................................................... 23
Ferramentas Adicionais ................................................................................. 23
RStudio ........................................................................................................ 24

CAPÍTULO 2 – COMEÇANDO A USAR O R ........................................................ 26


Obtendo Ajuda ............................................................................................... 26
Sobre Comandos e Argumentos .................................................................. 30
Manipulando Objetos ..................................................................................... 32
Criando Objetos ........................................................................................... 32
Removendo Objetos .................................................................................... 33
Listando Objetos .......................................................................................... 34
Propriedades dos Objetos............................................................................... 34
Estrutura de Dados ...................................................................................... 35
Atributos dos Objetos .................................................................................. 36
Infinito, NaN e NA ...................................................................................... 40

CAPÍTULO 3 – OBJETOS ESPECIAIS ................................................................. 43


Vetor .............................................................................................................. 43
Sequências ................................................................................................... 44
Repetições ................................................................................ 44
Índices em Vetores ....................................................................................... 46
Matriz .............................................................................................................. 47
Criando Matrizes ......................................................................................... 47
Obtendo Informações sobre a Matriz .......................................................... 48
Mais Informações sobre Construção de Matrizes ....................................... 49
Índices das Matrizes .................................................................................... 51
Array .............................................................................................................. 53
Criando Arrays ............................................................................................ 53
Índices em Arrays ........................................................................................ 56
Fator ............................................................................................................... 56
Data.frame...................................................................................................... 57
Índices dos Data.frames............................................................................... 60
Manipulando um Data.frame ....................................................................... 62
Separando um Data.frame por Grupos ........................................................ 64
Agrupando Data.frames ............................................................................... 64
Lista ............................................................................................................... 66
Alguns Comandos que Retornam Listas ..................................................... 67

CAPÍTULO 4 – OPERAÇÕES ARITMÉTICAS NO R .............................................. 69


Arredondamentos e Aproximações ................................................................ 71
Comandos round() e signif() ........................................................... 72
Truncando Valores ...................................................................................... 73
Teto e Piso ................................................................................................... 73
Operações com Vetores e Matrizes ............................................................. 73
Alguns Comandos Úteis ................................................................................ 76
Usando Alguns Tipos de Combinação de Operações .................................. 77

CAPÍTULO 5 – ENTRANDO COM DADOS .......................................................... 79


Uso do Comando scan() ............................................................................ 79
Uso do Comando edit() ............................................................................ 80
Montando uma Matriz com os Dados de uma Planilha Eletrônica ........... 81
Lendo Dados de um Arquivo-Texto .............................................................. 83
Usando o Comando read.table() .......................................................... 83
Lendo Dados de uma Planilha Eletrônica ...................................................... 85
Usando o Comando read.xlsx() .......................................................... 85
Carregando Dados Contidos em Pacotes ....................................................... 87
CAPÍTULO 6 – SALVANDO E ABRINDO ARQUIVOS DO R ................................. 88
Exibindo e Alterando o Diretório de Trabalho .............................................. 88
Exibindo o Conteúdo de um Diretório ........................................................... 89
Arquivos do R ................................................................................................ 89
Salvando e abrindo projetos no R (arquivos *.RData) ................................ 90
Salvando e Carregando o Histórico de Comandos (arquivos *.Rhistory) ... 90

CAPÍTULO 7 – CRIANDO FUNÇÕES .................................................................. 92


Entendendo o Conceito de Função ................................................................ 92
Funções Envolvendo Loops ........................................................................... 96
Funções Envolvendo Condição ..................................................................... 97
Operadores Lógicos ....................................................................................... 98

CAPÍTULO 8 – CRIANDO GRÁFICOS COM O R ................................................ 101


Conceitos Básicos ........................................................................................ 101
Uso do Comando plot() .......................................................................... 102
Um Gráfico Simples .................................................................................. 102
Alterando o Padrão dos Pontos .................................................................. 103
Vários Gráficos na Mesma Janela Gráfica ................................................ 104
Personalizando Gráficos ............................................................................ 106
Histogramas ................................................................................................. 108
Um Exemplo Bem Simples ....................................................................... 108
Personalizando Histogramas ..................................................................... 109
Ogiva ......................................................................................................... 112
Gráficos de Barras ....................................................................................... 113
Boxplots ....................................................................................................... 114
Cores nos Gráficos ....................................................................................... 116
Adicionando Algo em um Gráfico Existente ............................................... 116
Mudando as Linhas .................................................................................... 117
Definindo Manualmente o Intervalo dos Eixos ......................................... 118
Adicionando Texto .................................................................................... 118
Interagindo com a Janela Gráfica ................................................................ 119
Identificadores no Gráfico ......................................................................... 119
Pacotes Gráficos Adicionais ........................................................................ 121
CAPÍTULO 9 – ESTATÍSTICA DESCRITIVA...................................................... 122
Notações de Somas e Produtos .................................................................... 123
Somatório .................................................................................................. 123
Produtório .................................................................................................. 124
Medidas de Posição Amostral...................................................................... 125
Média ......................................................................................................... 125
Mediana ..................................................................................................... 126
Moda .......................................................................................................... 127
Medidas de Dispersão Amostral .................................................................. 128
Variância .................................................................................................... 128
Desvio-padrão ............................................................................................ 129
Amplitude Total......................................................................................... 129
Covariância e Correlação ............................................................................. 131

CAPÍTULO 10 – SOBRE PROBABILIDADE ....................................................... 134


Algumas Distribuições ................................................................................. 134
Binomial .................................................................................................... 138
Poisson ....................................................................................................... 140
Normal (Gauss) ......................................................................................... 142
Geração de Números Aleatórios .................................................................. 145
De um Conjunto Preestabelecido de Valores ............................................ 145
De uma Distribuição de Interesse .............................................................. 146

CAPÍTULO 11 – ALGUNS TESTES ESTATÍSTICOS ........................................... 148


Ideia Geral Sobre os Testes de Hipóteses .................................................... 148
Introdução .................................................................................................. 148
Tipos de Erros Inerentes aos Testes de Hipóteses ..................................... 150
P-value (ou valor p) ................................................................................... 150
Teste t (de Student) ...................................................................................... 152
Para uma Média ......................................................................................... 153
Para as Médias de Duas Amostras Independentes .................................... 155
Para as Médias de Duas Amostras Dependentes ....................................... 158
Teste F.......................................................................................................... 159
Outros Testes ............................................................................................... 161
Teste de Kolmogorov-Smirnov ................................................................. 161
Teste para a Normalidade ........................................................................................ 162
CAPÍTULO 12 – ANÁLISE DE VARIÂNCIA (ANOVA) .................................... 165
Delineamento Inteiramente Casualizado ..................................................... 166
Delineamento em Blocos Casualizados ....................................................... 169
Delineamento em Quadrado Latino ............................................................. 173
Experimentos Fatoriais ................................................................................ 174
Experimentos com Dois Fatores Segundo o DIC ...................................... 175
Fatorial Usando o DBC ............................................................................. 177
Experimentos em Parcelas Subdivididas ..................................................... 179
Um Exemplo de Parcela Subdividida Segundo o DBC ............................. 180
Teste de Comparações Múltiplas ................................................................. 182
Teste de Tukey .......................................................................................... 182

CAPÍTULO 13 – REGRESSÃO ......................................................................... 190


Polinomial Simples ...................................................................................... 191
De Grau Igual a 1 ...................................................................................... 191
De Grau Maior que 1 ................................................................................. 196
Um Gráfico Útil em Regressões ................................................................ 200
Polinomial Múltipla ..................................................................................... 203
Superfície de Resposta .............................................................................. 206
Modelos Não Polinomiais ............................................................................ 208
Um Modelo Exponencial ............................................................................. 208
Outros Modelos............................................................................................ 211

REFERÊNCIAS ............................................................................................... 212


APÊNDICE ..................................................................................................... 215
ÍNDICE REMISSIVO ........................................................................................ 220

View publication stats