Escolar Documentos
Profissional Documentos
Cultura Documentos
Testando a instalação
1) Abrir o RStudio
2) Confirmar a versão do R instalada. Caso não seja a versão recém-
instalada, ver [OBS2] do passo 2 anterior.
Utilizando o RStudio
1) Para executar comandos rapidamente no RStudio, basta digitarmos
o comando no Console e apertar ENTER.
E vamos ao curso!
Download
BDM free 2020-04-18.zip
O que é o proxy?
O Proxy é um servidor que faz a ponte entre o seu computador e
servidores web. Se você acessa a internet na rede da sua empresa, é
bastante provável que o seu acesso seja mediado por um proxy. O
objetivo é fazer o monitoramento, controle de acesso e filtro dos
conteúdos acessados de dentro da rede da sua empresa.
----------------------------------------------------------------------------------------------
Bugfix:
Exemplo:
read.table(
...
comment.char = "",
...
----------------------------------------------------------------------------------------------
OBS: Se você está atrás de um proxy, talvez seja preciso fazer uma
configuração adicional para utilizar a função POST do pacote httr. Se a
função POST estiver retornando erro, tentem passar as configurações
de proxy no parâmetro config. Por exemplo:
Expressões Regulares
Âncoras
^
: início da linha/string
l
$
: fim da linha/string
l
Quantificadores
a*
: "a" zero ou mais vezes
l
a+
: "a" uma ou mais vezes
l
a?
: "a" zero ou uma vez
l
a{m}
: "a" exatamente m vezes
l
a{m,}
: "a" pelo menos m vezes
l
a{m,n}
: "a" de m a n vezes
l
Operador OU e Colchetes
a|b
: "a" ou "b"
l
[abc]
: "a" ou "b" ou "c"
l
[A-Z]
: de A a Z (maiúsculo)
l
[A-Za-z]
: de A a Z (maiúsculo ou minúsculo)
l
[0-9]
: de 0 a 9 (equivalente a \d)
l
[\^ab]
: nem "a" nem "b" (negação)
l
Classes
\d
: dígito (0 a 9)
l
\w
: um caracter (letras ou underscore)
l
\s
: um espaço (espaço, tabulação ou quebra de linha)
l
.
: qualquer coisa (CUIDADO!)
l
Caracteres Especiais
^.[$()|\*+?
É preciso usar um
\
antes destes caracteres utilizá-los de forma literal.
OBS: Dentro de colchetes, não é necessário.
Ex:
\(
Alguns outros significados especiais:
\t
: tabulação
l
\n
: quebra de linha
l
Grupos
(abc)
: captura "abc" como um grupo, para ser usado futuramente na expressão com
\\n
, onde
n
l
é o número do grupo
Exemplo
:
(abc) \1
: captura "abc abc"
(\d)\1
: captura "11", "22", "33", etc
Gananciosos (greedy) ou Preguiçosos (lazy)?
Os quantificadores
\*
,
+
e
{}
são gananciosos por padrão, ou seja, tentam casar com a maior string
possível. Assim
<.*>
casa com a string inteira
"<tag>valor</tag>"
.
Se adicionarmos o lazy operator
?
, transformamos o operador em preguiçoso, e ele tentará casar
com a menor string possível. Assim
<.*?>
aplicado à string
"<tag>valor</tag>"
casa com as strings
"<tag>" e "</tag>"
.
Bugfixes:
Pessoal, incluí alguns bugfixes para consertar erros que vieram de
mudanças no padrão da tabela de projeção da ANBIMA.
#1 - Fixar Encoding:
- Problema: Em algumas máquinas, o encoding da página não era
detectado pelo readLines. Nesses casos, o "ç" de Março não era lido
corretamente e a expressão "\w+ de \d+" não capturava a string
"Março de 2019".
<td><p>valor</p></td>
#3 - strong's duplicados:
- Problema: Algumas vezes a projeção lida vem com duas tags strong
aninhadas, por exemplo:
<strong><strong>0,35</strong></strong>
Bugfix 2:
ler.projecoes.igp.anbima = function(){
pattern = paste0(
url = "http://www.anbima.com.br/pt_br/informar/estatisticas/precos-e-
indices/projecao-de-inflacao-gp-m.htm"
#s = str_flatten(txt, "\n")
# redundantes.
# P.Ex: "<strong><strong>"
vira "<strong>"
# e "</strong></strong>" vira
"</strong>"
dados$identificador = c("IGPM 1", "IGPM 2", "IGPM 3", "IPCA 1", "IPCA 2")
dados
# RESULTADO EM 20/05/2020
# > ler.projecoes.igp.anbima()