Você está na página 1de 2

Pq cientistas de dados usam R?

- Linguagem estatística, e não de programação;

- Criada no intuito de fazer análise estatística;

- Linguagem open source, não tem custos

- Extração, limpeza, carregamento e transformação de dados, análise estatística, modelagem


preditiva, machine learning, visualização de dados

- Linguagens mais usadas para ciência de dados: R, Phyton e SQL

Vantagens da linguagem R:

- Grande variedade de pacotes disponíveis (adicionais que levam o trabalho além);

- Flexibilidade e rapidez (linguagem de script – basta saber o que escrever);

- Análise estatística

Desvantagens da linguagem R:

- Não há interface gráfica (apenas linha de comando – tudo pelo teclado, não usa mouse);

- Limitação no uso de memória, principalmente com datasets muito grandes.

Dado: apenas um valor armazenado; quando se associa os dados, obtém-se a INFORMAÇÃO.

Informação gera Conhecimento.

Inteligência: Saber resolver o problema utilizando o conhecimento, através das informações


obtidas através da associação dos dados

#: adiciona comentário – que não irá rodar no script, serve apenas como informação adicional
ou anotação de alguma instrução de anotação;

<-: Criação de variáveis, que ficarão salvas para posterior utilização

Uma variável não pode ter um número como nome;

Função: executam comandos e geram pacotes

() abre e fecha parênteses definem a criação de uma função

?função – Ajuda sobre a utilização da função (help)

?summary – se a variável for numérica, exibe dados estatísticos (média, moda, separatrizes)
www.rdocumentation.org – instalação de pacotes não disponíveis

Você também pode gostar