Você está na página 1de 27

C A R L O S M AT O S

15/02/24

SUMMER SCHOOL
INTRODUÇÃO AO R
Agenda
Tópicos
• Processo de Instalação do Software R;
• Objetos do R;
• Operações Básicas;
• Vetores;
• Sequências;
• Matrizes;
• Data Frames;
• Exercícios – Parte 1
• Importando Dados;
• Estatística Básica;
• Introdução a Regressão Linear Simples;
• Exercícios – Parte 2
2
PROCESSO DE INSTALAÇÃO DO SOFTWARE R

• Acessar o site: https://cran.r-project.org/

3
PROCESSO DE INSTALAÇÃO DO SOFTWARE R

4
PROCESSO DE INSTALAÇÃO DO SOFTWARE R

5
PROCESSO DE INSTALAÇÃO DO SOFTWARE R

• Acessar o site: https://posit.co/downloads/

6
Quadrantes – R Studio

A
C • A: Editor/Script.

• B: Outputs.

• C: Painel onde nos


B mostra os comandos e
objetos criados.

• D: Console
D

7
OBJETOS DO R

• Vetores;
• Sequências;
• Matrizes;
• Arrays;
• Fatores;
• Lista;
• Data Frames;
• Funções.

13/02/2024 2021 Centro Universitário FMU | Conteúdo proprietário e confidencial 8


OPERAÇÕES BÁSICAS
Assim podemos definir o cálculo das operações básicas no R.

Atribuições de Valores:

idade <- 25

nome <- "João"

9
OPERAÇÕES BÁSICAS
Assim podemos definir o cálculo das operações básicas no R:

Operações Aritméticas:
# Adição
resultado_adicao <- 5 + 3

# Subtração
resultado_subtracao <- 10 – 4

# Multiplicação
resultado_multiplicacao <- 2 * 6

# Divisão
resultado_divisao <- 8 / 2

# Potência
resultado_potencia <- 3 ^ 2
10
OPERAÇÕES BÁSICAS
Assim podemos definir o cálculo das operações básicas no R:

Operações Aritméticas:

# Raiz Quadrada
resultado_raiz <- sqrt(25)

# Função "Soma“
vetor_para_somar <- c(2, 4, 6, 8, 10)
resultado_soma <- sum(vetor_para_somar)

# Função "Produto“
vetor_para_multiplicar <- c(1, 2, 3, 4, 5)
resultado_produto <- prod(vetor_para_multiplicar)

11
OPERAÇÕES BÁSICAS
Assim podemos definir o cálculo das operações básicas no R:

Operações lógicas:

# Igualdade
resultado_igualdade <- 5 == 5

# Desigualdade
resultado_desigualdade <- 10 != 5

# Maior que
resultado_maior_que <- 8 > 5

# Menor que
resultado_menor_que <- 3 < 7

12
VETORES

Vetores são estruturas unidimensionais que podem conter elementos de um único tipo. Aqui está um exemplo:

# Criando um vetor
meu_vetor <- c(1, 3, 5, 7, 9)

# Acessando elementos do vetor


print(meu_vetor[3])

# Atribuindo a uma variável informações de um vetor

X= meu_vetor[3]

13/02/2024 2021 Centro Universitário FMU | Conteúdo proprietário e confidencial 13


SEQUÊNCIAS

Sequências são usadas para gerar uma série de números em uma determinada ordem.

# Criando uma sequência


minha_sequencia <- seq(from = 1, to = 10, by = 2)

# Acessando elementos do vetor


print minha_sequencia [3])

# Visualizando a sequência
print(minha_sequencia)

# Acessando elementos com condições


lógicasprint(minha_sequencia[minha_sequencia > 5])

# Acessando os primeiros e últimos elementos


head(minha_sequencia, n = 2)
tail(minha_sequencia, n = 1)
13/02/2024 2021 Centro Universitário FMU | Conteúdo proprietário e confidencial 14
MATRIZES

Matrizes são estruturas bidimensionais que podem conter elementos de um único tipo.

# Criando uma matriz


minha_matriz <- matrix(c(1, 2, 3, 4, 5, 6), nrow = 2, ncol = 3)

# Visualizando a matriz
minha_matriz

13/02/2024 2021 Centro Universitário FMU | Conteúdo proprietário e confidencial 15


MATRIZES
# Operação com Matrizes
M6 = matrix(c(2, 3, 5, 6), nrow = 2)
M7 = matrix(c(5, 3, 8, 2), nrow = 2)
M8 = matrix(c(2, 4, 6, 2, 0,1), nrow = 2, ncol = 3)
M9 = matrix(c(1, 0.5, 0.3, 0.5, 1, 0.9, 0.3, 0.9, 1), nrow = 3, ncol = 3)
M6
# Soma
M_soma = M7 + M6
print(M_soma)

# Multiplicação por Escalar


M_prod_escalar = 10 * M9
print(M_prod_escalar)

# Multiplicação Matricial
M_prod = M6 %*% M8
print(M_prod)

# Transposta
M_transp = t(M8)
print(M_transp)
13/02/2024 2021 Centro Universitário FMU | Conteúdo proprietário e confidencial 16
DATAFRAMES

Data Frames são estruturas bidimensionais semelhantes a matrizes, mas podem armazenar diferentes tipos de dados em
colunas.

# Criando um dataframe

meu_dataframe <- data.frame(


Nome = c("Alice", "Bob", "Charlie"),
Idade = c(25, 30, 22),
Nota = c(90, 85, 92)
)

# Visualizando o dataframe
print(meu_dataframe)

17
DATAFRAMES

# Acessando a coluna 'Nome' usando o operador $


print(meu_dataframe$Nome)

# Acessando a segunda linha


print(meu_dataframe[2, ])

# Acessando linhas com base em uma condição lógica (idade maior que 25)
print(meu_dataframe[meu_dataframe$Idade > 25, ])

# Acessando o elemento na segunda linha e na segunda


colunaprint(meu_dataframe[2, 2])

18
IMPORTANDO DADOS

O processo de importação dos dados pode ser feito de forma automática no R usando alguns comandos
específicos. Apresentaremos como importar arquivos em excel e csv.

# Dados em formato csv


dados_BBSEG <- read.csv('D:/Cadu/FMU/2024.01/SummerSchool/Arquivos/BBSE3SA.csv',sep=",")

# Definindo um diretório padrão


setwd('D:/Cadu/FMU/2024.01/SummerSchool/Arquivos ')
getwd()

dados_porto <- read_excel("Porto_Seg.xlsx",sheet="Base" )

19
ESTATÍSTICA BÁSICA

Considere os Dados:
dados <- c(10, 15, 20, 25, 30, 35, 40)

# Média
media <- mean(dados)

#Mediana
mediana <- median(dados)

#Desvio Padrão
desvio_padrao <- sd(dados)

20
ESTATÍSTICA BÁSICA

# Frequência:
# Criando um vetor de dados categóricos
categorias <- c("A", "B", "A", "C", "B", "A", "C", "A", "B", "C")

# Calculando a frequência de cada categoria


frequencia <- table(categorias)

# Correlação:
x <- c(1, 2, 3, 4, 5)
y <- c(2, 4, 5, 4, 5)

# Calculando a correlação entre x e y


correlacao <- cor(x, y)

#Histograma
hist(dados)

21
INTRODUÇÃO A REGRESSÃO LINEAR SIMPLES
A Regressão Linear Simples é um modelo estatístico utilizado para analisar a relação entre uma variável
independente (preditora) e uma variável dependente (alvo).

Sendo uma ferramenta fundamental na análise de dados e na previsão de resultados com base em variáveis
explicativas.

22
INTRODUÇÃO A REGRESSÃO LINEAR SIMPLES

O modelo de regressão linear simples pode ser expresso da seguinte forma:

Y = 𝜷𝟎 + 𝜷𝟏 𝑿 + 𝜺

Onde:

•Y é a variável dependente (alvo)


•X é a variável independente (preditora).
•𝛽0 ​ é o intercepto, que representa o valor médio de Y quando X é igual a zero.
•𝛽1 é a inclinação, que representa a mudança média em Y para uma unidade de mudança em X.
•ε é o termo de erro, que captura a variação não explicada por X.

23
INTRODUÇÃO A REGRESSÃO LINEAR SIMPLES

Pressupostos do Modelo de Regressão Linear Simples

• O erro é uma variável aleatória com média 0, isto é, E[ε] = 0;

• O erro possui variância 𝜎 2 constante (Homoscedasticidade), isto é, Var(ε) = 𝜎 2 ;

• Os erros são não correlacionados, ou seja, cor(ε𝑖 , ε𝑗 ) = 0. Dessa maneira os erros são independentes entre si;

• Os erros são identicamente distribuídos com distribuição de probabilidade N(0; 𝜎 2 );

24
INTRODUÇÃO A REGRESSÃO LINEAR SIMPLES

Exemplo: Um modelo de regressão linear foi estabelecido entre as variáveis X e Y. Algumas observações foram
feitas e estão apresentadas na tabela abaixo:

Encontre:
a) Faça o gráfico.
b) Apresente a equação do modelo estimada.
c) Encontre as estimativas de 𝛽
෢0 e 𝛽
෢1
25
INTRODUÇÃO A REGRESSÃO LINEAR SIMPLES

# Criando a amostra
Y <- c(60,70,80,85,90)
X <- c(2,3,4,5,6)
Y
X

## Gráfico de Dispersão: “Scatter plot”


plot(X,Y, main = "Scatterplot", xlab = "X", ylab = "Y")

# Especificação do modelo através da formula lm "linear Model“


modelo_linear <- lm(Y~X)
summary(modelo_linear)

26
MUITO
OBRIGADO!
Carlos Eduardo Matos
carlos.matos@fmu.br

Você também pode gostar