Você está na página 1de 5

R Studio –Linguagem S

- O console é a única parte que roda o código, para limpar o console: Ctrl L

-Definindo variáveis: utilizo = ou <-


Ex.: m = log(2)
m <- log(2)

-Para saber o que a função faz: digita help(“nomedafunção”)

-As setas para cima e para baixo do teclado volta/avança os comandos digitados;

-Definindo vetores: nomedovetor = c( )


*O c significa concatenar
*Para chamar uma posição no vetor basta fazer: nomedovetor[posição desejada]
*Se estou trabalhando com caracteres faço: nomedovetor= c(“caractere”, ... , “caractereN”)

-Definindo matrizes (crio uma matriz vazia): nomedamatriz =matrix(nrow=número de linhas,


ncol=número de colunas)
*Para atribuir valores à matriz: nomedamatriz[numdalinha, numdacoluna]= valor
correspondente
*Para criar e atribuir valores em sequência à matriz: nomedamatriz=matrix(sequência(ex.: 1:24),
nrow=número de linhas, ncol=número de colunas)
*t(x)-matriz transposta
*solve(x)-matriz inversa

-Para abrir um pacote: library(nomedopacote)

Comandos em R

-Cálculo da média: mean (variável)

-Cálculo do desvio padrão: sd(variável)

-Cálculo da variância: var(variável)

-Cálculo da covariância: cov(variável)

-Cálculo da correlação linear (R): cor(x,y)

-Cálculo do tamanho da amostra: length(variável)

-Distribuição Normal
PNORM (valor em questão, média, desvio padrão amostral) –dá como saída a probabilidade
QNORM (probabilidade em questão) –dá como saída Z –indicar a probabilidade atentando para
o fato de ser unilateral ou bilateral
DNORM-densidade

-Distribuição T-student (quando não conheço desvio padrão)


PT(valor em questão, graus de liberdade(n-1))–dá como saída a probabilidade
QT(probabilidade em questão, graus de liberdade(n-1)) –dá como saída Z –indicar a
probabilidade atentando para o fato de ser unilateral ou bilateral
DT- densidade

-Distribuição chi-quadrado(x²)- com n-1 graus de liberdade


PQHISQ(valor em questão, graus de liberdade(n-1))–dá como saída a probabilidade
QCHISQ-(probabilidade em questão, graus de liberdade(n-1)) –dá como saída -faz o cálculo
através da probabilidade complementar
DQHISQ-densidade

-Intervalos de Confiança

-IC para média com variância conhecida


-Normal - IC= = mean(var) + qnorm(probabilidade em questão)*(sd/sqrt(n))
Ou
Instalo o pacote Teaching Demos e uso z.test:
install.packages(“TeachingDemos”)
library(TeachingDemos)
z.test(variável, desvio padrão populacional, conf.level = α) –calcula IC bilateral

-IC para média com variância desconhecida


-T-student - IC= = mean(var) + qt(probabilidade em questão, graus de liberdade(n-
1))*(s/sqrt(n)), onde s é o desvio padrão estimado para a amostra

-IC para variância e desvio padrão de uma distribuição normal


-Chi-quadrado

-IC para proporção populacional de uma amostra grande


-Normal

Testes de Hipóteses
Ex.:
Se μ
Z= = (mean(x) - )/ (sd/sqrt(n))
Ou z.test (variável, , sd) –Se não for indicado o α, a função considera 5%

Regressão Linear
#Declarar x, y
y=c()
x=c()

#Regressão simples
linear->y=bo+b1x
nomedaregressao=lm(y~x)

#Regressão múltipla
2 variáveis(x1 e x2)->y=bo+b1x1+b2x2
nomedaregressao=lm(y~x1+x2)

#Visualizar informações
Intercept=bo;
x=b1;
estimate=valor estimado;
std error=erro padrão;
t value =quantos erros padrões o coeficiente está distante de 0;
pr(>[t])=analisa T.H. para H0: bo ou b1=0, se for alta(mais de 5%), você rejeita a regressão;
probabilidade de estar fora do intervalo definido t-value
R² = indica se o modelo é bom, está entre 0 e 1;
R² ajustado= ajusta o valor de R² considerando uma maior quantidade de parâmetros;
summary(nomedaregressao) =resumo do que foi feito
Ex.:
Call:
lm(formula = y ~ x)

Residuals:
Min 1Q Median 3Q Max
-78.74 -27.64 -18.15 36.58 82.79

Coefficients:

Estimate Std. Error t value Pr(>|t|)


(Intercept) 2984.285 576.792 5.174 0.00207 **
x -7.627 1.940 -3.932 0.00770 **
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 61.25 on 6 degrees of freedom
Multiple R-squared: 0.7204, Adjusted R-squared: 0.6738
F-statistic: 15.46 on 1 and 6 DF, p-value: 0.007698

#Plotar reta de regressão simples


Chama o x
lines(x, predict(nomedaregressao))
ou
abline(intercept, x)
ou
abline(lm(y~x))

#Resíduos
residuals(nomedaregressao)

#Análise de variância -aov


summary(aov(lm(y~x))
Ex.:
Df Sum Sq Mean Sq F value Pr(>F)
x 1 57989 57989 15.46 0.0077 **
Residuals 6 22508 3751
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

#Plotar gráfico com segmentos


plot(x,y)
abline(lm(y~x))
residuos= residuals(lm(y~x)
nomedavariavel=predict(lm(y~x))-o valor de y na reta de regressão encontrada
Obs.: Se xo não pertence à x:
predict((lm(y~x), data.frame(x=xo), interval = "prediction", level = 1-alpha) -dá valores
do intervalo de confiança da predição
fit- valor "y=bo+b1xo" lwr- limite inferior upr- limite sperior
Se xo pertence à x:
predict((lm(y~x), data.frame(x=xo), interval = "confidence", level = 1-alpha) -dá valores
do intervalo de confiança
segments(x,y,x,nomedavariavel,col="cor desejada")
Obs.: nomedavariavel2=signif(parâmetro, número de casas decimais)-coloca o parâmetro pra
duas casas decimais
abs(variavel)-pega o valor absoluto da variavel
textxy(x,y, residuos) -colocar os valores do erro residuais

#Analisando a F-statistic -usa a distribuição "f"

pf(valor de F, grau de liberdade 1 (n-p), grau de liberdade 2 (n-p-1))


valor de F=MQm/MQe
Se valor de F>0 -verifico a validade do teste através de 1-pf = p-valor (indica a probabilidade de
F ser 0)

-Plotar gráficos:
plot(variável) ou plot(x,y)
hist(variavel)-plota um histograma
Demo (graphics) -mostra a capacidade de plotar gráficos no R.

Você também pode gostar