Escolar Documentos
Profissional Documentos
Cultura Documentos
R é uma linguagem de programação e software livre para estatística e gráficos. Ela foi criada por
Ross Ihaka e Robert Gentleman em 1993 e é amplamente utilizada em áreas como ciência de dados, es-
tatística, pesquisa e análise de dados. R possui uma grande comunidade ativa que contribui com pacotes e
ferramentas adicionais para a linguagem. Ele é compatível com vários sistemas operacionais, incluindo
Windows, Mac e Linux. R é amplamente utilizado tanto em ambientes acadêmicos quanto em indústrias,
como financeira, de saúde e de tecnologia da informação.
Algumas das características da linguagem são:
1. É uma linguagem de programação de alto nível, baseada em S, que foi desenvolvida para a análise
estatística e gráfica.
2. Possui uma grande variedade de bibliotecas e pacotes para análise de dados, visualização de dados
e modelagem estatística.
3. É gratuita e de código aberto, o que significa que qualquer pessoa pode usá-la e contribuir para o
seu desenvolvimento.
4. Possui uma sintaxe simples e intuitiva, o que a torna fácil de aprender.
5. Possui uma comunidade ativa e grande de usuários, o que significa que existem muitos recursos
disponíveis para ajudar os usuários a aprender e usar a linguagem.
6. Possui uma série de ferramentas para análise de dados, criação de gráficos e modelos estatísticos.
7. É altamente portátil, o que significa que pode ser usada em muitas plataformas diferentes, como
Windows, Mac e Linux.
1. Ler um arquivo .csv
dados <- read.csv2("caminho",header=True,sep=",",quote=’"’). Exemplo: dados <-
read.csv2("˜/Html/peso.csv",header=T,sep=",",quote=’"’). Neste exemplo, estamos indicando que o sepa-
rador de colunas é "," (sep=",") e o arquivo contem um cabeçalho (header=True ou header=T).
4. Criar uma sequência númerica Exemplo: criar uma sequência para a massa, indo de 77kg a 86kg
variando de 1 kg ☞ seq(77,86,1)
7. Estatística descritiva (Frequências) Exemplo: Criar uma lista de 100 notas de estudantes com valores
aleatórios entre 0 e 10 e distribuir as notas de acordo com a sequência (0-2,2-4,4-6,6-8.8-10).
• Criar os dados aleatórios: data <- runif(100,0,10)
• Criar uma sequência númerica para o intervalo: sn <- seq(0,10,2) (0-2,2-4,...8-10).
• Criar a distribuição de frequências: table(cut(data,sn,include.lowest=T))
Observação: O parâmetro, "include.lowest=T" serve para incluir os valores iniciais na distribuição
de frequências.
Para plotar o histograma, podemos usar ☞ hist(data,sn)
Observação: para tocar no gráfico e obter um valor, use: locator(1).
Para trocar a cor do gráfico - histograma.
hist(nota,inter,col = "magenta",border="white")
8. Análise de regressão
Use o seguinte modelo para ajuste lineares (lm) ☞ lm (y ˜ x) ☞ Exemplo: lm(data$Massa ˜
seq(1,112))
9. Anova
Use anova(objeto) onde objeto é o resultado de lm. Exemplo: anova(lm(data$Massa ˜ seq(1,112)))
Regressão quadrática
Exemplo ajustar um polinônio do segundo grau aos dados (-5,0),(0,10),(5,0).
Para fazer isso, podemos escrever: x<-c(-5,0,5) e y<-c(0,10,0) e em seguida usar o comando:
lm(y˜x+I(xˆ2))
Se estivermos interessados em obter apenas os coeficientes do polinômio, podemos usar:
reg<-lm(y˜x+I(xˆ2))
coefficients(reg)
Matrizes
Númerico
Resolver a seguinte equação 3(x-4)+2=x+6 que pode ser reescrita como 3(x-4)+2-x-6=0. Para calcu-
lar as raízes o R apressenta o comando uniroot que segue essa estrutura uniroot(f,c(a,b)), onde c(a,b)=[a,b]
é o intervalo da busca pela raiz.
f=function(x) 3*(x-4)+2-x-6
uniroot(f,c(0,10))
A saída do programa será:
$root [1] 8
$f.root [1] 0
$iter [1] 1
$init.it [1] NA
$estim.prec [1] 8
Gráficos
Plotar dois gráficos simultâneos
plot(bb);curve(83.87-0.03*x,col="red",add=T)
Use o comando "add=T" no último comando gráfico.
24. Teste Z duas proporções Para fazer um teste Z de proporção entre duas médias na linguagem R, você
pode usar a função prop.test(), que recebe como parâmetros os números de sucessos e os tamanhos das
amostras dos dois grupos. A função retorna o valor p do teste, o intervalo de confiança e as estimativas das
proporções. Você pode encontrar um exemplo de como usar essa função no primeiro resultado da
pesquisa1. Por exemplo: suponha que em um determinado semestre 20 de um total de 239 estudantes não
tenham feito prova. Em um outro semestre este número foi de 15 estudantes num total de 376. Suponha,
por exemplo, que queremos comparar se as proporcões são estatisticamente diferentes. Para isso podemos
usar a função prop.teste(valor 1, valor 2)
prop.test(x = c(20, 15), n = c(239, 376))