Você está na página 1de 10

LISTA 3 - MINERAÇÃO DE DADOS

Autor: Gustavo Ramos e Vinicius Lucidio

Resolução:

Questão 1

item a

library(tidyverse)
library(ggplot2)

iris <- as_tibble(iris)


# item a)
ggplot(iris)+
geom_point(aes(x=Sepal.Length,y=Sepal.Width,color=as.factor(Species)))+
xlab("Comprimentos da sépala")+
ylab("Larguras da sépala")+
labs(color="Espécie")+
ggtitle("Larguras da sépala (em cm) x Compr. da sépala por espécie (em cm)")

1
Larguras da sépala (em cm) x Compr. da sépala por espécie (em cm)
4.5

4.0
Larguras da sépala

3.5 Espécie
setosa
versicolor
3.0
virginica

2.5

2.0

5 6 7 8
Comprimentos da sépala

item b

ggplot(iris)+
geom_point(aes(x=Sepal.Length,y=Sepal.Width,color=as.factor(Species)))+
scale_color_manual(values = c("10","green","12"))+
xlab("Comprimentos da sépala")+
ylab("Larguras da sépala")+
labs(color="Espécie")+
ggtitle("Larguras da sépala (em cm) x Compr. da sépala (em cm)")

2
Larguras da sépala (em cm) x Compr. da sépala (em cm)
4.5

4.0
Larguras da sépala

3.5 Espécie
setosa
versicolor
3.0
virginica

2.5

2.0

5 6 7 8
Comprimentos da sépala

item c

ggplot(iris,aes(x=Sepal.Length,y=Sepal.Width, color=as.factor(Species)))+
geom_point()+
scale_color_manual(values = c("10","green","12"))+
geom_smooth(aes(x = Sepal.Length, y = Sepal.Width),colour="gray", size=1,se=FALSE)+
xlab("Comprimentos da sépala")+
ylab("Larguras da sépala")+
labs(color="Espécie")+
ggtitle("Larguras da sépala (em cm) x Compr. da sépala (em cm)")

3
Larguras da sépala (em cm) x Compr. da sépala (em cm)
4.5

4.0
Larguras da sépala

3.5 Espécie
setosa
versicolor
3.0
virginica

2.5

2.0

5 6 7 8
Comprimentos da sépala

item d

ggplot(iris,aes(x=Sepal.Length,y=Sepal.Width, color=as.factor(Species)))+
geom_point()+
scale_color_manual(values = c("10","green","12"))+
geom_smooth(se=FALSE)+
xlab("Comprimentos da sépala")+
ylab("Larguras da sépala")+
labs(color="Espécie")+
ggtitle("Larguras da sépala (em cm) x Compr. da sépala (em cm)")

4
Larguras da sépala (em cm) x Compr. da sépala (em cm)
4.5

4.0
Larguras da sépala

3.5 Espécie
setosa
versicolor
3.0
virginica

2.5

2.0

5 6 7 8
Comprimentos da sépala

item e

ggplot(iris,aes(x=Sepal.Length,y=Sepal.Width, color=as.factor(Species)))+
geom_point()+
scale_color_manual(values = c("10","green","12"))+
geom_smooth(aes(x = Sepal.Length, y = Sepal.Width),size=1,se=FALSE)+
facet_wrap(~Species)+
xlab("Comprimentos da sépala")+
ylab("Larguras da sépala")+
labs(color="Espécie")+
ggtitle("Larguras da sépala (em cm) x Compr. da sépala por espécie (em cm)")

5
Larguras da sépala (em cm) x Compr. da sépala por espécie (em cm)
setosa versicolor virginica
4.5

4.0
Larguras da sépala

3.5 Espécie
setosa
versicolor
3.0
virginica

2.5

2.0

5 6 7 8 5 6 7 8 5 6 7 8
Comprimentos da sépala

item f

str(iris)

## tibble [150 x 5] (S3: tbl_df/tbl/data.frame)


## $ Sepal.Length: num [1:150] 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
## $ Sepal.Width : num [1:150] 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
## $ Petal.Length: num [1:150] 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
## $ Petal.Width : num [1:150] 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
## $ Species : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...

iris_2<-gather(iris, key = "Variavel", value = "Valor",


Sepal.Length, Sepal.Width, Petal.Length, Petal.Width)
iris_2

## # A tibble: 600 x 3
## Species Variavel Valor
## <fct> <chr> <dbl>
## 1 setosa Sepal.Length 5.1
## 2 setosa Sepal.Length 4.9
## 3 setosa Sepal.Length 4.7
## 4 setosa Sepal.Length 4.6
## 5 setosa Sepal.Length 5

6
## 6 setosa Sepal.Length 5.4
## 7 setosa Sepal.Length 4.6
## 8 setosa Sepal.Length 5
## 9 setosa Sepal.Length 4.4
## 10 setosa Sepal.Length 4.9
## # ... with 590 more rows

iris_2$Variavel2 <- factor(iris_2$Variavel, labels = c("Compr. da pétala (em cm)",


"Largura da pétala (em cm)", "Compr. da sépala (em cm)", "Largura da sépala (em cm)"))

ggplot(iris_2)+
geom_histogram(aes(x=Valor),stat="bin",
position = "stack",fill="gray")+
aes(y=stat(count)/sum(stat(count))) +
ylab("Porcentagem")+
scale_y_continuous(labels = scales::percent)+
facet_wrap(~Variavel2)+
ggtitle("Distribuições das medidas das flores")

Distribuições das medidas das flores


Compr. da pétala (em cm) Largura da pétala (em cm)

6.0%

4.0%

2.0%
Porcentagem

0.0%

Compr. da sépala (em cm) Largura da sépala (em cm)

6.0%

4.0%

2.0%

0.0%
0 2 4 6 8 0 2 4 6 8
Valor

item g

library(ggridges)
ggplot(iris, aes(x = Sepal.Width, y = Species, fill = factor(stat(quantile)))) +

7
stat_density_ridges(
geom = "density_ridges_gradient",
calc_ecdf = TRUE,
quantiles = c(0.025, 0.975)
) +
scale_fill_manual(
name = "Probabilidade", values = c("#FF0000A0", "#A0A0A0A0", "#0000FFA0"),
labels = c("(0, 0.025]", "(0.025, 0.975]", "(0.975, 1]")
)+
xlab("Largura da sépala")+
ylab("Espécies")+
ggtitle("Distribuições das larguras da sépala por espécie")

Distribuições das larguras da sépala por espécie

virginica Probabilidade
Espécies

(0, 0.025]
(0.025, 0.975]
(0.975, 1]
versicolor

setosa

2 3 4
Largura da sépala

item h

# item h)
box_Sepal.Width<-ggplot(iris,aes(x=as.factor(Species), y=Sepal.Width, fill=as.factor(Species)))+
geom_boxplot()+
scale_fill_manual(name="Espécie", values = c("#FF0000A0","green", "#0000FFA0"))+
xlab("Espécie")+
ylab("Larguras da sépala")+
ggtitle("Larguras das Sépalas (em cm)")+
theme(legend.position = "none")

8
box_Sepal.Length<-ggplot(iris,aes(x=as.factor(Species), y=Sepal.Length, fill=as.factor(Species)))+
geom_boxplot()+
scale_fill_manual(name="Espécie",values = c("#FF0000A0","green", "#0000FFA0"))+
xlab("Espécie")+
ylab("Comprimentos da sépala")+
labs(color="Espécie")+
ggtitle("Comprim. das Sépalas (em cm)")+
theme(legend.position = "none")
box_Petal.Width<-ggplot(iris,aes(x=as.factor(Species), y=Petal.Width, fill=as.factor(Species)))+
geom_boxplot()+
scale_fill_manual(name="Espécie",values = c("#FF0000A0", "green", "#0000FFA0"))+
xlab("Espécie")+
ylab("Larguras da pétala")+
labs(color="Espécie")+
ggtitle("Larguras das pétalas (em cm)")+
theme(legend.position = "none")
box_Petal.Length<-ggplot(iris,aes(x=as.factor(Species), y=Petal.Length, fill=as.factor(Species)))+
geom_boxplot()+
scale_fill_manual(name="Espécie",values = c("#FF0000A0", "green", "#0000FFA0"))+
xlab("Espécie")+
ylab("Comprimentos da pétala")+
labs(color="Espécie")+
ggtitle("Comprim. das pétalas (em cm)")+
theme(legend.position = "none")

library(ggpubr)

ggarrange(box_Sepal.Width,box_Sepal.Length,box_Petal.Width,box_Petal.Length, ncol=2, nrow=2)

9
Larguras das Sépalas (em cm) Comprim. das Sépalas (em cm)

Comprimentos da sépala
4.5 8
Larguras da sépala

4.0
7
3.5
6
3.0

2.5 5

2.0
setosa versicolor virginica setosa versicolor virginica
Espécie Espécie

Larguras das pétalas (em cm) Comprim. das pétalas (em cm)

Comprimentos da pétala
2.5
Larguras da pétala

6
2.0

1.5
4
1.0

0.5 2

0.0
setosa versicolor virginica setosa versicolor virginica
Espécie Espécie

10

Você também pode gostar