Escolar Documentos
Profissional Documentos
Cultura Documentos
Instruções
Box Plot
Preencha os
campos do
Box plot como
mostra a Figura
ao lado
3. Execute o fluxo e vá para Visualizações para obter o gráfico. Salve a figura do gráfico (como
PNG) para colá-la no documento que será entregue. Ou então tire um print da sua tela e cole-o
no documento
O Box plot ou diagrama de caixa é um gráfico que permite visualizar a mediana, os quartis,
valores extremos e, opcionalmente, valores discrepantes (os outliers) de um atributo do
conjunto de dados. Dessa forma, com ele podemos ver valores centrais e extremos de uma
distribuição, e ter uma ideia da variabilidade dos valores dessa distribuição.
Observe as notas das escolas no box plot. Qual tipo de escola tem a maior mediana? Qual tem
a maior variabilidade de notas? E qual tem a maior quantidade de valores discrepantes?
Histograma
4. Volte para o mesmo fluxo de trabalho para continuar editando-o. Agora vamos calcular a
frequência absoluta de cada tipo de escola e plotar isso em um histograma.
Exemplo:
No Lemonade, não existe uma operação pronta para montar um histograma. Mas podemos
fazer isso com duas operações: uma para contar as frequências e a outra para plotar o gráfico
de barras. Já utilizamos essas duas caixinhas em aulas práticas anteriores, veja detalhes dessas
operações a seguir:
Permite agrupar as linhas da tabela pelos valores de um atributo, e aplica uma função a cada
grupo formado. Exemplos de funções que podem ser aplicadas incluem o Count (para contar
o número de elementos em cada grupo) e o Avg (Para tirar a média dos valores de cada
grupo)
A caixinha que iremos utilizar (Agrupar linhas por função) é a mesma da aula prática 05,
porém lá o objetivo era outro (calcular uma nota média para cada tipo de escola). Logo, a
configuração da caixinha na aula de hoje vai ser diferente.
Ao escolher uma função de agregação, temos que preencher três campos, a saber:
(1) Atributo: esse é o atributo que vai ser usado como parâmetro da função, ou seja, sobre
qual atributo a função será aplicada. Na aula 05, queríamos calcular a média das notas das
escolas. Na aula 06, queremos contar o número de escolas de cada tipo.
(2) Função: é o que queremos calcular. Ex.: uma contagem (Count), uma média (Avg)
(3) Novo atributo: você escolhe o nome que quiser para ele. É como se estivéssemos criando
uma coluna nova na tabela, com o novo nome que você escolheu. O novo atributo será
definido pelo resultado da aplicação da função - item (2) - sobre o atributo antigo - item (1).
5. Execute o fluxo e inclua o histograma gerado no documento que você irá submeter.
Seu fluxo final deve ficar parecido com a imagem a seguir (tente fazer sem olhar):