Você está na página 1de 36

🅼🅴🆃🅾🅳🅾🆂

🆀🆄🅰🅽🆃🅸🆃
🅰🆃🅸🆅🅾🆂

🅿🆁🅾🅵🅴🆂🆂🅾🆁
🅴🅳🆄🅰🆁🅳🅾 🅲🅰🆁🆅🅰🅻🅷🅾
🆃🆁🅸🅻🅷🅰
🅳🅴
🅰🅿🆁🅴🅽🅳🅸
🆉🅰🅶🅴🅼
🅰🆄🅻🅰 3

🅞🅡🅖🅐🅝🅘🅩🅐🅝🅓🅞 🅔 🅥🅘🅢🅤🅐🅛🅘🅩🅐🅝🅓🅞 🅓🅐🅓🅞🅢


🅾🅱🅹🅴🆃🅸🆅🅾🆂

O objetivo desta aula é:


1. Construir tabelas e gráficos para dados
categóricos e numéricos
2. Apresentar de forma apropriada os
gráficos
3. Organizar e analisar muitas variáveis
🅾🆁🅶🅰🅽🅸🆉🅰🅽🅳🅾 🅳🅰🅳🅾🆂 🅲🅰🆃🅴🅶🅾🆁🅸🅲🅾🆂

Você organiza dados categóricos tabulando os valores de uma determinada variável com base
nas categorias e posicionando os resultados em tabelas.
TABELA 1.2.1 - O que os patrões demandam durante o período de férias
Uma tabela resumida tabula os
Demanda Percentagem (%)
valores sob a forma de frequências
ou percentuais, no que se refere a Nenhuma demanda 65
cada uma das categorias. Esta disponível 18
Trabalhar durante parte do 13
tempo
Outra 4
Fonte: Dados extraídos e adaptados de “How Does Their Boss Treat Vacation Time?” USA
Today, 28 de julho de 2011, p. 1B.

Aula 3 – Organizando e Visualizando Dados | Centro Universitário Dr. Leão Sampaio | Professor Dr. José Eduardo de Carvalho Lima
🅾🆁🅶🅰🅽🅸🆉🅰🅽🅳🅾
TABELA 1.2.2 - Tabela de Contingência exibindo o tipo de
🅳🅰🅳🅾🆂
fundo e o nível de risco
🅲🅰🆃🅴🅶🅾🆁🅸🅲🅾🆂

Uma tabela de contingência faz uma


tabulação cruzada, ou agrega de
NIVEL DE RISCO
modo combinado, as respostas para
as variáveis categóricas, permitindo TIPO DE FUNDO Baixo Médio Alto Total
que você estude padrões que possam Crescimento 62 113 48 223
existir entre as variáveis. Valorização 37 32 26 95
Total 99 145 74 318

Aula 3 – Organizando e Visualizando Dados | Centro Universitário Dr. Leão Sampaio | Professor Dr. José Eduardo de Carvalho Lima
🅾🆁🅶🅰🅽🅸🆉🅰🅽🅳🅾
🅳🅰🅳🅾🆂 🅽🆄🅼🅴🆁🅸🅲🅾🆂

Você organiza dados numéricos criando disposições Uma disposição ordenada organiza
ordenadas ou distribuições. os valores de uma variável em
ordem de classificação, partindo do
menor valor para o maior.

TABELA 1.2.3 - Custo por Refeição para 50 Restaurantes do Centro da Cidade


Custos de Refeições em Restaurantes do Centro da Cidade
27 53 53 65 47 46 47 51 81 57 63 53 30 63 68 29 44 48 57 29 34 42 76 42 53 30
64 88 57 82 51 38 41 32 69 45 55 38 54 57 31 62 44 44 43 53 45 55 92 92

Aula 3 – Organizando e Visualizando Dados | Centro Universitário Dr. Leão Sampaio | Professor Dr. José Eduardo de Carvalho Lima
🅳🅸🆂🆃🆁🅸🅱🆄🅸🅲🅰🅾 🅳🅴
🅵🆁🅴🆀🆄🅴🅽🅲🅸🅰🆂
Custos de Refeições em Restaurantes do Centro da Cidade
27 53 53 65 47 46 47 51 81 57 63 53 30 63 68 29 44 48 57 29 34 42 76 42 53 30
64 88 57 82 51 38 41 32 69 45 55 38 54 57 31 62 44 44 43 53 45 55 92 92

Frequência para o centro


Custo da refeição da cidade
20 porém menos do que 30 3
30 porém menos do que 40 7 A distribuição de frequências permite que se
40 porém menos do que 50 13 chegue a algumas conclusões preliminares
50 porém menos do que 60 14 sobre os dados. Por exemplo, a Tabela mostra
60 porém menos do que 70 7 que o custo de refeições nos restaurantes do
70 porém menos do que 80 1 centro da cidade está concentrado entre $40 e
80 porém menos do que 90 3 $60.
90 porém menos do que 100 2
Total 50
Aula 3 – Organizando e Visualizando Dados | Centro Universitário Dr. Leão Sampaio | Professor Dr. José Eduardo de Carvalho Lima
🅳🅸🆂🆃🆁🅸🅱🆄🅸🅲🅰🅾
🅳🅴 🅵🆁🅴🆀🆄🅴🅽🅲🅸🅰🆂
Uma distribuição de frequências dispõe, de modo tabular, os valores de uma
variável numérica em um conjunto de classes numericamente ordenadas.
Cada uma das classes agrupa um intervalo de valores mutuamente excludentes,
conhecido como intervalo de classe. Cada um dos valores pode ser atribuído a
uma, e somente uma, única classe, e todos os valores devem necessariamente
estar contidos em um dos intervalos de classes.

valor mais alto − valor mais baixo


Amplitude do intervalo =
número de classes

Aula 3 – Organizando e Visualizando Dados | Centro Universitário Dr. Leão Sampaio | Professor Dr. José Eduardo de Carvalho Lima
🅳🅸🆂🆃🆁🅸🅱🆄🅸🅲🅰🅾 🅳🅴
🅵🆁🅴🆀🆄🅴🅽🅲🅸🅰🆂
Custos de Refeições em Restaurantes do Centro da Cidade
27 29 29 30 30 31 32 34 38 38 41 42 42 43 44 44 44 45 45 46 47 47 48 51 51
53 53 53 53 53 54 55 55 57 57 57 57 62 63 63 64 65 68 69 76 81 82 88 92 92
Frequência para o
Custo da refeição centro da cidade

Total
Aula 3 – Organizando e Visualizando Dados | Centro Universitário Dr. Leão Sampaio | Professor Dr. José Eduardo de Carvalho Lima
🅳🅸🆂🆃🆁🅸🅱🆄🅸🅲🅰🅾 🅳🅴
🅵🆁🅴🆀🆄🅴🅽🅲🅸🅰🆂
Custos de Refeições em Restaurantes do Centro da Cidade
27 29 29 30 30 31 32 34 38 38 41 42 42 43 44 44 44 45 45 46 47 47 48 51 51
53 53 53 53 53 54 55 55 57 57 57 57 62 63 63 64 65 68 69 76 81 82 88 92 92
Frequência para o centro
Custo da refeição da cidade
20 porém menos do que 30 3
30 porém menos do que 40 7
40 porém menos do que 50 13
50 porém menos do que 60 14
60 porém menos do que 70 7
70 porém menos do que 80 1
80 porém menos do que 90 3
90 porém menos do que 100 2
Total 50
Aula 3 – Organizando e Visualizando Dados | Centro Universitário Dr. Leão Sampaio | Professor Dr. José Eduardo de Carvalho Lima
🅳🅸🆂🆃🆁🅸🅱🆄🅸🅲🅰🅾 🅳🅴 🅵🆁🅴🆀🆄🅴🅽🅲🅸🅰🆂
🆁🅴🅻🅰🆃🅸🆅🅰🆂 🅴 🅿🅴🆁🅲🅴🅽🆃🅰🅶🅴🅽🆂

Uma distribuição de frequências relativas apresenta a frequência relativa, ou proporção, do total


correspondente a cada um dos grupos que cada uma das classes representa.
A proporção, ou frequência relativa, em cada um dos grupos é igual à quantidade de valores em cada
uma das classes dividida pela quantidade total de valores.

número de valores em cada classe


Frequência Relativa =
número total de valores

Aula 3 – Organizando e Visualizando Dados | Centro Universitário Dr. Leão Sampaio | Professor Dr. José Eduardo de Carvalho Lima
🅳🅸🆂🆃🆁🅸🅱🆄🅸🅲🅰🅾
🅳🅴 🅵🆁🅴🆀🆄🅴🅽🅲🅸🅰🆂 TABELA 1.2.5 - Distribuições de Frequências Relativas e Distribuições
de Percentagens para o Custo de Refeições em Restaurantes do
🆁🅴🅻🅰🆃🅸🆅🅰🆂 🅴 Centro da Cidade
🅿🅴🆁🅲🅴🅽🆃🅰🅶🅴🅽🆂

Frequência para o Frequência


Custo da Refeição centro da cidade Relativa
20 porém menos do que 30 3
30 porém menos do que 40 7
40 porém menos do que 50 13
50 porém menos do que 60 14
60 porém menos do que 70 7
70 porém menos do que 80 1
80 porém menos do que 90 3
90 porém menos do que 100 2
Total 50
Aula 3 – Organizando e Visualizando Dados | Centro Universitário Dr. Leão Sampaio | Professor Dr. José Eduardo de Carvalho Lima
🅳🅸🆂🆃🆁🅸🅱🆄🅸🅲🅰🅾
🅳🅴 🅵🆁🅴🆀🆄🅴🅽🅲🅸🅰🆂 TABELA 1.2.5 - Distribuições de Frequências Relativas e Distribuições
de Percentagens para o Custo de Refeições em Restaurantes do
🆁🅴🅻🅰🆃🅸🆅🅰🆂 🅴 Centro da Cidade
🅿🅴🆁🅲🅴🅽🆃🅰🅶🅴🅽🆂

Frequência para o Frequência


Custo da Refeição centro da cidade Relativa
20 porém menos do que 30 3 0.06
30 porém menos do que 40 7 0.14
40 porém menos do que 50 13 0.26
50 porém menos do que 60 14 0.28
60 porém menos do que 70 7 0.14
70 porém menos do que 80 1 0.02
80 porém menos do que 90 3 0.06
90 porém menos do que 100 2 0.04
Total 50 1
Aula 3 – Organizando e Visualizando Dados | Centro Universitário Dr. Leão Sampaio | Professor Dr. José Eduardo de Carvalho Lima
🅳🅸🆂🆃🆁🅸🅱🆄🅸🅲🅰🅾 🅳🅴 🅵🆁🅴🆀🆄🅴🅽🅲🅸🅰🆂
🆁🅴🅻🅰🆃🅸🆅🅰🆂 🅴 🅿🅴🆁🅲🅴🅽🆃🅰🅶🅴🅽🆂

Uma distribuição de percentagens apresenta a percentagem do total correspondente a cada um dos


grupos que cada uma das classes representa. A percentagem em cada grupo corresponde à sua
respectiva proporção multiplicada por 100 %.

Aula 3 – Organizando e Visualizando Dados | Centro Universitário Dr. Leão Sampaio | Professor Dr. José Eduardo de Carvalho Lima
🅳🅸🆂🆃🆁🅸🅱🆄🅸🅲🅰🅾
🅳🅴 🅵🆁🅴🆀🆄🅴🅽🅲🅸🅰🆂 TABELA 1.2.5 - Distribuições de Frequências Relativas e Distribuições
de Percentagens para o Custo de Refeições em Restaurantes do
🆁🅴🅻🅰🆃🅸🆅🅰🆂 🅴 Centro da Cidade
🅿🅴🆁🅲🅴🅽🆃🅰🅶🅴🅽🆂

Frequência para o Frequência


Custo da Refeição centro da cidade Relativa Percentagem (%)
20 porém menos do que 30 3 0.06
30 porém menos do que 40 7 0.14
40 porém menos do que 50 13 0.26
50 porém menos do que 60 14 0.28
60 porém menos do que 70 7 0.14
70 porém menos do que 80 1 0.02
80 porém menos do que 90 3 0.06
90 porém menos do que 100 2 0.04
Total 50 1
Aula 3 – Organizando e Visualizando Dados | Centro Universitário Dr. Leão Sampaio | Professor Dr. José Eduardo de Carvalho Lima
🅳🅸🆂🆃🆁🅸🅱🆄🅸🅲🅰🅾
🅳🅴 🅵🆁🅴🆀🆄🅴🅽🅲🅸🅰🆂 TABELA 1.2.5 - Distribuições de Frequências Relativas e Distribuições
de Percentagens para o Custo de Refeições em Restaurantes do
🆁🅴🅻🅰🆃🅸🆅🅰🆂 🅴 Centro da Cidade
🅿🅴🆁🅲🅴🅽🆃🅰🅶🅴🅽🆂

Frequência para o Frequência


Custo da Refeição centro da cidade Relativa Percentagem (%)
20 porém menos do que 30 3 0.06 6
30 porém menos do que 40 7 0.14 14
40 porém menos do que 50 13 0.26 26
50 porém menos do que 60 14 0.28 28
60 porém menos do que 70 7 0.14 14
70 porém menos do que 80 1 0.02 2
80 porém menos do que 90 3 0.06 6
90 porém menos do que 100 2 0.04 4
Total 50 1 100
Aula 3 – Organizando e Visualizando Dados | Centro Universitário Dr. Leão Sampaio | Professor Dr. José Eduardo de Carvalho Lima
🅳🅸🆂🆃🆁🅸🅱🆄🅸🅲🅰🅾
🅰🅲🆄🅼🆄🅻🅰🅳🅰
A distribuição de percentagens acumuladas proporciona um modo de apresentar
informações sobre a percentagem de valores que se encontram abaixo de um
determinado montante. Você utiliza a distribuição de percentagens como a base para
construir uma distribuição de percentagens acumuladas.

Aula 3 – Organizando e Visualizando Dados | Centro Universitário Dr. Leão Sampaio | Professor Dr. José Eduardo de Carvalho Lima
Percentual (%) dos Custos de Refeições que São Mais
Intervalo de Classe Percentagem (%) Baixos que o Limite Inferior do Intervalo de Classe
20 porém menos do que 30 6 0 (não existem refeições que custem menos do que 20)
30 porém menos do que 40 14 6
40 porém menos do que 50 26 20
50 porém menos do que 60 28 46
60 porém menos do que 70 14 74
70 porém menos do que 80 2 88
80 porém menos do que 90 6 90
90 porém menos do que 100 4 96
100 porém menos do que 110 0 100

🅳🅸🆂🆃🆁🅸🅱🆄🅸🅲🅰 TABELA 1.2.6 Desenvolvendo a Distribuição de Percentagens


Acumuladas para Custos de Refeições nos Restaurantes do Centro da
🅾 🅰🅲🆄🅼🆄🅻🅰🅳🅰 Cidade

Aula 3 – Organizando e Visualizando Dados | Centro Universitário Dr. Leão Sampaio | Professor Dr. José Eduardo de Carvalho Lima
Custa da Percentual dos Custos de Refeições no Centro da Cidade que
refeição ($) Custam Menos do que uma Quantia Indicada
Por exemplo, pode ser que
20 0
você deseje conhecer qual
30 6
40 20
percentagem das refeições nos
50 46 restaurantes do centro da
60 74 cidade custa menos de $40 ou
70 88 qual percentagem custa menos
80 90 de $50.
90 96
100 100

🅳🅸🆂🆃🆁🅸🅱🆄🅸🅲🅰 TABELA 1.2.7 Distribuições de Percentagens Acumuladas para Custos


🅾 🅰🅲🆄🅼🆄🅻🅰🅳🅰 de Refeições nos Restaurantes do Centro da Cidade

Aula 3 – Organizando e Visualizando Dados | Centro Universitário Dr. Leão Sampaio | Professor Dr. José Eduardo de Carvalho Lima
🆅🅸🆂🆄🅰🅻🅸🆉🅰🅽🅳🅾 🅳🅰🅳🅾🆂
🅲🅰🆃🅴🅶🅾🆁🅸🅲🅾🆂
O gráfico que você escolhe para visualizar os dados para uma única variável categórica
dependem do fato de você estar buscando enfatizar o modo como as categorias se comparam
diretamente uma à outra (gráfico de barras), ou o modo como as categorias formam partes de
um todo (gráfico de pizza), ou se você tem dados que estejam concentrados em algumas
poucas entre as suas categorias (diagrama de Pareto). Para visualizar os dados para duas
variáveis categóricas, você utiliza um gráfico de barras paralelas.

Aula 3 – Organizando e Visualizando Dados | Centro Universitário Dr. Leão Sampaio | Professor Dr. José Eduardo de Carvalho Lima
🆅🅸🆂🆄🅰🅻🅸🆉🅰🅽🅳🅾 🅳🅰🅳🅾🆂
🅲🅰🆃🅴🅶🅾🆁🅸🅲🅾🆂
TABELA 1.2.1 - O que os patrões demandam durante o período de férias

Demanda Percentagem (%)


Nenhuma demanda 65
Esta disponível 18
Trabalhar durante parte do 13
tempo
Outra 4
Fonte: Dados extraídos e adaptados de “How Does Their Boss Treat Vacation Time?” USA
Today, 28 de julho de 2011, p. 1B.

Aula 3 – Organizando e Visualizando Dados | Centro Universitário Dr. Leão Sampaio | Professor Dr. José Eduardo de Carvalho Lima
🅶🆁🅰🅵🅸🅲🅾 🅳🅴
🅱🅰🆁🆁🅰🆂
Um gráfico de barras visualiza uma variável
categórica como uma série de barras, com
cada uma das barras representando a
identificação de cada uma das categorias.

O comprimento de cada uma das barras


representa a frequência ou a percentagem de
valores que se posicionam em uma
determinada categoria, e cada uma das
barras é separada por um espaço conhecido
como uma lacuna.
🅶🆁🅰🅵🅸🅲🅾 🅳🅴
🅿🅸🆉🆉🅰
Um gráfico de pizza utiliza partes de um
círculo que representam o detalhamento
de cada uma das categorias.

O tamanho de cada uma das partes, ou


fatia da pizza, varia de acordo com a
porcentagem em cada uma das categorias.
🅳🅸🅰🅶🆁🅰🅼🅰 🅳🅴 🅿🅰🆁🅴🆃🅾
Em um diagrama de Pareto, os resultados
correspondentes a cada uma das
categorias são inseridos em um gráfico
sob a forma de barras verticais, em
ordem descendente, de acordo com suas
respectivas frequências, e são
combinados com uma linha de
percentagens acumuladas no mesmo
gráfico.
🅶🆁🅰🅵🅸🅲🅾 🅳🅴 🅱🅰🆁🆁🅰🆂
🅿🅰🆁🅰🅻🅴🅻🅰🆂
TABELA - Tabela de contingência exibindo o tipo de fundo e o nível de risco
🅶🆁🅰🅵🅸🅲🅾 🅳🅴 🅱🅰🆁🆁🅰🆂
🅿🅰🆁🅰🅻🅴🅻🅰🆂
Um gráfico de barras paralelas utiliza
conjuntos de barras para ilustrar as
respostas combinadas a partir de duas
variáveis categóricas.
🆅🅸🆂🆄🅰🅻🅸🆉🅰🅽🅳
🅾 🅳🅰🅳🅾🆂
🅽🆄🅼🅴🆁🅸🅲🅾🆂

Você visualiza os dados de uma variável


numérica por meio de uma variedade de
técnicas que mostram a distribuição de valores.

Essas técnicas incluem a disposição ramo e


folha, o histograma, o polígono de percentagens
e o polígono de percentagens acumuladas
(ogiva) e o box-plot, que requer medidas
descritivas resumidas.
🅷🅸🆂🆃🅾🅶🆁🅰🅼🅰
Visualiza os dados sob a forma de um gráfico
de barras verticais, no qual cada uma das
barras representa um intervalo de classe, a
partir de uma distribuição de frequências ou
de uma distribuição de percentagens.

A variável numérica ao longo do eixo


horizontal e utiliza o eixo vertical de modo a
representar a frequência ou a percentagem
dos valores, para cada um dos intervalos de
classe. Jamais existem quaisquer tipos de
lacunas entre as barras adjacentes em um
histograma.
🅿🅾🅻🅸🅶🅾🅽🅾 🅳🅴
🅿🅴🆁🅲🅴🅽🆃🅰🅶🅴🅽🆂

Ao utilizar uma variável categórica para


dividir os dados de uma variável numérica em
dois ou mais grupos, você visualiza os dados
construindo um polígono de percentagens.

Esse gráfico utiliza os pontos médios de cada


um dos intervalos de classe para representar
os dados de cada uma das classes e, depois
disso, aponta no gráfico os pontos médios, em
suas respectivas percentagens de classe, sob
a forma de pontos em uma linha ao longo do
eixo X.
🅿🅾🅻🅸🅶🅾🅽🅾 🅳🅴 🅿🅴🆁🅲🅴🅽🆃🅰🅶🅴🅽🆂
🅰🅲🆄🅼🆄🅻🅰🅳🅰🆂 (🅾🅶🅸🆅🅰)

O polígono de percentagens acumuladas, ou


ogiva, utiliza a distribuição de percentagens
acumuladas, para exibir as percentagens
acumuladas ao longo do eixo Y.

Diferentemente do polígono de percentagens,


os limites inferiores do intervalo de classe
para a variável numérica aparecem no gráfico,
em suas respectivas percentagens de classe,
como pontos em uma linha ao longo do eixo X.
🆅🅸🆂🆄🅰🅻🅸🆉🅰🅽🅳🅾 🅳🆄🅰🆂
🆅🅰🆁🅸🅰🆅🅴🅸🆂 🅽🆄🅼🅴🆁🅸🅲🅰🆂
Visualizar duas variáveis numéricas conjuntamente pode revelar possíveis
relações entre duas variáveis. Para visualizar duas variáveis numéricas, você
constrói um gráfico de dispersão. No que se refere ao caso especial em que uma
das variáveis que você tem em mãos representa a passagem de tempo, você
utiliza um gráfico de séries temporais.
🅶🆁🅰🅵🅸🅲🅾 🅳🅴 🅳🅸🆂🅿🅴🆁🆂🅰🅾

Um gráfico de dispersão explora a possível


relação entre duas variáveis numéricas, ao
inserir no gráfico os valores
correspondentes a uma variável numérica
no eixo horizontal, ou X, e os valores
correspondentes a uma segunda variável
numérica no eixo vertical, ou Y.
Atividade de pesquisa 1
Pesquisar e estudar para próxima aula “Coeficiente de
correlação de Pearson”.
🅶🆁🅰🅵🅸🅲🅾 🅳🅴 🆂🅴🆁🅸🅴🆂
🆃🅴🅼🅿🅾🆁🅰🅸🆂
Um gráfico de séries temporais insere os
valores de uma variável no eixo Y e insere
no eixo X o período de tempo associado a
cada um dos valores numéricos.

Um gráfico de séries temporais pode ajudar


a visualizar tendências nos dados, que
ocorrem ao longo do tempo.
🅿🆁🅾🆇🅸🅼🅰 🅰🆄🅻🅰
🄾🅁🄶🄰🄽🄸🅉🄰🄽🄳🄾 🄴
🅅🄸🅂🅄🄰🄻🄸🅉🄰🄽🄳🄾
🄳🄰🄳🄾🅂
🄲🄰🅃🄴🄶🄾🅁🄸🄲🄾🅂 🄴
🄽🅄🄼🄴🅁🄸🄲🄾🅂 🅄🅂🄰🄽🄳🄾
🄵🄴🅁🅁🄰🄼🄴🄽🅃🄰
🄲🄾🄼🄿🅄🅃🄰🄲🄸🄾🄽🄰🄻
“🄴🅇🄲🄴🄻”
🅿🆁🅾🅵🅴🆂🆂🅾🆁
🄴/🄾🅄
🅿🆁🅾🅵🅴🆂🆂🅾🆁
🅂🄾🄵🅃🅆🄰🅁🄴
🅴🅳🆄🅰🆁🅳🅾 “🅁”
🅴🅳🆄🅰🆁🅳🅾🅲🅰🆁🆅🅰🅻🅷🅾
🅲🅰🆁🆅🅰🅻🅷🅾
🅾🅱🆁🅸🅶🅰
🅳🅾!

🅿🆁🅾🅵🅴🆂🆂🅾🆁
🅿🆁🅾🅵🅴🆂🆂🅾🆁
🅿🆁🅾🅵🅴🆂🆂🅾🆁
🅴🅳🆄🅰🆁🅳🅾
🅴🅳🆄🅰🆁🅳🅾
🅴🅳🆄🅰🆁🅳🅾 🅲🅰🆁🆅🅰🅻🅷🅾
🅲🅰🆁🆅🅰🅻🅷🅾
🅲🅰🆁🆅🅰🅻🅷🅾

Você também pode gostar