Escolar Documentos
Profissional Documentos
Cultura Documentos
Exercício 1
Considere os dados a seguir sobre a durabilidade (em meses) de 1000 baterias.
Construa os histogramas pelos métodos de frequência e densidade. Qual deve ser utilizado? Jus-
tifique.
Calculando a amplitude dos intervalos de classe (base) e a densidade de frequência (h)
frequência relativa
h= ,
base
temos
Os histogramas construídos pelo método da frequência e pelo método da densidade são apresen-
tados a seguir.
1
Utilizando a frequência Utilizando a densidade
0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
350
300
250
Densidade (h)
Frequência
200
150
100
50
0
0 3 6 9 12 15 18 21 24 0 3 6 9 12 15 18 21 24
Durabilidade Durabilidade
Como as amplitudes das classes são de tamanhos diferentes, deve ser utilizado o histograma cons-
truído pelo método de densidade, que retrata o que de fato ocorre com os dados dessa variável
2
Exercício 2
Para solicitar o cartão de crédito de uma loja, os clientes precisam responder o seguinte questionário:
• Nome completo:
• CPF:
• Telefone:
3
(b) Em um certo dia, 7 pessoas solicitaram o cartão da loja. As informações
sobre idade, nível de escolaridade, renda mensal e se já possui ou não cartão de
crédito dessas pessoas estão dispostas na tabela a seguir.
i. Que gráfico você utilizaria para representar a variável nível de escolaridade? e para a variável
idade?
Nível de escolaridade, por ser uma variável qualitativa, poderia ser representada através de um
gráfico de pizza ou de barras. Como idade é uma variável quantitativa, pode-se representá-la
utilizando um boxplot ou histograma.
ii. Construa dois gráficos de pizza, um que represente o nível de escolaridade das pessoas que
possuem cartão de crédito e outro que represente o nível de escolaridade das pessoas que não
possuem cartão de crédito. Inclua em cada gráfico as porcentagens corretas.
– Passo 1: Calcular as porcentagens. Observe que, das quatro pessoas que possuem cartão
de crédito, duas delas possuem nível médio (2/4 ou 50%), uma possui pós-graduação
(1/4 ou 25%) e uma possui nível superior (1/4 ou 25%). Já das três pessoas que não
possuem cartão de crédito, uma possui nível fundamental (1/3 ou 33,33%), uma possui
nível superior (1/3 ou 33,33%) e uma possui nível médio (1/3 ou 33,33%).
– Passo 2: Dividir o gráfico em setores (fatias) de acordo com as porcentagens, como está
ilustrado na figura a seguir.
4
SIM NÃO
Médio (50%)
Fundamental (33%)
Médio (33%)
– Passo 1: Inserção dos dados. Ir na guia “Dados” ) “Novo conjunto de dados” ) Escolher
o nome que deseja para o conjunto de dados e clicar em “OK”. Depois, entrar com os
valores como o exemplo abaixo e clicar em “OK”.
– Passo 2: Construir os gráficos. Para construir o gráfico de setores para as pessoas que
possuem cartão de crédito vá na guia “Gráficos” ! “Gráfico de Pizza”. Na aba “Dados”
selecione a variável “SIM” na lista de variáveis e clique em “OK”. O gráfico será exibido
em uma nova janela. Para copiá-lo, clique com o botão direito sobre o gráfico e escolha a
opção “Copiar como Bitmap”. Em seguida cole no documento da sua lista de exercícios.
Repita o mesmo procedimento para a variável “NAO”. O resultado obtido deverá ser igual
a figura anterior.
5
iii. O gráfico a seguir foi construído para representar a variável renda mensal. Esse gráfico é ade-
quado considerando o tipo da variável? Que outro gráfico poderia ser utilizado? Justifique sua
resposta.
Renda Mensal
1200 (14%)
1500 (14%)
1100 (14%)
2450 (14%)
5800 (14%)
3100 (14%)
4000 (14%)
Não, o gráfico de pizza não é adequado para representar a variável renda mensal, pois essa variá-
vel é quantitativa. Nesse caso, podemos representá-la através de um histograma, por exemplo.
O histograma para a variável renda mensal está disposto na figura a seguir.
0.0004
0.0003
density
0.0002
0.0001
0.0000
renda
6
Para obter o histograma pelo Rcmdr, é só seguir os passos:
– Ir na guia “Dados” ) “Novo conjunto de dados” ) Escolher o nome que deseja para
o conjunto de dados e clicar em “OK”. Depois, entrar com os valores da variável renda
como o exemplo abaixo e clicar em “OK”.
7
Exercício 3
O conjunto de dados IRIS presente na biblioteca padrão do R apresenta valores de comprimento e
largura de pétalas e sépalas de 150 flores de íris. As variáveis são: Sepal.Length: “Comprimento da
sépala”; Sepal.Width: “Largura da sépala”; Petal.Length: “Comprimento da pétala” e Petal.Width:
“Largura da pétala”. O conjunto de dados apresenta outra variável chamada Species que apresenta a
qual espécie cada flor pertence, que pode ser setosa, versicolor ou virginica.
Considere apenas as variáveis Sepal.Width e Petal.Width independente da espécie para responder
os ítens abaixo com uso de recurso computacional.
Ler o conjunto de dados: Clique na guia “Dados” ! “Conjunto de dados em pacotes” ! “Ler
dados de pacote “attachado” ”. Escolher pacote “datasets” com clique duplo e em seguida escolher o
conjunto de dados “iris” com clique duplo. Por fim, clique em “OK”.
• Cálculo das medidas resumo: Clique na guia “Estatísticas” ! “Resumos” ! “Resumos nu-
méricos”. Na aba “Dados” selecione as variáveis “Sepal.Width” e “Petal.Width” na lista de
variáveis e em seguida na aba “Estatísticas” selecione as estatísticas de interesse, que no nosso
caso são: média, desvio padrão, coeficiente de variação e o quartil 0,50 (digite 0.50 em “Quan-
tis”). Clique em “OK”.
O resultado é apresentado a seguir. Na coluna “mean” estão dispostas as médias, na coluna “sd” estão
dispostos os desvios padrões.
mean sd cv 50% n
Petal.Width 1,199333 0,7622377 0,6355511 1,3 150
Sepal.Width 3,057333 0,4358663 0,1425642 3,0 150
As variâncias são obtidas pelo quadrado dos desvios padrões. Uma forma de obter usando o
Rcmdr é:
Na janela “RScript” do Rcmdr digite o seguinte comando e depois submeta (ou Ctrl+R):
0.7622377^2
> 0.7622377^2
[1] 0.5810063
8
Repetindo para o desvio padrão de “Sepal.Width”, temos:
> 0.4358663^2
[1] 0.1899794
Como pode ser observado, a largura da pétala é mais dispersa do que a largura da sépala das flores
de Iris, tanto em termos de desvio padrão quanto de coeficiente de variação.
16 ●
34 ●
33 ●
4.0
2.0
3.5
1.5
Sepal.Width
Petal.Width
3.0
1.0
2.5
0.5
2.0
61 ●
9
apresenta uma observação discrepante muito abaixo e três observações discrepantes muito acima do
conjunto de valores.
Exercício 4
Sabe-se que, embora os usuários da Internet gostem da conveniência das compras on-line, eles real-
mente têm preocupações em relação à privacidade e à segurança. Um estudo buscou saber se essa
preocupação é a mesma entre homens e mulheres. Utilizando uma amostra de 825 mulheres e 775
homens usuários da Internet, questionou-se o grau de concordância com a declaração: “Eu não gosto
de fornecer o número de meu cartão de crédito ou informações pessoais on-line”. Os dados obtidos
estão disponíveis no arquivo dados_internet.xlsx e são resumidos na tabela a seguir.
• Concordância com uma declaração sobre fornecimento de dados na internet: qualitativa ordinal.
Para construir o gráfico de setores para as mulheres vá na guia “Gráficos” ! “Gráfico de Pizza”.
Na aba “Dados” selecione a variável “Mulher” na lista de variáveis e clique em “OK”. O gráfico será
exibido em uma nova janela. Para copiá-lo, clique com o botão direito sobre o gráfico e escolha a
opção “Copiar como Bitmap”. Em seguida cole no documento da sua lista de exercícios. Repita o
10
mesmo procedimento para a variável “Homem”. Os gráficos de setores construídos para gênero de
acordo com a concordância são apresentados a seguir.
Mulher Homem
Concorda (33%)
Concorda (30%)
Discorda (15%)
Discorda (26%)
• Já para a categoria Discorda, vemos que 26% das mulheres discordam da afirmação e apenas
15% dos homens discordam. Ou seja, mais uma vez nota-se que as mulheres tem menor receio
em utilizar informações pessoais e de crédito online.
• Conclui-se que as distribuições de concordância com a declaração: “Eu não gosto de fornecer o
número de meu cartão de crédito ou informações pessoais on-line” são diferentes para homens
e mulheres.
11