Você está na página 1de 11

MAE0116 – Noções de Estatística

Grupo A – 1o Semestre de 2022


2021
Lista de exercícios 2 – Estatística Descritiva II – CASA (Gabarito)

Exercício 1
Considere os dados a seguir sobre a durabilidade (em meses) de 1000 baterias.

Durabilidade (meses) Frequência Frequência relativa


0`3 40 0,04
3`6 50 0,05
6`9 130 0,13
9 ` 12 250 0,25
12 ` 18 330 0,33
18 ` 24 200 0,20

Construa os histogramas pelos métodos de frequência e densidade. Qual deve ser utilizado? Jus-
tifique.
Calculando a amplitude dos intervalos de classe (base) e a densidade de frequência (h)
frequência relativa
h= ,
base
temos

Durabilidade (meses) Frequência Frequência relativa Base h


0`3 40 0,04 3 0,013
3`6 50 0,05 3 0,017
6`9 130 0,13 3 0,043
9 ` 12 250 0,25 3 0,083
12 ` 18 330 0,33 6 0,055
18 ` 24 200 0,20 6 0,033

Os histogramas construídos pelo método da frequência e pelo método da densidade são apresen-
tados a seguir.

1
Utilizando a frequência Utilizando a densidade

0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
350
300
250

Densidade (h)
Frequência

200
150
100
50
0

0 3 6 9 12 15 18 21 24 0 3 6 9 12 15 18 21 24

Durabilidade Durabilidade

Como as amplitudes das classes são de tamanhos diferentes, deve ser utilizado o histograma cons-
truído pelo método de densidade, que retrata o que de fato ocorre com os dados dessa variável

2
Exercício 2
Para solicitar o cartão de crédito de uma loja, os clientes precisam responder o seguinte questionário:

• Nome completo:

• Idade (em anos):

• CPF:

• Telefone:

• Nível de escolaridade: ( ) Fundamental ( ) Médio ( ) Superior ( ) Pós-graduação

• Você já possui cartão de crédito? ( ) Sim ( ) Não

• Qual é a sua renda mensal?

(a) Classifique as variáveis do questionário


• Nome completo: Qualitativa nominal

• Idade (em anos): Quantitativa discreta

• CPF: Qualitativa nominal

• Telefone: Qualitativa nominal

• Nível de escolaridade: Qualitativa ordinal

• Você já possui cartão de crédito? Qualitativa nominal

• Qual é a sua renda mensal? Quantitativa contínua

3
(b) Em um certo dia, 7 pessoas solicitaram o cartão da loja. As informações
sobre idade, nível de escolaridade, renda mensal e se já possui ou não cartão de
crédito dessas pessoas estão dispostas na tabela a seguir.

Idade Nível de escolaridade Renda mensal Possui cartão de crédito


20 Médio 1200,00 Sim
35 Médio 2450,00 Sim
25 Pós-graduação 3100,00 Sim
48 Superior 5800,00 Sim
18 Fundamental 1100,00 Não
23 Superior 1500,00 Não
31 Médio 4000,00 Não

i. Que gráfico você utilizaria para representar a variável nível de escolaridade? e para a variável
idade?
Nível de escolaridade, por ser uma variável qualitativa, poderia ser representada através de um
gráfico de pizza ou de barras. Como idade é uma variável quantitativa, pode-se representá-la
utilizando um boxplot ou histograma.

ii. Construa dois gráficos de pizza, um que represente o nível de escolaridade das pessoas que
possuem cartão de crédito e outro que represente o nível de escolaridade das pessoas que não
possuem cartão de crédito. Inclua em cada gráfico as porcentagens corretas.

Para fazer a mão:

– Passo 1: Calcular as porcentagens. Observe que, das quatro pessoas que possuem cartão
de crédito, duas delas possuem nível médio (2/4 ou 50%), uma possui pós-graduação
(1/4 ou 25%) e uma possui nível superior (1/4 ou 25%). Já das três pessoas que não
possuem cartão de crédito, uma possui nível fundamental (1/3 ou 33,33%), uma possui
nível superior (1/3 ou 33,33%) e uma possui nível médio (1/3 ou 33,33%).
– Passo 2: Dividir o gráfico em setores (fatias) de acordo com as porcentagens, como está
ilustrado na figura a seguir.

4
SIM NÃO

Médio (50%)
Fundamental (33%)

Médio (33%)

Pós−graduação (25%) Superior (25%)


Superior (33%)

Para fazer via Rcmdr:


Uma sugestão de obtenção está exposta a seguir.

– Passo 1: Inserção dos dados. Ir na guia “Dados” ) “Novo conjunto de dados” ) Escolher
o nome que deseja para o conjunto de dados e clicar em “OK”. Depois, entrar com os
valores como o exemplo abaixo e clicar em “OK”.

– Passo 2: Construir os gráficos. Para construir o gráfico de setores para as pessoas que
possuem cartão de crédito vá na guia “Gráficos” ! “Gráfico de Pizza”. Na aba “Dados”
selecione a variável “SIM” na lista de variáveis e clique em “OK”. O gráfico será exibido
em uma nova janela. Para copiá-lo, clique com o botão direito sobre o gráfico e escolha a
opção “Copiar como Bitmap”. Em seguida cole no documento da sua lista de exercícios.
Repita o mesmo procedimento para a variável “NAO”. O resultado obtido deverá ser igual
a figura anterior.

5
iii. O gráfico a seguir foi construído para representar a variável renda mensal. Esse gráfico é ade-
quado considerando o tipo da variável? Que outro gráfico poderia ser utilizado? Justifique sua
resposta.

Renda Mensal

1200 (14%)

1500 (14%)

1100 (14%)

2450 (14%)

5800 (14%)

3100 (14%)

4000 (14%)

Não, o gráfico de pizza não é adequado para representar a variável renda mensal, pois essa variá-
vel é quantitativa. Nesse caso, podemos representá-la através de um histograma, por exemplo.
O histograma para a variável renda mensal está disposto na figura a seguir.
0.0004
0.0003
density

0.0002
0.0001
0.0000

1000 2000 3000 4000 5000 6000

renda

6
Para obter o histograma pelo Rcmdr, é só seguir os passos:

– Ir na guia “Dados” ) “Novo conjunto de dados” ) Escolher o nome que deseja para
o conjunto de dados e clicar em “OK”. Depois, entrar com os valores da variável renda
como o exemplo abaixo e clicar em “OK”.

– Ir na guia “Gráficos” ) “Histograma” ) Escolher a variável renda e em opções escolher


a escala do eixo. No histograma gerado nesse exemplo foi selecionada a opção “Densida-
des”. Após isso, clicar em “OK”.

7
Exercício 3
O conjunto de dados IRIS presente na biblioteca padrão do R apresenta valores de comprimento e
largura de pétalas e sépalas de 150 flores de íris. As variáveis são: Sepal.Length: “Comprimento da
sépala”; Sepal.Width: “Largura da sépala”; Petal.Length: “Comprimento da pétala” e Petal.Width:
“Largura da pétala”. O conjunto de dados apresenta outra variável chamada Species que apresenta a
qual espécie cada flor pertence, que pode ser setosa, versicolor ou virginica.
Considere apenas as variáveis Sepal.Width e Petal.Width independente da espécie para responder
os ítens abaixo com uso de recurso computacional.

Ler o conjunto de dados: Clique na guia “Dados” ! “Conjunto de dados em pacotes” ! “Ler
dados de pacote “attachado” ”. Escolher pacote “datasets” com clique duplo e em seguida escolher o
conjunto de dados “iris” com clique duplo. Por fim, clique em “OK”.

(a) Obtenha média, mediana, variância, desvio padrão e coeficiente de variação


para as variáveis Sepal.Width e Petal.Width.
A seguir apresentamos os passos utilizados no Rcmdr.

• Cálculo das medidas resumo: Clique na guia “Estatísticas” ! “Resumos” ! “Resumos nu-
méricos”. Na aba “Dados” selecione as variáveis “Sepal.Width” e “Petal.Width” na lista de
variáveis e em seguida na aba “Estatísticas” selecione as estatísticas de interesse, que no nosso
caso são: média, desvio padrão, coeficiente de variação e o quartil 0,50 (digite 0.50 em “Quan-
tis”). Clique em “OK”.

O resultado é apresentado a seguir. Na coluna “mean” estão dispostas as médias, na coluna “sd” estão
dispostos os desvios padrões.

mean sd cv 50% n
Petal.Width 1,199333 0,7622377 0,6355511 1,3 150
Sepal.Width 3,057333 0,4358663 0,1425642 3,0 150

As variâncias são obtidas pelo quadrado dos desvios padrões. Uma forma de obter usando o
Rcmdr é:
Na janela “RScript” do Rcmdr digite o seguinte comando e depois submeta (ou Ctrl+R):

0.7622377^2

O resultado estará na janela “Output”.

> 0.7622377^2
[1] 0.5810063

8
Repetindo para o desvio padrão de “Sepal.Width”, temos:

> 0.4358663^2
[1] 0.1899794

A tabela com todas as estatísticas solicitadas é apresentada a seguir.

mean sd var cv 50% n


Petal.Width 1,199333 0,7622377 0,5810063 0,6355511 1,3 150
Sepal.Width 3,057333 0,4358663 0,1899794 0,1425642 3,0 150

Como pode ser observado, a largura da pétala é mais dispersa do que a largura da sépala das flores
de Iris, tanto em termos de desvio padrão quanto de coeficiente de variação.

(b) Construa o boxplot das variáveis Petal.Width e Sepal.Width. Comente sobre


a dispersão, pontos extremos e simetria dos dados, para cada variável.
Para construir o Boxplot no Rcmdr vá na guia “Gráficos” ! “Boxplot. Na aba “Dados” selecione a
variável “Petal.Width” na lista de variáveis e clique em “OK”. O gráfico será exibido em uma nova
janela. Para copiá-lo, clique com o botão direito sobre o gráfico e escolha a opção “Copiar como
Bitmap”. Em seguida cole no documento da sua lista de exercícios. Repita o mesmo procedimento
para a variável “Sepal.Width”. Os gráficos construídos são apresentados a seguir.
2.5

16 ●

34 ●
33 ●
4.0
2.0

3.5
1.5

Sepal.Width
Petal.Width

3.0
1.0

2.5
0.5

2.0

61 ●

A variável largura da pétala (Petal.Width) apresenta característica de assimetria à direita, enquanto


que, a variável largura da sépala (Sepal.Width) possui uma forma mais simétrica. Além disso, ve-
mos que a variável largura da pétala não apresenta valores aberrantes, já a variável largura da sépala

9
apresenta uma observação discrepante muito abaixo e três observações discrepantes muito acima do
conjunto de valores.

Exercício 4
Sabe-se que, embora os usuários da Internet gostem da conveniência das compras on-line, eles real-
mente têm preocupações em relação à privacidade e à segurança. Um estudo buscou saber se essa
preocupação é a mesma entre homens e mulheres. Utilizando uma amostra de 825 mulheres e 775
homens usuários da Internet, questionou-se o grau de concordância com a declaração: “Eu não gosto
de fornecer o número de meu cartão de crédito ou informações pessoais on-line”. Os dados obtidos
estão disponíveis no arquivo dados_internet.xlsx e são resumidos na tabela a seguir.

Concorda fortemente Concorda Discorda Discorda fortemente Total


Mulheres 268 276 216 65 825
Homens 358 234 118 65 775
Total 626 510 324 130 1600

(a) Identifique as variáveis do estudo e classifique-as


As variáveis do estudo são:

• Gênero: qualitativa nominal;

• Concordância com uma declaração sobre fornecimento de dados na internet: qualitativa ordinal.

(b) Com o auxílio de recurso computacional, faça um gráfico de setores para


as mulheres com a concordância. Faça o mesmo gráfico para os homens. Você
diria que as distribuições de concordâncias são diferentes? Comente.
Ler o conjunto de dados: Clique na guia “Dados” ) “Importar arquivos de dados” ) “do Excel”.
Em seguida defina um nome para o seu conjunto de dados (por exemplo, Internet) e clique em “OK”.
Navegue até o diretório onde o seu conjunto de dados está localizado e clique em “Abrir”. Selecione
a aba do Excel onde está localizado o conjunto de dados (no nosso caso, “Dados”) e clique em “OK”.

Para construir o gráfico de setores para as mulheres vá na guia “Gráficos” ! “Gráfico de Pizza”.
Na aba “Dados” selecione a variável “Mulher” na lista de variáveis e clique em “OK”. O gráfico será
exibido em uma nova janela. Para copiá-lo, clique com o botão direito sobre o gráfico e escolha a
opção “Copiar como Bitmap”. Em seguida cole no documento da sua lista de exercícios. Repita o

10
mesmo procedimento para a variável “Homem”. Os gráficos de setores construídos para gênero de
acordo com a concordância são apresentados a seguir.

Mulher Homem

Concorda (33%)
Concorda (30%)

Concorda fortemente (32%)

Concorda fortemente (46%)


Discorda fortemente (8%) Discorda fortemente (8%)

Discorda (15%)
Discorda (26%)

• Entre as mulheres, a predominância se dá na categoria Concorda (33%) seguida da categoria


Concorda fortemente (32%), onde há praticamente a mesma porcentagem de resposta.

• Entre os homens, a predominância ocorre na categoria Concorda fortemente (46%) se-


guida da categoria Concorda (30%). Isto evidencia que há um temor maior entre os homens
em fornecer informações pessoais e de crédito online.

• Para ambos os sexos, a categoria Discorda fortemente apresenta menor frequência de


resposta, mostrando que apenas 8% dos homens e 8% das mulheres não sentem medo algum
em fornecer informações pessoais ou de cartão de crédito em compras online.

• Já para a categoria Discorda, vemos que 26% das mulheres discordam da afirmação e apenas
15% dos homens discordam. Ou seja, mais uma vez nota-se que as mulheres tem menor receio
em utilizar informações pessoais e de crédito online.

• Conclui-se que as distribuições de concordância com a declaração: “Eu não gosto de fornecer o
número de meu cartão de crédito ou informações pessoais on-line” são diferentes para homens
e mulheres.

11

Você também pode gostar