Você está na página 1de 7

www.datascienceacademy.com.

br

Análise Estatística Para Data Science I


com R e SAS

Lista 6 de Exercícios
Análise Estatística Para Data Science I

*** Atenção ***

Esta lista de exercícios está dividida em


duas partes, sendo a primeira parte
exercícios que devem ser resolvidos em R e
a segunda parte exercícios que devem ser
resolvidos em SAS.

Data Science Academy 2


www.datascienceacademy.com.br
Análise Estatística Para Data Science I

Parte 1 – Exercícios que devem ser resolvidos usando Linguagem R

Exercício 1:

Uma lâmpada é selecionada aleatoriamente de uma caixa que contém uma lâmpada de 40
watts, uma lâmpada de 60 watts, uma lâmpada de 75 watts, uma lâmpada de 100 watts e uma
lâmpada de 120 watts. Escreva a função de probabilidade para a variável aleatória que
representa a potência da lâmpada selecionada aleatoriamente e determine a média e a
variância dessa variável aleatória.

Exercício 2:

Calcule a probabilidade de obter 6 ou mais “caras” em 10 lançamentos de uma moeda


ponderada, onde a probabilidade de obter uma “cara” em qualquer tentativa é de 0,33.

Exercício 3:

Mais acidentes são registrados nas oficinas de reparo de carrocerias durante os meses de maio
e junho do que no resto do ano. Suponha que uma oficina particular tenha uma média de
quatro acidentes por mês. Qual é a probabilidade de haver mais de sete acidentes nesta oficina
durante o mês de maio? Qual é a probabilidade de não mais do que três acidentes ocorrerem
durante os meses de maio e junho? Assuma que o número de carros atendidos na oficina siga
uma distribuição de Poisson.

Exercício 4:

Chamadas telefônicas para um número local 911 são conhecidas por seguir uma distribuição de
Poisson com uma média de duas chamadas por minuto. Calcule a probabilidade de que:

(a) haverá zero chamadas durante um período de um minuto.


(b) haverá menos de cinco chamadas em um período de um minuto.
(c) haverá menos de seis chamadas em uma hora.

Exercícios 5:

Muitas vezes, o número de tentativas de Bernoulli necessárias para alcançar algum número fixo
(r) de sucessos é a quantidade de interesse. Quando a variável aleatória X é definida como o
número de falhas anteriores ao primeiro sucesso, X tem uma distribuição binomial negativa
escrita X ~ NB(r,¶). Com base nisso, resolva o problema a seguir.

Data Science Academy 3


www.datascienceacademy.com.br
Análise Estatística Para Data Science I

Em um lote particular de pneus, 10% apresentaram defeito devido a um problema em uma das
máquinas de produção. Qual é a probabilidade de ter que examinar seis pneus antes de
encontrar quatro pneus com defeito?

Data Science Academy 4


www.datascienceacademy.com.br
Análise Estatística Para Data Science I

Parte 2 – Exercícios que devem ser resolvidos usando SAS

Exercício 1:

Usando o trecho de código abaixo, crie o dataset Iris (copie e cole no SAS Studio e estude o
código).

/* Criando um dataset */
data Iris;
input SepalLength SepalWidth PetalLength PetalWidth @@;
label sepallength='Sepal Length' sepalwidth='Sepal Width'
petallength='Petal Length' petalwidth='Petal Width';
datalines;
50 33 14 02 46 34 14 03 46 36 . 02
51 33 17 05 55 35 13 02 48 31 16 02
52 34 14 02 49 36 14 01 44 32 13 02
50 35 16 06 44 30 13 02 47 32 16 02
48 30 14 03 51 38 16 02 48 34 19 02
50 30 16 02 50 32 12 02 43 30 11 .
58 40 12 02 51 38 19 04 49 30 14 02
51 35 14 02 50 34 16 04 46 32 14 02
57 44 15 04 50 36 14 02 54 34 15 04
52 41 15 . 55 42 14 02 49 31 15 02
54 39 17 04 50 34 15 02 44 29 14 02
47 32 13 02 46 31 15 02 51 34 15 02
50 35 13 03 49 31 15 01 54 37 15 02
54 39 13 04 51 35 14 03 48 34 16 02
48 30 14 01 45 23 13 03 57 38 17 03
51 38 15 03 54 34 17 02 51 37 15 04
52 35 15 02 53 37 15 02
;

Com o dataset criado, construa uma matriz de correlação entre as 4 variáveis do dataset.

Obs: Crie a matriz usando código SAS e a task Correlation Analysis.

Exercício 2:

A distribuição de Poisson é uma das distribuições de probabilidade discretas mais comuns. A


distribuição de Poisson é uma distribuição de probabilidade discreta com média e variância
igual a lambda. Uma variável aleatória discreta X é Poisson distribuída com o parâmetro lambda
se sua Função de Massa de Probabilidade (PMF) estiver na forma:

Data Science Academy 5


www.datascienceacademy.com.br
Análise Estatística Para Data Science I

Se uma variável aleatória X é Poisson distribuída com o parâmetro lambda, isso é escrito como
X ~ po(lambda).

A distribuição de Poisson expressa a probabilidade de que uma determinada contagem de


eventos ocorrerá em um determinado período de tempo, uma vez que esses eventos
geralmente ocorrem com uma taxa média constante conhecida. Dado que você em um dia
inteiro de 24 horas recebe três e-mails por hora, em média, qual é a probabilidade de que na
próxima hora, você receberá sete e-mails? Esta é a pergunta que a distribuição de Poisson
responde. Aqui, definiríamos lambda = 3, pois essa é a média da distribuição. Como a média e a
variância são as mesmas na distribuição de Poisson, a variância também será igual a 3.
Portanto, podemos modelar esse exemplo por uma variável estocástica X ~ po(4).

Abaixo você encontra o código completo que cria a Função de Massa de Probabilidade (PMF).
Copie e cole o código no SAS Studio, execute e estude-o com atenção. Defina lambda para
valores diferentes, execute o programa e veja como a Função de Massa de Probabilidade é
alterada. O que acontece quando o lambda tem um valor grande? E o que acontece quando é
pequeno?

/* Exercício 2 - Poisson */
%let lambda=4;

data Poisson_PMF;
do k=0 to 10;
PMF=pdf('Poisson', k, &lambda);
output;
end;
run;

title "Poisson Probability Mass Function.";

proc sgplot data=Poisson_PMF noautolegend;


vbar k / response=PMF barwidth=0.5 legendlabel="PMF";
keylegend / location=inside position=NE across=1;
yaxis display=(nolabel);
run;

Exercício 3:

As lâmpadas de um fabricante têm 10% de chance de queimar antes de 100 horas. Quatro
lâmpadas são selecionadas aleatoriamente e testadas por 100 horas. Qual é a probabilidade de
que no máximo uma das lâmpadas se queime? Seja Y o número de lâmpadas queimadas. Y tem
uma distribuição binomial com parâmetros n = 4 e p = 0,1. Dica: Use a função pdf().

Data Science Academy 6


www.datascienceacademy.com.br
Análise Estatística Para Data Science I

As soluções serão apresentadas no próximo capítulo.

Data Science Academy 7


www.datascienceacademy.com.br

Você também pode gostar