21073 - Introdução às probabilidades e estatı́stica
bayesianas Ano lectivo 2022/23 Docente: António Araújo
e-fólio A
Para a resolução do e-fólio, aconselha-se que:
• Verifique se o ficheiro que recebeu está correcto. O e-fólio consiste de 2 páginas com 2 problemas e termina com a palavra FIM.
• Como o e-fólio tem um tempo prolongado de resolução, espera-se
que as respostas que enviar estejam legı́veis, com boa apresentação e organização. Deve fazer à parte o trabalho auxiliar e enviar ape- nas uma versão final, ”limpa”. Deve digitalizar a sua resolução de forma legı́vel, ou executá-la directamente em formato digital (aceita- se word, pdf, ou scans em jpeg, png ou tiff - se usar varios ficheiros envie apenas um arquivo com todos eles, em rar ou zip). Respostas ilegı́veis não serão cotadas, por isso verifique bem o seu ficheiro antes de enviar.
• Justifique cuidadosamente todas as suas respostas. Apresente to-
dos os cálculos que julgue necessários para a compreensão do seu raciocı́nio.
• Tenha em atenção o prazo de entrega do e-fólio e as indicações para
submeter a resolução disponibilizadas na sala de aulas virtual.
• O e-fólio é um trabalho individual. Pode utilizar recursos externos
(pesquisa online, literatura, etc) mas não pode pedir ajuda a terceiros nem discutir os problemas com os seus colegas.
Critérios de avaliação e cotação:
• Este e-fólio tem a cotação total de 4 valores, assim distribuı́dos: questão 1: 1 valor; questão 2: 3 valores. Por favor preencha os seus dados: • Nome: Óscar Barquero-Pérez
• B.I: 52099757L (espanhol)
• No de Estudante 2100589
• Curso: Introdução à Probabilidade e Estatística Bayesiana
2. Um biólogo pretende estudar a prevalência de um certo parasita numa
população de aves de uma certa espécie. Recolhe duas amostras consecutivas. Na primeira amostra observou 30 aves e verificou que 18 tinham o parasita. Na amostra seguinte recolheu 60 aves e verificou que 38 tinham o parasita. a) Seja θ a proporção de indı́viduos da população que alberga o parasita. Diga quais as distribuições de probabilidade posterior de θ ao fim de cada dia, tomando um prior uniforme para θ antes da primeira amostra. Usando o R, faça os gráficos dos posteriores dos dois dias, sobrepostos para que se perceba a evolução do prior com o efeito das amostras sucessivas. b) Calcule um intervalo de credibilidade a 95% para os posteriores de θ nos dois dias sucessivos, ou seja, um intervalo que tenha 95 por cento da probabilidade de conter o verdadeiro valor de θ. O intervalo deve ser simétrico, no sentido em que as regiões que lhe são exteriores à esquerda e à direita devem ter igual probabilidade (use adequadamente o comando qbeta do R, ou uma tabela de Betas). c) Na continuação da alı́nea a), calcule a aproximação Normal da distribuição posterior de θ (quando todas as medições foram realizadas). Use ainda essa aproximação para obter um intervalo de credibilidade a 95 por cento para o valor de θ. Faça um gráfico desta normal, acrescente-o aos gráficos da alı́nea a), e compare com o que obteve nessa alı́nea. Nota: usando o R pode sobrepor dois gráficos (digamos de funções f e g) fazendo curve(f(x), col=”blue”’) para o primeiro (por exemplo) e curve(g(x), col=”red”, add=TRUE) para o segundo (e seguintes). A instrução “add=TRUE” para os gráficos a seguir ao primeiro assegura a sobreposição.