Você está na página 1de 39

Liga Brasileira de Bioinformática 2º Edição

Primeira fase
Instruções:

1. A prova é composta por 60 questões de múltipla escolha, contendo as


opções de resposta A, B, C ou D.
2. Qualquer erro associado à prova deverá ser enviado para o e-mail oficial da
LBB (ligabrasileirabioinformatica@gmail.com), com o título “ Erro - Prova 1º
fase LBB 2º Edição”.
3. O tempo de duração da prova é de 5 horas e 3 minutos.
4. Não esqueça que a prova só estará finalizada após a submissão do
formulário de respostas encontrado no classroom (Turma: LBB 2º Edição).
Fiquem atentos que só utilizaremos as respostas submetidas até 5h03m após
o início da prova. Sem a submissão, constará que o seu time não fez a prova.
5. Conforme consta no regulamento, a organização da LBB não se
responsabiliza por provas não enviadas.

“Que a força esteja com vocês. Obi Wan Kenobi”


Biologia

1. Muitas enzimas fazem parte do controle de qualidade da síntese de DNA, onde


atuam como verificadoras das DNA polimerases durante a replicação, reparo e
recombinação do DNA. Você, jovem pesquisador(a), está examinando a replicação
do DNA em um mutante de um grupo de mamíferos, que possui uma DNA
polimerase parcialmente defeituosa. Alguns experimentos em laboratório usando
DNA polimerase mutante apresentaram uma taxa de erro de 0,01, em comparação
com a taxa de erro esperada de 0,00001. Você, perspicaz, já sabe qual é a
atividade da polimerase mutante provavelmente ausente, em comparação com a
polimerase normal. Qual a sua resposta?

a) 5’3’ poliymerase
b) 5’3’ recombinase
c) 3’5’ exonuclease
d) 3’5’ glicosilase

2. Imagine que uma pandemia global causada por um vírus atinge o planeta Terra.
A identificação do proteoma do vírus é rápida, o que permite que os pesquisadores,
através de ferramentas de bioinformática, identifiquem um gene humano que
codifica uma proteína idêntica a uma proteína produzida pelo vírus. Após semanas
de testes, um fragmento de DNA que inclui o gene compartilhado é isolado.
Posteriormente o fragmento é aquecido para que haja a separação das duplas fitas
de DNA, permitindo que o DNA humano pareie com o RNA viral. Através da
microscopia eletrônica, encontra-se a seguinte molécula híbrida:

Os resultados observados a partir do fragmento de DNA compartilhado são


repensados e outras análises são propostas. O que ocorreria se o pesquisador
tivesse isolado o mRNA maduro da célula humana e o colocasse para emparelhar
com o RNA viral? Será que veríamos o mesmo tipo de molécula híbrida?

a) A polimerização do genoma viral seria 3' 5'. Posteriormente, a DNA-polimerase


dependente de RNA é usada em algum ponto durante o ciclo de vida viral para
copiar o genoma viral. Sendo assim, uma cópia idêntica é gerada, portanto, não
veríamos o tipo de molécula híbrida mostrado acima.
b) A RNA polimerase é usada em algum ponto durante o ciclo de vida viral para
copiar o genoma viral, que ocasiona a hibridização pareada das fitas, portanto,
veríamos o tipo de molécula híbrida mostrado acima.
c) Os desoxirribonucleotídeos seriam incorporados ao genoma viral empacotado.
Posteriormente, a polimerase usada pelo vírus para copiar seu genoma forma uma
ligação covalente entre um fosfato 5' e um hidroxila 3', que ocasionaria a
hibridização da fita traduzida, portanto, veríamos o tipo de molécula híbrida
mostrado acima.
d) Após o processo de splicing e dado que as duas proteínas são idênticas, você
esperaria que as duas moléculas fossem iguais, portanto, não veríamos o tipo de
molécula híbrida mostrado acima.

3. Experimentos com levedura são utilizados em diversas áreas da ciência, desde a


produção de etanol até testes rápidos de Covid-19 (CoronaYeast – UNICAMP). Em
um ensaio científico para verificar a influência da ausência de oxigênio no consumo
de glicose durante uma fermentação de etanol, dois tubos de ensaio são inoculados
com a mesma quantidade de meio de crescimento, e com o mesmo número de
células de S. cerevisiae. Posteriormente, as células são crescidas em condições
idênticas, exceto pela presença ou ausência de oxigênio. Observou-se que as
células de ambas as culturas convertem glicose em piruvato por meio da glicólise e,
em seguida, metabolizam o piruvato.

Levando em consideração as respostas aeróbicas e anaeróbicas fornecidas pela


levedura, você acha que as células de ambas as culturas são capazes de obter a
mesma quantidade de ATP a partir da glicólise?

a) Sim, a glicólise não requer oxigênio e fornece dois mols de ATP por mol de
glicose. A diferença na produção de ATP é determinada pelo que acontece após a
glicólise, ou seja, respiração ou fermentação.
b) Não, já que a cultura aeróbia fará a respiração, e produzirá cerca de 36
ATP/glicose. Já a cultura anaeróbica realizará fermentação, o que dá 2 ATP/glicose.
Assim, há mais energia para fazer mais células de levedura em condições aeróbias.
c) Sim, pois o caminho percorrido pelo açúcar entre as fermentações será o mesmo.
Além disso, em ambas as fermentações serão observadas a produção de ácido
lático e etanol. Como os produtos são os mesmos, a energia total de 2 mols de ATP
é a mesma.
d) Não, pois a ausência de oxigênio causa uma disfunção severa no gradiente de
concentração na mitocôndria, já que à medida que os elétrons passam de uma
proteína para outra, os íons H + passam pela membrana para formar um gradiente
de carga e concentração. Essa disfunção faz com que a mitocôndria produza menos
ATP que a condição anaeróbica, totalizando um mol de ATP.

4. A infecção eficiente pelo HIV requer a expressão do gene Tat do HIV. Todos os
mutantes Tat são incapazes de se espalhar a partir das células de uma infecção
inicial para infectar outras células. Que tipo de célula você usaria para estudar a
infectividade do HIV de tipo selvagem?

a) miócitos cardíacos de camundongos.


b) células renais caninas
c) neurônios humanos
d) Nenhuma das alternativas
5. Tiemi era diretora de artes e resolveu escrever um conto para sua filha, Aninha.
Como Aninha gostava muito de histórias, ela resolveu utilizar todos os
conhecimentos adquiridos na faculdade de Cinema sobre roteiro, e ensinar alguns
conceitos de biologia à sua filha. E o conto começou assim:

“Em uma bela floresta, com campos, vales e montanhas vivia uma comunidade de
coelhinhos fofos e felpudos, brancos como a neve”. Neste momento, Aninha
interrompe a mãe e diz: "Não, eles são azuis, são azuis mamãe”. Tiemi, para não
contrariar Aninha, concordou e continuou: “Os coelhinhos azuis viviam felizes e
unidos, passeavam nos vales e florestas, e se divertiam com as flores”. Porém, em
um belo dia, os humanos resolveram construir uma grande represa…” Aninha
interrompe novamente: “nossa mamãe, tão previsível fazer uma represa”. Então,
para introduzir novos conceitos à Aninha, Tiemi continua: “Na região em que os
coelhinhos viviam, acontece uma falha na placa tectônica, que possibilitou o
surgimento de elevações no relevo após milhares de anos, separando os coelhinhos
azuis em dois grupos…” Aninha interrompe mais uma vez a mãe e pergunta se
placas tectônicas são os blocos rochosos na crosta terrestre que se movimentam. A
mãe diz que sim e relembra que isso é uma situação hipotética. “Milhares de anos
após a separação dos dois grupos de coelhos, foi observado uma diferença entre
esses dois grupos. Um dos grupos continuou azul, porém, do outro lado das
elevações ocorreu o surgimento de coelhinhos roxos com bolinhas.”

Criando uma segunda situação, Tiemi começou: “Em uma floresta com vales e
montanhas que viviam os coelhinhos fofos e AZUIS” Aumentado o tom de voz…
continuou: “as fêmeas começaram a apresentar tempos diferentes de reprodução.
Algumas tinham seus filhos no outono, outras na primavera. Alguns machos
começaram a demonstrar preferência pelas fêmeas do outono e outros da
primavera. Com o passar de milhares de anos com os coelhinhos se reproduzindo
de acordo com sua preferência de estação do ano, gerou o aparecimento de
coelhinhos rosa com bolinhas.

Após a história de sua mãe, Aninha recriou o conto em quatro cenários: A, B, C e D.


Considerando a história e as imagens criadas por Aninha, escolha a alternativa
correta:
Imagem criada no Canva

a) A primeira história é representada pelas letras A e B da imagem. Como na


história ela diz claramente que a separação entre os dois grupos ocorreu milhares
de anos depois podemos afirmar que tratam-se de espécies distintas. É um evento
de especiação alopátrica.
b) Podemos afirmar que a segunda história representa um evento de especiação
alopátrica, representado pelas imagens C e D. Em que os coelhos se tornam
espécies distintas por mudarem de cor.
c) A primeira história, representada pelas imagens A e D, representa uma
especiação simpátrica, visto que não foi necessário um isolamento geográfico para
que os coelhos deixassem de se reproduzir entre si.
d) Nenhuma das anteriores.

6. Pesquisadores da Holanda estavam analisando dois vírus com material genético


dupla fita: S568 e J756. Analisando o genoma dos vírus, eles identificaram nessas
amostras uma composição de quatro bases nitrogenadas formando o material
genético. Três das bases nitrogenadas que compõem o genoma do vírus também
estavam presentes no genoma de S. cerevisiae. Com o sequenciamento de S568 e
J756, foram identificadas em S568 30 mil guaninas e 120 mil bases nitrogenadas no
total. Em J756 foram identificadas 25 mil guaninas e 115 mil bases nitrogenadas ao
todo.
Selecione a alternativa que tenha respectivamente: A quantidade da quarta base
nitrogenada encontrada no genoma do vírus S568; e o vírus que teoricamente seria
mais resistente ao calor com base em seu material genético.

a) 32,5 mil uracilas; S568


b) 30 mil uracilas; S568
c) 32,5 mil timinas; J756
d) 30 mil timinas; J756

7. Em 1908, os estudiosos Hardy e Weinberg propuseram que, populações


suficientemente grandes, sob acasalamentos ao acaso, e ausência de migração,
mutações, e seleção natural, as frequências gênicas e genotípicas permanecem
constantes de geração em geração. Em uma população de lulas da África, a
frequência do alelo autossômico dominante para uma determinada característica é
igual a 0,6. Considerando que essa população está sob o equilíbrio de Hardy-
Weinberg, quais as frequências dos possíveis genótipos? Considere A dominante e
a recessivo.

a) f(AA) = 0.16, f(Aa) = 0.58, f(aa) = 0.16


b) f(AA) = 0.16, f(Aa) = 0.48, f(aa) = 0.16
c) f(AA) = 0.36, f(Aa) = 0.58, f(aa) = 0.16
d) f(AA) = 0.36, f(Aa) = 0.48, f(aa) = 0.36

8. Eduardo sofreu um acidente e precisa receber uma transfusão urgentemente.


Miguel, o biomédico do hospital, está avaliando qual o tipo sanguíneo de Eduardo
para avisar o banco de sangue.
Sabendo que geralmente:
Considere as afirmações e selecione o tipo sanguíneo de Eduardo.

I - Miguel percebeu que o sangue de Eduardo não aglutinava com o anticorpo anti-A
II- Não havia aglutinação com o anticorpo anti-B no sangue de Eduardo
III- O heredograma abaixo representa o tipo sanguíneo da esposa de Eduardo, de
Eduardo e da prole de ambos:

IV- Eduardo e sua esposa são pais biológicos da prole apresentada em III.

a) A
b) B
c) AB
d) O

9. Cynthia iniciou um projeto de doutorado para estudar o efeito de um alimento


(c521) em camundongos. Em seu projeto, Cynthia analisou 4 gerações de
camundongos:

Ela observou que após dois meses, os indivíduos de G1 deixavam de se alimentar


de c521 toda vez que sentiam o cheiro do alimento. Esse efeito estava associado a
um condicionamento negativo desses animais. Em G4, Cynthia observou que os
animais apresentaram o mesmo comportamento que G1 após dois meses de
ingestão de c521 sem nunca terem provado o alimento.

Com base nas informações fornecidas sobre os resultados de Cynthia, e os


possíveis mecanismos apresentados na imagem, escolha a alternativa que melhor
representa o que pode explicar os resultados obtidos:

a) A geração G3 pode carregar modificações no DNA de células olfativas de um dos


parentais (G2) utilizando o mecanismo B. Essa mutação pode ter permitido que os
animais reconheçam o odor como algo perigoso. Nesse caso, as células somáticas
devem ter sido transmitidas aos descendentes.
b) Aumento do número de cópias de genes relacionados com o reconhecimento de
odor devem ter ocorrido em células cerebrais (mecanismo A). Isso seria suficiente
para transmissão da característica aos descendentes, visto que todas as células de
um indivíduo apresentam o mesmo padrão genômico.
c) Os indivíduos de G4 podem carregar modificações epigenéticas que os permitam
reconhecer o alimento c521 como uma situação perigosa (mecanismo C). Porém, é
necessário que essas modificações ocorram em um outro tecido específico além do
olfativo.
d) A geração G3 pode ter acumulado variantes presentes nos telômeros que
codificam proteínas importantes para o reconhecimento de moléculas apenas nos
indivíduos de G2 (mecanismo D). Essas mutações juntas devem ter sido suficientes
para que G4 reconhecesse o cheiro antes mesmo de provar a comida.

10. Os RNAs são macromoléculas importantes e apresentam inúmeras funções


celulares. Assinale a alternativa correta:

a) Os pequenos RNAs nucleares têm papel como cofatores importantes


no “spliceossomo”. Diferentes tipos de interação de RNAs com outros RNAs e/ou
proteínas estão envolvidos no processo. Estes RNAs foram os primeiros a serem
descobertos e antecedem a descoberta de tRNAs e mRNAs .
b) Os primeiros microRNAs, pequenos RNAs com papel regulatório, foram
descobertos em Caenorhabditis elegans, um nematódeo. Eles inibem a tradução e
aceleram a degradação de mRNAs atuando principalmente na região UTR 3’ em
pareamento imperfeito de bases. Além dos microRNAs, os RNAs não codificantes
longos também constituem importantes macromoléculas com papel regulatório.
c) Podemos dizer que os RNAs estão presentes no Dogma Central da Biologia
Molecular”. Neste mecanismo, os mRNAs e os tRNAs correspondem aos “moldes”
usados pela maquinaria do ribossomo (composto por rRNAs e proteínas), que é
responsável pela tradução de proteínas.
d) Apesar de RNAs serem essenciais em diferentes processos celulares, nenhum
deles estão envolvidos na alteração da composição química de outras
macromoléculas (DNA, RNA ou proteínas) da célula.

11. As áreas urbanas são importantes em termos de diversidade biológica. Elas


apresentam diversos ecossistemas, que podem incluir espécies nativas, raras e até
mesmo ameaçadas. Embora não sejam muito valorizadas pela população e por
iniciativas públicas, já existe um corpo de literatura reforçando a importância de
iniciativas visando a preservação da biodiversidade urbana. Em relação à sua
conservação, podemos fazer quatro afirmações, exceto:

a) Pequenos ambientes, incluindo árvores isoladas ou tanques, consistem em


importantes recursos como habitat. Conjuntos pequenos de áreas dispersas em
uma cidade poderiam, inclusive, apresentar uma maior biodiversidade em relação a
uma área contínua.
b) Áreas inicialmente criadas para o convívio humano podem se tornar importantes
para a biodiversidade de espécies, denominadas como habitats não convencionais.
Por exemplo, é possível que um campo de golfe se torne uma área importante neste
sentido.
c) Algumas ações podem ser tomadas para favorecer a biodiversidade em
ambientes urbanos, com a finalidade de dar auxílio às diferentes espécies na
convivência com estes ambientes. Embora iniciativas deste tipo não tenham sido
implementadas no Brasil, podemos citar alguns exemplos, entre eles a alteração
das luzes da cidade para favorecer o melhor convívio das espécies noturnas.
d) É possível fazer um planejamento, durante a construção de um projeto urbano,
para que ele permita o crescimento e expansão da cidade minimizando os impactos
negativos para a biodiversidade que nela existe.

12. O papel da água é muito importante em diversos processos que ocorrem em


células vegetais, cujo entendimento exige conhecimento prévio sobre osmose e
difusão. Sobre estes últimos, podemos afirmar que:

a) após serem estabelecidas concentrações iguais em dois ambientes, a


movimentação de partículas entre eles se encerra. Desta forma, em uma membrana
semipermeável o fluxo de água ocorre até que o número de moléculas de água em
cada lado da membrana seja igual.
b) a velocidade da difusão depende da diferença de concentração e, assim como a
osmose, envolve processos de transporte passivo. Ademais, podemos dizer que a
movimentação de moléculas na difusão ocorre de forma aleatória.
c) o processo de osmose, que é definido como a penetração de solvente de uma
solução de maior para menor concentração, ocorre em células vivas e também pode
ocorrer em sistemas artificiais.
d) Uma das principais diferenças entre osmose e difusão é que na primeira o
solvente é a água, enquanto na última outras moléculas estão envolvidas. Ainda
fazendo referência ao solvente envolvido na osmose, podemos dizer que a
plasmólise (ocorre em células vegetais) tem a água como o solvente em comum
com a osmose.

13. João estava avaliando um material de parasitologia. Ele se deparou com as


seguintes afirmações. Porém não conseguiu ter a certeza, então te encaminhou um
e-mail. A sua resposta será encaminhada para o João.

Analise as afirmativas abaixo, dê valores Verdadeiro (V) ou Falso (F) e assinale a


alternativa que apresenta a sequência correta de cima para baixo.
( ) No que se refere a Trypanosoma cruzi: A forma Tripomastigota, encontrada na
corrente sanguínea e em fezes de triatomíneos (hospedeiro invertebrado),
caracteriza-se por ser alongada, possuir núcleo central e um cinetoplasto terminal
de onde emergem o flagelo e a membrana ondulante; A forma amastigota,
encontrada normalmente em intestino de triatomíneos caracteriza-se por ser
esférica.
( ) Os vetores de relevância para a saúde pública são aqueles que veiculam e
transmitem os agentes infecciosos desde o reservatório até o
hospedeiro. Mamíferos, aves e preferencialmente roedores são vetores da peste
bubônica através das pulgas.
( ) Existem diversos tipos de parasitas e hospedeiros. Dentre uma das
características para classificar os parasitas, podemos usar: Parasito heteroxênico
(exemplo: Wuchereria bancrofti) e parasito monoxênico (exemplo: Enterobius
vermiularis).
( ) Várias parasitoses têm características comuns provocadas pela ingestão de água
e alimentos contaminados. Alguns exemplos de parasitas que eliminam cistos nas
fezes humanas são Entamoeba histolytica e Ascaris lumbricoides

a) V; F; V; F;
b) F; V; F; V;
c) F; V; V; F
d) V; F; F; F

14. Quase todos os processos nas células precisam de enzimas para que ocorram
de forma adequada. As reações intermediadas por enzimas se denominam reações
enzimáticas, e estas são afetadas pela temperatura, o pH, a concentração da
própria enzima e do substrato e outros fatores físico-químicos. Um experimento
realizado em in vivo mede a atividade de duas enzimas específicas que atuam em
diferentes tecidos de um mesmo paciente, como mostra o gráfico abaixo. Ambas as
medições são feitas em temperatura constante e controladas.

A respeito da natureza e da atividade enzimática das enzimas A e B, assinale a


alternativa correta.
a) A tripsina pode representar o padrão de atividade da proteína A, atuando no
duodeno.
b) O aumento da temperatura faria com que a atividade enzimática da enzima A
aumentasse, e a de B diminuísse, pois haveria a supressão de íons H+ no meio.
c) A enzima B, atuante originalmente no estômago, proporciona um aumento do pH
estomacal quando este está próximo de 6.0.
d) As enzimas que atuam na quebra dos alimentos podem ser representadas pela
atividade da proteína A.

15. Você começou a estagiar recentemente em um laboratório de biologia


molecular. Seu orientador te entrega o resumo do projeto financiado pela fundação
de amparo à pesquisa de seu estado e te pede para analisar com atenção:

O efeito de altas altitudes na prática de esportes é amplamente


discutido. Isso ocorre devido ao fato de que ao aumentar a altitude,
o efeito da pressão atmosférica em um indivíduo é menor. Sabe-se
que a pO2 impacta a saturação de hemoglobina em um organismo,
sendo necessário a aclimatação de jogadores em cidades de alta
altitude. O objetivo deste trabalho é determinar mudanças no
metabolismo de pessoas que encontram-se a mais de 15 dias em
lugares de alta altitude.

Com essa pequena introdução, seu orientador te passa as seguintes


informações:

● Nós conseguimos acesso a um estudo realizado na Cidade do


México do tipo X com N=800 e conduzido para identificar
diversas características.
● Desse total, 350 indivíduos vieram de cidades praianas a
menos de 2 dias.
● Foram coletadas amostras de sangue. Foram selecionadas as
células A, B, C, D, E e F.
● A porção Y do sangue será sequenciado utilizando a
metodologia Illumina.
● Temos acesso a resultados de estudo de associação entre
altitude e genoma completo.
01. O estudo (X) a que vocês tiveram acesso é do tipo caso-controle.
02. A porção do sangue que melhor representa Y é a porção 2 (constituída pelas
células A, C, D e E), já que a porção 3 é formada por células que não possuem DNA
e RNA (células B e F).
04. SNPs no cromossomo 6, 13 e 8 são os mais indicados para TWAS.
08. Para estudos metabólicos é preferível estudar o RNA, pois eles sugerem
mudanças no metabolismo.
16. O resultado apresentado na imagem indica os genes diferenciais por
cromossomos.
32. Supondo que você encontrou um transcrito (HbF) com expressão reduzida em
indivíduos controle. Você poderia sugerir que nessa população, o HbF foi uma
adaptação que dá vantagem aos indivíduos da Cidade do México.

Considerando as instruções fornecidas sobre o projeto e a imagem acima, selecione


a alternativa que melhor representa a interpretação do resultado apresentado.

a) 01+ 04+08+32 = 45
b) 01+02+16 = 19
c) 02+16+32 = 50
d) 04+08+32 = 44

16. Modelos animais são uma ferramenta poderosa para investigar a patofisiologia
de doenças humanas, tais como Alzheimer, depressão, Parkinson e ansiedade.
Neste sentido, é importante relacionar o comportamento do animal em alguns testes
com os sintomas observados em diversas doenças. Uma pesquisadora de mestrado
está realizando uma experimentação utilizando modelos animais para verificar se a
ativação do receptor NOP utilizando alguns agonistas está relacionada com a
patofisiologia de algumas condições. Dessa forma é incorreto afirmar que:

a) Os anticolinesterásicos reduzem o tempo de exploração do objeto na sessão de


teste no teste de reconhecimento de objetos.
b) A imipramina é usada como controle negativo em modelos animais de depressão,
reduzindo o tempo de imobilidade no teste de suspensão pela cauda e reduzindo o
tempo nos cantos do aparato no teste de interação social.
c) Antagonistas dopaminérgicos são capazes de reduzir a locomoção (distância
percorrida) do animal no teste do campo aberto
d) A venlafaxina é capaz de elevar o grooming ou auto limpeza do animal no teste
do campo aberto.

17. Augusto fez doutorado em neurociências e, após alguns anos, decidiu dar aulas
para o Ensino Médio, uma paixão que trazia desde a infância. Ministrando aulas
para inúmeras turmas de biologia em uma escola central em uma capital brasileira,
ele pode observar alunos com diferentes características, como personalidades e
compreensão dos conteúdos de biologia. Observador e cientista nato, sempre
analisou comentários de seus colegas de trabalho sobre os motivos que os alunos
são tão diferentes e até críticas sobre seu próprio trabalho como professor. Entre as
hipóteses levantadas pelos professores, qual é suportada por evidências científicas?

a) Eles diziam que José não estava fazendo seu trabalho direito. Para ter sucesso
com os alunos, ele deveria adaptar suas aulas aos diferentes estilos de aprendizado
da preferência dos alunos. Como cada aluno aprende usando um sentido (como a
visão), José deveria planejar suas aulas direcionadas a cada tipo diferente de aluno.
b) Eles relacionaram sempre a capacidade cognitiva dos alunos com a história de
vida deles. Isso porque os alunos que viveram em um ambiente enriquecido durante
as fases iniciais de desenvolvimento, em particular durante os três primeiros anos
de vida, tiveram melhor desenvolvimento do cérebro.
c) Eles acreditavam que alguns alunos apresentavam algum nível de problema
associado com o desenvolvimento de seus cérebros, mas ainda se reuniam
frequentemente com José para planejarem aulas da melhor forma a contribuir para
o aprendizado destes alunos. Isso porque problemas associados com as diferentes
formas de desenvolvimento do cérebro podem ser “remediados” com educação.
d) Eles diziam que os alunos poderiam alcançar melhores notas muito mais
facilmente se fossem esforçados e conseguissem superar a porcentagem usada do
cérebro. Isso porque é sabido que os seres humanos têm apenas 10% do cérebro
ativo, o que é reforçado por evidências científicas anatômicas, mostrando uma
proporção 1/10 no número de neurônios e de células da glia.

18. Em face dos diversos questionamentos e iniciativas globais sobre inclusão e


diversidade, a empresa Sherelu Educational, que atua na área de educação e
ensino em ciências biológicas, vem buscando incorporar aspectos nos materiais
didáticos que produz com a finalidade de reduzir a visão centrada no macho e
também de esclarecer aspectos sobre a reprodução humana. Entre as informações
incorporadas no material didático, eles

a) incorporaram aspectos sobre as interações sociais vivenciadas pela fêmea do


urso polar, já que o macho sempre foi tratado como representativo da espécie.
Apesar de estes ursos serem considerados solitários pela vida social do macho,
sabe-se que as fêmeas permanecem toda sua vida junto às proles e diversos
aspectos de suas vidas diferem do que é esperado de indivíduos solitários.
b) enfatizaram o papel da vagina, do útero e do oviduto no momento da concepção,
já que o macho sempre foi considerado como o lado “ativo” e a fêmea o “passivo”.
Apesar da ideia disseminada de que existe uma “competição”, os espermatozóides
não têm poder suficiente para chegarem ao ponto de concepção sozinhos, muito
embora a movimentação deles também não seja regulada pelo trato feminino.
c) incluíram uma imagem descrevendo o ciclo menstrual, destacando sua
regularidade. Isso porque tem-se uma ideia falsa de que o ciclo menstrual é variável
entre as mulheres e até mesmo entre as diferentes idades na mesma mulher. Ao
contrário do que se pensa, esta regularidade existe e tem, inclusive, implicações
médicas: sabe-se que as mulheres com fase lútea reduzida apresentam menor
fertilidade.
d) enfatizaram que, embora as mulheres não tenham próstata, elas apresentam
glândula de Skene, com as características muito semelhantes: ambas apresentam
mesma embriologia, bioquímica, estrutura e vascularidade. As mulheres não
apresentam câncer nessa glândula, por isso vemos esforços direcionados apenas
para a prevenção e tratamento de câncer de próstata (em homens). Ademais, os
tratamentos desenvolvidos para o câncer de próstata não teriam eficácia se fossem
aplicados em mulheres

19. Um aspecto importante em relação à genética das imunoglobulinas e linfócitos T


inclui o processo de recombinação (rearranjo) dos genes das cadeias leves e
pesadas. O processo de recombinação de genes é importante na eliminação de
células auto reativas e como consequência do rearranjo do DNA, o gene se torna
ativo, pois o promotor associado com o gene é levado para perto de um ativador.
Esse processo aleatório é direcionado para o reconhecimento de microrganismos.

Qual etapa da síntese de imunoglobulinas está ocorrendo na imagem abaixo?

a) Transcrição da cadeia pesada


b) Processamento do RNA da cadeia pesada
c) Tradução da cadeia leve
d) Transporte para o Retículo Endoplasmático da cadeia leve

20. Coronavírus são causadores de infecções respiratórias em uma variedade de


animais, incluindo aves e mamíferos. Sete coronavírus são reconhecidos como
patógenos em humanos. Os coronavírus sazonais estão em geral associados a
síndromes gripais. Nos últimos 20 anos, dois deles foram responsáveis por
epidemias, causando a síndrome respiratória aguda grave (SRAG). Em relação à
estrutura e função do coronavírus, marque a alternativa incorreta:
a) A proteína S (representada em A) é a proteína da espícula, a qual permite o
encaixe do vírus à célula. Ou seja, o SARS-CoV-2 se liga ao receptor ACE2
encontrado nas células através da proteína S (exemplo, células pulmonares).
Conhecer melhor a proteína da espícula poderá permitir fabricar medicamentos que
impedem o vírus de aderir às células humanas.
b) A proteína da espícula do SARS-CoV-2 é mais densa do que SARS-CoV, essa
particularidade permite que o SARS-CoV-2 se fixe de maneira mais sólida aos
receptores ACE2 na célula hospedeira. Esta variação entre o SARS-CoV e o SARS-
CoV-2, permitiu que o SARS-CoV-2 infectasse as células humanas e se propagasse
rapidamente.
c) A proteína N (representada em B) camufla o RNA (representado em E) diante
do sistema imunológico da célula. Enquanto que a proteína E (representada em D)
ajuda na infecção de outras células.
d) Em C está representado a membrana glicoproteica (envelope viral), a qual
protege o vírus e em D está representado a proteína 24 do capsídeo, a qual protege
o RNA viral (representado em B) e as integrases associadas ao RNA.
Ciência da Computação

21. Grafos são estruturas interessantíssimas de se entender, e podem dificultar a


vida de muitos estudantes. Suponha que tenhamos um grafo simples e não
direcionado com 2n vértices e 2n arestas, dado n ≥ 3. Este grafo consiste em dois
ciclos separados com n arestas cada. O grafo G abaixo representa o exemplo
mencionado para n=5:

Um par de vértices (p,q) de G é selecionado aleatoriamente a partir dos pares de


vértices distintos, sem arestas entre eles. Um novo grafo G' é construído para ser o
mesmo que G, exceto que existe uma aresta entre p e q. Qual é a probabilidade de
que G' esteja conectado?

a)

b)

c)

d)
22. Qual o diâmetro do grafo G abaixo?

a) 2
b) 3
c) 4
d) 5

23. Você deve combinar cada algoritmo abaixo com o limite superior assintótico
mais aproximado para o pior tempo de execução, inserindo uma das letras A,B, C
ou D na linha correspondente. Para algoritmos de ordenação, n é o número de
elementos de entrada. Para algoritmos de grafos, n é número de vértices e o
número de arestas é Θ(n). Qual a sequência correta de letras lida de cima para
baixo?

____ Insertion sort A: O(logn)


____ Heapsort B: O(n)
____ Bellman-Ford C: O(nlogn)
____ DFS D: O( )
____ Prim

a) D - C - D - B - C
b) D - B - C - C - B
c) D - A - D - D - C
d) D - D - C - B - B

24. Um programador criou um código para gerir a abertura de seu cofre pessoal. A
abertura do cofre ocorre quando a saída da função descrita abaixo, void libera (int
n), imprimir dois valores iguais. Qual número o programador necessita digitar como
entrada nesta função para liberar seu cofre? A função está codificada em
Linguagem C, e o valor digitado pelo programador corresponde a variável n .
a) 47
b) 46
c) 45
d) 44

25. Quantas soluções inteiras positivas (x,y,k) existem para a equação:

a) 0
b) 1
c) 2
d) 3

26. A figura mostra o grafo não dirigido G(V,E), onde V é o conjunto dos objetos
vértices (nós) e E o conjunto dos objetos arestas. V={A, B, C, D, E, F, G, H, I, J, K,
L}. Encontre o centro do grafo G(V, E) e o centro quando eliminado a aresta EF ou
FE.

a) {E, F} e {F}
b) {E, F} e {E}
c) {F} e {F, G}
d) {E} e {F, G}
27. Devido à importância de prever e combater as doenças que afligem as
populações do estado Caramandunga, o governo destinou um orçamento para a
construção de um Hospital destinado à atenção, pesquisas e desenvolvimento de
vacinas. Esse hospital deverá ser construído em uma região em que esteja o mais
próximo para todos. Sabendo-se os tempos de trajeto (em minutos) pelos caminhos
que unem as cidades entre si, em qual cidade devera-se instalar o Hospital?

Considere M a matriz de adjacência do grafo ponderado G(V,E), onde V={A, B, C,


D, E, F, G} representa o conjunto dos vértices (nós), e cada nó representa uma
cidade, entretanto E representa o conjunto das arestas, e cada aresta representa o
tempo de percorrido de uma cidade a outra..

a) A
b) B
c) C
d) D

28. Qual o valor retornado pela função question em python no trecho abaixo?

a) ‘A’
b) ‘G’
c) TypeError: 'str' object is not callable
d) [‘A’,’T’,’C’,’G’]
29. Dado a imagem abaixo, de tamanho 9x9, qual seria o resultado da aplicação de
um filtro de suavidade linear com um kernel 3x3?

a)

b)

c)

d)
30. O Sr. Iwatani desenvolveu um programa para auxiliar o Pac-Man a atravessar o
labirinto e obter seu precioso alimento. Dado a figura abaixo mostrando o mapa de
varredura dos possíveis caminhos analisados, qual algoritmo foi utilizado neste
programa?

a) Busca em largura
b) Busca BLAST
c) Busca em profundidade
d) Busca A*

31. Qual o valor da soma abaixo:

√ √ √ √ √ √ √

a) √
b) √
c) √
d) √

32. Nicolás estava planejando um experimento e decidiu anotar o crescimento de


sua bactéria em intervalos de 10 minutos. A observação dos valores foi realizada
em intervalos constantes por uma hora e vinte minutos. Após esse tempo, ele
obteve a seguinte série:
Considere que a taxa de crescimento da bactéria segue um padrão. Qual é a soma
de dígitos do número de bactérias imediatamente cumpridas 6 horas?

a) 34
b) 44
c) 54
d) 64

33. Suponha que você é o gerenciador de um banco de dados em MySQL (a


imagem abaixo representa o modelo físico). Foi solicitado a você um relatório de
todos os pesquisadores associados ao orientador com id_orientador igual a 507. A
saída deverá ter duas colunas, em que a primeira coluna deve conter o nome do
orientador e a segunda coluna os nomes dos pesquisadores associados ao
orientador. Qual query você executaria?

a) SELECT concat(p.nome, " ", p.sobrenome) "Orientador", concat(o.nome, " ",


o.sobrenome) "Pesquisador" FROM pesquisador p JOIN pesquisador o ON
p.id_pesquisador = o.id_orientador WHERE o.id_orientador = 507;
b) SELECT concat(o.nome, " ", o.sobrenome) "Orientador", concat(p.nome, " ",
p.sobrenome) "Pesquisador" FROM pesquisador p JOIN pesquisador o ON
p.id_pesquisador = o.id_orientador WHERE p.id_orientador = 507;
c) SELECT concat(o.nome, " ", o.sobrenome) "Orientador", concat(p.nome, " ",
p.sobrenome) "Pesquisador" FROM pesquisador p JOIN pesquisador o ON
o.id_pesquisador = p.id_orientador WHERE o.id_orientador = 507;
d) SELECT concat(p.nome, " ", p.sobrenome) "Orientador", concat(o.nome, " ",
o.sobrenome) "Pesquisador" FROM pesquisador p JOIN pesquisador o ON
o.id_pesquisador = p.id_orientador WHERE p.id_orientador = 507;

34. Marque a opção que apresenta a sequência correta de algoritmos de clustering


utilizado na imagem abaixo.
a) K-Means (K=2), Aglomerativo (N=4), Propagação de afinidade, Densidade
(DBSCAN)
b) Aglomerativo (N=2), K-Means (K=4), Densidade (DBSCAN), Propagação de
afinidade
c) Aglomerativo (N=2), Propagação de afinidade, Densidade (DBSCAN), K-Means
(K=2)
d) K-Means (K=2), Propagação de afinidade, Aglomerativo (N=2), Densidade
(DBSCAN)

35. Marque a alternativa que corresponda a sequência correta de algoritmos de


classificação utilizados na imagem abaixo:
a) KNN, SVM (linear), Decision Tree, Random Forest, Naive Bayes
b) KNN, Naive Bayes, SVM (linear), Random Forest, ANN
c) ANN, Decision Tree, SVM (linear), Naive Bayes, ANN
d) SVM (linear), Decision Tree, ANN, Random Forest, SVM (polinomial)

36. Um heap binário é uma estrutura de dados útil para a implementação de


sistemas de enfileiramento com prioridade. Para os casos de inserção e extração de
elementos a notação assintótica no melhor caso é Ω(1) e no pior caso é O(log(n)).
Se o arranjo V1 (Min Binary Heap) representa um sistema de enfileiramento. Qual
seria a representação do novo arranjo (V2) após inserir um valor 5 e depois extrair a
raiz?

a) V2 = [5, 5, 7, 13, 7, 7, 19, 19, 14, 12, 23, 9, 11]


b) V2 = [5, 7, 7, 7, 5, 13, 12, 19, 23, 9, 11, 14, 19]
c) V2 = [5, 7, 5, 13, 12, 7, 7, 19, 14, 19, 23, 9, 11]
d) V2 = [5, 5, 7, 7, 7, 9, 11, 12, 13, 14, 19, 19, 23]

37. Seja a equação de uma função recursiva:

Calcule a notação assintótica.


38. Qual deve ser a ordem de execução das linhas de código em python para obter
o volume de uma esfera com raio maior ou igual a 2? O raio deve ser definido como
entrada pelo usuário.

[1] v *= pow(int(r), 3)
[2] v += pi
[3] r = input()
[4] v *= 4
[5] from math import pi
[6] v = 0
[7] print('volume: {}'.format(round(v, 2)))
[8] v /= 3

a) 3, 5, 6, 8, 4, 1, 2, 7
b) 3, 5, 6, 4, 8, 2, 1, 7
c) 5, 3, 6, 1, 2, 8, 4, 7
d) 5, 3, 6, 2, 4, 1, 8, 7

39. Seja o autômato finito:

Considere o grafo de estados como a representação do A:


Encontre a expressão regular de A.

40. Mayla é uma exímia estudante e consegue realizar cálculos rapidamente. Ela
trabalha na seção de logística em uma empresa do ramo de entregas. Em sua
empresa cada produto possui um código formado por barras verticais. Por exemplo,
a imagem abaixo possui quatro barras de 2 mm de largura, três barras de 1 mm de
largura e duas de largura 0.1 mm. Cada código a ser inserido no banco de dados
terá uma disposição diferente dessa sequência de barras. O gerente de Mayla
deseja saber quantos códigos distintos existirão a partir deste código na imagem.
Qual a resposta da estudante?

a) 745
b) 830
c) 1150
d) 1260
Bioinformática
41. Abaixo está representada uma rede bayesiana composta por cinco estados
binários, representados por A,B,C,D e E. Cada estado corresponde a um gene, cuja
expressão pode ser “ON” ou “OFF”. A Tabela 1 abaixo mostra o valor de corte de
expressão para que o gene seja considerado ativo em determinada condição (“ON”)
ou desativado (“OFF”), caso não atinja esse valor de expressão.

Figura 1. Rede bayesiana composta por cinco estados binários, representados por
A,B,C,D e E.

Tabela 1. Expressões mínimas de ativação de cada gene na rede da Figura 1.


Gene Expressão mínima para ativar

A 180

B 80

C 60

D 100

E 30

De acordo com as informações fornecidas da rede (figura acima) e as


probabilidades abaixo, calcule a probabilidade do estado da rede ocorrer, dado a
expressão dos genes presentes na Tabela 2.
Tabela 2. Expressões dos genes presentes na rede da Figura 1.
Gene A B C D E

Expressão 250 90 70 110 50

a) 0,0271
b) 0,0341
c) 0,0421
d) 0,0531

42. Existem muitas maneiras de agrupar (clustering) genes que possuem o mesmo
perfil de expressão gênica sobre muitas condições. Suponha que foi inventado um
novo método de agrupamento não baseado em distância, como descrito abaixo.

Seja o valor da expressão do gene i na condição j, e o Z-score do gene i na


condição j. Considere que depende da média da expressão do gene i, dada por
̅ e o desvio padrão . Logo, o valor de é:

̅̅̅̅


Calculamos a medida , onde e são, respectivamente, o z-
score dos genes p e q na condição j, e n é o total de condições anotadas. Quanto
maior for o valor de maior a correlação entre os genes.

Abaixo se encontram quatro genes e suas expressões ao longo de seis tempos. A


partir das expressões, calcule todos os valores de dois a dois. Use a
aproximação para duas casas decimais para os valores de . Assinale a
alternativa correta.
T1 T2 T3 T4 T5 T6

Gene A 1 1,5 2 2,5 3 3

Gene B 1 0,5 1,5 0,5 1,5 1

Gene C 4 2,8 2 1,5 0,5 0,5

Gene D 1,5 1,7 2,5 2,5 2,2 2

a)
b)
c)
d)

43. Quando uma estrutura de rede é aplicada a sistemas biológicos, ela é chamada
de rede biológica. Essa estrutura de rede é aproximada para um grafo. Uma das
aplicações mais comuns de redes biológicas é através de redes proteína-proteína
(PPI networks), onde os nós são as proteínas e as arestas as interações entre elas.
Uma métrica comum utilizada em conectividade de redes é o grau (degree) de um
nó, sendo obtido pela contagem de interações deste nó com todos os outros da
rede. Um exemplo de uma rede biológica está destacado abaixo.

A distribuição de graus de uma rede, P(k), fornece a probabilidade de um vértice


escolhido ter o grau k. Ela é obtida contando o número de nós com uma
determinada conectividade e dividindo por N vértices. Essa medida fornece uma
maneira fácil de inferir a conectividade e pode ser usada para classificação de redes
biológicas. Se a maioria dos vértices tiver um grau semelhante, P(k) será uma
distribuição com um determinado pico (vide figura abaixo).
No entanto, a maioria das redes biológicas são livre de escala (scale-free), o que
implica que sua distribuição de conexões é desigual e pode ser aproximada por
P(k) ≈ , onde a é uma constante positiva. Nesse caso, quando a maioria dos
vértices está pouco conectada, um grande número de arestas está concentrado em
um pequeno número de nós. Qual o melhor gráfico que descreve a relação de P(k)
em uma rede livre de escala?

44. Qual destas expressões regulares pode ser utilizada para recuperar todos os
aminoácidos bem como suas respectivas cadeias, posição na estrutura e
coordenadas espaciais; a partir de um arquivo PDB:

a) ATOM .{12}([A-Z]{3}) ([A-Za-z]{1,2}).*?(\d+).{4}.*?(\d+.\d+).*?(\d+.\d+).*?(\d+.\d+)


b) ATOM ([A-Z]*) ([A-Za-z]*).*?(\d+).*?(\d+.\d+).*?(\d+.\d+).*?(\d+.\d+)
c) ATOM .*([A-Z]*) ([A-Za-z]).*?(\d+).*?(\d+.\d+).*?(\d+.\d+).*?(\d+.\d+)
d) ATOM .{12}([\s]{3}) ([\s]{1,2}).*?(\d+).{4}.*?(\d+.\d+).*?(\d+.\d+).*?(\d+.\d+)

45. Um bioinformata tentou alinhar duas sequências proteicas: AELPL e AIPL. Ele
utilizou o algoritmo Needleman-Wunsch e obteve o resultado mostrado abaixo.
Dada a matriz de pontuação obtida, quais foram os parâmetros utilizados para
Match, Mismatch e Gap Penalty?

A E L P L

0 -2 -4 -6 -8 -10

A -2 2 0 -2 -4 -6

I -4 0 0 -2 -4 -6

P -6 -2 -2 -2 0 -2

L -8 -4 -4 0 -2 2

Seq1: AELPL
Seq2: AI-PL

a) Match: 2, Mismatch: 0 e Gap: 2


b) Match: 2, Mismatch: -2 e Gap: -2
c) Match: 2, Mismatch: -2 e Gap: 2
d) Match: 2, Mismatch: 0 e Gap: -2

46. Marque a opção que corresponda à árvore filogenética gerada para as quatro
sequências abaixo, considerando que as distâncias foram calculadas utilizando
Levenshtein e o agrupamento foi feito por UPGMA.

>seqA
QINSRWWCNDGRTPGS
>seqB
QICSAWWCNDCRDPGC
>seqC
QICSRWWCNDGRDPGC
>seqD
QINSRWWCDDGRTPGS

a) (((SeqA:0.5,SeqD:0.5):1.75,SeqC:1.75):2.25,SeqB:2.25)
b) ((SeqA:1,SeqD:1):7.5,(SeqC:4.5,SeqB:4.5):7.5)
c) (((SeqA:1,SeqD:1):3.5,SeqC:3.5):5,SeqB:5)
d) ((SeqA:0.5,SeqD:0.5):3.75,(SeqC:2.25,SeqB:2.25):3.75)

47. O algoritmo Needleman-Wunsch, baseado na programação dinâmica, é utilizado


para alinhamento global de sequências biológicas. Esse algoritmo retorna o melhor
alinhamento possível, entretanto o resultado obtido não necessariamente tem uma
significância biológica, sendo importante a escolha de um sistema de pontuação
adequado ao problema. A complexidade do algoritmo é de ordem Θ(mn), e quanto
maior o comprimento das sequências, maior é o custo computacional associado.
Utilize este algoritmo para alinhar as sequências S1 e S2, considerando as
pontuações +2 para os match, -1 para os mismatch e -3 para os gap penalty.

S1: ATTTAGC
S2: CTTATC

Escolha a alternativa que contenha o score (pontuação ótima) e o número de


alinhamentos possíveis para as sequências S1 e S2, respectivamente.

a) 2 e 3
b) 3 e 3
c) 2 e 4
d) 3 e 4

48. A evolução, a inferência filogenética e a bioinformática caminham juntas em


relação às estimações de tempo de divergência entre organismos. Sobre métodos
de estimação de tempo de divergência usando dados moleculares,

a) Nas gerações mais primitivas de métodos para estimação de taxas evolutivas


eram atribuídas taxas evolutivas diferentes para os diferentes ramos de uma árvore
filogenética. À medida que os métodos avançaram (início dos anos 2000), foram
desenvolvidas estratégias para identificar e remover genes e espécies para os quais
a regra não se aplicava, para então inferir tempos de divergência na árvore com
regiões e taxa removidos, época em que houve muito avanço em relação aos
estudos de tempo de divergência em mamíferos, vertebrados, metazoários e
eucariotos.
b) Os métodos mais antigos para estimação de tempo de divergência assumiram a
existência de um relógio molecular estrito. Um método com essa premissa foi
aplicado para estimar o tempo de divergência entre genes em duas espécies de
mamíferos, X e Y, para o qual datações fósseis entre uma das espécies, X, e uma
terceira, Z, foi usada. Regressão linear a partir da origem foi usada para calibração
de tempo e para conversão de distância em tempo.
c) Na primeira geração de métodos de estimação de relógio molecular
predominavam aqueles que assumiam um acúmulo linear de mutações ao longo de
uma filogenia; por isso, os métodos datavam tempos de divergência assumindo um
modelo estatístico ou correlação entre as taxas ao longo da árvore, global ou
localmente.
d) Os primeiros métodos para estimação de tempo de divergência usando
sequências moleculares, que foram aplicadas a sequências de alfa e beta globinas,
assumiram um relógio molecular estrito. Para usar estes métodos, era necessário
escolher um modelo para processo de especiação (como de “apenas nascimento”
ou de “nascimento e morte”), bem como as mínimas e máximas associadas a cada
ponto de calibração da árvore e as distribuições de incertezas a eles associadas.

49. Em relação ao Gene Ontology,

a) O banco de dados de Gene Ontology permite que bioinformatas recuperem


informações como “quais são as funções do gene X?”, mas também permitem
realizar entradas bem mais específicas no banco como, por exemplo, “quais as
evidências experimentais de atividade do gene X em determinada patologia?”. Além
disso, estes bancos de dados permitem a realização de análise de enriquecimento
de termos GO em um experimento envolvendo a expressão gênica em uma dada
condição. Esta análise consiste no agrupamento dos genes de um determinado
organismo em classes funcionais, seguido de um teste estatístico que releva
processos biológicos a serem investigados com maior profundidade, nesta dada
condição.
b) As anotações de termos do GO são estáticas; assim, genes que foram
associados a determinadas funções moleculares em 2014 deverá continuar
associado às mesmas funções, com a finalidade de evitar inconsistências nas
análises de bioinformática desenvolvidas por pesquisadores de diferentes grupos de
pesquisa e diferentes versões do banco de dados.
c) Funções moleculares envolvendo atividades de ligação são igualmente descritas
por termos de GO diferentes. Por exemplo, ‘GO:0030332 cyclin binding’,
‘GO:0005524 ATP binding’, ‘GO:0004693 cyclin-dependent protein serine/threonine
kinase activity’, ‘GO:0005515 protein binding’ e ‘GO:0004674 protein
serine/threonine kinase activity’ apresentam a mesma complexidade de ontologia
nas análises computacionais e são igualmente amplas em contextualização
biológica.
d) O chamado GO slim (ou “subset”) apresenta uma visão geral de funções,
localização e papel biológico de determinados genes. O banco do Gene Ontology
não apresenta estes subsets disponíveis para a comunidade científica, mas provê
ferramentas adequadas para que o usuário possa criar seu subset, que ajuda a
entender com mais detalhes as funções específicas de um gene. Um exemplo é a
especificidade de cofatores enzimáticos.

50. Em relação às diferentes estratégias de anotação de genomas de eucariotos


usando métodos computacionais:

a) Uma estratégia possível envolve o uso de um preditor de gene ab initio que irá
recuperar a CDS mais provável para cada gene, o que envolve necessariamente o
uso de dados experimentais de transcriptoma (como RNA-Seq).
b) Uma estratégia possível envolve o uso de diferentes softwares de predição ab
initio. No entanto, neste caso o usuário não consegue usar um software para
recuperação de uma anotação final baseada em consenso entre os diferentes
preditores.
c) Uma estratégia possível envolve o alinhamento de ESTs, proteínas e transcritos
obtidos em experimentos de transcriptoma (como RNA-Seq), seguido de softwares
que geram uma anotação final baseada em consenso e em evidências. No entanto,
neste caso o usuário é impossibilitado de adicionar informações como sobre as
UTRs ou splicing alternativo.
d) Uma estratégia possível envolve o alinhamento de proteínas, ESTs e uso de
dados de RNA-Seq. Sequências de outros organismos podem ser usadas como
evidências, mas geralmente estão restritas às sequências de proteínas.

51. As tecnologias de Sequenciamento de Nova Geração permitem o


desenvolvimento de ferramentas de bioinformática para a anotação de variantes
usando um genoma de referência. Sobre estes métodos:
a) eles permitem identificar a relação de uma determinada variante com um gene.
Por exemplo, é possível identificar uma variante localizada em um determinado
exon e predizer qual alteração acarreta na proteína traduzida, incluindo uma
variante sinônima de troca de uma tirosina em uma sequência de referência por um
fenilalanina na sequência do organismo em estudo.
b) eles permitem identificar variantes em regiões intergênicas, desde que suas
posições de início e fim tenham sido explicitamente declaradas em um arquivo de
anotação, como o arquivo Variant Call Format (ou VCF).
c) eles atuam mapeando (ou “alinhando”) leituras de sequenciamento no genoma de
referência e, desta forma, descobrem variantes comparando o alelo da sequência
mapeada com o alelo presente na posição homóloga do genoma de referência que
está sendo usado.
d) além de permitirem a identificação de variantes em genes e regiões intergênicas,
eles também permitem a comparação das variantes descobertas com as disponíveis
em bancos de dados como o dbSNP, vinculado ao NCBI (National Center for
Biotechnology Information).

52. Marque a opção incorreta a respeito do banco de dados SCOP:

a) O SCOP tem como objetivo fornecer uma descrição detalhada das relações
evolutivas e funcionais de famílias de proteínas, independentemente de haver ou
não estrutura resolvida.
b) Proteínas que possuem o mesmo enovelamento, porém baixa similaridade de
sequência ou funcional, são classificadas como diferentes superfamílias e
consequentemente presume-se que tenham apenas um ancestral comum muito
distante.
c) Proteínas que possuem o mesmo enovelamento e uma razoável similaridade de
sequência e/ou função, são classificadas como famílias e consequentemente
presume-se que tenham um ancestral em comum mais próximo.
d) De acordo com o SCOP, o enovelamento é um atributo de uma superfamília,
porém famílias que fazem parte de superfamílias que desenvolveram características
estruturais distintas podem pertencer a um enovelamento diferente

53. Qual é o código Pfam do domínio S2 da sequência cuja estrutura está


depositada no PDB (Protein Data Bank) com o código 7JWY?
a) PF00318
b) PF05213
c) PF01601
d) PF16451

Texto referente à questão 54 e 55

Considere a estrutura do gene na figura abaixo e responda as duas próximas


perguntas. Os números dos éxons e seus tamanhos em nucleotídeos estão
indicados. A transcrição pode iniciar em qualquer uma das setas mostradas, e os
éxons 2 e/ou 3 podem ser separados.
54. Quantas isoformas possíveis deste gene poderiam existir?
a) 4
b) 5
c) 6
d) 7

55. Assumindo que os reads são single-end e exigirmos que uma leitura de junção
deve ter uma sobreposição mínima de 10 pb com cada exon, qual é o comprimento
do read mais curto que garantiria a capacidade de identificar inequivocamente todas
as isoformas deste gene?

a) 250 bp
b) 270 bp
c) 650 bp
d) 670 bp

56. A análise de expressão diferencial de dados de RNA-Seq testa milhares de


hipóteses em um único experimento biológico. Para limitar os falsos positivos, é
necessário ajustar os valores de p-value, para comparações múltiplas. Existem
vários métodos de correção, e podemos citar a correção de Bonferroni ou
de Benjamini-Hochberg. Considere um estudo de expressão gênica para identificar
genes diferencialmente expressos utilizando o DESeq2. Foram analisados 8 genes
e os valores dos seguintes p-values não corrigidos estão apresentados na tabela
abaixo. São ditos genes diferencialmente expressos se o valor do p-value após a
correção for menor ou igual que um valor crítico ɑ.

Gene P-value

1 0.00050

2 0.00770

3 0.00400

4 0.05000

5 0.00020

6 0.00560

7 0.06200

8 0.00620
Aplicando a correção de Bonferroni, quantos genes são considerados
diferencialmente expressos para ɑ = 0,05 ?

a) 5
b) 6
c) 7
d) 8

57. Metagenômica é o estudo de material genético recuperado diretamente de


amostras ambientais. Através de estudos de metagenômica, podemos mostrar
diferenças entre as comunidades microbianas de diferentes ambientes e estimar o
número de espécies diferentes em uma amostra. Para isso existem os índices de
alfa e beta diversidade. Na figura a seguir, indique se estamos olhando para a
diversidade alfa ou beta. Além disso, julgue se sequenciamos com profundidade de
cobertura suficiente para descrever as diferentes amostras presente no gráfico.

a) Alfa diversidade. Algumas das curvas de rarefação já atingiram um platô, o que


indica que precisamos apenas calcular de forma correta o índice de diversidade.
b) Alfa diversidade. Algumas das curvas de rarefação ainda estão subindo, o que
indica que precisamos de mais sequenciamento para obter uma imagem completa
por amostra.
c) Beta diversidade. Algumas das curvas de rarefação já atingiram um platô, o que
indica que precisamos apenas calcular de forma correta o índice de diversidade.
d) Beta diversidade. Algumas das curvas de rarefação ainda estão subindo, o que
indica que precisamos de mais sequenciamento para obter uma imagem completa
por amostra.

58. Julgue as informações abaixo a respeito da ferramenta BLAST e assinale a


alternativa correta.

I. BLAST é uma ferramenta heurística de alinhamento global desenvolvida em 1990.


II. No alinhamento de sequências realizado pelo BLAST, a segunda etapa é
pesquisar em um banco de dados de sequências para a ocorrência das palavras de
entrada.
III. A etapa final envolve o alinhamento de pares estendendo-se as palavras em
ambas as direções enquanto conta a pontuação de alinhamento usando a mesma
matriz de substituição.
IV. TBLASTX consulta as sequências de proteínas em um banco de dados de
sequência de nucleotídeos com as sequências traduzidas em todos os seis frames
de leitura.

a) I, II, III, IV
b) I, IV
c) II, III
d) II, III, IV

59. O algoritmo Longest Common Subsequence (LCS) visa encontrar a


subsequência comum mais longa entre sequências de texto. Ele é utilizado em
diversas aplicações como em sistemas de controle de versões, reconhecimento de
voz e imagens, otimização de consultas de bancos de dados, entre outros. É
utilizado na Bioinformática para o alinhamento de duas sequências (DNA ou
proteínas) ou na busca de padrões comuns nestas sequências. Para duas
sequências de caracteres (m e n de comprimento) o tempo de execução para a
programação dinâmica é de O(nm). Nem sempre o algoritmo retorna uma única
subsequência. O algoritmo pode retornar todas as subsequências, diferentes, mas
com a mesma pontuação. Define-se para duas sequências X = (x1, x2, x3, …, xm) e Y
= (y1, y2, y3, …, yn), os prefixos de X como X1,2,3,…,m e os prefixos de Y como
Y1,2,3,…,n, onde a solução é definida pela função LCS(X,Y):

Quais seriam as LCS das sequências X = ATGATTACAA e Y = TGCCACTA?.

a) TGATA e TGACA
b) TGATA e TGCAA
c) TGACA e TGCAA
d) TGATA, TGACA e TGCAA

60. O algoritmo de (Ruth) Nussinov foi desenvolvido para obter a estrutura


secundária de uma molécula de RNA, onde se procura o maior número de pares de
bases emparelhadas. Esse algoritmo utiliza o princípio de programação dinâmica
para o preenchimento de uma matriz de pontuação. Em cada iteração incrementa-
se o valor de i (posição inicial da sequência) e decrementa-se o valor de j (posição
final da sequência), avaliando e procurando o maior valor entre quatro casos.
Preenchida a matriz, se faz o processo de backtracking para a obtenção da
estrutura secundária.
Seja S uma sequência de RNA de tamanho L e γ a matriz de pontuação da
sequência S (Si ϵ {A,U,C,G}).

Inicialização da Matriz:

Critérios para o preenchimento.

Quais são os valores que faltam na matriz de pontuação (semi-preenchida)


seguinte?

a) γ(1,5)=1, γ(4,7)=1, γ(2,7)=2 e γ(1,8)=3


b) γ(1,5)=2, γ(4,7)=1, γ(2,7)=3 e γ(1,8)=3
c) γ(1,5)=2, γ(4,7)=2, γ(2,7)=2 e γ(1,8)=4
d) γ(1,5)=1, γ(4,7)=2, γ(2,7)=3 e γ(1,8)=4

//
Fim de prova.
https://lbb.ime.usp.br/

Você também pode gostar