Você está na página 1de 20

Artigo

Um novo coronavírus associado a doenças respiratórias


humanas na China

https://doi.org/10.1038/s41586-020-2008-3 Recebido: 7 de Fan Wu 1,7, Su Zhao 2,7, Bin Yu 3,7, Yan-Mei Chen 1,7, Wen Wang 4,7, Canção Zhi-Gang 1,7, Yi Hu 2,7,
Zhao-Wu Tao 2 Jun-Hua Tian 3 Yuan-Yuan Pei 1 Ming-Li Yuan 2 Yu-Ling Zhang 1 Fa-Hui Dai 1
janeiro de 2020 Aceito: 28 de janeiro de 2020 Publicado
Yi Liu 1 Qi-Min Wang 1 Jiao-Jiao Zheng 1 Lin Xu 1 Edward C. Holmes 1,5 & Yong-Zhen Zhang 1,4,6 ✉
online: 3 de fevereiro de 2020

As doenças infecciosas emergentes, como a síndrome respiratória aguda grave (SARS) e a doença do vírus Zika,
representam uma grande ameaça à saúde pública 1-3. Apesar dos intensos esforços de pesquisa, como, quando e onde

Verifique se há atualizações novas doenças aparecem ainda são uma fonte de considerável incerteza. Uma doença respiratória grave foi relatada
recentemente em Wuhan, província de Hubei, China. Em 25 de janeiro de 2020, foram notificados pelo menos 1.975
casos desde a internação do primeiro paciente em 12 de dezembro de 2019. Investigações epidemiológicas sugeriram
que o surto estava associado a um mercado de frutos do mar em Wuhan. Aqui, estudamos um único paciente que
trabalhava no mercado e foi internado no Hospital Central de Wuhan em 26 de dezembro de 2019, enquanto
experimentava uma síndrome respiratória grave que incluía febre, tontura e tosse. Seqüenciamento de RNA
metagenômico 4 de uma amostra de líquido de lavagem broncoalveolar do paciente identificou uma nova cepa do vírus
RNA da família Coronaviridae, que é designado aqui coronavírus 'WH-Human 1' (e também foi referido como
'2019-nCoV'). A análise filogenética do genoma viral completo (29.903 nucleotídeos) revelou que o vírus estava mais
intimamente relacionado (89,1% de similaridade de nucleotídeos) a um grupo de coronavírus do tipo SARS (gênero
Betacoronavirus, subgênero Sarbecovirus) que havia sido encontrado anteriormente em morcegos na China. 5) Este
surto destaca a capacidade contínua de transbordamento viral de animais para causar doenças graves em seres
humanos.

O paciente estudado era um homem de 41 anos de idade, sem histórico de hepatite, início da doença) (Extended Data Fig. 1e). Investigações etiológicas preliminares excluíram
tuberculose ou diabetes. Ele foi internado e hospitalizado no Hospital Central de Wuhan a presença do vírus influenza, Chlamydia pneumoniae e Mycoplasma pneumoniae usando kits
em 26 de dezembro de 2019, 6 dias após o início da doença. O paciente relatou febre, comerciais de detecção de antígenos patógenos, e isso foi confirmado por PCR. Outros
aperto no peito, tosse improdutiva, dor e fraqueza por 1 semana após a apresentação patógenos respiratórios comuns, incluindo adenovírus humanos, também apresentaram
(Tabela 1). O exame físico das características cardiovasculares, abdominais e resultados negativos por PCR quantitativo (qPCR) (Dados Estaduais Fig. 2). Embora tenha
neurológicas mostrou que estas eram normais. Linfopoenia leve (definida como menos de sido administrada uma combinação de antibióticos, terapia antiviral e glicocorticóide, o
9 × 10 5  células por ml), mas as contagens de glóbulos brancos e plaquetas eram normais paciente apresentou insuficiência respiratória e recebeu ventilação não invasiva de alto
em um teste completo de hemograma. Níveis elevados de proteína C-reativa (41,4 mg l −1 fluxo. A condição do paciente não melhorou após 3 dias de tratamento e ele foi internado na
unidade de terapia intensiva. O paciente foi transferido para outro hospital em Wuhan para
tratamento adicional 6 dias após a admissão.
de sangue; intervalo de referência, 0–6 mg l −1) foram observados e os níveis de aspartato
aminotransferase, desidrogenase láctica e creatina quinase foram levemente elevados nos
testes de química do sangue. O paciente apresentava hipoxemia leve com níveis de oxigênio de Investigações epidemiológicas realizadas pelo Centro Wuhan de Controle e Prevenção de
67 mm Hg, conforme determinado pelo teste de gasometria arterial. No primeiro dia de Doenças revelaram que o paciente trabalhava em um mercado local de frutos do mar.
admissão (dia 6 após o início da doença), as radiografias de tórax eram anormais com Notavelmente, além de peixes e moluscos, uma variedade de animais selvagens vivos - incluindo
sombreamento no espaço aéreo, como opacidades em vidro fosco, consolidação focal e ouriços, texugos, cobras e pássaros (rolas) - estavam disponíveis para venda no mercado antes
consolidação irregular em ambos os pulmões (Extended Data Fig. 1). As tomografias do início do surto, bem como carcaças de animais e carne de animais. Não havia morcegos
computadorizadas do tórax revelaram consolidação focal bilateral, consolidação lobar e disponíveis para venda. Embora o paciente pudesse ter tido contato com animais selvagens no
consolidação irregular, principalmente no pulmão inferior (Extended Data Fig. 1a – d). Uma mercado, ele não se lembrava de ter sido exposto a aves vivas.
radiografia de tórax revelou uma sombra difusa e difusa bilateral difusa no dia 5 após a
admissão (dia 11 após a Para investigar os possíveis agentes etiológicos associados a essa doença, foram
coletados líquidos de lavagem broncoalveolar (LBA) e

11 Centro Clínico de Saúde Pública de Xangai, Universidade de Fudan, Xangai, China. 2 Departamento de Medicina Pulmonar e Cuidados Críticos, Hospital Central de Wuhan, Faculdade de Medicina Tongji, Universidade de Ciência e Tecnologia

Huazhong, Wuhan, China. 3 Centro Wuhan para Controle e Prevenção de Doenças, Wuhan, China. 4 Departamento de Zoonose, Instituto Nacional de Controle e Prevenção de Doenças Transmissíveis, China Center for Disease Control and Prevention,

Pequim, China. 5 Marie Bashir Institute for Infectious Diseases and Biosecurity, School of Life and Environmental Sciences e School of Medical Sciences, Universidade de Sydney, Sydney, Nova Gales do Sul, Austrália. 6 Faculdade de Saúde Pública,

Universidade de Fudan, Shanghai, China.


7 Esses autores contribuíram igualmente: Fan Wu, Su Zhao, Bin Yu, Yan-Mei Chen, Wen Wang, Zhi-Gang Song e Yi Hu. ✉ e-mail: zhangyongzhen@shphc.org.cn

Natureza | V. 579 12 de março de 2020 | 265


Artigo
Quadro 1 Sintomas clínicos e dados do paciente cobertura a uma profundidade média de 6,04 × (variação de 0,01 a 78,84 ×) (Dados estendidos
Fig. 3). A carga viral na amostra LBA foi estimada pelo qPCR em 3,95 × 10 8  cópias por ml
Característica Paciente (Extended Data Fig. 4).
Anos de idade) 41. A organização do genoma viral do WHCV foi determinada pelo alinhamento da
Sexo Masculino sequência a dois membros representativos do gênero Betacoronavirus: um coronavírus
associado a humanos (SARS-CoV Tor2, número de acesso GenBank AY274119) e um
Data do início da doença 20 de dezembro de 2019
coronavírus associado a morcegos (bastão SL-CoVZC45, acesso GenBank número
Data de admissão 26 dezembro 2019
MG772933). As regiões não traducionais e o quadro de leitura aberta (ORF) do WHCV
sinais e sintomas
foram mapeados com base nesse alinhamento de sequência e na previsão de ORF. O
Febre sim genoma viral do WHCV foi semelhante a esses dois coronavírus (Fig. 1 e Tabela
Temperatura corporal (° C) 38,4 Suplementar 3). A ordem dos genes (5 ′ a 3 ′) foi a seguinte: replicase ORF1ab, espigão (S),
Tosse sim envelope (E), membrana (M)  e nucleocápside (N). O WHCV possui sequências terminais 5
'e 3' que são típicas de betacoronavírus, com 265 nt na extremidade terminal 5 'e 229 nt na
Produção de escarro sim
extremidade terminal 3'. A replicase prevista ORF1ab gene do WHCV é
Tonto sim

Fraqueza sim

Aperto no peito sim 21.291 nt de comprimento e continha 16 proteínas não estruturais previstas (Tabela
Dispneia sim Suplementar 4), seguidas por (pelo menos) 13 ORFs a jusante. Além disso, o WHCV
Cultura bacteriana Negativo compartilha um domínio altamente conservado (LLRKNGNKG: aminoácidos 122–130) em nsp1 com
SARS-CoV. O previsto S, ORF3a,
Terapia com glicocorticóides sim
E, M e N os genes do WHCV têm 3.822, 828, 228, 669 e 1.260 nt de comprimento,
Terapia antibiótica Cefoselis
respectivamente. Além dessas regiões ORF, que são compartilhadas por todos os membros do
Terapia antiviral Oseltamivir
subgênero Sarbecovirus, o WHCV é semelhante ao SARS-CoV, na medida em que carrega um ORF8
Oxigenoterapia Ventilação mecânica gene (com um comprimento de 366 nt) localizado entre o M e N Genes ORF. As funções das
ORFs do WHCV foram previstas com base nas dos coronavírus conhecidos e estão descritas na
Tabela Suplementar 5. De maneira semelhante ao SARS-CoV Tor2, uma sequência reguladora
da transcrição líder (TRS) e nove TRSs putativos do corpo podem ser facilmente identificados a
realizaram sequenciamento meta-transcriptômico profundo. A amostra clínica foi manuseada em montante da extremidade 5 ′ da ORF no WHCV, e a sequência central de TRS conservada em
um laboratório de nível 3 de biossegurança no Centro Clínico de Saúde Pública de Xangai. O potencial apareceu em duas formas - ACGAAC ou CUAAAC (Tabela Suplementar 6).
RNA total foi extraído de 200 μl de BALF e uma biblioteca meta-transcriptômica foi construída
para o sequenciamento em pares (leituras de 150 bp) usando um Illumina MiniSeq, como
descrito anteriormente 4,6-8. No total, geramos 56.565.928 leituras de sequência que foram Para determinar as relações evolutivas entre o WHCV e os coronavírus previamente
montadas de novo e rastreadas quanto a possíveis agentes etiológicos. Dos 384.096 contigs identificados, estimamos árvores filogenéticas com base nas sequências nucleotídicas da
montados pela Megahit 9 o mais longo (30.474 nucleotídeos (nt)) possuía alta abundância e sequência do genoma inteiro, os genes proteicos não estruturais ORF1a e ORF1b, e as
estava intimamente relacionado a um isolado de coronavírus (CoV) tipo SARS de morcego - principais proteínas estruturais codificadas pelo S, E, M e N genes (Fig. 2 e Dados
morcego SL-CoVZC45 (número de acesso ao GenBank MG772933) - que havia sido amostrado estendidos Fig. 5). Em todas as filogenias, o WHCV agrupou-se com membros do
anteriormente na China, com identidade de nucleotídeo de 89,1% (Tabelas Suplementares 1, 2). subgênero Sarbecovírus, incluindo o SARS-CoV responsável pela pandemia global de
A sequência do genoma desse vírus, bem como seus terminais, foi determinada e confirmada SARS 1,2 2002-2003, bem como vários coronavírus semelhantes à SARS que foram obtidos
por PCR de transcrição reversa (RT – PCR) 10 e amplificação rápida 5 '/ 3' de extremidades de de morcegos 5,11–13.
cDNA (RACE), respectivamente. Esta cepa de vírus foi designada como coronavírus WH-Human
1 (WHCV) (e também foi referida como '2019-nCoV') e toda a sua sequência genômica (29.903 No entanto, o WHCV mudou a posição topológica dentro do subgênero Sarbecovírus,
nt) recebeu o número de acesso ao GenBank MN908947. Remapear os dados de dependendo de qual gene foi usado, o que sugere que a recombinação ocorreu neste grupo
sequenciamento de RNA para o genoma completo do WHCV resultou em uma montagem de de vírus no passado (Fig. 2 e Extended Data Fig. 5). Especificamente, no S árvore de genes
123.613 leituras, fornecendo 99,99% de genoma (Extended Data Fig. 5), o WHCV estava mais intimamente relacionado ao coronavírus de
morcego SL-CoVZC45 com 82,3% de identidade de aminoácidos (e cerca de 77,2% de
identidade de aminoácidos ao SARS-CoV; Tabela Suplementar 3)

10
1a S 3b M 8 N
WHCV 29.903 pb
1b 3a
E 67a7b 9a 9b

10
1a S 3b M 8N
Bat SL-CoVZC45 29.802 pb
1b 3a

E 6 7b
7a 9a 9b

8a 8b

SARS-CoV Tor2 1a S M N 29.751 bp


1b 3a 3b
E 6 7b
7a 9a 9b

2.000 4.000 6.000 8.000 10.000 12.000 14.000 16.000 18.000 20.000 22.000 24.000 26.000 28.000

Posição

Fig. 1 Organização do genoma de SARS e CoVs semelhantes a SARS. A organização dos genes para WHCV, morcego SL-CoVZC45 e SARS-CoV Tor2.

266 Natureza | V. 579 12 de março de 2020


uma ChRCoV HKU24
b
100 ChRCoV HKU24
HCoV-OC43 100
Embecovírus HCoV-OC43 Embecovírus
HCoV-HKU1 HCoV-HKU1
100
MHV MHV
EriCoV EriCoV
100 100
MERS-CoV MERS-CoV
Merbecovírus Merbecovírus
100 Ty-BatCoV HKU4 Ty-BatCoV HKU4
100
Pi-BatCoV HKU5 Pi-BatCoV HKU5
Ro-BatCoV GCCDC1 Ro-BatCoV GCCDC1
100100 100
BtRt-BetaCoV / GX2018 Nobecovírus 100 BtRt-BetaCoV / GX2018 Nobecovírus
98
Ro-BatCoV HKU9 Ro-BatCoV HKU9
Bat Hp-BetaCoV Hibecovírus Bat Hp-BetaCoV Hibecovírus
WHCV WHCV
100
Morcego SL-CoVZC45 Bat CoV BM48-31 / BGR / 2008 Bat
100 100 100
Morcego SL-CoVZXC21 SARS-CoV HKU3
Bat CoV BM48-31 / BGR / 2008 Morcego SL-CoVZC45
SARS-CoV de morcego HKU3 BtCoV / Morcego SL-CoVZXC21
279/2005 SARS-CoV de morcego Rm1 BtCoV / 279/2005 Bat SARS-CoV Rm1
BtCoV Rp / Shaanxi2011 BtRf-BetaCoV BtCoV Rp / Shaanxi2011 BtRf-BetaCoV /
/ JL2012 Bat CoV JTMC15 JL2012 Bat CoV JTMC15 BtRf-BetaCoV /
BtRf-BetaCoV / HeB2013 BtRf-BetaCoV HeB2013 BtRf-BetaCoV / SX2013
100 100
/ SX2013 No entanto, é importante morcego SARS-CoV Rf1 BtCoV / 273/2005
ressaltar que, em caso de divergência 100 BtCoV11 / SC2018 CoV semelhante a
de preços e estoques no site, o valor e SARS YNLF 34C Civet SARS-CoV SZ3
a disponibilidade válidos são os SARS-CoV BJ01 SARS-CoV TOR2
99
apresentados no carrinho de compras. SARS-CoV WH20 morcego semelhante a
CoS SARS-CoV Rs672 BtRs-BetaCoV / SARS CoV Rs4231 morcego semelhante a
100
YN2018A BtRs-BetaCoV / YN2013 CoV SARS CoV Rs4874 morcego semelhante a
100 SARV WIV16 BtRs-BetaCoV / YN2013 Bt
semelhante a SARS de morcego
-BetaCoV / YN2018C BtRs-BetaCoV /
RsSHC014 CoV semelhante a SARS de
YN2018B BtRs-BetaCoV / YN2018D CoV Sarbecovírus
morcego Rf4092 CoV semelhante a Sarbecovírus
semelhante a SARS de morcego Rf4092
99 100 SARS de morcego Rs4231
CoV semelhante a SARS CoV RsSHC014
BtRs-BetaCoV / YN2018C
100 98 CoV semelhante a SARS CoV Rs3367
100 BtRs-BetaCoV / YN2018BV -como CoV
Morcego semelhante a SARS CoV WIV1
100 86 Rs4874 Morcego SARS-like CoV 100
100 BtRs-BetaCoV / GX2013 Morcego
WIV16 Morcego SARS-like CoV
BetaCoV / YN2018A SARS-CoV Rs672
Rs3367 Morcego SARS-like CoV WIV1 96 100 100
98
90
100 96
92
99
97
100 99 100

96 99 100
98
100 96
89 96 97
97 99
99
100
0,5
0,5 94
100

c d 100
HCoV-HKU1 MHV
ChRCoV HKU24
Ro-BatCoV GCCDC1 Embecovírus
99 80
HCoV-OC43
BtRt-BetaCoV / GX2018 Nobecovírus
Ro-BatCoV HKU9 EriCoV
HCoV-HKU1 MHV 98
89 77 Ty-BatCoV HKU4
ChRCoV HKU24 Merbecovírus
Embecovírus 88
Pi-BatCoV HKU5
HCoV-OC43
MERS-CoV
99
Ro-BatCoV HKU9
EriCoV
BtRt-BetaCoV / GX2018 Nobecovírus
MERS-CoV
Merbecovírus Ro-BatCoV GCCDC1
70 91 Ty-BatCoV HKU4 91
Bat Hp-BetaCoV Hibecovírus
98 Pi-BatCoV HKU5
Hibecovírus
Bat Hp-BetaCoV Bat CoV BM48-31 / WHCV
98 81
Morcego SL-CoVZC45
BGR / 2008
97 Morcego SL-CoVZXC21
96 WHCV
Morcego SL-CoVZC45 Bat CoV BM48-31 / BGR / 2008 BtCoV Cp
Morcego SL-CoVZXC21 / Yunnan2011 LYRa11 BtRs-BetaCoV /
CoV semelhante a SARS de morcego GX2013 BtCoV / 279/2005 SARS-CoV Rm1
RsSHC014 CoV WIV16 semelhante a SARS bast SARS-CoV HKU3 morcego SARS-CoV
de morcego CoV WIV1 semelhante a SARS de Rp3 BtCoV Rp / Shaanxi2011
morcego CoV Rs3367 de morcego semelhante BtRs-BetaCoV BetaCoV / YN2018C CoV
99
a SARS de morcego Rs4874 CoV semelhante semelhante a SARS Rs4231 BtRl-BetaCoV /
a SARS de morcego Rs4874 SARS-CoV de SC2018 Civet SARS-CoV SZ3 SARS-CoV
morcego Rs672 BtRf-BetaCoV / JL2012 CoV WH20 SARS-CoV BJ01 SARS-CoV TOR2
de morcego JTMC15 BtCoV / 273/2005 SARS BtRs-BetaCoV / YN2018A BtRf-BetaCoV /
89 de morcego -CoV Rf1 BtRf-BetaCoV / HeB2013 BtRt-Beta JL2012 Bat CoV
99
HeB2013 BtRf-BetaCoV / SX2013 JTMC15 BtCoV / 273/2005 Bastão
93
BtRs-BetaCoV / YN2018A LYRa11 SARS-CoV SARS-CoV Rf1 Bastão semelhante a SARS
Rp3 morcego-CoV Rp3 morcego-CoV HKU3 CoV YNLF 34C Bastão semelhante a SARS
BtCoV Rp / Shaanxi2011 BtCoV / 279 / 88 79 CoV Rf4092 Bastão semelhante a SARS
2005BM SARS-CoV / Yunnan2011 93
CoV Rs4874 Bastão semelhante a SARS Sarbecovírus
BtRs-BetaCoV / GX2013 CoV semelhante a Sarbecovírus 74
82 CoV Rs3367 Bastão semelhante a SARS
91 71 92 SARS Rf4092 SARS-CoV TOR2 SARS-CoV
CoV WIV1 Bastão semelhante a SARS CoV
BJ01 CoV semelhante a SARS YNLF 34C 87 99
75
WIV16 BtRs-BetaCoV / YN2018D
87 SARS-CoV WH20 Civet SARS-CoV SZ3 CoV
BtRs-BetaCoV / YN2018B CoV semelhante
semelhante a SARS Co4 Rs4231
a SARS CoV RsSHC014 Bat SARS-CoV
BtRs-BetaCoV / BetaCoV BetaCoV / YN2018D 99
82 77 Rs672
BtRl-BetaCoV / SC2018 BtRs-BetaCoV /
YN2018C
83 74 89
99

97

84 89

75

0,5 0,5

Fig. 2 Árvores filogenéticas de probabilidade máxima de sequências nucleotídicas da ORF1a, ORF1b, (> 70) acima ou abaixo das ramificações indicam valores percentuais de autoinicialização para os nós associados. As

E e M genes do WHCV e coronavírus relacionados. árvores estavam enraizadas no meio do caminho apenas para maior clareza. A barra de escala representa o número de

uma, Árvores filogenéticas de ORF1a. b Árvores filogenéticas de ORF1b. c Árvores filogenéticas de E. d Árvores substituições por site.
filogenéticas de M. EriCoV, coronavírus Erinaceus. Números

A filogenia da ORF1b, o WHCV, caiu em uma posição basal dentro do subgênero Sarbecovírus com os de SARS-CoVs e de morcegos semelhantes a SARS. As sequências RBD do WHCV
(Fig. 2). Essa divisão topológica, que provavelmente reflete a recombinação entre os estavam mais estreitamente relacionadas às SARS-CoVs (73,8-74,9% de identidade de
sarbecovírus de morcegos, também foi observada nas árvores filogenéticas estimadas para aminoácidos) e CoVs semelhantes a SARS, incluindo as cepas Rs4874, Rs7327 e Rs4231
domínios conservados na poliproteína replicase pp1ab (Extended Data Fig. 6). (75,9-76,9% de identidade de aminoácidos), que são capazes usar o receptor ACE2 humano para
entrada de células 11 ( Tabela Suplementar 7). Além disso, o RBD da proteína spike do WHCV era
Para entender melhor o potencial do WHCV em infectar humanos, o domínio de ligação apenas um aminoácido mais longo que o RBD da proteína spike do SARS-CoV (Extended
ao receptor (RBD) de sua proteína spike foi comparado

Natureza | V. 579 12 de março de 2020 | 267


Artigo
uma1.0

0,9

0,8

0,7

0,6

Semelhança
0,5

0,4

0,3

0,2 Bastão SL-CoVZC45 Rf1


SARS-CoV Tor2 WIV1

0,1

1.029 1.652
00
600 400 200 0 800 1.000 1.200 1.400 1.600 1.800 2.000 2.200 2.400 2.600 2.800 3.000 3.200 3.400 3.600 3.800

Posição

b Região 1 - 1.028 Região 1.029–1.652 Região 1.653-3.804


WHCV Rm1 WHCV

BastãoBastão SL-CoVZC45
SL-CoVZXC21 WIV1
Rp3 Bat SL-CoVZC45 Bat
RsSHC014
TOR2 Rs4231
SARS-CoV SARS-CoV
SZ3 Rf1 Rm1
Rp3 96100100 Rf1 Bat SL-CoVZC45 SL-CoVZXC21 Rm1 Rp3
99 81 100

99 Bat SL-CoVZXC21 97

100 98 99 100
WHCV Rf1 SARS-CoV
WIV1 SARS-CoV
SARS-CoV
RsSHC014 TOR2
SZ398Rs4231
97 91 TOR2 SARS-CoV SZ3
99
RsSHC014 WIV1
84 100
Rs4231

0,2 0,1 0,05 92

Fig. 3 Possíveis eventos de recombinação no S gene dos sarbecovírus. CoVZC45. b Filogenias da principal região parental (1 - 1.028 e 1.653 -
uma, O gráfico de similaridade de sequência revela dois pontos de interrupção putativos de recombinação (linhas 3.804) e região parental menor (1.029–1.652). As filogenias foram estimadas usando um método de máxima

tracejadas pretas), com suas localizações indicadas na parte inferior. O gráfico mostra comparações de similaridade verossimilhança e foram enraizadas no ponto médio para maior clareza. Os números acima ou abaixo das

dos S gene do WHCV (consulta) comparado com as sequências de SARS-CoV Tor2 e de CoVs semelhantes a SARS ramificações indicam valores percentuais de autoinicialização. A barra de escala representa o número de

WIV1, Rf1 e substituições por site.

Dados Fig. 7a). Por outro lado, outros CoVs semelhantes a SARS de morcego - incluindo genoma como um todo. No entanto, alguma evidência de recombinação passada foi detectada
a cepa Rp3 que não pode se ligar à ACE2 humana 14 - teve deleções de aminoácidos nas no S gene de WHCV, SARS-CoV e CoV do tipo morcego SARS (WIV1 e RsSHC014) ( P  <3.147
posições 433-437 e 460-472 em comparação com a sequência em SARS-CoVs (Dados × 10 -3 para P  <9.198 × 10 -9), para os quais as parcelas de similaridade sugeriram a presença de
estendidos Fig. 7a). O determinado anteriormente 15 A estrutura cristalina da RBD da pontos de interrupção da recombinação nos nucleotídeos 1.029 e 1.652, que separam os S gene
proteína spike de SARS-CoV complexada com ACE2 humana (Banco de Dados de do WHCV em três regiões (Fig. 3). Nas filogenias dos fragmentos de nucleotídeos de 1 a 1.029
Proteínas (PDB) 2AJF) revelou que as regiões 433-437 e 460-472 interagem diretamente e de 1.652 até o final da sequência, o WHCV estava mais relacionado ao morcego
com a ACE2 humana e, portanto, podem ser importantes na determinação da SL-CoVZC45 e ao morcego SL-CoVZXC21, enquanto na região dos nucleotídeos 1.030 a 1.651
especificidade das espécies. (Dados estendidos Fig. 7b). Previmos as estruturas proteicas (região RBD) O WHCV agrupado com SARS-CoV e CoVs tipo morcego SARS (WIV1 e
tridimensionais dos domínios RBD da proteína spike de WHCV, Rs4874 e Rp3 por RsSHC014) que são capazes de transmissão direta humana 17,20. Apesar desses eventos de
modelagem de homologia de proteínas usando o servidor SWISS-MODEL e as recombinação, que parecem relativamente comuns entre os sarbecovírus, não há evidências de
comparamos com a estrutura cristalina do domínio RBD da proteína spike de SARS-CoV que a recombinação tenha facilitado o surgimento de WHCV.
(PDB 2GHV) (Dados estendidos Fig. 7c – f). De acordo com o alinhamento da sequência,
as estruturas proteicas previstas dos domínios RBD do WHCV e Rs4874 estavam
intimamente relacionadas às do SARS-CoV e diferentes da estrutura prevista do domínio Os coronavírus estão associados a uma série de surtos de doenças infecciosas em
RBD de Rp3. Além do que, além do mais, 16 Em resumo, as altas similaridades das humanos, incluindo SARS em 2002-2003 e síndrome respiratória do Oriente Médio (MERS)
seqüências de aminoácidos e das estruturas proteicas previstas dos domínios RBD do em 2012 1,21 Quatro outros coronavírus - coronavírus humano HKU1, OC43, NL63 e 229E -
WHCV e SARS-CoV sugerem que o WHCV possa usar com eficiência a ACE2 humana também estão associados a doenças respiratórias 22-25. Embora os coronavírus tipo SARS
como um receptor para a entrada celular, o que poderia potencialmente facilitar a tenham sido amplamente identificados em mamíferos, incluindo morcegos desde 2005 na
transmissão de humano para humano 11,17,18. China 10,26-28, a origem exata dos coronavírus infectados por humanos permanece incerta. Aqui,
descrevemos um novo coronavírus - WHCV - no LBA de um paciente com doença
respiratória grave em Wuhan, China. A análise filogenética sugere que o WHCV é um
membro do gênero Betacoronavirus (subgênero Sarbecovirus) que possui algumas
semelhanças genômicas e filogenéticas com o SARS-CoV 1 particularmente no RBD da
proteína spike. Essas semelhanças genômicas e clínicas com a SARS, bem como sua alta
Para caracterizar ainda mais os supostos eventos de recombinação na história evolutiva dos abundância em amostras clínicas, fornecem evidências de uma associação entre o WHCV e
sarbecovírus, a sequência do genoma completo do WHCV e quatro coronavírus representativos - o surto contínuo de doenças respiratórias em Wuhan e em todo o mundo. Embora o
CoV Rp3 semelhante ao SARS do morcego, CoVZC45, CoVZC45, CoVZXC21 e SARS-CoV Tor2 - isolamento do vírus de apenas um único paciente não seja suficiente para concluir que
foram analisados ​usando o Programa de Detecção de Recombinação v.4 (RDP4) 19 Embora os causou esses sintomas respiratórios, nossos achados foram corroborados de forma
gráficos de similaridade sugerissem a ocorrência de possíveis eventos de recombinação entre independente em outros pacientes em um estudo separado 29
WHCV e SARS-CoVs ou CoVs semelhantes a SARS (Extended Data Fig. 9), não havia evidências
significativas de recombinação em todo o mundo.

268 Natureza | V. 579 12 de março de 2020


A identificação de múltiplos CoVs semelhantes a SARS em morcegos levou à ideia de que esses 14. Ren, W. et al. Diferença no uso de receptores entre coronavírus da síndrome respiratória aguda grave (SARS) e
coronavírus tipo SARS de origem de morcego. J. Virol. 82, 1899–1907 (2008).
animais agem como hospedeiros de um reservatório natural desses vírus 22,23. Embora os vírus do tipo SARS
15. Li, F., Li, W., Farzan, M. & Harrison, SC Estrutura do domínio de ligação ao receptor de pico de coronavírus da SARS
tenham sido amplamente identificados em morcegos na China, vírus idênticos ao SARS-CoV ainda não complexado com o receptor. Ciência 309, 1864-1868 (2005).

foram documentados. Notavelmente, o WHCV está mais intimamente relacionado aos coronavírus do 16. Hulswit, RJG et al. Os coronavírus humanos OC43 e HKU1 se ligam a 9- O- siálico acetilado
ácidos através de um local de ligação ao receptor conservado no domínio da proteína spike A. Proc. Natl Acad. Sci. EUA 116, 2681-2690
morcego e mostra 100% de similaridade de aminoácidos ao SL-CoVZC45 de morcego nas proteínas nsp7
(2019).
e E (Tabela Suplementar 3). Assim, esses dados sugerem que os morcegos são um possível hospedeiro 17. Ge, XY et al. Isolamento e caracterização de um coronavírus tipo morcego SARS que utiliza o receptor ACE2. Natureza

para o reservatório viral do WHCV. No entanto, como uma variedade de espécies animais estava à venda 503, 535-538 (2013).
18. Yang, XL et ai. Isolamento e caracterização de um novo coronavírus de morcego intimamente relacionado ao progenitor
no mercado quando a doença foi relatada pela primeira vez, são necessários mais estudos para determinar
direto do coronavírus da síndrome respiratória aguda grave. J. Virol. 90,
o reservatório natural e quaisquer hospedeiros intermediários do WHCV. 3253-3256 (2016).
19. Martin, DP et al. RDP3: um programa de computador flexível e rápido para analisar recombinação. Bioinformática
26, 2462-2463 (2010).
20. Menachery, VD et al. Um conjunto semelhante a SARS de coronavírus circulantes de morcego mostra potencial para o
Nota adicionada como prova: Desde que este documento foi aceito, o ICTV designou o surgimento humano. Nat. Med. 21 1508-1513 (2015).
21. Bermingham, A. et ai. Doença respiratória grave causada por um novo coronavírus, em um paciente transferido
vírus como SARS-CoV-2 30; além disso, a OMS divulgou o nome oficial da doença causada
para o Reino Unido do Oriente Médio, em setembro de 2012. Euro Surveill. 17 20290 (2012).
por esse vírus, que é o COVID-19 31
22. Hamre, D. & Procknow, JJ Um novo vírus isolado do trato respiratório humano. Proc.
Soc. Exp. Biol. Med. 121, 190-193 (1966).
23. McIntosh, K., Becker, WB e Chanock, RM Crescimento no cérebro de camundongos em aleitamento de vírus "tipo IBV" de pacientes
Conteúdo online
com doença do trato respiratório superior. Proc. Natl Acad. Sci. EUA 58,
Quaisquer métodos, referências adicionais, resumos de relatórios da Nature Research, dados de 2268- 2273 (1967).
24. van der Hoek, L. et ai. Identificação de um novo coronavírus humano. Nat. Med. 10, 368-373
origem, dados estendidos, informações suplementares, agradecimentos, informações de revisão
(2004).
por pares; detalhes de contribuições de autores e interesses concorrentes; e declarações de 25. Woo, PC et al. Caracterização e sequência completa do genoma de um novo coronavírus, o coronavírus HKU1, de
disponibilidade de dados e códigos estão disponíveis em pacientes com pneumonia. J. Virol. 79, 884-95 (2005).
26. Li, W. et ai. Os morcegos são reservatórios naturais de coronavírus do tipo SARS. Ciência 310, 676-679
https://doi.org/10.1038/s41586-020-2008-3.
(2005).
27. Lau, SK et al. Síndrome respiratória aguda grave vírus do tipo coronavírus em morcegos-ferradura chineses. Proc.
Natl Acad. Sci. EUA 102, 14040-14045 (2005).
1 Drosten, C. et al. Identificação de um novo coronavírus em pacientes com síndrome respiratória aguda
28. Wang, W. et ai. A descoberta de um coronavírus altamente divergente na musaranho asiática da China ilumina a
grave. N. Engl. J. Med. 348, 1967-1976 (2003).
origem dos alfa-coronavírus. J. Virol. 91, e00764-17 (2017).
2. Wolfe, ND, Dunavan, CP & Diamond, J. Origens das principais doenças infecciosas humanas.
29. Zhou, P. et al. Um surto de pneumonia associado a um novo coronavírus de provável origem em morcego. Natureza https://doi.org/10.1038/s
Natureza 447, 279-283 (2007).
(2020).
3) Ventura, CV, Maia, M., Bravo-Filho, V., Góis, AL & Belfort, R. Jr. Zika vírus no Brasil e atrofia macular em
30. Gorbalenya, AE Coronavírus grave relacionado à síndrome respiratória aguda - as espécies e seus vírus, uma declaração
criança com microcefalia. Lanceta 387, 228 (2016).
do Grupo de Estudos Coronavírus. Pré-impressão em bioRxiv https: // doi.org/10.1101/2020.02.07.93786 (2020).
4) Shi, M. et ai. Redefinindo a virosfera do RNA invertebrado. Natureza 540, 539-543 (2016).
5) Hu, D. et ai. Caracterização genômica e infectividade de um novo coronavírus semelhante a SARS em morcegos chineses. Emerg.
31. OMS. Palavras do Diretor-Geral da OMS no briefing da mídia sobre 2019-nCoV em 11 de fevereiro de 2020.
Micróbios infectam. 7 1–10 (2018).
https://www.who.int/dg/speeches/detail/who-director-general-s-remarks- at the media-
6 Shi, M. et ai. A história evolutiva dos vírus do RNA dos vertebrados. Natureza 556, 197-202 (2018).
briefing-on-2019-ncov-on-11-fevereiro-2020 (OMS, 11 de fevereiro de 2020).

7) Yadav, PD et al. Sequências do vírus Nipah de humanos e morcegos durante o surto de Nipah, Kerala, Índia, 2018. Emerg.
Nota do editor A Springer Nature permanece neutra em relação a reivindicações jurisdicionais em mapas publicados e
Infectar. Dis. 25, 1003–1006 (2019).
afiliações institucionais.
8. McMullan, LK et al. Caracterização do vírus Ebola infeccioso do surto em andamento para orientar as
atividades de resposta na República Democrática do Congo: uma análise filogenética e in vitro. Lancet
Acesso livre Este artigo está licenciado sob uma Atribuição Creative Commons
Infect. Dis. 19 1023-1032 (2019).
4.0 Licença Internacional, que permite o uso, compartilhamento, adaptação, distribuição e
9 Li, D., Liu, CM, Luo, R., Sadakane, K. & Lam, TW MEGAHIT: uma solução de nó único ultra-rápida para montagem de
reprodução em qualquer meio ou formato, desde que você forneça
metagenômica grande e complexa por meio do gráfico sucinto de Bruijn.
crédito ao (s) autor (es) original (is) e à fonte, forneça um link para a licença Creative Commons e indique se foram feitas
Bioinformática 31, 1674-1676 (2015).
alterações. As imagens ou outro material de terceiros neste artigo estão incluídos na licença Creative Commons do artigo, a
10. Wang, W. et ai. Descoberta, diversidade e evolução de novos coronavírus coletados em roedores na China. Virologia
menos que indicado de outra forma em uma linha de crédito para o material. Se o material não estiver incluído na licença
474, 19-27 (2015).
Creative Commons do artigo e o uso pretendido não for permitido por regulamentação estatutária ou exceder o uso permitido,
11. Hu, B. et al. A descoberta de um rico conjunto genético de coronavírus relacionados ao SARS fornece informações novas sobre a
você precisará obter permissão diretamente do detentor dos direitos autorais. Para visualizar uma cópia desta licença, visite
origem do coronavírus SARS. PLoS Pathog. 13, e1006698 (2017).
http://creativecommons.org/licenses/by/4.0/.
12. Lin, X.-D. et al. Ampla diversidade de coronavírus em morcegos da China. Virologia 507, 1–10
(2017).
13. Xu, L. et ai. Detecção e caracterização de diversos alfa- e betacoronavírus de morcegos na China. Virol. Pecado. 31, 69-77
(2016). © Autor (es) 2020

Natureza | V. 579 12 de março de 2020 | 269


Artigo
Métodos A RT – PCR foi realizada usando 2,5 μl de RNA com 8 pmol de cada iniciador e sonda de 4
pmol nas seguintes condições: transcrição reversa a 42 ° C por 10 minutos, 95 ° C por 1
Relatório de dados minuto, seguida de 40 ciclos de 95 ° C por 15 se 60 ° C por 1 min. As reações foram realizadas
Não foram utilizados métodos estatísticos para predeterminar o tamanho da amostra. Os e detectadas pelos sistemas de PCR em tempo real ABI 7500. O produto de PCR que cobre os
experimentos não foram randomizados e os pesquisadores não foram cegos para a alocação iniciadores Taqman e a região da sonda foi clonado no vetor pLB usando o Kit de Clonagem
durante os experimentos e a avaliação dos resultados. Rápida Simples com Base Letal (TianGen) como padrões para teste quantitativo de carga viral.

Informações do paciente e coleta de dados clínicos e amostra


Paciente com início agudo de febre (temperatura acima de
37,5 ° C), tosse e aperto no peito, admitidos no Hospital Central de Wuhan, em Wuhan, Caracterização do genoma do vírus e análise filogenética
China, foram considerados suspeitos. Durante a admissão, o LBA foi coletado e Para o genoma do vírus recém-identificado, as ORFs potenciais foram previstas e anotadas
armazenado a -80 ° C até o processamento posterior. Dados demográficos, clínicos e usando as assinaturas conservadas dos locais de clivagem reconhecidos pelas proteinases
laboratoriais foram recuperados dos prontuários clínicos do paciente. O estudo foi revisado do coronavírus e foram processadas no pacote de software Lasergene (v.7.1, DNAstar). Os
e aprovado pelo comitê de ética do Instituto Nacional de Controle e Prevenção de genes virais foram alinhados usando o algoritmo L-INS-i implementado no MAFFT (v.7.407) 37)
Doenças Transmissíveis, Centro Chinês de Controle e Prevenção de Doenças. O
consentimento informado assinado por escrito foi obtido do paciente. As análises filogenéticas foram então realizadas usando as sequências nucleotídicas de
vários conjuntos de dados do gene CoV: (1) genoma inteiro, (2) ORF1a, (3) ORF1b, (4) nsp5
(3CLpro), (5) RdRp (nsp12), (6) nsp13 (Hel), (7) nsp14 (ExoN), (8) nsp15 (NendoU), (9) nsp16
(O-MT), (10) pico (S) e (11) nucleocapsídeo (N). As árvores filogenéticas foram inferidas usando
Construção e sequenciamento de bibliotecas de RNA o método de máxima verossimilhança implementado no programa PhyML (v.3.0) 38,
O RNA total foi extraído da amostra BALF usando o kit Mini RNeasy Plus Universal (Qiagen),
seguindo as instruções do fabricante. A quantidade e a qualidade da solução de RNA foram usando o modelo de substituição reversível no tempo generalizado e a poda de subárvore e a
avaliadas usando uma máquina Qbit e um bioanalisador Agilent 2100 (Agilent Technologies) reformulação da troca de ramificações. Os valores de suporte do Bootstrap foram calculados a partir
antes da construção e sequenciamento da biblioteca. Uma biblioteca de RNA foi então de 1.000 árvores pseudo-replicadas. O modelo mais adequado de substituição de nucleotídeos foi
construída usando o kit SMARTer Stranded Total RNA-Seq v.2 (TaKaRa). A depleção do RNA determinado usando MEGA (v.5) 39
ribossômico foi realizada durante a construção da biblioteca, seguindo as instruções do As identidades de aminoácidos entre as seqüências foram calculadas usando o programa
fabricante. A sequenciação de extremidade emparelhada (leituras de 150 pb) da biblioteca de MegAlign implementado no pacote de software Lasergene (v.7.1, DNAstar).
RNA foi realizada na plataforma MiniSeq (Illumina). A preparação e o seqüenciamento da
biblioteca foram realizados no Centro Clínico de Saúde Pública de Xangai, Universidade de
Fudan, Xangai, China. Análise de recombinação do genoma

Os possíveis eventos de recombinação na história dos sarbecovírus foram avaliados usando o


RDP4 19 e Simplot (v.3.5.1) 40 A análise do RDP4 foi realizada com base na sequência completa do
genoma (nucleotídeo), usando os métodos RDP, GENECONV, BootScan, chi quadrado
Processamento de dados e identificação do agente viral máximo, quimera, SISCAN e 3SEQ. Eventos putativos de recombinação foram identificados
As leituras de sequenciamento foram o primeiro adaptador e a qualidade foi ajustada usando o com uma correção corrigida por Bonferroni P- valor de corte de 0,01. Gráficos de similaridade
programa Trimmomatic 32) As 56.565.928 leituras restantes foram montadas de novo usando os dois foram inferidos usando Simplot para caracterizar ainda mais os possíveis eventos de
Megahit (v.1.1.3) 9 e Trindade (v.2.5.1) 33 com configurações de parâmetro padrão. O Megahit gerou recombinação, incluindo a localização de possíveis pontos de interrupção.
um total de 384.096 contigs montados (faixa de tamanho de 200 a 30.474 nt), enquanto o Trinity
gerou
1.329.960 contigs com uma faixa de tamanho de 201 a 11.760 nt. Todos esses contigs montados
foram comparados (usando BLASTn e Diamond BLASTx) com todos os bancos de dados de Análise do domínio RBD da proteína spike do WHCV
nucleotídeos e proteínas não redundantes (nr), com e valores definidos para 1 × 10 -10 e 1 × 10 -5, respectivamente.
Um alinhamento de sequência de aminoácidos de sequências RBD de WHCV, SARS-CoVs e
Para identificar possíveis agentes etiológicos presentes nos dados de seqüenciamento, a CoVs tipo SARS de morcego foi realizado usando MUSCLE 41
abundância dos contigs reunidos foi avaliada primeiro como as contagens esperadas usando o As estruturas proteicas previstas do RBD da proteína spike foram estimadas com base no
programa RSEM 34 implementado no Trinity. Leituras não humanas (23.712.657 leituras), geradas alinhamento alvo-modelo usando o ProMod3 no servidor SWISS-MODEL
pela filtragem de leituras de hosts usando o genoma humano (liberação humana 32, GRCh38.p13, (https://swissmodel.expasy.org/). As sequências dos picos dos domínios RBD do WHCV,
baixada do Gencode) por Bowtie2 35, foram utilizados para a avaliação da abundância do RSEM. Rs4874 e Rp3 foram pesquisadas pelo BLAST contra a sequência de aminoácidos primária
contida na biblioteca de modelos SWISS-MODEL (última atualização, 9 de janeiro de 2020;
última versão do PDB, 3 de janeiro de 2020). Os modelos foram criados com base no
Como os contigs mais longos gerados por Megahit (30.474 nt) e Trinity (11.760 nt) alinhamento alvo-modelo usando o ProMod3. A qualidade do modelo global e perresidue foi
mostraram alta similaridade com o morcego isolado de coronavírus tipo SARS, morcego avaliada usando a função de pontuação QMEAN 42 Os arquivos PDB das estruturas
SL-CoVZC45, e foram encontrados em alta abundância (Tabelas Suplementares 1, 2), A proteicas previstas foram exibidos e comparados com as estruturas cristalinas da espiga
sequência (30.474 nt) - que cobria quase todo o genoma do vírus - foi usada para o desenho do RBD da SARS-CoV (PDB 2GHV) 43 e o cristal da estrutura do pico RBD de SARS-CoV
primer para confirmação por PCR e determinação dos terminais do genoma. Os iniciadores complexado com ACE2 humana (PDB 2AJF) 15
utilizados para as experiências de PCR, qPCR e RACE estão listados na Tabela Suplementar 8.
O ensaio de PCR foi conduzido conforme descrito anteriormente 10

e os terminais genômicos completos foram determinados usando o kit Takara SMARTer RACE 5 Resumo dos relatórios
'/ 3' (TaKaRa), seguindo as instruções do fabricante. Posteriormente, a cobertura do genoma e a Informações adicionais sobre o desenho da pesquisa estão disponíveis no Resumo dos Relatórios de

profundidade do sequenciamento foram determinadas remapeando todas as leituras ajustadas Pesquisa da Natureza, vinculado a este artigo.

por adaptadores e de qualidade para todo o genoma do WHCV usando o Bowtie 35 e Samtools 36

As cargas virais do WHCV no LBAF foram determinadas por RT-PCR quantitativo em Disponibilidade de dados

tempo real, usando o kit Tak-PCR PrimeScript RT-PCR Takara (Takara RR064A), seguindo As leituras de sequência geradas neste estudo estão disponíveis no banco de dados NCBI
as instruções do fabricante. Tempo real Sequence Read Archive (SRA) sob a acessão do BioProject
número PRJNA603194. A sequência completa do genoma do WHCV foi depositada no 42. Waterhouse, A. et al. MODELO SUÍÇO: modelagem homológica de estruturas e complexos de proteínas. Nucleic
Acids Res. 46, W296-W303 (2018).
GenBank sob o número de acesso MN908947.
43. Hwang, WC et al. Base estrutural de neutralização por um anticorpo humano anti-severo da proteína do pico da síndrome
respiratória aguda, 80R. J. Biol. Chem. 281, 34610-34616 (2006).

32. Bolger, AM, Lohse, M. e Usadel, B. Trimmomatic: um aparador flexível para dados de seqüência de Illumina. Bioinformática
30, 2114-2120 (2014). Reconhecimentos Este estudo foi financiado pelo Projeto Nacional Especial sobre investigação de recursos básicos da China
33. Grabherr, MG et al. Conjunto de transcriptoma completo a partir de dados de RNA-seq sem um genoma de referência. Nat. (concessão 2019FY101500) e pela Fundação Nacional de Ciências Naturais da China (concessão 81861138003 e 31930001). A
Biotechnol. 29 644-652 (2011). ECH é apoiada por uma bolsa de estudos da ARC Australian Laureate (FL170100022).
34. Li, B., Ruotti, V., Stewart, RM, Thomson, JA & Dewey, estimativa de expressão gênica de RNA-seq da CN com incerteza
de mapeamento de leitura. Bioinformática 26, 493–500 (2010).
35. Langmead, B. & Salzberg, SL Alinhamento rápido de leitura com folga com Bowtie 2. Nat. Métodos Contribuições do autor Y.-ZZ concebeu e desenhou o estudo. SZ, YH, Z.-WT e M.-LY realizaram o trabalho clínico
9 357-359 (2012). e a coleta de amostras. BY e J.-HT realizaram a investigação epidemiológica e a coleta de amostras. FW, Z.-GS, LX,
36. Li, H. et ai. O formato de alinhamento de sequência / mapa e as ferramentas do SAM. Bioinformática 25, Y.-YP, Y.-LZ, F.-HD,
2078-2079 (2009). YL, J.-JZ e Q.-MW realizaram os experimentos. Y.-MC, WW, FW, ECH e Y.-ZZ analisaram os dados. Y.-ZZ, ECH e FW
37. Katoh, K. & Standley, DM MAFFT versão 7 do software de alinhamento de múltiplas sequências: melhorias no escreveram o artigo com contribuições de todos os autores. Y.-ZZ liderou o estudo.
desempenho e na usabilidade. Mol. Biol. Evol. 30, 772-780 (2013).
38. Guindon, S. et al. Novos algoritmos e métodos para estimar filogenias de probabilidade máxima: avaliando o
desempenho do PhyML 3.0. Syst. Biol. 59, 307-321 (2010). Interesses competitivos Os autores declaram não ter interesses concorrentes.
39. Tamura, K. et al. MEGA5: análise genética molecular evolutiva usando métodos de máxima verossimilhança,
distância evolutiva e parcimônia máxima. Mol. Biol. Evol. 28, Informações adicionais Informações suplementares está disponível para este artigo em
2731-2739 (2011). https://doi.org/10.1038/s41586-020- 2008-3.
40. Lole, KS et al. Genomas completos do vírus da imunodeficiência humana tipo 1 de soroconversores infectados pelo
subtipo C na Índia, com evidências de recombinação intersubtipo. J. Virol. Correspondência e solicitações de materiais deve ser endereçado a Y.-ZZ
73, 152-160 (1999). Informações de revisão por pares Natureza agradece a Nicholas Loman e ao (s) outro (s) revisor (es) anônimo (s) por sua contribuição para a
41. Edgar, RC MUSCLE: alinhamento de múltiplas sequências com alta precisão e alto rendimento. Nucleic revisão por pares deste trabalho.
Acids Res. 32 1792-1797 (2004). Informações sobre reimpressões e permissões está disponível em http://www.nature.com/reprints.
Artigo

Dados estendidos Fig. 1 | Radiografias de tórax do paciente. uma - d A tomografia e consolidação irregular foram claramente observadas, especialmente na parte inferior do pulmão.

computadorizada do tórax foi obtida no dia da admissão (dia 6 após o início da doença). e Uma radiografia de tórax foi obtida no dia 5 após a admissão (dia 11 após o início da doença).
Consolidação focal bilateral, consolidação lobar Foram observadas sombras difusas e difusas bilaterais.
Dados estendidos Fig. 2 | Outros patógenos respiratórios não foram detectados na amostra BALF foi usado como controle negativo (NEG) e amostras positivas (POS) incluíram plasmídeos que
cobrem os iniciadores Taqman e as regiões da sonda da influenza A, as linhagens Victoria e
por RT-PCR em tempo real. uma - e A amostra BALF foi testada quanto à presença do vírus influenza A ( uma),
linhagem Victoria dos vírus influenza B ( b) a linhagem Yamagata dos vírus influenza B ( c) adenovírus Yamagata dos vírus influenza B, adenovírus humano e Chlamydia pneumoniae.
humano ( d) e
Chlamydia pneumoniae ( e) A amostra 1 foi a amostra BALF do paciente, água
Artigo

Dados estendidos Fig. 3 | Gráfico de contagem de leitura mapeada do genoma do WHCV. Os histogramas mostram a profundidade da cobertura por base do genoma do WHCV. A profundidade média de sequenciamento do genoma do

WHCV foi de 604,21 nt.


Dados estendidos Fig. 4 | Quantificação de WHCV em amostras clínicas por RT-PCR em tempo real. uma,amplificação (curva marrom). b Curva de amplificação do padrão de DNA para WHCV. Da esquerda para a
Avaliação da especificidade dos iniciadores WHCV. As amostras de teste incluíram amostras clínicas direita, as concentrações de DNA foram de 1,8 × 10 8, 1.8 × 10 7
positivas para pelo menos um dos seguintes vírus: vírus influenza A (09H1N1 e H3N2), vírus influenza B, 1.8 × 10 6 1.8 × 10 5 1.8 × 10 4 e 1,8 × 10 3) c Curva ajustada linear de C t valores para concentrações do padrão
adenovírus humano, vírus sincicial respiratório, rinovírus, vírus da parainfluenza tipo 1–4, bocavírus de DNA WHCV. d Quantificação de WHCV na amostra BALF por RT-PCR em tempo real. O padrão de
humano, humano metapneumovírus, coronavírus OC43, coronavírus NL63, coronavírus 229E e DNA do WHCV foi usado como controle positivo (POS), água (NEG) e branco foram usados ​como
coronavírus HKU1. Somente o plasmídeo padrão de WHCV (WHCV 15.704–16.846 pb em um vetor pLB) controle negativo. A curva de amplificação da amostra BALF é mostrada em verde.
levou a resultados positivos
Artigo

Dados estendidos Fig. 5 | Árvores filogenéticas de probabilidade máxima das sequências valores percentuais de autoinicialização. As árvores estavam enraizadas no meio do caminho apenas para maior clareza. A barra

nucleotídicas de todo o genoma e S e N genes do WHCV e coronavírus relacionados. Os números (> de escala representa o número de substituições por site.

70) acima ou abaixo dos ramos indicam


Dados estendidos Fig. 6 | Árvores filogenéticas de probabilidade máxima das sequências ramos indicam valores percentuais de autoinicialização. As árvores estavam enraizadas no meio do caminho apenas para

nucleotídicas da 3CL, RdRp, Hel, ExoN, NendoU e O-MT genes do WHCV e coronavírus maior clareza. A barra de escala representa o número de substituições por site.

relacionados. Números (> 70) acima ou abaixo do


Artigo

Dados estendidos Fig. 7 | Veja a próxima página para legenda.


Dados estendidos Fig. 7 | Análise da RBD da proteína spike do coronavírus WHCV. uma, Alinhamentos de receptor ACE2 humano (PDB 2AJF). O ACE2 humano é mostrado em azul e o RBD da proteína spike de
sequências de aminoácidos de sequências RBD de CoVs semelhantes a SARS. Três CoVs semelhantes a SARS de SARS-CoV é mostrado em verde. Os resíduos importantes na ACE2 humana que interagem com o RBD da
morcego - que poderiam usar eficientemente a ACE2 humana como receptor - tinham uma sequência RBD de tamanho proteína spike de SARS-CoV são marcados.
semelhante ao SARS-CoV. O WHCV contém uma única inserção Val470. Os principais resíduos de aminoácidos c Estrutura proteica prevista do RBD da proteína spike do WHCV com base no alinhamento
envolvidos na interação com a ACE2 humana são marcados por quadrados laranja. Por outro lado, cinco CoVs alvo-modelo usando o ProMod3 no servidor SWISS-MODEL.
semelhantes a SARS de morcego, incluindo Rp3, que anteriormente não se ligavam ao ACE2 14 — Teve deleções de d Estrutura prevista da RBD da proteína spike da CoV Rs4874 semelhante a SARS.
aminoácidos em dois motivos (aminoácidos 433-437 e 460-472, destacados por caixas vermelhas) em comparação e Estrutura prevista da RBD da proteína spike de CoV Rp3 semelhante a SARS.
com os de SARS-CoV.11 b Os dois motivos (aminoácidos 433–437 e 460–472) são mostrados em vermelho para a f Estrutura cristalina da RBD da proteína spike de SARS-CoV (verde) (PDB 2GHV). Os motivos que se
estrutura cristalina da RBD da proteína spike da SARS-CoV em complexo com o assemelham aos aminoácidos 433-437 e 460-472 da proteína spike do SARS-CoV são mostrados em
vermelho.
Artigo

Dados estendidos Fig. 8 | Comparação da sequência de aminoácidos do domínio N-terminal da que podem se ligar ao ácido siálico e aos SARS-CoVs que não podem (SZ3, WH20, BJ0 e Tor2). Os principais
proteína spike. Comparação da sequência de aminoácidos do domínio N-terminal da proteína spike do resíduos 16 para a ligação do ácido siálico ao BCoV, MHV e HCoV OC43 e HKU1 são destacados por quadrados
WHCV, coronavírus bovino (BCoV), vírus da hepatite de camundongo (MHV) e coronavírus humano (HCoV laranja.
OC43 e HKU1)
Dados estendidos Fig. 9 | Eventos de recombinação no WHCV. O gráfico de similaridade de sequência de WHCV, CoVs semelhantes a SARS e CoVs semelhantes a SARS revela eventos putativos de recombinação.
pesquisa de natureza | resumo de relatórios
Autor (es) correspondente (s): Yong-Zhen Zhang Última atualização

pelo (s) autor (es): 25 de janeiro de 2020

Resumo dos Relatórios


A Nature Research deseja melhorar a reprodutibilidade do trabalho que publicamos. Este formulário fornece estrutura para consistência e transparência nos relatórios. Para mais informações sobre políticas
de Pesquisa da Natureza, consulte Autores e Árbitros e a Lista de verificação da política editorial .

Estatisticas
Para todas as análises estatísticas, confirme se os seguintes itens estão presentes na legenda da figura, legenda da tabela, texto principal ou seção Métodos. n / a Confirmado

O tamanho exato da amostra ( n) para cada grupo / condição experimental, dado como um número discreto e unidade de medida Uma declaração sobre se foram

realizadas medições de amostras distintas ou se a mesma amostra foi medida repetidamente O (s) teste (s) estatístico (s) utilizado (s) E se são um ou dois frente e verso

Somente testes comuns devem ser descritos apenas pelo nome; descreva técnicas mais complexas na seção Métodos.

Uma descrição de todas as covariáveis ​testadas

Uma descrição de quaisquer suposições ou correções, como testes de normalidade e ajuste para comparações múltiplas. Uma descrição completa dos parâmetros estatísticos, incluindo tendência central

(por exemplo, médias) ou outras estimativas básicas (por exemplo, coeficiente de regressão) E variação (por exemplo, desvio padrão) ou associação. estimativas de incerteza (por exemplo, intervalos de

confiança) Para testes de hipótese nula, a estatística do teste (por exemplo, F, t r) com intervalos de confiança, tamanhos de efeito, graus de liberdade e P valor anotado

Dê valores P como valores exatos sempre que adequado.

Para análise bayesiana, informações sobre a escolha de priores e configurações de Monte Carlo da cadeia de Markov. Para projetos hierárquicos e

complexos, identificação do nível apropriado para testes e relatório completo dos resultados. Estimativas dos tamanhos dos efeitos d Pearson's r) indicando

como eles foram calculados

Nossa coleção na web em estatísticas para biólogos contém artigos sobre muitos dos pontos acima.

Software e código
Informações sobre políticas sobre disponibilidade de código de computador

Coleção de dados Nenhum software foi usado.

Análise de dados Trimmotic (v0.39): ajuste e qualidade da aparagem de sequências Megahit (v1.1.3) e Trinity
(v2.5.1): montagem de leituras de novo
Blastn (v2.7.1), Diamond blastx (v0.9.21): anotação baseada em homologia de leituras e contigs de sequenciamento Bowtie2 (v2.3.4.1) e
samtools (v 0.1.19-44428cd): mapeamento de leitura e análise de resultados MAFFT (v7 .407) e MUSCLE (v3.8.425): alinhamento de sequência
PhyML (v3.0): estimativa de árvore filogenética

MEGA (v5): Modelo mais adequado para determinação de substituição de nucleotídeos e geração de árvores Pacote de
software Lasergene (v7.1): predição e anotação de ORF Geneious prime (v2019): visualização do alinhamento

Programa de Detecção de Recombinação (v4, RDP4) e Simplot (v3.5.1): análise de recombinação e visualização de plotagem de similaridade Servidor SWISS-MODEL
(https://swissmodel.expasy.org/): previsão da estrutura RBD da proteína de pico.

Para manuscritos que utilizam algoritmos ou software personalizados que são centrais para a pesquisa, mas que ainda não foram descritos na literatura publicada, o software deve ser disponibilizado aos editores / revisores. Nós encorajamos fortemente a deposição de código em
um repositório da comunidade (por exemplo, GitHub). Veja a Pesquisa da Natureza diretrizes para o envio de código e software para mais informações.
Outubro 2018

11
Dados

pesquisa de natureza | resumo de relatórios


Informações sobre políticas sobre disponibilidade de dados

Todos os manuscritos devem incluir um declaração de disponibilidade de dados . Esta declaração deve fornecer as seguintes informações, quando aplicável:

- Códigos de acesso, identificadores exclusivos ou links da Web para conjuntos de dados publicamente disponíveis

- Uma lista de figuras que associaram dados brutos


- Uma descrição de quaisquer restrições à disponibilidade de dados

Toda a sequência do genoma obtida neste estudo foi submetida ao GenBank com o número de acesso MN908947. Fig. 1-3, Dados estendidos Fig. 3,
Dados estendidos Fig. 5-9 têm dados brutos associados.

Relatórios específicos de campo


Selecione aquele abaixo que melhor se adequa à sua pesquisa. Se você não tiver certeza, leia as seções apropriadas antes de fazer sua seleção.

Ciências da Vida Ciências comportamentais e sociais Ciências ecológicas, evolutivas e ambientais

Para obter uma cópia de referência do documento com todas as seções, consulte nature.com/documents/nr-reporting-summary-flat.pdf

Ciências da vida estudam desenho


Todos os estudos devem divulgar esses pontos, mesmo quando a divulgação for negativa.

Tamanho da amostra O objetivo deste estudo foi descobrir os possíveis agentes etiológicos associados à doença respiratória grave ocorridos recentemente na cidade de Wuhan, província de Hubei, China.
Estudamos um paciente e coletamos líquido de lavagem broncoalveolar (LBA) daquele que exibia síndrome respiratória grave, incluindo febre, tontura e tosse. Por se tratar de um
estudo de descoberta, o número de indivíduos é irrelevante para as conclusões tiradas no artigo.

Exclusões de dados Nenhum dado foi excluído das análises.

Replicação A montagem de novo de leituras foi realizada usando dois programas.


Toda a sequência viral do genoma obtida da montagem de leitura foi confirmada por ensaios de PCR. Os resultados das análises
filogenéticas e de recombinação foram confirmados por múltiplas execuções.

Randomização Não aplicável. O objetivo deste estudo foi descobrir o possível agente etiológico associado à doença respiratória grave ocorrida
recentemente na cidade de Wuhan, província de Hubei, China. Como pudemos obter a amostra de LBA apenas de um paciente que apresentava síndrome respiratória grave,
incluindo febre, tontura e tosse, a randomização não foi aplicável a este estudo.

Cegamento Não aplicável. Apenas uma biblioteca de RNA foi gerada neste estudo e, portanto, nenhuma alocação de grupo foi realizada.

Relatórios para materiais, sistemas e métodos específicos


Exigimos informações dos autores sobre alguns tipos de materiais, sistemas experimentais e métodos utilizados em muitos estudos. Aqui, indique se cada material, sistema ou método listado é relevante para o seu estudo.
Se você não tiver certeza se um item da lista se aplica à sua pesquisa, leia a seção apropriada antes de selecionar uma resposta.

Materiais e sistemas experimentais Métodos


n / a Envolvidos no estudo n / a Envolvidos no estudo

Anticorpos Citometria de fluxo ChIP-seq

Linhas celulares eucarióticas Neuroimagem baseada em RM

Paleontologia

Animais e outros organismos Participantes

em pesquisas humanas Dados clínicos


Outubro 2018

Participantes da pesquisa em seres humanos

Informações sobre políticas sobre estudos envolvendo participantes de pesquisa em seres humanos

Características da população Recentemente, uma doença respiratória grave surgiu na cidade de Wuhan, província de Hubei, na China. O objetivo deste estudo é descobrir o agente etiológico. Embora os
registros clínicos de sete pacientes estivessem disponíveis neste estudo, a amostra do BAFL foi obtida apenas de um paciente. Aqui, apenas um paciente foi descrito no texto
com base nos comentários dos árbitros.

Recrutamento O paciente que apresentou sinais clínicos de doença respiratória, incluindo febre e tosse, foi recrutado.

2
Supervisão ética Este estudo foi revisado e aprovado pelos comitês de ética do Instituto Nacional de Controle e Prevenção de Doenças Transmissíveis do CDC da China. Além disso, o

pesquisa de natureza | resumo de relatórios


paciente assinou um termo de consentimento informado por escrito.

Observe que informações completas sobre a aprovação do protocolo do estudo também devem ser fornecidas no manuscrito.

Outubro 2018

Você também pode gostar