Você está na página 1de 14

https://doi.org/10.

1038/s41586-020-2923-3

AcceleratedArticlePreview

Modelos de rede de mobilidade do COVID-19


explicar as iniquidades e fazer a reabertura

Recebido: 15 de junho de 2020 Aceito: 21 Serina Chang, Emma Pierson, PangWei Koh, JalineGerardin, Beth Redbird, DavidGrusky e Jure Leskovec

de outubro de 2020

AcceleratedArticle PreviewPublished
online 10 de novembro de 2020 Este é um arquivo PDF de um papel revisado por um especialista que foi aceito para publicação. Embora não editado, o

O
conteúdo foi submetido à formatação reliminar. A natureza está fornecendo esta versão anterior do papel datilografado como
Citar este artigo como: Chang, S. et al. Modelos de rede de
mobilidade de COVID-19 explicam um serviço para nossos autores e leitores. O texto e as figuras serão submetidos a uma cópia e uma revisão à prova antes de

G
iniquidades e reabertura de informações. Natureza o artigo ser publicado em sua forma final. Observe que, durante os erros do processo de produção, podem ser descobertos, os

TI
https://doi.org/10.1038/s41586-020-2923-3
quais podem afetar o conteúdo, e todas as isenções de responsabilidade legais se aplicam.
(2020).

AR
E
D
A
AD
ER
EL
AC
ÃO
Ç
TA
EN
ES
R
AP

Natureza | www.nature.com
Artigo

Modelos de rede de mobilidade do COVID-19


explicar as iniquidades e fazer a reabertura

https://doi.org/10.1038/s41586-020-2923-3 Serina Chang 1,9, Emma Pierson 1,2,9, PangWei Koh 1,9, JalineGerardin 3, Beth Redbird 4,5,
DavidGrusky 6,7 e Jure Leskovec 1,8 ✉
Recebido: 15 de junho de 2020 Aceito: 21

de outubro de 2020
O COVID-19 pandêmico mudou drasticamente os padrões de mobilidade humana, necessitando de
Publicado on-line: 10 de novembro de 2020
modelos epidemiológicos que capturem os efeitos das mudanças na mobilidade na disseminação do vírus 1 Nós
introduceametapopulationSEIRmodel que integra de grão fino, dynamicmobilitynetworks tosimulate
thespreadof SARS-CoV-2 in10of o phonedata largestUSmetropolitanstatistical areas.Derivedfromcell, nosso
mobilitynetworksmapthehourlymovementsof98millionpeople de bairros (censusblockgroups, orCBGs)
topointsof interesse (POIs) suchas restaurantsandreligiousestablishments, integratingthesenetworks

O
connecting57kCBGs to553kPOIswith5.4 billionhourlyedges.Weshowthatby, um modelo SEIR relativamente

G
simples pode ajustar-se com precisão à trajetória do caso real, apesar de mudanças substanciais no

TI
comportamento da população ao longo do tempo.Nosso modelo também prediz corretamente taxas de
infecção mais altas entre os grupos raciais e socioeconômicos desfavorecidos 2–8 unicamente das diferenças

AR
na mobilidade: descobrimos que os grupos desfavorecidos não foram capazes de reduzir a mobilidade de
forma tão acentuada e que os POIs que eles visitam são mais numerosos e, portanto, de maior risco. Ao
capturar quem está infectado em quais locais, nosso modelo oferece suporte a análises detalhadas que

E
podem informar respostas policiais mais eficazes e equitativas ao COVID-19.
D
A
AD
ER

Em resposta à crise do COVID-19, pedidos de permanência em casa foram executados em muitos trabalho que modela a disseminação de doenças usando agregados 15-19, histórico 20-22,
EL

países para reduzir o contato entre os indivíduos e retardar a disseminação do vírus 9 Desde então, ou dados de mobilidade sintética 23-25; separadamente, outro trabalho analisou dados de mobilidade
os funcionários públicos têm continuado a deliberar sobre quando é aberta, o que coloca um no contexto do COVID-19, mas sem um modelo subjacente de propagação da doença 26-30.
AC

segurança para retornar e como a capacidade de permitir 10 Responder a essas perguntas requer
modelos epidemiológicos que podem capturar os efeitos das alterações na mobilidade na Combinar nosso modelo epidemiológico com essas redes de mobilidade permite-nos
disseminação do vírus. Em particular, as descobertas de eventos de "superespalhamento" não apenas ajustar com precisão a contagem de casos observados, mas também realizar
COVID-19 11-14 motivam modelos que podem refletir os riscos heterogêneos de visitar locais análises detalhadas que podem informar respostas políticas mais eficazes e equitativas ao
ÃO

diferentes, embora tenham relatado disparidades nas taxas de infecção 2–8 requer modelos que COVID-19. Ao capturar informações sobre POIs individuais (por exemplo, número de
podem explicar o impacto desproporcional do vírus em grupos desfavorecidos. visitantes por hora, duração média da visita), nosso modelo pode estimar os impactos de
estratégias de reabertura específicas, como apenas reabrir certas categorias de POI ou
Ç

restringir a ocupação máxima em cada POI.


TA

Para atender a essas necessidades, construímos redes de mobilidade dinâmica de granulação fina a partir de dados de localização do celular e usamos
nosso
essas redes para modelar a disseminação de SARS-CoV-2 em 10 das maiores áreas estatísticas metropolitanas modelo
(referidas pode
abaixo identificar
das áreas populações de risco e prever corretamente, somente a
metropolitanas) nos Estados Unidos. Essas redes mapeiam os movimentos de hora em hora de 98 milhões departir de padrões
pessoas de gruposde
de mobilidade, que grupos raciais e socioeconômicos desfavorecidos
blocos censitários
EN

enfrentam
(CBGs), que oferecem unidades geográficas que normalmente contêm 600–3.000 pessoas, para pontos de interesse taxas
(POIs) mais altas
específicos. de infecção.
Conforme
mostrado na tabela S1, os POIs não são locais residenciais que as pessoas visitam, como restaurantes, mercearias e estabelecimentos religiosos. No topo
de cada rede, sobrepomos um modelo SEIR de uma população de metapopulação que Modelo de rede de mobilidade
ES
R
AP

rastreia os trajetórias de infecção de cada CBG, bem como os POIs em que Usamos dados doSafeGraph, uma empresa que agrega anonimizada
é provável que essas infecções tenham ocorrido. Isso se baseia no primeiro dados de localização de aplicativos móveis, para padrões de mobilidade de estabilidade de

1 Departamento de Ciência da Computação, Stanford University, Stanford, CA, 94305, EUA. 2 Microsoft Research, Cambridge, MA, 02142, EUA. 3 Departamento de Medicina Preventiva, Northwestern University, Chicago, IL, 60611, EUA. 4 Departamento

de Sociologia, Northwestern University, Evanston, IL, 60208, EUA. 5 Institute for Policy Research, Northwestern University, Evanston, IL,
60208, EUA. 6 Departamento de Sociologia, Universidade de Stanford, Stanford, CA, 94305, EUA. 7 Center on Poverty and Inequality, Stanford University, Stanford, CA, 94305, EUA. 8 Chan Zuckerberg Biohub, San Francisco, CA, 94158, EUA. 9 Esses
autores contribuíram igualmente: Serina Chang, Emma Pierson, PangWei Koh. ✉ e-mail: jure@cs.stanford.edu

Natureza | www.nature.com | 1
1 de março a 2 de maio de 2020. Para cada área metropolitana, representamos o contribuiu (EDFigura 2). Por exemplo, restaurantes e academias de ginástica contribuíram com menos
movimento de indivíduos entre os CBGs e os POIs como uma rede parcial com bordas infecções previsíveis ao longo do tempo, provavelmente devido ao bloqueio de pedidos que fecham
variáveis no tempo, em que o peso de uma borda entre aCBG e o POI representa o esses POIs, enquanto os supermercados permaneceram estáveis ou até aumentaram em sua
número de visitantes desse CBG para aquele POI em um determinado dia (Figura 1a). contribuição, o que está de acordo com seu status de negócios essenciais.
SafeGraphalsoferece a área nos pés quadrados de cada POI, bem como a sua
categoriaSistema de classificação da indústria norte-americana (NAICS) (por exemplo,
centro de fitness, restaurante de serviço completo) e a duração média da visita em Reabertura com ocupação máxima reduzida
minutos. 31 para gerar redes POI-CBG a partir de dados doGraphicsSafe. Em geral, as Se uma minoria de POIs produzir a maioria das infecções, então as estratégias de
redescompreende 5,4 bilhões de frações por hora entre 56.945 CBGs e 552.758 POIs reabertura que visam especificamente POIs de alto risco devem ser especialmente
(Tabela 1 ED). eficazes. 35 A reabertura completa sem reduzir a ocupação máxima produzida como em
infecções previstas: na área do Chicagometro, nossos modelos projetaram 32%
adicionais (95%
Nós sobrepomos um modelo SEIR em cada rede de mobilidade 15,20, onde cada CBG
mantém seus próprios estados suscetível (S), exposto (E), infeccioso (I) e removido (R)
(Figura 1b). densidade variável de indivíduos infecciosos para determinar a taxa de
infecção horária de POI. todos os três parâmetros permanecem durante todo o tempo.
Calibrar um modelo separado para cada área metropolitana usando contagens de casos IC, 25% –35%) da população seria infectada até o final de maio (Figura 2c). No entanto, a
confirmadas de redução da ocupação máxima reduziu substancialmente o risco sem reduzir drasticamente a
mobilidade geral: limitar a 20% da ocupação máxima na área de Chicago reduziu as novas
infecções previstas em mais de 80%, mas perdemos apenas 42% das visitas gerais, e

O
observamos tendências semelhantes em outras áreas metropolitanas (ED Figura 3). linearidade

G
das infecções previstas como função das visitas: uma pode atingir uma redução
proporcionalmente maior nas infecções com uma pequena redução nas visitas. Além disso, em

TI
O jornal New York Times minimizando o erro quadrático médio (RMSE) para casos de comparação com outra estratégia de reabertura que reduziu uniformemente as visitas para cada
incidentes diários 32 Nosso modelo se encaixa com precisão na contagem de casos diários POI de seus níveis em março anterior, a redução da ocupação máxima sempre resultou em

AR
observados em todas as áreas de 10 metros de março de 8 a 9 de maio de 2020 (Figura 1c, menos infecções previstas para o mesmo número de visitas totais (Figura 2c e Figura 4 ED).
d). Além disso, quando calibrado apenas em contagens de casos até 14 de abril, o modelo Isso ocorre porque a ocupação máxima reduzida tira proveito da densidade de visita variável
prevê casos razoavelmente bem no período de tempo de saída transmitida de 15 de abril a 9 dentro de cada POI, reduzindo desproporcionalmente as visitas ao POI durante os períodos de
de maio de 2020 (Figura 1c e EDFigura 1a). Nosso achado técnico-chave é que a rede de

E
alta densidade mais arriscados, mas deixando as contagens de visitas alteradas durante os
mobilidade dinâmica permite que mesmo nossos casos SEIR se ajustem com precisão
D
períodos de menor risco. Esses resultados apóiam descobertas anteriores de que intervenções
durante períodos de 15 de abril a 9 de maio de 2020. precisas, como reduzir a ocupação máxima, podem ser mais eficazes do que medidas menos
direcionadas, enquanto incorrem em custos econômicos substancialmente mais baixos 36
A
AD

Planos de redução e reabertura de mobilidade


ER

A magnitude da redução da mobilidade é pelo menos tão importante quanto o seu tempo
Risco relativo de reabertura de categorias diferentes de POIs

A mobilidade nos EUA caiu drasticamente em março de 2020: por exemplo, as visitas Como descobrimos que certas categorias de POI contribuíam muito mais com infecções evitadas em
EL

gerais de POI na área do agômetro de Chicago caíram 54,7% entre a primeira semana de março (Figura 2 de ED), também esperávamos que a reabertura de algumas categorias de POI fosse
março e a primeira semana de abril de 2020. Construímos as redes de mobilidade mais arriscada do que a reabertura de outras. Para avaliar isso, simulamos a reabertura de cada
AC

contrafactual dimensionando a magnitude da redução da mobilidade para baixo e categoria no turno em 1 de maio (retornando seus padrões de mobilidade aos níveis iniciais de março,
mudando a linha do tempo para as redes mais cedo e mais tarde, Em todas as áreas como antes), enquanto mantemos todos os outros POIs em seus níveis de mobilidade reduzidos a
metropolitanas, descobrimos que a magnitude da redução da mobilidade era pelo menos partir do final de abril. Encontramos uma grande variação nos riscos de reabertura previstos: em
tão importante quanto o seu tempo (Figura 2a, Tabelas S4-S5): por exemplo, se a média entre restaurantes, áreas metropolitanas, hotéis, ginásios cafés, organizações religiosas e
ÃO

redução da mobilidade na área do Agometro de Chic tivesse sido apenas um quarto restaurantes de serviço limitado produziram os maiores aumentos previstos de infecções quando
maior, as infecções previstas teriam aumentado em 3,3 × (IC 95%, 2,8-3,8), em reabertos (Figura 5d). A reabertura de restaurantes de serviço completo foi particularmente arriscada:
comparação com a1 .5 × (IC 95%, 1,4-1,6) aumento fez com que as pessoas não na área metropolitana de Chicago, previmos um adicional de 596k (IC de 95%, 434k-686k) infecções
Ç

reduzissem sua mobilidade uma semana inteira depois. Além disso, se a redução da até o final de maio, mais do que três vezes a próxima categoria de POI de maior risco (Figura 2d).
TA

nomobilidade tivesse ocorrido, 18,19,33,34. Esses riscos são somados a todos os POIs na categoria, mas os riscos relativos após a normalização
pelo número de POI foram muito semelhantes (EDFigura 5c). Essas categorias foram previstas como
mais perigosas porque, nos dados de mobilidade, seus POIs tendiam a ter densidades de visita
EN

maiores e / ou permaneceram lá por mais 24 horas (Figuras S15).


ES

Uma minoria da conta de POIs para a maioria das infecções previstas


Em seguida, investigamos se como nós reduzimos a mobilidade - isto é, para quais POIs -
importa. Calculamos o número de infecções que ocorreram em cada POI em nossas
R

simulações de 1º de março a 2 de maio de 2020 e descobrimos que a maioria das Disparidades demográficas em infecções
AP

infecções previstas ocorreram em uma pequena fração dos POIs “superespalhados”; por Nós caracterizamos a propagação diferencial de SARS-CoV-2 ao longo de linhas demográficas
exemplo, na área de Chicago, 10% dos POIs representaram 85% (IC 95%, 83% -87%) usando dados do Censo dos EUA para anotar cada CBG com sua composição racial e renda
das infecções previstas em POIs (Figura 2b, Figura S10). média, em seguida, rastreando as taxas de infecção previstas em CBGs com diferentes
composições demográficas: por exemplo, dentro de cada área metropolitana, comparando CBGs
no decis superior e inferior para a renda. Usamos esta abordagem para estudar a mobilidade

Natureza | www.nature.com | 2
Artigo
mecanismos por trás das disparidades e para quantificar como as diferentes estratégias de reabertura mas também tem um impacto diferente sobre os grupos desfavorecidos especificamente. Por
impactam os grupos desfavorecidos. exemplo, nosso modelo previu que a reabertura completa na área metropolitana de Chicago
resultaria em 39% adicionais (IC 95%, 31% -42%) da população de CBGs no medicamento
Prevendo disparidades de dados de mobilidade inferior sendo infectado dentro de um mês, em comparação com 32% (IC 95%, 25% -35%)
Apesar de apenas ter acesso a dados de mobilidade e sem informações demográficas, nossos população (Figura 3f; resultados para todas as áreas metropolitanas em EDFigura 3). Da mesma
modelos previram corretamente maiores riscos de infecção entre grupos raciais e forma, a Figura S4 ilustra que a reabertura de categorias de POI individuais tende a ter um
socioeconômicos desfavorecidos 2–8. Em todas as áreas metropolitanas, os indivíduos de CBGs na impacto maior previsto sobre o CBG de menor renda. Planos de reabertura mais restritos
década inferior de renda eram substancialmente mais propensos a ter sido infectados no final da produzem disparidades absolutas menores nas infecções previstas - por exemplo, prevemos que
simulação, embora todos os indivíduos tenham começado com probabilidades iguais de infecção a reabertura em 20% da ocupação máxima em Chicag poderia resultar em infecções adicionais
(Figura 3a). Essa disparidade prevista foi impulsionada principalmente por algumas categorias de para 6% (95%
POI (por exemplo, restaurantes de serviço completo), que infectaram proporções muito maiores
de CBGs de renda mais baixa do que de CBGs de renda superior (Figura 3c e S2). Da mesma IC, 4% –8%) da população geral e 10% (IC 95%, 7% –13%) da população em CBGs no
forma, descobrimos que os CBG com menos residentes brancos tinham maiores riscos decil de renda inferior (Figura 3f) - embora a disparidade relativa permaneça.
previsíveis de infecção (Figura 3). Na discussão de SI, confirmamos que a magnitude das
disparidades de nossos modelos de predições são geralmente consistentes com as disparidades
do mundo real e ainda mais explora as grandes disparidades previstas na Filadélfia, que decorre
de diferenças substanciais nos POIs que são frequentados por CBGs de renda mais alta e mais Discussão
baixa. Na análise abaixo, discutimos dois mecanismos que produzem taxas de infecção previstas O conjunto de dados de mobilidade que usamos tem limitações: ele não cobre todas as
mais altas entre os CBGs de baixa renda e mostramos na Figura 6 e na Tabela 4 da EDF que populações, não contém todos os POIs e não pode capturar a heterogeneidade de
sub-CBG. Nosso modelo em si também é oparsimonioso e não inclui todos os recursos do

O
resultados semelhantes também se aplicam às disparidades raciais.
mundo real relevantes para a transmissão da doença. Discutimos essas limitações em

G
detalhes mais detalhados na discussão do SID. Em parte, os BCGs de renda têm taxas
de infecção mais altas porque tendem a visitar POIs mais densos e porque não reduziram

TI
tanto a mobilidade (provavelmente porque não podem trabalhar tão facilmente de casa 4) —Para
segurar com firmeza. Nossa abordagem de modelagem de rede refinada naturalmente se

AR
CBGs de baixa renda viram reduções menores na mobilidade estende a outros conjuntos de dados de mobilidade e modelos que capturam mais
Um primeiro mecanismo que produziu disparidades foi que, em todas as áreas metropolitanas, os aspectos da transmissão no mundo real, e estes representam direções interessantes para
CBGs de renda mais baixa não reduziram sua mobilidade tão acentuadamente nas primeiras trabalhos futuros.
semanas de março de 2020, e tinham mobilidade mais alta do que os CBGs de renda mais alta de

E
março a maio (Figura 3d, ED Figura 6). Por exemplo, em abril, os CBGs de baixa renda na área
D
metropolitana de Chicago tiveram 27% mais visitas de POI per capita do que os CBGs de alta renda.
As diferenças de nível de categoria nos padrões de visita explicaram parcialmente as disparidades
A

de infecção em cada categoria: por exemplo, os CBGs de baixa renda fizeram substancialmente Nossos resultados podem orientar os formuladores de políticas que buscam avaliar abordagens
AD

mais visitas per capita a supermercados do que os CBGs de alta renda (Figura S3) e, concorrentes para a reabertura. Apesar da crescente preocupação com as disparidades raciais e
consequentemente, experimentaram mais infecções previstas nessa categoria (Figura S2). socioeconômicas em infecções e mortes, tem sido difícil para os formuladores de políticas lidar com
essas preocupações; eles estão atualmente operando sem muita evidência sobre os impactos
ER

dispersos das políticas de reabertura, solicitando chamadas para pesquisas que identificam as causas
das disparidades observadas e sugerem abordagens políticas para resolvê-las 5,8,37,38.
POIs visitados; renda inferior; CBG; taxas de transmissão mais altas
EL

Diferenças em seu percapitadonão explicam totalmente as disparidades de infecção: por exemplo, Cafes & SnackBars Nossa modelagem de mobilidade refinada aborda ambas as necessidades. Nossos resultados
foram visitados com mais frequência porCBGs de renda mais alta em cada área metropolitana (Figura S3), mas nosso sugerem que as disparidades de infecção não são a consequência inevitável de fatores que
AC

modelo previu que Cafes & Snack Bars infectaram uma proporção maior de CBGs de baixa renda na maioria das áreas são difíceis de abordar em curto prazo, como diferenças nas condições preexistentes; no
metropolitanas (Figura S2). Descobrimos que mesmo dentro de uma categoria de POI, as taxas de transmissão contrário, as decisões de políticas de curto prazo podem afetar substancialmente os resultados
previstas em POIs frequentados por CBGs de renda mais baixa tendiam a ser maiores do que as taxas de infecção e a quantidade de POIs permitidas de recuperação permitida. Considerando o
correspondentes para CBGs de renda mais alta (Figura 3e; ED Tabela 3), porque os POIs frequentados por CBGs de impacto disparatado dos planos de reabertura pode levar os formuladores de políticas a adotar
ÃO

renda mais baixa tendiam a ser menores e mais aglomerados nos dados de mobilidade . Como um estudo de caso, políticas que possam reduzir as densidades de infecção em bairros desfavorecidos por meio
examinamos os supermercados em mais detalhes. Em 8 das áreas de 10 metros, os visitantes deCBGs de renda mais de apoio, por exemplo, (1) limites mais restritos em ocupações de POI, (2) centros de
baixa encontraram taxas de transmissão mais altas previstas em mercearias do que os visitantes deCBGs de renda distribuição de alimentos de emergência a concentrações reduzidas em bairros de alto risco
Ç

mais alta (taxa de transmissão média de 2,19, Tabela ED3). Por que uma visita à mercearia prevista para um indivíduo disparidades no acesso aos testes 2), ( 4) melhoria da política de licença paga ou suporte de
TA

de renda mais baixa? Os dados do SafeGraph mostraram que o armazém médio visitado por indivíduos de baixa renda renda que permite que os trabalhadores essenciais reduzam a mobilidade quando estão
tinha 59% mais visitantes por hora por pé quadrado, e seus visitantes ficavam 17% a mais em média (medianas nas doentes e (5) melhora a prevenção de infecções no local de trabalho para trabalhadores
áreas metropolitanas). Essas descobertas destacam como as diferenças refinadas nos padrões de mobilidade - com essenciais, como EPI de alta qualidade, boa ventilação e distanciamento, quando possível. À
EN

que frequência as pessoas saem e para quais POIs vão - podem contribuir, em última instância, para disparidades medida que as políticas de reabertura continuam a ser debatidas, é fundamental construir
dramáticas nos resultados de infecção previstos. Por que visitar a mercearia foi predito como sendo um lugar perigoso ferramentas que possam avaliar a eficácia e a equidade de diferentes abordagens. Esperamos
para um indivíduo de baixa renda? Os dados do SafeGraph mostraram que o armazém médio visitado por indivíduos de que nosso modelo, ao capturar a heterogeneidade entre POIs, grupos demográficos e cidades,
ES

baixa renda tinha 59% mais visitantes por hora por pé quadrado, e seus visitantes ficavam 17% a mais em média ajude a atender a essa necessidade.
(medianas nas áreas metropolitanas). Essas descobertas destacam como as diferenças refinadas nos padrões de
R

mobilidade - com que frequência as pessoas saem e para quais POIs vão - podem contribuir, em última instância, para

disparidades dramáticas nos resultados de infecção previstos. Por que visitar a mercearia foi predito como sendo um
AP

lugar perigoso para um indivíduo de baixa renda? Os dados do SafeGraph mostraram que o armazém médio visitado

por indivíduos de baixa renda tinha 59% mais visitantes por hora por pé quadrado, e seus visitantes ficavam 17% a mais em média (medianas nas áreas metropolitanas). Essas descobertas destacam como as diferenças refinadas nos padrões de mobilidade -
Onlinecontent
O plano de reabertura deve levar em conta o impacto disperso Quaisquer métodos, referências adicionais, resumos de relatórios da NatureResearch, dados de
Como os grupos desfavorecidos sofrem uma carga maior de infecção, é fundamental não origem, dados estendidos, informações suplementares, agradecimentos, informações de revisão por
considerar apenas o impacto geral dos planos de reabertura pares; detalhes das contribuições do autor

3 | Natureza | www.nature.com
e interesses competitivos; andstatementsofdataandcodeavailability estão disponíveis em 21 Pei, S. & Shaman, J. Simulação inicial de SARS-CoV2 Spread and Intervention Effects in the Continental US. medRxiv ( 2020).
Disponível em https://doi.org/10.1101/2020.03.21.20040303. Aleta, A. et al. Modelagem do impacto do distanciamento
https://doi.org/10.1038/s41586-020-2923-3.
22 social, teste, rastreamento de contato e quarentena domiciliar em cenários de segunda onda da epidemia de COVID-19. medRxiv

(2020). Disponível em https://doi.org/10.1101/2020.05.06.20092841. Duque, D. et al. COVID-19: Como diminuir o


1 Buckee, CO et al. Dados de mobilidade agregados podem ajudar a combater COVID-19. Ciência 368,
23 distanciamento social se for necessário. medRxiv ( 2020). Disponível em https://doi.org/10.1101/2020.04.29.20085134.
145–146 (2020).
2 Wilson, C. TheseGraphs ShowHowCOVID-19 está devastando os bairros de baixa renda da cidade de Nova York. Tempo
24 Block, P. et al. Estratégias de distanciamento baseadas em redes sociais para nivelar a curva COVID-19 em um mundo
( 2020). Disponível em https://time.com/5821212/ coronavirus-low-income-Communities /.
pós-bloqueio. Nature Human Behavior 4, 588–596 (2020). Karin, O. et al. Estratégias de saída cíclica adaptativa do
25 bloqueio para suprimir COVID-19 e permitir a atividade econômica. medRxiv ( 2020). Disponível em
3- Garg, S. et al. Taxas de hospitalização e características de pacientes hospitalizados com doença coronavírus
https://doi.org/10.1101/202
confirmada em laboratório 2019 — COVID-NET, 14 estados, 1 a 30 de março de 2020. (Relatório semanal de
0.04.04.20053579.
mortalidade e morbidade do CDC (MMWR), 2020). Disponível em
26 Gao, S. et al. Mapeamento das mudanças no padrão de mobilidade em nível de condado nos Estados Unidos em resposta
https://www.cdc.gov/mmwr/volumes/69/wr/mm6915e3.htm.
ao COVID-19. SIGSPATIAL especial 12, 16–26 (2020). Klein, B. et al. Avaliação das mudanças na mobilidade e na
4 Reeves, RV & Rothwell, J. Class e COVID: Como os menos ricos enfrentam riscos duplos.
27 mobilidade individual nas principais áreas metropolitanas dos Estados Unidos durante o surto de COVID-19 (2020).
The Brookings Institution ( 2020). Disponível em https://www.brookings.edu/blog/ up-front / 2020/03/27 /
Disponível em networkscienceinstitute.org/publications/assessing-changes-in-commuting-and-individual-
class-and-covid-how-the-less-affluent-face-double-risk /. Pareek, M. et al. Etnia e COVID-19: uma prioridade
Mobility-in-Major-metropolitan-areas-in-the-United States-during-the-covid-19-outbreak. Benzell, SG, Collis, A. & Nicolaides,
5 urgente de pesquisa em saúde pública.
C. Racionando o contato social durante a pandemia de COVID-19: Risco de transmissão e benefícios sociais das
The Lancet 395, 1421–1422 (2020).
28 localidades dos EUA. Anais da National Academy of Sciences 17, 14642–14644 (2020). Baicker, K. et al. É mais seguro
6 van Dorn, A., Cooney, RE & Sabin, ML COVID-19 exacerbando as desigualdades nos EUA.
visitar uma cafeteria ou aGym? O jornal New York Times ( 2020). Disponível em
The Lancet 395, 1243–1244 (2020).
https://nytimes.com/interactive/2020/05/06/opinion/coronavirus-us-reopen. html.
7 Yancy, CW COVID-19 e afro-americanos. JAMA 323, 1891–1892 (2020). Chowkwanyun, M. & Reed Jr, AL Racial
29
8 Health Disparities andCovid-19 - Cuidado e Contexto. NewEngland Journal of Medicine 383, 201–203 (2020).
Flaxman, S. et al. Estimativa dos efeitos de intervenções não farmacêuticas sobre COVID-19 na Europa. Natureza 584,
9 257–261 (2020).
30 Hsiang, S. et al. O efeito de políticas anti-contágio em larga escala na pandemia de coronavírus (COVID-19). Natureza
584, 262–267 (2020).

O
10 Rojas, R. & Delkic, M. À medida que os estados reabrem, os governadores equilibram os riscos existentes com os novos.
31 Deming, WE & Stephan, FF Em um ajuste de mínimos quadrados de uma tabela de frequência amostrada quando os totais
O jornal New York Times ( 2020). Disponível em https://www.nytimes.com/2020/05/17/us/ Endo, A. et al. Estimando
marginais esperados são conhecidos. The Annals of Mathematical Statistics
coronavirus-states-reopen.html.

G
11, 427–444 (1940).
11 a superdispersão na transmissão COVID-19 usando o surto
32 O jornal New York Times. Dados do Coronavirus (Covid-19) nos Estados Unidos (2020). Disponível em
tamanhos fora da China. WellcomeOpen Research 5 ( 2020). Hong Kong. NatureMedicine

TI
https://github.com/nytimes/covid-19-data.
12 Adam, DC et al. Potencial de agrupamento e superespalhamento de infecções por SARS-CoV-2 em Park, SY et al. Coronavirus
33 Tian, H. et al. Uma investigação das medidas de controle da transmissão durante os primeiros 50 dias da epidemia de
( 2020).
COVID-19 na China. Ciência 368, 638–642 (2020). Watts, DJ et al. Epidemias multiescala ressurgentes em um modelo

AR
13 DiseaseOutbreak inCall Center, South Korea. Emergente
34 hierárquico de metapopulação.
Doenças infecciosas 26, ( 2020).
Anais da National Academy of Sciences 102, 11157–11162 (2020). Departamento de Saúde Pública da
14 Bi, Q. et al. Epidemiologia e transmissão de COVID-19 em 391 casos e 1.286 de seus
35 Califórnia. COVID-19, Orientação da Indústria: Varejo (2020). Disponível em
contatos próximos em Shenzhen, China: um estudo de coorte retrospectivo. The Lancet Infectious
https://covid19.ca.gov/pdf/guidance-retail.pdf.
Doenças 20, 911–919 (2020). surto de coronavírus (COVID-19). Ciência 368, 395–400

E
36 Birge, J., Candogan, O., & Feng, Y. Controlling Epidemic Spread: Reducing Economic Losses with
15 Chinazzi, M. et al. O efeito das restrições de viagens na disseminação do romance Jia, JS de 2019 et al. O fluxo
TargetedClosures (2020). Disponível em https://bfi.uchicago.edu/wp-content/ uploads / BFI_WP_202057-1.pdf.
(2020).
16 populacional direciona a distribuição espaço-temporal de COVID-19 na China. Pei, S., Kandula, S. & Shaman, J.
D
37 WebbHooper, M., Nápoles, AM, & Pérez-Stable, EJ COVID-19 e Disparidades Racial / Étnicas. JAMA 323,
Natureza 582, 389–394 (2020). Espalhe nos Estados Unidos. medRxiv ( 2020). Disponível em
2466–2467 (2020).
17 Differential Effects of Intervention Timing onCOVID-19
A
38 Laurencin, CT & McClinton, A. A pandemia de COVID-19: uma chamada à ação para identificar e abordar
https://doi.org/10.1101/2020.05. Lai, S. et al. Efeito de intervenções não farmacêuticas para conter COVID-19 na
disparidades étnicas e raciais. Journal of Racial and Ethnic Health Disparities 7,
AD

15.20103655.
398–402 (2020).
18 China. Badr, H. et al. Associação entre padrões de mobilidade e transmissão COVID-19 no
Natureza 585, 410–413 (2020).
19 Nota do editor A Springer Nature permanece neutra em relação a reivindicações jurisdicionais em mapas publicados e
afiliações institucionais.
ER

EUA: estudo de modelagem matemática. The Lancet Infectious Diseases ( 2020). novo coronavírus
20 Li, R. et al. Infecção não documentada substancial facilita a rápida disseminação de
(SARS-CoV2). Ciência 368, 489–493 (2020). © O (s) Autor (es), sob licença exclusiva da Springer Nature Limited 2020
EL
AC
ÃO
Ç
TA
EN
ES
R
AP

Natureza | www.nature.com | 4
Artigo

O
G
TI
AR
Figura1 | Descrição e ajuste do modelo. (uma) A rede de mobilidade captura visitas horárias de cada grupo de 406 intervalo de datas de 15 de abril a 9 de maio). À direita: o ajuste do modelo melhorou ainda mais quando calibramos o

blocos censitários (CBG) para cada ponto de interesse (POI). As linhas verticais indicam que a maioria das visitas modelo em toda a faixa de dados (RMSEondailycases = 387 para o intervalo de datas de 15 de abril a 9 de maio). ( d) Ajustamos

E
ocorre entre POIs e CBGs próximos. As visitas caíram drasticamente de março (parte superior) para abril (parte modelos separados para10 das maiores áreas estatísticas metropolitanas dos Estados Unidos, modelando uma população

inferior), conforme indicado pela densidade inferior das linhas cinzas. ( b) Pesamos o modelo de disseminação de total de 98 milhões de pessoas; aqui, mostramos todos os ajustes do modelo, como em (c) -Direito. Em (c) e (d), a linha
D
doença na rede de mobilidade, com cadaCBG tendo sua propriedade de compartimentos SEIR. Novas infecções azul representa as previsões do modelo e os cinzas representam os casos relatados diariamente; como tendem a ter

ocorrem nos POIs e nos CBGs, com a rede de mobilidade que rege as subpopulações de diferentes CBGs grande variabilidade, mostramos a média semanal suavizada (linha laranja). As regiões sombreadas denotam 2,5t e 97,5
A
interagem à medida que visitam os POIs. percentis entre os conjuntos de parâmetros e as realizações estocásticas. Em todas as áreas metropolitanas, amostramos
AD

97 conjuntos de parâmetros, com 30 realizações estocásticas cada (N = 2.910); consulte a Tabela S6 para o número de

(c) Esquerda: Para testar a predição fora da amostra, calibramos o modelo ondata antes de 15 de abril de 2020 conjuntos de área permetro.

(linha preta vertical). Mesmo que seus parâmetros permaneçam fixos ao longo do tempo, o modelo prevê com

precisão a trajetória do caso na área de Chicagometro após 15 de abril, usando dados de mobilidade
ER

(RMSEondailycases =
EL
AC
ÃO
Ç
TA
EN
ES
R
AP

5 | Natureza | www.nature.com
O
G
TI
AR
E
D
Figura2 | Avaliação da redução da mobilidade e reabertura. A área de Chicago é usada como um exemplo, mas reduzindo as visitas, a estratégia de ocupação máxima reduzida sempre resulta em um aumento menor previsto
A
os resultados de referência para todas as áreas de metro são fornecidos para cada subfigura. ( a) Simulações nas infecções para o mesmo número de visitas (ED Figura 4). Os eixos representam a diferença relativa entre o
contrafactuais (à esquerda) da redução da mobilidade passada ilustram que a magnitude da redução (no meio) foi número previsto de novas infecções sob a estratégia de ocupação reduzida em comparação com a redução
AD

pelo menos tão importante quanto seu tempo (à direita) (Tabelas S4-S5). ( b) O modelo prevê que a maioria das uniforme. ( d) A reabertura de restaurantes de serviço completo tem o maior impacto previsto sobre as infecções,
infecções em POIsocorre em uma pequena fração de POIs “superespalhadores” (Figura S10). ( c) Esquerda: devido ao grande número de restaurantes, bem como às densidades de visitas altas e aos longos tempos de
Representamos graficamente as infecções cumulativas previstas após um mês da reabertura contra a fração de permanência (Figuras S15-S24). As cores são usadas para distinguir as diferentes categorias de POI, mas não
ER

visitas perdidas pela reabertura parcial em vez da reabertura completa (EDFigura 3); as anotações dentro do têm nenhum significado adicional. Todos os resultados nesta figura são agregados a conjuntos de 4 parâmetros
gráfico mostram a fração de ocupação máxima usada como tampa. Em comparação com a reabertura total, limitar e 30 realizações estocásticas (N = 120). Regiões sombreadas em (a – c) denotam o 2,5º–
a ocupação máxima de 20% em Chicago reduz as novas infecções em mais de 80%, enquanto perde apenas 42%
EL

do total de visitas. Direita: Comparado uniformemente

97,5 percentis; as caixas em (d) denotam o intervalo interquartil, com pontos de dados fora do intervalo
mostrado individualmente.
AC
ÃO
Ç
TA
EN
ES
R
AP

Natureza | www.nature.com | 6
Artigo

O
G
TI
AR
Figura3 | Padrões de mobilidade atribuídos às diferenças de infecção. Para (c – f), Chicagometroárea é usada como As 10 principais das 20 categorias com a maioria das visitas são marcadas, cobrindo 0,48–2,88 visitas per capita

E
um exemplo, mas são fornecidas referências a resultados para todas as áreas metropolitanas para cada subfigura. ( a) Em (HardwareStores – Full-ServiceRestaurants). ( f) A reabertura (em diferentes níveis de ocupação máxima
D
todas as áreas metropolitanas, nosso modelo prevê que as pessoas em CBGs de baixa renda têm maior probabilidade de reduzida) leva a infecções mais previstas em CBGs de baixa renda do que na população geral (Figura 3). Em (c
serem infectadas. ( b) Pessoas em áreas de CBGs não brancas também são mais propensas a serem infectadas, embora – f), púrpura representa CBGs de renda mais baixa, amarelo denotaCBGs de renda menor e azul representa a
os resultados sejam mais variáveis em áreas cruzadas. ( c) A disparidade geral prevista é impulsionada por algumas população geral. Com exceção de (d) e (e), que foram diretamente extraídos dos dados de mobilidade, todos os
A
categorias de POI, como restaurantes de serviço completo (Figura S2). ( d) Um motivo para as disparidades previstas é resultados nesta figura representam previsões agregadas sobre realizações de modelo. Em todas as áreas
AD

que os CBGs de renda mais alta podem reduzir seus níveis de mobilidade abaixo dos CBGs de renda mais baixa (Figura metropolitanas, amostramos 97 conjuntos de parâmetros, com 30 realizações estocásticas cada (N = 2.910);
6). ( e) Dentro de cada categoria de POI, pessoas de CBGs de renda mais baixa tendem a visitar POIs que têm taxas de consulte a Tabela S6 para o número de conjuntos de área permetro. As regiões sombreadas em (c) e (f)
transmissão mais altas previstas (Tabela ED3). O tamanho de cada ponto representa o número médio de visitas por denotam os 2,5-97,5 percentis; as caixas em (a – b) denotam o intervalo interquartil, com pontos de dados fora
ER

habitante feitas para a categoria. o do intervalo mostrado individualmente.


EL
AC
ÃO
Ç
TA
EN
ES
R
AP

7 Natureza | www.nature.com
Métodos dados mostraram que é geograficamente representativo: por exemplo, não representa
sistematicamente indivíduos de condados indiferentes de CBGs ou com composições
A seção de métodos é estruturada conforme a seguir. Descrevemos os conjuntos de dados que raciais, níveis de renda ou níveis educacionais diferentes 50,51.
usamos emMétodosM1 e a rede de mobilidade que derivamos desses conjuntos de dados
emMétodosM2. Em Métodos M3, discutimos o modelo SEIR que abordamos na rede de
mobilidade; emMétodosM4, descrevemos como calibramos este modelo e quantificamos a Censo dos EUA. Nossos dados sobre a demografia dos grupos de blocos do censo (CBGs)
incerteza em suas previsões. Por fim, emMétodosM5, fornecemos detalhes sobre os vêm do AmericanCommunity Survey (ACS) do USCensus Bureau 52 Usamos o ACS de 5 anos
procedimentos experimentais usados para nossas análises de redução da mobilidade, planos de (2013–2017) para extrair a renda familiar temática, proporção de residentes brancos e
reabertura e disparidades demográficas. proporção de residentes negros de cada CBG. Para a população total de cada CBG, usamos as
estimativas de um ano mais recentes (2018); as estimativas de um ano são mais ruidosas, mas
desejamos minimizar o viés sistemático para baixo em nossas contagens de população total
M1Datasets (devido ao crescimento da população) tornando-as o mais recentes possível.
SafeGraph. Usamos dados fornecidos porSafeGraph, uma empresa que agrega dados de
localização anônimos de vários aplicativos móveis. Os dados do SafeGraph capturam o
movimento das pessoas entre os grupos de blocos censitários (CBGs), que são unidades
geográficas que geralmente contêm uma população entre 600 e 3.000 pessoas e pontos de NewYorkTimes. Nós calibramos nossos modelos usando o conjunto de dados COVID-19
interesse (POIs), como restaurantes, mercearias ou estabelecimentos religiosos. publicado pelo O jornal New York Times 32 O terceiro conjunto de dados consiste em
Especificamente, usamos os seguintes conjuntos de dadosSafeGraph: contagens cumulativas de casos e mortes nos Estados Unidos ao longo do tempo, em
nível de estado e país. Para cadametro que modelamos, somamos as contagens em nível
1. Padrões de locais 39 andWeekly Patterns (v1) 40 Esses conjuntos de dados contêm, de país para produzir contagens gerais para a área do entirremetro.

O
para cada POI, contagens por hora do número de visitantes, estimativas do conjunto de

G
dados de visitas medianas em minutos (o "tempo de permanência") e estimativas
agregadas semanais e mensais de CBGs residenciais dos visitantes. o decorrer do mês.

TI
Para cada POI, o SafeGraphal fornece sua categoriaNorth American Dataethics. O conjunto de dados de O jornal New York Times consiste em casos confirmados
IndustryClassificationSystem (NAICS), bem como estimativas de sua duração média de COVID-19 agregados e contagens de mortes coletadas por jornalistas de conferências de notícias

AR
visitas em minutos e sua área física em pés quadrados. (A área é computada usando o públicas e lançamentos de dados públicos. Para os dados de mobilidade, o consentimento foi obtido
polígono de impressão do pé que o gráfico seguro atribui ao POI 41,42.) Analisamos dados de pelas fontes terceiras que coletaram os dados. O SafeGraphag agrega dados de aplicativos móveis
padrões de lugares de janeiro para obter o consentimento de seus usuários para coletar dados de localização anônimos. Os dados

E
de mobilidade do Google consistem em conjuntos de dados agregados e anônimos de usuários que
D
optaram por ativar a configuração Histórico de localização. Além disso, obtivemos a permissão do IRB
para dados doSafeGraph do escritório do IRB da Universidade Northwestern.
A
1º de março de 2019 a 29 de fevereiro de 2020 e dados de padrões semanais de 1º de março de 2020 a 2 de maio de

2020.
AD

2. SocialDistancingMetrics 43, que contém estimativas diárias da proporção de pessoas que ficam
em casa em cada CBG. Analisamos dados da Métrica de Distanciamento Social de 1º de março M2Mobilitynetwork
de 2020 a 2 de maio de 2020. Definição. Nós consideramos um gráfico bipartido completo e não dirigido G = (V, E)
ER

Nós nos concentramos em 10 das maiores áreas estatísticas metropolitanas nos EUA (Tabela 1 de Dados com bordas variáveis no tempo. Thevertices V são particionados em um conjunto
Estendidos). Escolhemos essas áreas metropolitanas pegando um subconjunto aleatório dos dadosSafeGraphPadrões conjuntos C = { c 1, …, c m}, representando m grupos de blocos censitários (CBGs), e
e selecionando a área de 10 metros com os POIs mais comuns nos dados. Nossos métodos neste artigo podem ser P = { p 1, …, p n}, representando n pontos de interesse (POIs). Dos dados do USCensus, cadaCBG c Eu é
EL

aplicados diretamente, em princípio, às outras áreas metropolitanas nos dados SafeGraph originais. Para cada área rotulado com sua população N c, incomedistribution, andracial andagedemographics. FromSafeGra Eu
metropolitana, incluímos todos os POIs que atendam a todos os seguintes requisitos: (1) o POI está localizado na área phdata, eachPOI p j é rotulado de forma semelhante com sua categoria (por exemplo, restaurante,
AC

metropolitana; (2) O SafeGraph tem dados de visita para este POI para uma hora e meia que foi modelo, de 12 de mercearia ou
manhã 1 de março de 2020 a 11 de maio 2 de maio de 2020; (3) O SafeGraph registrou osCBGs iniciais dos visitantes organização religiosa), seu tamanho físico dentro dos pés quadrados uma p, andtheme-
j

deste POI por pelo menos um mês de janeiro de 2019 a fevereiro de 2020; (4) o POI não é um POI “pai”. POIs “pais” hora de Diandwell d p de visitantes para p j. O peso W( t) eu j onanedge ( c Eu, p j) em
j

compreendem uma pequena fração de POIs nos dados que se sobrepõem e incluem as visitas de seus POIs “filhos”: Tempo t representa nossa estimativa do número de indivíduos da CBG
ÃO

por exemplo, muitos pequenos no conjunto de dados são POI pais que incluem as visitas de lojas que têm pelo menos c Eu visitando POI p j no t- a hora da simulação. Registramos o número de arestas (com alturas não
1 visita registrada a pelo menos 10 dos POIs restantes; para evitar visitas de contagem dupla, foram todos os POIs zero) em cada área metropolitana e em todas as horas
originais do conjunto de dados. Após aplicar esses filtros de POI, incluímos todos os CBGs que tenham pelo menos 1 de março1, 2020 a maio2, 2020inExtendedDataTable1. Em todas as áreas de 10 metros,
Ç

visita registrada a pelo menos 10 dos POIs restantes; isso significa que os CBGs de fora da área metropolitana podem estudamos 5,4 bilhões de bordas entre 56.945CBGs e
TA

ser incluídos se visitarem essa área metropolitana com frequência suficiente. As estatísticas resumidas dos dados 552.758 POIs.
pós-processados estão naTabela de dados estendidos1. Em geral, analise 57kCBGs das10metroáreas e mais de

310M de visitas dessesCBGs até 553kPOIs. isso significa que os CBGs de fora da área metropolitana podem ser Estimativa de rede (visão geral). O desafio técnico central na construção desta rede é
EN

estimar os pesos da rede W( t) = { W( t)


incluídos se visitarem essa área metropolitana com frequência suficiente. As estatísticas resumidas dos dados eu j }

pós-processados estão naTabela de dados estendidos1. Em geral, analise 57kCBGs das10metroáreas e mais de fromSafeGraphdata, uma vez que esta matriz de visita não está disponível diretamente
310M de visitas dessesCBGs até 553kPOIs. isso significa que os CBGs de fora da área metropolitana podem ser daedata. Nossa metodologia geral para estimativa de rede é a seguinte:
ES

incluídos se visitarem essa área metropolitana com frequência suficiente. As estatísticas resumidas dos dados

pós-processados estão naTabela de dados estendidos1. Em geral, analise 57kCBGs das10metroáreas e mais de 1. FromSafeGraphdata, wecanderiveatime-independentestimate
W da matriz de visita que captura a distribuição agregada de visitas de CBGs para POIs
R

310M de visitas dessesCBGs até 553kPOIs.

Os dados do SafeGraph foram usados para estudar as preferências do consumidor 44 e polarização de janeiro de 2019 a fevereiro de 2020.
AP

política 45 Mais recentemente, ele foi usado como uma das principais fontes de dados de mobilidade nos 2. No entanto, os padrões de visita diferem substancialmente de uma hora para outra (por exemplo,

Estados Unidos para rastrear os efeitos da pandemia SARS-CoV-2 26,28,46–48. Na seção 1 dos métodos dia versus noite) e dia de hoje (por exemplo, pré versus pós-bloqueio). Para capturar essas
SIM, mostramos que as tendências agregadas nos dados de mobilidade do SafeGraphup para agregar variações, usamos SafeGraphdata atual para estimar os limites CBG VOCÊ( t), ou seja, o
tendências nos dados de mobilidade do Googlem nos EUA 49, antes e depois da imposição de medidas número de pessoas em cada CBG que estão visitando POIs em seu t, bem como os
de permanência no homem. Análises anteriores deSafeGraph POImarginals V ( t), ou seja, o total
número de visitantes presentes em cada POI p j na hora t.
Artigo
3.A seguir, aplicamos o procedimento de adaptação proporcional iterativa (IPFP) M3.1 O número de novas exposições N S c N (Stt)→ c
cii E.ciiNós
E separamos o número
para estimar uma matriz de visita horária W( t) que é consistente com os marginais horários VOCÊ( t) e de novas exposições N ( t)
c Eu no tempo t em duas partes: casos de S c → E inCBG
V ( t) mas de outra forma "tão semelhante quanto poss Eu ble ”para a distribuição de visitas na matriz visitando POIs, que um Eu ré c s Eu amplificado de Pois (( S ( t) / N) ∑ n
c c j = 1 λ ( pt) W( eu j ), e de
t)
conduzido j
agregada de visitas W , em termos de divergência Kullback-Leibler. outros casos não capturados visitando POIs, wh Eu ich a Eu re samp
Binom ( S ( t),c Euλ ( t) c).
Eu
IPFP é um método estatístico clássico 31 para ajustar as distribuições conjuntas para
distribuições marginais pré-especificadas, e também é conhecido na literatura como ajuste Novas exposições de POIs visitantes. Presumimos que qualquer
proporcional, o algoritmo RAS ou raking 53 visitante do POI p no tempo t tem a mesma probabilidade independente λ ( t)
j p
Nas ciências sociais, tem sido amplamente utilizado para inferir as características de subpopulações de estar infectado e fazer a transição do suscetível ( S) ao j
locais (por exemplo, dentro de cada CBG) de dados agregados 54–56. exposto ( E) Estado. Uma vez que existem W( t) visitantes doCBG c para POI
eu j Eu

O IPFP estima a distribuição conjunta de visitas de CBGs para POIs, alternando o p j no tempo t, e assumimos que um S ( t) c/ N c fração do pesadelo
Eu g thesevisitors suscep-
isdistribuído
escalonamento de cada linha para as marginais de linha horária (CBG) VOCÊ( t) e dimensionar tabela, o número de novas exposiçõesa Eu seg
cada coluna para marcar os marginais da coluna horária (POI) V ( t). Para mais detalhes sobre o ( t)
asBinom ( W( t) euSj ( t)c / N c, λ p) ≈ Pois ( λ p W eu j S c / N). O número
( t) (t) (t)
de novos ex-
j t going vi j sitors Eu do CBG cc Eu é portanto Eu

procedimento de estimativa, referimos o leitor à Seção 3 de métodos SIM. posições amon Eu garota Eu eu ou
distribuído como a soma da expressão acima em todos os POIs,
Pois (( S (c t) / N)c ∑ n λj 1=( pt) W( t)).
Eu
taxaeu de
j cção no POI p no tempo t, λ ( t): = β ( t) ⋅ EU ( t) / V ( t),
Dinâmica do modelo M3 j

Wemodel Eu o infe j pj pj pj
pj
Para modelar a disseminação deSARS-CoV-2, vamos cobrir um modelo de transmissão de
como o produto de sua taxa de transmissão β ( t) e proporção de infeccioso
doença de uma população na rede de mobilidade definida em Métodos M2.A estrutura do p

indivíduos EU ( t)p /j V ( t),p jOnde V ( t): = p∑j m W( t)i =j 1 eu j é o número total de visitantes para
modelo de transmissão seguepriortrabalhoummodelopidemiológicodeSARS-CoV-2 15,20 mas

O
p j no tempo t. Modelamos a taxa de transmissão no POI p j no tempo t Como
incorpora uma rede de mobilidade de granulação fina nos cálculos da taxa de transmissão.

G
Construímos redes de mobilidade separadas e modelos para cada área metropolitana
V ( t)
estatística. (8)
β (p t):j = ψ ⋅ d 2 ⋅ pp j,uma p

TI
j j

Usamos um modelo SEIR com suscetível ( S), exposto ( E), infeccioso ( EU),
e removido ( R) compartimentos. Os indivíduos suscetíveis nunca foram infectados, mas podem

AR
Onde uma p é a área física de p j, e ψ é uma constante de transmissão (compartilhada entre todos
adquirir o vírus por meio do contato com indivíduos infecciosos, que podem acontecer em POIs j

os POIs) que se vale de dados. A inversescalingof trans-


ou em sua casaCBG. Eles entram no estado exposto, durante o qual foram infectados, mas
taxa de missão com área uma p é uma suposição simplificadora padrão 57 A fração do tempo de
ainda não são infecciosos. Os indivíduos transicionam de uma exposição a infecciosa em uma j

E
permanência d p ∈ [ 0, 1] é a fração de uma hora em média
taxa inversamente proporcional ao período de latência média. Por fim, eles passam para o
visitante de p j a qualquer hora j vai gastar lá (SIMethods Section3); tem efeito aquático na
estado removido em uma taxa inversamente proporcional a um período infeccioso. O estado
D ( t)
taxa de transmissão de POI β porque reduz
removido representa os indivíduos que já não podem estar infectados ou infectar outros, por pj
ambos (1) o tempo que um visitante suscetível gasta em p j e (2) a densidade dos visitantes em p
exemplo, porque se recuperaram, se isolaram por si ou morreram.
A
j. Com esta expressão para a taxa de transmissão β ( t),
pj
AD

nós podemos calcular a taxa de infecção no POI p j no tempo t Como

EachCBG c mantém
Eu
sua própria instanciação SEIR, com S ( t), E ( t), EU ( t), c c Eu easc Eu e
EU ( t) EU ( t)
e R ( t) representando quantos indivíduos na CBG c são ineac Eu hdis λ (p t)j = β ( t)p⋅j Vp j =( t)ψ ⋅ d 2 ⋅ p j . (9)
ER

c Eu
Eu
pj uma p j
estado na hora t, e N = S ( t) +cE
Eu
( t) + EU
c Eu
( t) + R
c Eu
( t) c Eu c.EuA cada hora t, nós provamos pj

as transições entre os estados da seguinte forma:


Para valores suficientemente grandes de ψ e uma proporção suficientemente grande de
EL

S c( Eut) n∑ λ ( t) W( t) indivíduos infectados, a expressão acima pode às vezes exceder


N (St)→ E ~ Pois ( pj ij) + Binom ( S ( t), λ c( t)
Eu c)Eu
(1) 1. Para resolver isso, simplesmente reduzimos a taxa de infecção para 1. No entanto, isso ocorre muito
ci ci
N c Eu j =1
AC

raramente para as configurações de parâmetro e duração de simulação que usamos.

( t)
N (Et)→ Eu ~ Binom ( E c, 1 / δ E) (2) Finalmente, para computar o número de indivíduos infecciosos em p j no tempo
ci ci Eu

t, eu p,
( t)presumimos que a proporção de indivíduos infecciosos entre
ÃO

j( t)
aW kj visitantes de p j fromaCBG c k espelha a densidade geral de infecção
( t) ( t)
N Eu c → R ~ Binom ( Eu c, 1 / δ EU), (3)
Eu
ci Eu ções EU ( t)c / N c nesse CBG, embora não tenhamos esse fator de escalonamento ψ pode
k

( t) ( t)
responsável por k diferenças na proporção de indivíduos infecciosos que visitam POIs. Isto dá
Onde λ p é a taxa de infecção no POI p j no tempo t; W eu j , a eu j- a entrada da matriz de
Ç

visita da rede de mobilidade (Métodos M2), é o


TA

número de visitantes doCBG c Eu toPOI p j no tempo t; λ ( t) é a base de m


c Eu
( t) ck W kj( t).
infecção que é independente da visita aos POIs; δ E é o período de latência temático; e δ é um Eu p: = ∑ EU ( t) (10)
j
k=1Nck
período infecciosoEutemático.
EN

Em seguida, atualizamos cada estado para refletir essas transições. Deixei


Δ S ( t): = S ( t +c1)Eu- S ( t) c Eu c, e da mesma forma paraΔ E ( t), Δ EU
c Eu ( t), andΔ
c Eu R ( t) c.EuEntão, Taxa básica de novas exposições não capturadas por POIs visitantes. Inaddi
Eu
ES

ção para as novas exposições de infecções em POIs, modelamos uma taxa básica
Δ Sc ( t): = - N ( t) S c → E ci
Eu (4) específica de CBG de novas exposições que é independente da atividade de visitação de
Eu

POI.
R

Δ E c( t): = N ( t)S c → E ci - N ( Et)→ Eu


Eu ci (5)
ci
AP

Eu

c Euprobabilidade de hasabase λ ( t) c de se tornar infectado e em transição para


( t)
Δ EU
c Eu
( t): = N ( Et) → Eu - N Eu → R ci (6) o estado exposto, onde Eu
ci ci ci

Eu ( t)
c Eu

Δ R c:( t)= N ( t) (7) λ c:( t)= β (11)


Eu
Eu
ci → R.ci Eu base ⋅ N c Eu
é o produto da taxa de transmissão básica β base e a proporção Taxas específicas de POI de infecção, o modelo de agregação de mobilidade apenas captura uma única
de indivíduos infecciosos em CBG c Eu. β base é uma constância (compartilhada entre todos os CBGs) que probabilidade de que uma pessoa suscetível de muitos CBG se tornará infectada devido à visita a
cabemos todata. qualquer POI no momento t; fazemos essa simplificação porque um modelo de mobilidade de agregação
não mais tem acesso à quebra
Número total de novas exposições. Colocando tudo junto
para baixo de visitas entre CBGs e POI. Esta probabilidade λ ( t) POI é definido como
produz a expressão para a distribuição de novas exposições emCBG c Eu
no tempo t, m= 1∑ n W(
∑ Eu j = 1t) eu j Eu ( t)
λ (POI
t)
= ψ ⋅ ⋅ , (19)
nm N
• S ( t) n •
mobilidade média no tempo t
N (St)→ E ci ~ Pois • c Eu λ ( t) (t) + Binom (( t), (t) p WSeucλj •
ci
• N c∑j = 1 j
• Eu c)Eu

• Eu
• Onde m é o número de CBGs, n é o número de POIs, EU( t) é o número total de indivíduos
• S ( t) n d 2 • m EU ( t) • • infecciosos ao longo do tempo t, e N é o tamanho populacional total da área metropolitana. Para
pj • c k W( t) • W( t) •
= Pois • ψ ⋅ c Eu ⋅ ∑ uma • ∑ kj • eu j • a base de infecções em CBGs, supomos
• N pj•k=1 Nck

c Eu j=1
• • (12) o mesmo processo do nosso modelo de rede: a probabilidade λ ( t) c que um
novas infecções de POIs visitantes pessoa suscetível em CBG c Eu ficará infectado no seu CBG Eu no tempo
• Eu ( t) •
t é igual a β base vezes a fração infecciosa atual de c Eu ( Equação 11). Juntando tudo, o modelo
c Eu •.
+ Binom • S ( t) βc, base ⋅ de mobilidade agregada define o número
• Eu N c•Eu •
• de novas exposições emCBG c Eu no tempo t Como

taxa básica de novas infecções por CBG

( t) ( t) ( t
N (S t)→ ci Binom ( S, λ) + B inom ( S t)c, λ () c) .

O
E~ POI
ci c Eu
Eu Eu
(20)
M3.2 Número de novos casos infecciosos e removidos. Wemodel novas infecções de POIs visitantes taxa básica de novas infecções por CBG

G
expor os indivíduos como se tornando infecciosa catarata inversamente proporcional
Todas as outras dinâmicas permanecem a mesma entre o modelo de mobilidade
tional para o período de latência média δ E. Ateachtimestep t, presumimos que cada indivíduo exposto

TI
agregada e nosso modelo de rede, e nós calibramos os modelos da mesma maneira, que
tem uma probabilidade constante e independente do tempo
descreveremos nos métodos M4. Constatamos que nosso modelo de rede superou
de se tornar infeccioso, com

AR
substancialmente o modelo de mobilidade agregada em predição de casos fora da
N (Et)→ Eu ~ Binom ( E ( t) (13) amostra 58: em média, em áreas metropolitanas de 58 -fitaggregatemobilitymodel
ci ci c,Eu1 / δ E).
(ExtendedDataFigure1). Isso demonstra que não é apenas padrões gerais de mobilidade,
Da mesma forma, modelamos indivíduos infecciosos em transição para o estado removido a mas especificamente a mobilidade rede isso permite que nosso modelo se ajuste com
uma taxa inversamente proporcional ao tema infeccioso
E
precisão aos casos observados.
D
período δ EU, com
A
N (Eut)→ R ~ Binom ( EU ( t) c,Eu1 / δ EU), (14) Comparação com a linha de base que não usa dados de mobilidade. Para determinar
ci ci
AD

a extensão para obter dados de mobilidade elevada na modelagem da caixa de trajetória, também
Nós estimamos δ E = 96 horas 20,58 e δ I = 84 horas 20 da literatura anterior. comparamos nosso modelo com um modelo de linha de base SEIR que não usa dados de mobilidade e
simplesmente supõe que todos os indivíduos dentro de um metro são amix uniformemente. Nesta linha
Inicialização do modelo M3.3. Experimentos experimentais, t = 0é a primeira hora de 1º de março
ER

de base sem mobilidade, o risco de um indivíduo de ser infectado e de fazer a transição para o tempo
de 2020. Aproximamo-nos do infeccioso Eu e removido R compartimentos em t = 0 como
exposto t é
inicialmente vazio, com todos os indivíduos infectados no exposto E compartimento.
Wefurtherassumethesameesperadoinicial
EL

Eu ( t)
prevalência p 0 ineveryCBG c Eu. Em t = 0, cada indivíduo na área metropolitana λ ( t): = β base ⋅ , (21)
N
tem a mesma probabilidade independente p 0 de ser exposto E em vez de suscetível S. Assim,
AC

inicializamos o modelo de estado por configuração Onde EU( t) é o número total de indivíduos infecciosos no momento t, e
N é o tamanho total da população da área metropolitana. Como acima, as outras dinâmicas do
S c( =0) N c - E ( 0) c Eu
(15) modelo são idênticas, e a calibração do modelo foi realizada
Eu Eu

uma pesquisa de grade semelhante β base e p 0 Como esperado, descobrimos que ambos os modelos de
ÃO

mobilidade e de agregação de rede superaram os de mobilidade


E c( ~0) Binom ( N p c,Eu0) (16)
model onout-of-sample casepredictions (ExtendedDataFigura 1).
Eu
Ç

EU
c =( 0
0) (17) Calibração e validação do modelo M4
Eu
TA

A maioria dos nossos parâmetros do modelo podem ser estimados a partir dos
dadosSafeGraph eUSCensus, ou obtidos a partir do trabalho anterior (consulteTabela de
R c( =0) 0 (18)
Eu
dados estendida2 para um resumo).
EN

M3.4 Modelos de aggregatemobilidade e sem mobilidade de base


Comparação com o modelo de mobilidade agregada. Nossos modelos adaptados 1. A transmissão constante em POIs, ψ ( Equação (9))
ES

mobilitynetworktosimulatediseasespread.Totestifthisdetailedmodel isnecessary, ou 2. Taxa de transmissão de base, β base ( Equação (11))


ifourmodel issimplymakinguseofaggregatemobilitypatterns, nós 3. A proporção inicial de indivíduos expostos ao longo do tempo t = 0, p 0 ( Equação (16)).
testedanalternateSEIRmodel que usos theaggregate numberofvisitsmadetoanyPOI
R

inthemetroarea ineachhour, butnot modelo Nesta seção, descrevemos como esses parâmetros podem ser usados para o número publicado de casos
AP

thebreakdownofvisitsbetweenspecificCBGstospecificPOIs.Likeour, confirmados, conforme relatado por O jornal New York Times. Montamos modelos para cadametroárea

theaggregatemobilitymodelalsocapturesnewcasesfromvisitingPOIsandabaserateof separadamente.

infectionthatisindependentofPOIvisitactivity, assim,
thetwomodelshavethesamethreefreeparameters ( ψ, escala M4.1 Seleção de intervalos de parâmetros

taxas de transmissão em POIs; β base, taxa de transmissão da base; e p 0, a fração inicial de Fatores de taxa de transmissão ψ e β base. Selecionamos intervalos de parâmetros
indivíduos infectados). No entanto, em vez de ter para os fatores de taxa de transmissão ψ e β base verificando se o modelo
Artigo
as saídas correspondem às faixas plausíveis do número de reprodução básico R 0 casos, assumimos que um r c = 0,1 20,58,64-66 proporção de infecções vai
pré-bloqueio, desde R 0 tem sido o estudo de trabalhos anteriores substanciais sobre ser confirmados e, além disso, serão confirmados exatamente δ c = 168 horas (7 dias) 20,66 depois
SARS-CoV-2 59. Sob nosso modelo, nós e compor R 0 = R base + R POI, de se tornar infeccioso. A partir dessas suposições,
Onde R POI descreve a transmissão devido a POIs e R base descreve a transmissão restante (como podemos calcular o número previsto de casos recentemente confirmados em todos os CBGs na
na Equação (12)). Nós primeiroestabelecemos plausível área retroauricular d,
intervalos para R base e R POI antes de traduzir esses intervalos intoplausíveis para β base e ψ.
m 24 d - δc

N casos
( dia d) = r c ⋅ ∑ ∑ N (E τ)c → EU , (24)
Nós assumimos que R base varia de 0,1–2. R base modela a transmissão que não está i = 1 τ = 24 ( d −1) + 1− δc
Eu
ci

correlacionada com a atividade em POIs no SafeGraphdataset,


incluindo transmissão interna e transmissão em categorias de POI que não são bem Onde m indica o número total de CBGs na área metropolitana e para

capturadas no conjunto de dados SafeGraph. Escolhemos o limite inferior de 0,1 porque conveniência nós definimos N ( τ) E Eu
Eu. ci

está além desse ponto, a transmissão de base só contribuiria minimamente para o geral R, na hora τ, tobe0when τ < 1 c →, o número de pessoas recentemente infecciosas

Considerando que o trabalho anterior sugere que a transmissão dentro de casa é um DeNYTdata, temos o número relatado de casos novos N̂ ( dia d) casos

contribuinte substancial para a transmissão geral 60–62. Householdtransmissionalone para cada dia d, somados em cada país na área metropolitana. Comparamos o número de
casos relatados e o número de casos que nosso modelo prevê, calculando o erro médio
não é estimado ser suficiente para derrubar em geral R 0 acima de 1; por exemplo, um único quadrático (RMSE) entre cada um dos D = ☐ T / 24 ☐ dias de nossas simulações,
indivíduo infectado foi estimado para causar uma média de
0,32 (0,22, 0,42) secundário dentro de infecções domiciliares 60 Contudo,
Porque R base também pode capturar a transmissão em POIs não capturados no 1D
RMSE = ( N casos
( dia d)- N̂ ( dia d)casos) 2. (25)
SafeGraphdataset, para ser conservador, escolhemos um limite superior D ∑d = 1

O
do R base = 2; como descrevemos abaixo, os modelos de melhor ajuste para todas as áreas de barbear de

G
10 metros R base < 2, e 9 de 10 têm R base < 1.Weallow R POI Torange Para cada combinação de parâmetros do modelo e para cada área metropolitana,
de 1-3, que corresponde a permitir R 0 = R POI + R base torange de quantificamos o ajuste do modelo com o banco de dados NYT, executando 30 para

TI
1,1-5. Esta é uma faixa conservadoramente ampla, uma vez que a estimativa anterior de trabalho realizações cásticas e calculando a média de seu RMSE. 67
pré-bloqueio R 0 de 2–3 59.

AR
Para determinar os valores de R base e R POI aquele determinado par de β base e
ψ implicar, semeamos uma fração de casos de índice e, em seguida, executamos o modelo Nossa simulação vai de 1 de março a 2 de maio de 2020, e usamos dados de mobilidade desse

em dados de mobilidade em loop da primeira semana de março para capturar período. No entanto, porque presumimos que os casos serão

E
condições de pré-bloqueio. Inicializamos o modelo configurando p 0, a proporção inicial de confirmado δ c = 7 dias após os indivíduos se tornarem infecciosos, prevemos o número de casos com um

indivíduos expostos no momento t = 0, para p 0 = 10 -4, e deslocamento de 7 dias, de março de 8 a 9 de maio de 2020.
D
então a amostragem de acordo com a Equação (16). Deixei N 0 bethenumber de indivíduos
inicialmente expostos amostrados. Calculamos o número de M4.3 Seleção de parâmetros e quantificação de incerteza. Através-
A

indivíduos que estes N 0 casos de índice passaram a infectar através da transmissão de neste artigo, foram relatadas as predições agregadas de diferentes parâmetros
AD

base, N base, e transmissão POI, N POI, que dá etersetsof ψ, β base, e p 0 e múltiplas realizações estocásticas. Para cada área metropolitana, nós:

N POI 1. Encontre o conjunto de parâmetros de melhor ajuste, ou seja, com o menor RMSE médio
R POI = (22)
ER

N0 casos de incidentes diários sobre realizações estocásticas.


2. Selecione todos os conjuntos de parâmetros que alcançam um RMSE (média sobre

N realizações estocásticas) dentro de 20% do RMSE do conjunto de parâmetros de melhor ajuste.


EL

R base = base. (23)


N0
3. Reúna todas as previsões nesses conjuntos de parâmetros e todos
AC

Calculamos a média dessas quantidades sobre as realizações estocásticas para cada de suas realizações estocásticas e reportar sua média e 2,5º / 97,5º percentis.
área de metrô. A Figura S6 mostra que, como esperado, R base é linear em β base
e R POI é linear em ψ. R base encontra-se na faixa plausível quando β base gamas Em média, cadametroárea tem 9,7 conjuntos de parâmetros que atingem um RMSE dentro de 20% do
de 0,0012-0,024, e R POI encontra-se na faixa plausível (por pelo menos uma área conjunto de parâmetros de melhor ajuste (Tabela S6). Para cada conjunto de parâmetros, temos resultados
ÃO

metropolitana) quando ψ varia de 515-4,886, enquanto o parâmetro para 30 realizações estocásticas.


intervalos que consideramos ao ajustar o modelo. Conforme descrito nos Métodos M4.2, verificamos que; os dados de ThisprocedurecorrespondstorejectionsamplinginanAproximate BayesianComputationframework 15,
contagem de casos para todas as áreas metropolitanas podem ser úteis em que pressupomos um modelo de erro que é Gaussiano com variação constante; escolhemos
Ç

configurações de parâmetros para β base e ψ dentro dessas faixas. um limite de aceitação com base no que o modelo mais adequado atinge; e usamos uma grade de
TA

parâmetros uniforme em vez da amostragem de um uniforme anterior. Itquantifica a incerteza de


Prevalência inicial de exposições, p 0 A extensão para o qual SARS-CoV-2 duas fontes. Primeiro, asaealizações múltiplas capturam a variabilidade estocástica entre as
infecção espalhou-se nos EUA pelo início da simulação (março 1, execuções do modelo com os mesmos parâmetros. Em segundo lugar, a simulação com todos os
EN

2020) atualmente não está claro 63 Para responder por esta incerteza, nós conjuntos de parâmetros que estão dentro de 20% do RMSE do melhor ajuste captura a incerteza
p 0 para variar em um grande intervalo entre 10 -5 e 10 -2. Conforme descrito em Métodos M4.2, verificamos que nos parâmetros do modelo ψ,
os dados de contagem de todas as áreas metropolitanas podem
ES

estar em forma usando configurações de parâmetros para p 0 dentro desta faixa. β base, e p 0 O último é equivalente a assumir que a probabilidade posterior sobre os
parâmetros verdadeiros é uniformemente distribuída entre todos
M4.2 Adequado ao número de casos confirmados. Usando o parâmetro parâmetro definido dentro do limite de 20%.
R

intervalos acima, pesquisamos sobre ψ, β base, e p 0 para encontrar os modelos que melhor se adaptam
AP

ao número de casos confirmados relatados por TheNewYork Validação de modelo M4.4 em casos fora da amostra. Nós validamos nosso

Vezes ( NYT) 32 Para cada área metropolitana, úmido e testado 1.500 diferentes combinações modelos, mostrando que eles preveem o número de casos confirmados em dados fora da amostra

ções de ψ, β base, e p 0 nos parâmetros especificados acima, com pa- quando temos acesso aos dados de mobilidade correspondentes. Para cada área metropolitana,

râmetros linearmente espaçados para ψ e β base e distribuído logaritmicamente para p 0 dividimos o conjunto de dados disponívelNYT em um conjunto de treinamento (abrangendo março de

Nos métodos M3, modelamos diretamente o número de infecções, mas não 8, 2020 a 14 de abril de 2020) e um conjunto de teste (abrangendo 15 de abril de 2020 a 9 de maio de

o número de casos confirmados. Para estimar o número de casos confirmados 2020).


ψ, β base, e p 0, conforme descrito nos métodos M4.2, mas apenas usando o conjunto de treinamento. Em
seguida, avaliamos a precisão preditiva do modelo resultante Distribuição de infecções previstas em POIs (Figuras 2b, Extend-
No conjunto de teste. Ao executar nossos modelos no conjunto de teste, ainda usamos dados de edData2, S10). Usamos nossos modelos nos dados de mobilidade observados de 1 de março a 2 de
mobilidade do período de teste. Portanto, esta é uma avaliação de se os modelos podem prever maio de 2020 e registramos o número de infecções previstas que ocorrem em cada POI.
com precisão o número de casos, dados dados de mobilidade, em um período de tempo que Especificamente, para cada hora t, nós calculamos o
não foi usado para calibração do modelo. A Figura 1 de Dados estendida mostra que nosso número de infecções esperadas que ocorrem em cada POI p j tomando o
modelo de rede se ajusta bem aos dados de caso fora da amostra e que nosso modelo supera número de pessoas suscetíveis que visitam p j naquela hora multiplicado por
substancialmente os modelos alternativos que usam dados de mobilidade agregados (sem uma a taxa de infecção POI λ ( t) p ( Equação (9)). InFigures2bandS10, wesort
rede) ou não usam dados de mobilidade em geral (Métodos M3.4). Todos os outros resultados os POIs por seu pr total j número editado de infecções (somadas horas) e traçar a
são gerados usando conjuntos de parâmetros que melhor se ajustam ao inteira conjunto de distribuição cumulativa de infecções sobre essa ordem de POIs. Na Figura 2 de dados
dados, conforme descrito acima. estendidos, selecionamos as categorias de POI que contribuem com as infecções mais
limitadas e traçamos a proporção diária de infecções de POI que cada categoria
contabilizou (somadas em POI dentro da categoria) ao longo do tempo.

Detalhes da análise M5

Nesta seção, incluímos detalhes adicionais sobre os experimentos subjacentes às figuras Reduzindo a mobilidade limitando a ocupação máxima (Figuras 2c,
no jornal. Omitimos explicações para as figuras que estão completamente descritas no ExtendedData3). Implementamos duas estratégias de reabertura parcial: uma que reduzia
texto principal. uniformemente as visitas nos POIs a uma fração da atividade total e a outra que “limitava” cada
visita por hora do POI à fração da ocupação máxima do POI. Para cada estratégia de
Contrafatuais de redução da mobilidade (Figura 2a, Tabelas S4-S5). reabertura, iniciamos a simulação em 1 ° de março de 2020 e a executamos até 31 de maio de

O
Para simular o que aconteceria se alterássemos a magnitude ou o tempo de redução da 2020, usando a rede de mobilidade observada de março de 1 a 30 de abril de 2020 e, em

G
mobilidade, modificamos as redes de mobilidade real de 1 de março a 2 de maio de 2020 seguida, usando a rede hipotética de mobilidade pós-reabertura de maio a 31,
e executamos nossos modelos nos dados hipotéticos. Na Figura 2a, relatamos o número

TI
total de pessoas por 100 mil habitantes infectados (ou seja, nos estados exposto, 2020, correspondendo ao impacto projetado dessa estratégia de reabertura. Porque nós
infeccioso e removido) no final da simulação. sempre observamos dados de mobilidade de 1 de março a maio

AR
2, 2020, imputamos os dados de mobilidade ausentes até 31 de maio de 2020 por meio de looping os
Para estimular uma magnitude menor de redução da mobilidade, interpolamos entre a rede dados de mobilidade da primeira semana de março, como na análise acima sobre o efeito das
de mobilidade da primeira semana de simulação (1 a 7 de março de 2020), que usamos para reduções anteriores na mobilidade. Deixei T representam a última hora para a qual observamos dados
representar os níveis de mobilidade típicos, e a rede de mobilidade observada real para cada

E
de mobilidade (2 de maio de 2020, 23h). Para simplificar a nota, wedefine
semana. Deixei W( t) representar a matriz de visita observada na t- a hora da simulação, e deixe
D
f (t) = t mod 168map t à sua hora correspondente na primeira semana de simulação, uma vez
A
•t E se t <T,
que há 168 horas em uma semana. Para representar o cenário onde as pessoas se h (t): = • (28)
f (t) de outra forma,
AD


comprometeram com α ∈ [ 0, 1] vezes o real
redução observada na mobilidade, construímos uma matriz W ̃ ( t) onde, como acima, f (t) = t mod 168. Esta função deixa t inalterado se houver dados de
α isso é
a α- combinação convexa de W( t) e W f (t), mobilidade observados no momento t, andotherwisemaps t à hora correspondente na primeira
ER

semana de nossa simulação.


W (α:t)= αW ( t) + ( 1 - α) W f (t). (26) Para simular uma estratégia de reabertura que reduzisse uniformemente as visitas a um γ- fração
de seu nível original, onde γ ∈ [ 0, 1], construímos a matriz do visitante
EL

E se α é 1, então W̃ (αt)= W ( t), e usamos a rede de mobilidade real observada para a


simulação. Por outro lado, se α = 0, então W ̃ ( t) = W f (t), α
AC

h (t)
e presumimos que as pessoas não reduziram seus níveis de mobilidade em todos • W E se t <τ,
W ̃ γ:( =t) •• (29)
repetindo a matriz de visita durante a primeira semana de março durante a simulação. •
• γW h (t) de outra forma,
Qualquer outro α ∈ [ 0, 1] interpola entre esses dois extremos.
Onde τ representa a primeira hora da reabertura (1º de maio de 2020, 12h). Em outras palavras,
ÃO

Para estimular a mudança no tempo de redução da mobilidade, mudamos a rede de mobilidade d usamos a rede de mobilidade observada atual até a hora
∈ [ -7, 7] dias. Deixei T representam a última hora em nossa simulação (2 de maio de 2020, 23h), τ, e, posteriormente, simulado γ- fração dos níveis de mobilidade total.
vamos f (t) = t mod 168map t à sua hora correspondente na primeira semana de simulação como Para simular a estratégia de ocupação reduzida, primeiro estimamos o
Ç

acima, e da mesma forma deixe g (t) mapa t à hora correspondente na última semana de simulação ocupação máxima M pj de cada POI p j como o número máximo de visitas que já teve em uma hora,
TA

(27 de abril a 2 de maio de 2020). Construímos a visita com deslocamento temporal durante todo o período de 1º de março a 2 de maio de 2020.
Como nas seções anteriores, vamos W( t)
eu j representar o eu j- então, no observado

visitmatriz W , ou seja, o número de pessoas da CBG c Eu quem visitou p j


( t)
matriz W( t)
EN

d
em uma hora t, e deixar V ( t) pj representam o número total de visitantes para p j naquilo
• W ( t -24 d) se 0≤ t - 24 d ≤ T, hora, ou seja, ∑ W(Eut) eu j . Simulamos capping em um β- fração do máximo
W (dt) •: = • W f (t -24 d) E se t - 24 d < 0, (27) ocupação, onde β ∈ [ 0, 1], através da construção da matriz de visita W( t)
ES

β de quem
• eu j- thentry é
• W g (t -24 d) de outra forma.

• W h (t)
R

eu j
E se t <τ ou V ( t) p j≤ βM p,
E se d é positivo, isso corresponde a iniciar a redução da mobilidade d • j

( t)•
W • βM p j W h (t) de outra forma.
AP

ijβ: = (30)
dias depois; se imaginarmos o tempo em uma linha horizontal, isso muda a série temporal para a
• eu j
direita 24 d horas. No entanto, fazer isso deixa o primeiro 24 d • V (pt)j

horassem dados de visita, então preenchê-lo reutilizando dados de visita da primeira semana de
simulação. Da mesma forma, se d é negativo, isso corresponde a iniciar a redução da mobilidade d dias Isso corresponde ao seguinte procedimento: para cada POI p j e tempo
antes, e preenchemos os últimos 24 d t, primeiro verificamos se t <τ ( a reabertura não começou) ou se V ( t) p≤ βM p ( a hum
j

horas com dados de visita da última semana de simulação. número total de visitas a p no tempo tj está abaixo do permitido j máxima
Artigo
βM).pjSe sim, nós deixamos W categoria, acumulada durante todo o período de dados (1 de março a 2 de maio,
h (t) inalterado. Caso contrário, calculamos o fator de escala βM pj isso
eu j

2020) e depois dividido pela população total do grupo.


reduziria o total de visitas para p no tempo t até j
V (pjt)

o máximo permitido βM pj, e, em seguida, reduza todas as visitas de cada Taxa média de transmissão prevista da categoria aPOI (Figura 3e,
CBG c Eu para p j proporcionalmente. Para ambas as estratégias de reabertura, calculamos o Tabelas de dados estendidos 3–4). Calculamos a taxa de transmissão horária média prevista
aumento previsto na incidência cumulativa no final da experimentada por um grupo de CBGs você em uma categoria de POI V Como
período de abertura (31 de maio de 2020), em comparação com o início do período de abertura (1 de maio de

2020).
T ( t) (t)
∑ c Eu ∈ você ∑ p ∈j V ∑ t = 1 W eu j β p j

β UV: = , (32)
Risco relativo de reabertura de categorias diferentes de POIs (Figuras 2d, T ( t)
∑ c Eu ∈ você ∑pj∈V ∑W
t = eu
1
j
ExtendedData5, S11, S15 – S24). Devemos reabrir separadamente as 20 categorias de POI
com a maioria das visitas nos dados do SafeGraph. Nesta análise, seguimos o trabalho anterior 28 onde, como acima, β ( t) é a taxa de transmissão no POI p j em uma hora t ( Equação (8)), W( t) é o
pj
e não estudar quatro categorias: “ChildDay Care Services” e “Elementary and Secondary número de visitantes doCBG c no POI p em uma hora t,
eu j Eu j
Schools” (porque as crianças com menos de 13 anos não são bem monitoradas e T é a última hora em nossa simulação. Isso representa a taxa de transmissão esperada
peloSafeGraph); “DrinkingPlaces (AlcoholicBeverages)” (porque oSafeGraphs parece ter encontrada durante uma visita por alguém de um grupo CBG você toaPOI na categoria V.
contado esses locais 28) e “NatureParksandOtherSimilar Institutions” (porque os limites e,
portanto, as áreas não são bem definidos pelo SafeGraph). Também excluímos "Hospitais
médicos e cirúrgicos gerais" e "Outras operações aeroportuárias" (porque os hospitais e as Relatório de resumo
viagens aéreas envolvem muitos fatores de risco adicionais ou nosso modelo não é projetado Mais informações sobre o desenho da pesquisa estão disponíveis no Nature

O
para captura). Não filtramos esses POIs durante a adaptação do modelo (ou seja, presumimos ResearchReportingSummary vinculado a este artigo.
que as pessoas visitam esses POIs e que ocorrem transmissões lá ) porque incluí-los ainda

G
aumenta a proporção da mobilidade geral que nosso conjunto de dados captura; simplesmente
não analisamos essas categorias, porque desejamos ser conservadores e apenas nos Disponibilidade de dados

TI
concentrar nas categorias em que estamos mais confiantes de que capturaremos a transmissão Rede de mobilidade horária inferida, bem como os modelos estimados estão disponíveis
fielmente.

AR
no site do projetohttp: //covid-mobility.stanford.edu.Raw censusdata
(https://www.census.gov/programs-surveys/acs), casos e contagens de óbitos de O jornal
New York Times ( https://github.com/nytimes/ covid-19-data) e os dados da Googlemobility
Esta análise de reabertura é semelhante aos experimentos anteriores sobre redução de ocupação (https://www.google.com/ covid19 / Mobility /) estão disponíveis publicamente. (https:
máxima vs. reabertura uniforme. Como acima, definimos o tempo de reabertura τ a 1º de maio de 2020,

E
//www.safegraph. com / covid-19-data-consortium).
12h. Para estimular a reabertura de uma categoria POI, tomamos o conjunto de POIs nessa categoria, V, e
D
definir seus níveis de atividade após a reabertura para a primeira semana de março. Para POIs que não
A
estão na categoria V, mantemos seus níveis de atividade após a reabertura do mesmo, ou seja,
simplesmente repetimos os níveis de atividade da última semana de nosso
AD

Disponibilidade de código
dados (27 de abril a 2 de maio de 2020): Isso dá para a matriz da visita W( t) Entradas
O código está disponível publicamente no site do projetohttp: // covid-mobilidade. stanford.edu.
ER

• W( t) E se t <τ,
eu j

W(ij: t)= •• W f (t) Eeu jse t ≥ τ, p j ∈ V (31) 39 SafeGraph. Esquema de lugares (2020). Disponível em https://docs.safegraph.com/docs/ places-schema.
EL


• W geu(t)j E se t ≥ τ, p ∉ V. 40 SafeGraph. Padrões semanais (2020). Disponível em https://docs.safegraph.com/docs/ Weekly-patterns.
• j
AC

41 SafeGraph. Usando polígonos do SafeGraph para estimar a metragem quadrada de um ponto de interesse (2019).
Como na análise de reabertura acima, f (t) mapas t à hora correspondente na primeira Disponível em https://www.safegraph.com/blog/

semana de março, e g (t) mapas t à hora correspondente na última semana de nossos using-safegraph-polygons-to-estima-point-of-interest-square-metragem.
42 SafeGraph. Guia para dados de pontos de interesse: Perguntas frequentes sobre dados de POI (2020). Disponível em https: //
dados. Para cada categoria, calculamos a diferença prevista entre (1) a fração cumulativa
www.safegraph.com/points-of-interest-poi-data-guide.
ÃO

de pessoas que foram infectadas até o final do período de reabertura (31 de maio, 43 SafeGraph. Social DistancingMetrics (2020). Disponível em https://docs.safegraph.com/ docs /
social-distancing-metrics.
44 Athey, S. & et al. Estimar as preferências heterogêneas dos consumidores por restaurantes e tempo de viagem usando dados
2020) e (2) a fração cumulativa de pessoas infectadas até 31 de maio se não reabrimos a
de localização móvel. No Artigos e procedimentos da AEA 108, 64–67 (2018).
Ç

categoria de POI (ou seja, se simplesmente repetimos os níveis de atividade da última


semana de nossos dados). Este visa modelar o aumento da incidência acumulativa ao final de 45 Chen, MK & Rohla, R. O efeito do partidarismo e da propaganda política em laços familiares próximos. Ciência 360, 1020–1024
TA

(2018).
maio a partir da reabertura da categoria POI. Na Figura 5 e nas Figuras de Dados Estendidos
46 Farboodi, M., Jarosch, G. & Shimer, R. Efeitos internos e externos de distanciamento social em uma pandemia (2020).
S15-S24, o painel inferior direito mostra o aumento previsto para a categoria como um todo, e Disponível em https://nber.org/papers/w27059.
EN

o painel inferior esquerdo mostra o aumento previsto perPOI ( ou seja, o total aumentado 47 Killeen, BD & et al. AConjunto de dados de nível nacional para informar a resposta dos Estados Unidos ao COVID-19 (2020).
Disponível em https://arxiv.org/abs/2004.00756.
dividido pelo número de POIs na categoria). 48 Allcott, H. & et al. Polarização e saúde pública: diferenças partidárias no distanciamento social durante a pandemia de
Coronavirus (2020). Disponível em nber.org/papers/w26946. Google. Relatórios COVID-19CommunityMobility (2020).
ES

49. Disponível em https://google.com/ covid19 / mobilidade /.

Per-capitamobilidade (Figuras 3d, Dados estendidos 6, S3). Cada grupo 50 Athey, S. & et al. Segregação experiente (2019). Disponível em https://gsb.stanford.edu/ faculty-research /
de CBGs (por exemplo, o decil de renda inferior) compreende um conjunto você de CBGs que se working-papers / expertise-segregation.
R

51 Squire, RF E quanto ao viés no conjunto de dados SafeGraph? (2019). Disponível em https: //


enquadram nos critérios correspondentes. Na Figura 3d e ExtendedData Figura 6, mostramos as
safegraph.com/blog/what-about-bias-in-the-safegraph-dataset.
per-capitamobilidades diárias de diferentes pares de grupos (interrompido por incômodo e
AP

52 USCensus. Pesquisa da AmericanCommunity. Disponível em https://census.gov/ programs-Survey /


círculo). Medir a mobilidade per capita de um grupo por dia d, pegamos o número total de visitas acs.
53 Bishop, YM, Fienberg, SE & Holland, PW Discretemultivariate analysis (1975).
feitas
54 Birkin, M. & Clarke, M. SYNTHESIS - um sistema de informação espacial sintético para análise urbana e regional:
24 d + 23 (
desses CBGs para qualquer POI, ∑ c∈ você ∑ p ∈j P ∑ t = 24 d W t) eu j , e dividir por métodos e exemplos. Meio ambiente e planejamento A 20, 1645–1671 (1988).
Eu

a população total dos CBGs no grupo, ∑ c Eu ∈ você N. Na Figura S3, mostramos


c
o número total Eu 55. Wong, DW A confiabilidade do uso do procedimento de ajuste proporcional iterativo. O Geógrafo
de visitas feitas por cada grupo a cada POI Profissional 44, 340-348 (1992).

Você também pode gostar