Você está na página 1de 6

Machine Translated by Google

Comentário

Diálogos em Geografia Humana


3(3) 274–279
Big data, cidades inteligentes e ª O(s) Autor(es) 2013
Reimpressões e
permissão: sagepub.co.uk/
planejamento urbano journalsPermissions.nav DOI:
10.1177/2043820613513390 dhg.sagepub.com

Michael Batty
Faculdade Universitária de Londres, Reino Unido

Resumo
Defino big data em relação ao seu tamanho, mas presto especial atenção ao facto de que os dados a que me refiro são dados
urbanos, ou seja, dados de cidades que estão invariavelmente etiquetados no espaço e no tempo. Argumento que este tipo de dados
está a ser transmitido em grande parte a partir de sensores, e isto representa uma mudança radical nos tipos de dados que temos
sobre o que acontece onde e quando nas cidades. Descrevo como o crescimento do big data está a mudar a ênfase do planeamento
estratégico de longo prazo para o pensamento de curto prazo sobre como as cidades funcionam e podem ser geridas, embora com
a possibilidade de que, durante períodos de tempo muito mais longos, este tipo de big data se torne uma fonte de informações sobre
todos os horizontes temporais. Para concluir, ilustro a necessidade de uma nova teoria e análise com respeito a 6 meses de dados
de cartões de viagem inteligentes de viagens individuais nos sistemas de transporte público da Grande Londres.

Palavras-
chave big data, gestão de disrupções, nova teoria, streaming em tempo real, horizontes de tempo mais curtos, cidades inteligentes

Existem muitas definições de “big data”, mas uma das melhores dados para uma melhor compreensão do mundo que nos rodeia.
que ouvi, e não sei a quem atribuí-la, é “quaisquer dados que É sempre arriscado argumentar que “desta vez é diferente”,
não cabem numa folha de cálculo Excel”. Isto dá imediatamente mas a nossa obsessão actual com grandes volumes de dados é
uma ideia do tamanho, pois tais planilhas agora têm uma motivada não apenas por questões de dimensão, mas pelas
dimensão de cerca de um milhão de linhas e um número muito formas reais como cada vez mais dados estão a ser recolhidos.
menor de colunas; esta definição também sugere que big data Muito, se não a maior parte, do que hoje chamamos de big
deve ser definido em relação às ferramentas padrão que data é produzido automaticamente, rotineiramente e por diversas
permitem seu processamento para alguma finalidade (Reades, formas de sensores. Este tem sido o caso desde que as primeiras
2013). Isto implica que big data não é um conceito novo, mas tecnologias industriais foram desenvolvidas utilizando a
existe em todas as épocas em que as ferramentas para monitorização contínua de tarefas e atividades rotineiras em
processamento de dados estão sempre a ser ampliadas pelo formato analógico e, em seguida, as tecnologias elétricas deram
aumento do tamanho. Existem algumas histórias maravilhosas um impulso dramático a essa detecção através de
sobre como grandes conjuntos de dados impulsionaram o
desenvolvimento de novos hardware, software e métodos
matemáticos ao longo da história da computação, mas o foco
Autor correspondente: Michael
atual parece anunciar um tipo bastante diferente de resposta à
Batty, Centro de Análise Espacial Avançada, University College London,
maneira como poderíamos usar tais dados. Gower Street, Londres, WC1E 6BT, Reino Unido.
E-mail: m.batty@ucl.ac.uk
Machine Translated by Google

Maluco 275

diversas máquinas, incluindo telefones e computadores. Mas foi a interagiram com computadores e dados e software foram transferidos
miniaturização digital que realmente mudou o jogo, na medida em para o exterior, no sentido de que os computadores começaram a
que, pela primeira vez, vemos agora computadores a serem ser usados para acessar recursos em locais remotos.

incorporados em todos os tipos concebíveis de objectos, incluindo Isto tornou-se generalizado com a difusão da World Wide Web e,
nós próprios, e é isto que está a gerar quantidades de dados sem na última década, a noção de computação através da Web – onde
precedentes. Na verdade, o que realmente estimulou o surgimento os recursos podem ser acedidos interactivamente – passou a definir
do big data foi a recolha de dados relativos a atividades nas quais as principais formas de trabalhar com computadores. Nessa mistura
os seres humanos estão intimamente envolvidos. Com 7 mil surgiu a ideia de que um computador é simplesmente um dispositivo
milhões de pessoas no planeta, que acedem a cerca de 1,2 mil cujo poder de processamento permite ao usuário simplesmente
milhões de computadores pessoais, há agora (meados de 2013) interagir com dados, software e outros usuários onde a maior parte
mais do que este número de smartphones, cerca de 1,5 mil milhões, da computação, agora definida como armazenamento de dados e
crescendo cerca de 30% anualmente. A escala de dados gerados seu processamento, está localizada em algum lugar. onde está na
por esses dispositivos é assustadora. 'nuvem'.

Na verdade, as tecnologias de sensores tornaram-se onipresentes Nesta mistura entrou o big data, distorcendo a lógica um passo
com qualidades quase plug and play, permitindo assim que qualquer adiante, na medida em que pela primeira vez os computadores
pessoa monitore e colete dados de objetos com movimento que estão sendo usados em massa para detectar mudanças e coletar
podem ser detectados por esses dispositivos. No nosso domínio da dados, ao mesmo tempo em que são localizados remotamente e
cidade, por exemplo, os dados de viagens automatizados e rápidos transmitem seus dados para outros locais, todos os quais são
registam agora a procura e a oferta, o desempenho dos vários remoto dos usuários finais cuja tarefa é trabalhar com os dados.

dispositivos, os custos envolvidos, a utilização de combustível, Esta é, na verdade, uma perspectiva muito nova, na medida em
energia e assim por diante. Os dados que temos sobre o transporte que representa ao mesmo tempo um novo passo na miniaturização
público em Londres, onde cerca de 8 milhões de viagens por dia e na fragmentação da computação. Para dar uma ideia de quão
são feitas em metrô, trens pesados e ônibus, são retirados do recente tem sido esta mudança para o big data, podemos usar o
cartão inteligente que 85% de todos os passageiros usam. Isto big data para explorar “a ascensão do big data” através do Google
rende cerca de 45 milhões de viagens por semana, 180 milhões Trends, que nos permite explorar o motor de busca do Google
por mês, cerca de um bilhão a cada semestre e assim por diante. para gerar a popularidade de diferentes tendências (Choi e Varian,
O conjunto de dados será infinito até que a tecnologia seja alterada 2009). Os termos chave – computação em nuvem, Web 2.0 e big
e mesmo quando isso ocorrer, os dados gerados continuarão, pelo data – revelam que, nos últimos nove anos, foram os big data que
menos em princípio, a ser um fluxo contínuo. tiveram, de longe, o interesse de crescimento mais rápido. Estas
tendências são mostradas na Figura 1(a), onde fica bastante claro
Este é o tipo de dados que preocupam aqui. como a Web 2.0, a computação em nuvem e os big data geraram
No jargão contemporâneo da computação, os grandes volumes sucessivas ondas de interesse, sendo big data a palavra da moda
de dados estão ligados à noção geral de que a computação, desde atual. É tentador especular que esta onda, como as outras
a sua criação, há 60 anos, seguiu um caminho de descentralização mostradas na figura, irá passar e algo mais relacionado com a
em termos de hardware e software, e agora dos seus dados. À digitalização do mundo tomará o seu lugar.
medida que os computadores se tornaram cada vez menores, eles
se tornaram espacialmente onipresentes, localizados em qualquer
lugar e em todos os lugares, mas em paralelo. Isto tem sido Ao mesmo tempo, na Figura 1(b), mostro o interesse popular em
acompanhado por formas descentralizadas de comunicação onde big data na forma dos banners da empresa EMC2 que você
o hardware é capaz de interagir ao nível mais básico. Os encontra e que estão atualmente em exibição na estação ferroviária
computadores e as comunicações convergiram durante este do terminal 5 do aeroporto de Heathrow, em Londres. Isto deveria
processo de expansão global, e isto levou à decomposição das ser suficiente para convencer que o big data entrou no imaginário
muitas tarefas diferentes que definem a computação. Há vinte ou popular.
mais anos, a arquitetura cliente-servidor passou a definir como
Esta é uma demonstração particularmente interessante da
ascensão do big data, em grande parte porque estamos usando big data.
Machine Translated by Google

276 Diálogos em Geografia Humana 3(3)

Figura 1. (a) A ascensão da Web 2.0, da computação em nuvem e do big data de 2004 a 2013; (b) big data transforma negócios:
os anúncios da empresa EMC2 na estação ferroviária do terminal 5 do aeroporto de Heathrow.

dados para realmente rastrear o mesmo. O Google Trends sendo planejável, em certo sentido, ao longo de minutos, horas
permite utilizar todos os recursos do motor de busca Google e dias, em vez de anos, décadas ou gerações.
para avaliar a popularidade pós-2004 (ou não) de tais palavras- A ascensão do big data não está apenas associada às
chave, clichês, frases de efeito e assim por diante (Preis et al., tecnologias de detecção, pois existem muitos conjuntos de big
2012). O motor de busca processa agora dados suficientes para data gerados por respostas humanas; no entanto, uma parcela
poder produzir tendências bastante específicas no uso de cada vez maior de big data é produzida automática e
palavras numa escala (em termos de consultas) e numa rotineiramente a partir de sensores. Com o tempo, é provável
frequência (de acesso) que é simplesmente sem precedentes. O que os grandes volumes de dados se tornem inteiramente
mecanismo de busca Google processa cerca de 30 bilhões de associados aos dados detectados rotineiramente, especialmente
pesquisas por semana; portanto, a pesquisa pelo termo big data porque os conjuntos de dados tradicionais tendem a ser cada
ilustrada acima foi realizada em um conjunto verdadeiramente vez mais complementados pela detecção rotineira, bem como
de “big data”, onde os volumes de pesquisa estão disponíveis pelo crowdsourcing (onde os indivíduos introduzem os seus
por semana. próprios dados). Há, no entanto, uma coincidência entre o que
hoje se chama cidades inteligentes e big data, com a inteligência
nas cidades relacionada principalmente com as maneiras pelas
quais os sensores podem gerar novos fluxos de dados em tempo
A cidade inteligente e a teoria urbana
real com posicionamento geográfico preciso, e como os dados
A perspectiva aqui é manifestamente espacial e urbana, na podem ser gerados. as bases geradas posteriormente podem
medida em que os conjuntos de dados dizem respeito a grandes ser integradas para agregar valor. Esta última possibilidade é
cidades. Meu interesse neles é principalmente desenvolver uma uma esperança um tanto piedosa, pois, a menos que existam
nova compreensão de como as cidades funcionam, embora em chaves comuns, o que invariavelmente não existem, os conjuntos
horizontes temporais muito mais curtos do que tradicionalmente de dados são geralmente impossíveis de vincular. No entanto,
tem sido o foco da geografia urbana. Isto, no entanto, gera estes tipos de dados que até agora tratam do movimento e dos
imediatamente uma preocupação sobre como estes dados transportes, de alguns fluxos de energia e de serviços públicos,
podem ser usados para derivar teorias bastante novas sobre e que com o tempo podem muito bem estender-se a dados
como as cidades funcionam, na medida em que o foco está em espaciais do mercado financeiro – mercados imobiliários e dados
questões de prazo muito mais curto do que até agora, e muito de pontos de venda relativos a outros tipos de consumo – são o
mais no movimento e na mobilidade do que na localização de material de cidades inteligentes (Batty et al., 2012). É claro que
uso da terra e o funcionamento a longo prazo do sistema urbano. é frequentemente apontado que as cidades só se tornam
Isto é planeamento urbano sob uma nova roupagem – isto é, pensar inteligentes
nas cidades quando
é umaas
como
, e esta pessoas
condição são
sine inteligentes2
qua non do nosso argumento aqui.
Machine Translated by Google

Maluco 277

Cidades inteligentes também podem ser sinônimos de cidades cidades e seu funcionamento, a busca por tais correlações seria
inteligentes, cidades da informação, cidades virtuais, uma espécie de diversão, por
entre muitas outras nomenclaturas, mas aqui a nossa o que precisamos procurar em big data só poderá
o uso pertence estritamente aos dados e à teoria ser descoberto através das lentes da teoria.
que traz muito mais imediatismo ao nosso ambiente urbano A outra questão é que big data – dados transmitidos
entendimento. Na história dos estudos urbanos e tempo real na resolução de segundos – torna-se dados
planejamento, a maioria das teorias e aplicações têm isso se aplica a todos os tipos de horizonte de tempo, se for coletado
focado no longo prazo – no que acontece nas cidades medido ao por tempo suficiente. Poderemos ver o
longo de meses e anos, certamente não tipo de mudanças no big data que antes eram apenas
ao longo de minutos e horas. Na verdade, o transporte sempre amostrados ou coletados a cada 10 anos em completa
preocupado com os picos de fluxo diário, mas estes são censos populacionais. Portanto, não estamos no limiar de um
presume-se que pertença a um período muito mais longo e, portanto, momento em que a nossa capacidade de atenção é necessariamente
a maior parte da nossa teoria e planejamento tem sido focada tornando-se mais curto, mas num limiar em que a nossa capacidade
sobre o que acontece com as cidades ao longo dos horizontes de planejamento de atenção está a ser enriquecida ao longo de muitos horizontes de
que se referem a anos – o curto prazo é de 5 anos e tempo. Assim, a nova teoria deve abordar essas diversas
a longo prazo, 20 ou 50 anos. Claro, muitos horizontes. O desafio, claro, é que o big data
grupos estão preocupados com a forma como as cidades funcionam mais empurrará o mundo ainda mais para o curto prazo
rotineiramente ao longo do dia, mas isso não foi considerado parte e já há evidências disso em recentes
do planejamento urbano, exceto em termos de urbanismo. reações às crises globais. Isto deve ser resistido.
pesquisa operacional para emergências e serviços relacionados.
Grande parte da gestão rotineira das cidades tem
Planejando a cidade inteligente
foi realizado de maneira ad hoc, não necessariamente
sem quaisquer dados ou ciência, mas certamente sem a O big data certamente está enriquecendo nossas experiências de
tipo de teoria e modelagem abrangentes que como as cidades funcionam e está oferecendo muitas novidades
caracteriza o longo prazo. oportunidades de interação social e muito mais
As cidades inteligentes desmentem uma mudança nesta ênfase para uma tomada de decisão informada em relação aos nossos
compreensão mais profunda de como os sistemas urbanos conhecimento sobre a melhor forma de interagir nas cidades. Se
funcionam no curto prazo. A noção de ruptura é toda esses desenvolvimentos espontâneos serão para nossa vantagem
tão importantes quanto o big data e as diversas ferramentas que são coletiva ou ainda não foram vistos
sendo construído como parte da teoria da complexidade, particularmente há, sem dúvida, um lado obscuro nestes desenvolvimentos, muito
aqueles que pertencem às redes, estão sendo rapidamente obviamente em questões de privacidade e
moldados para lidar com como se pode responder e planejar confidencialidade. Vale a pena ilustrar alguns dos
crises de muito curto prazo. Estes podem variar desde aqueles potenciais destes desenvolvimentos, bem como alguns
que afligem o sistema de transportes a questões relativas dos problemas e para encerrar o argumento, um exemplo do maior
ao mercado imobiliário e à prestação de serviços sociais conjunto de dados que o nosso grupo (Centro
e outros serviços, todos eles administrados para Análise Espacial Avançada na University Col lege London,
no passado de maneiras bastante ad hoc. Mas para realmente conseguir Reino Unido) estão trabalhando vale a pena ser apresentado.
para controlar essas questões, é necessária uma nova teoria. Como Ocidente Temos cerca de 1 bilhão de registros de todos
(2013) argumenta de forma tão vívida que “big data requer grande aqueles que entraram e saíram do público
teoria”: dados sem teoria não têm sentido, apesar do sistemas de transporte implantando o cartão inteligente 'Oyster'
argumento apresentado por comentaristas como para pagar viagens, que incluem ônibus, metrô
como Anderson (2008) que argumenta que agora podemos obter trens e trens pesados de superfície na Grande Londres.
teoria na era do big data. Tudo que alguém precisa O período de tempo para os dados é superior a 6 meses durante
procuram em big data, assim diz o argumento, são mais 2011–12. Cerca de 85% dos viajantes utilizam o cartão e
e mais correlações. Na verdade, à medida que os dados aumentam, o imediatamente temos um problema de abrangência, pois aqueles
O número de correlações espúrias aumenta exponencialmente, que não o utilizam provavelmente
como indicou Taleb (2013). Em termos de ser grupos especializados – turistas, aqueles que estão
Machine Translated by Google

278 Diálogos em Geografia Humana 3(3)

usuários ocasionais, aqueles que não podem pagar pelo É possível fazer suposições sobre os passageiros e seu
cartão real e assim por diante. O conjunto de dados é posicionamento temporal no sistema, mas, que eu saiba,
notável porque sabemos onde as pessoas entram e saem ninguém tentou esse tipo de síntese. Atualmente, o que
do sistema, além de cerca de 10% dos usuários que não podemos fazer com os dados do Oyster é atribuí-los às
desistem devido a barreiras abertas. O conjunto de dados linhas e, em seguida, fechar estações e linhas e descobrir
é, portanto, ainda mais reduzido em sua abrangência. Como para onde os passageiros podem desviar. Existem muitas
os tap-ins e os tap-outs não podem ser associados às questões neste tipo de análise, mas, em princípio, podem
origens e destinos das viagens, não podemos usar ser feitas previsões para dar alguma sensação de
facilmente esses dados em nossos modelos de tráfego perturbação. Até agora, a maioria das medidas de
padrão sem um trabalho de detetive muito inteligente para interrupção são feitas no sistema de rede sem carregar os
associar esses dados de viagens a locais de casa, trabalho volumes de passageiros e, até agora, análises simples da
e outros terrenos. usar atividades. Isto é possível através rede são tudo o que está disponível para descobrir atrasos.
de uma boa estimativa, mas exige que aumentemos e Em suma, combinar os dados da procura com a rede é
sintetizemos os dados com outros conjuntos de dados possível e está a ser tentado, mas combiná-los com os
independentes e, portanto, há sempre erros. dados da oferta é quase impossível. O comportamento de
Esses dados são potencialmente extremamente úteis desvio dos viajantes também é complicado, pois as
para descobrir interrupções no sistema. Precisamos, no pessoas podem caminhar entre estações e pontos de
entanto, de gerar algumas análises cognitivas inteligentes ônibus, e há uma análise considerável necessária para
sobre como as pessoas percorrem os vários sistemas de indicar como as pessoas podem mudar o modo de viagem
transporte, tal como precisamos de atribuir viajantes a de uma rede para outra – seja para fazer uma viagem
diferentes linhas para garantir que podemos medir o número simples ou interrompida. . Estes são desafios enormes que
correto de viajantes em cada linha. . Como o tubo, por exigirão novas teorias sobre como as pessoas se comportam
exemplo, é extremamente complicado em termos em tais situações numa escala espacial muito precisa. Os
geométricos, precisamos descobrir como as pessoas o big data fornecem o contexto para o estudo deste tipo de
navegam. O estado da arte do que sabemos sobre comportamento de curto prazo, mas estamos no início de
navegação em ambientes complexos ainda é bastante tais explorações, e as muitas armadilhas que indicamos
primitivo. Muitas suposições têm de ser feitas e não temos aqui provavelmente nos preocuparão por algum tempo
dados sobre o que os diferentes utilizadores do sistema (Reades, 2013). ).
realmente aprenderam sobre as suas rotas.
Novos usuários do sistema se comportarão de maneira
diferente dos usuários experientes e isso introduzirá mais Notas
erros. Podemos ver perturbações nos dados ao determinar
1. Jon Reades, do Kings College London, é responsável pela
os momentos em que os viajantes entram e saem do
mineração e análise de dados dos conjuntos de dados do
sistema, mas para realmente prever perturbações em linhas
cartão Oyster mencionados neste artigo (Reades, 2013).
individuais e em estações, precisamos de combinar estes
2. O adjetivo smart é um uso peculiarmente norte-americano,
dados de procura com a oferta de veículos e comboios que
onde é usado muito mais amplamente em conversas do que
compõem o sistema. o sistema.
em inglês. Refere-se ao anterior movimento de crescimento
Felizmente, a Transport for London (TfL) possui dados
inteligente nas cidades dos Estados Unidos, onde tem sido
muito detalhados sobre ônibus e trens que nos fornecem
utilizado há cerca de 20 anos como sinónimo de expansão
um geoposicionamento preciso, horários e atrasos em
planeada ou contida.
relação aos horários. Em princípio, estes podem ser
comparados com os viajantes que utilizam o cartão Oyster.
Referências
Estes conjuntos de dados de procura e oferta, no entanto,
são totalmente incompatíveis porque não há forma de saber Anderson C (2008) O fim da teoria: o dilúvio de dados tornará o
que passageiro no sistema embarca em que comboio ou método científico obsoleto? Wired Magazine, 16 de julho,
autocarro, pelo que não podem ser atribuídos atrasos http://www.wired.com/science/discoveries/revista/16-07/
cumulativos a passageiros individuais. Novamente, é pb_theory (acessado em 30 de julho de 2013) .
Machine Translated by Google

Maluco 279

Batty M, Axhausen K, Fosca G, Pozdnoukhov A, Bazzani A, Reades J (2013) Pequenos segredos do big data: parte 1. Placetique:
Wachowicz M, et al. (2012) Cidades inteligentes do Pessoas, dados, lugar, http://www.reades.com/2013/05/
futuro. Tópicos Especiais 214 do European Physical Journal: 31/big-data-little-secret/ (acessado em 31 de maio de 2013).
481–518. Taleb NN (2013) Cuidado com os grandes erros do 'big data'.
Choi H e Varian H (2009) Prevendo o presente com Wired Blog, 2 de fevereiro, http://www.wired.com/opin ion/2013/02/big-
Tendências do Google, http://www.google.com/googleblogs/ data-means-big-errors-people/
pdfs/google_predicting_the_present.pdf, (acessado em 31 (acessado em 31 de maio de 2013).

Maio de 2013). West GF (2013) Big data precisa de uma grande teoria para acompanhá-lo.
Preis T, Moat HS, Stanley HE e Bishop SR (2012) Scientific American, 15 de maio, http://www.scientifica merican.com/
Quantificando a vantagem de olhar para frente. Relatórios Científicos article.cfm?id¼big-data-needs-big-the ory (acessado em 31 de maio
2: 350. de 2013).

Você também pode gostar