Escolar Documentos
Profissional Documentos
Cultura Documentos
2
É importante ressaltar que, desde muito cedo, a humanidade percebeu o
valor e importância dos dados: a obtenção destes, por seu uso, posse ou domínio
por aquele que não é seu proprietário ou detentor, sempre propiciou vantagem
econômica, política e de poder.
E a respeito de tal ilação, há vários exemplos na história da humanidade:
na Idade Média, era comum a interceptação e tortura dos mensageiros dos reinos
para obtenção de informações. Já no século XX, com o fim da Primeira Grande
Guerra, foi criada uma máquina de criptografia chamada Enigma, usada pela
Alemanha nazista para codificar suas ordens e mensagens de guerra,
impossibilitando o conhecimento e interpretação dos dados pelo inimigo.
Edgar Morin (1986, p. 43) identifica a importância dos dados na Guerra ao
dizer “a guerra informacional tornou-se simplesmente parte intrínseca e essencial
da guerra no século XX”. Já Manuel Castells (1999, p. 411) assevera que quem
detém a informação, detém o poder. Para o citado autor, na era da informação,
isso significa que “as lutas pelo poder são lutas culturais”.
Acompanhando essa evolução e caminho, os movimentos de expropriação
dos dados tendem a se intensificar. Afinal de contas, eles podem revelar detalhes
da intimidade, dos hábitos, do modo de agir e de pensar de uma pessoa. E isso é
muito valioso na contemporaneidade, pois as informações obtidas dos dados dos
usuários interessam fortemente a prestadores de serviços e a comerciantes que,
para poderem potencializar seus ganhos, precisam conhecer os hábitos e
preferências de seus consumidores.
Conforme asseverado por Parchen et al. (2013, p. 158): “O processo
capitalista enxergou no uso dos computadores e na evolução da informática, uma
ampliação do seu modo de acumulação de riquezas e de poder através do
domínio da informação”. Portanto, não é de se estranhar que empresas como o
Google ou o Facebook se tornaram veneradas e seus proprietários, ricos e
influentes. Isso porque os dados de seus consumidores são coletados e vendidos
a anunciantes, os quais fazem ofertas de seus produtos de forma dirigida,
segmentada e extremamente personalizada ao público que utiliza esses serviços,
graças à análise das predileções constatadas no perfil de cada usuário.
3
TEMA 2 – MINERAÇÃO DE DADOS NO BIG DATA
1
E os dados, eles mesmos, beiram se tornar uma importante mercadoria, ativamente comprada e
vendida em um mercado global de vários bilhões de dólares. Para os governos, dados dinâmicos
generalizados estão oferecendo novas introspecções sobre suas próprias operações, bem como
remodelando os meios para governar e regular a sociedade (tradução nossa).
4
Os dados das redes sociais online podem ser usados para extrair
informações sobre padrões de interações interpessoais e opiniões.
Esses dados podem auxiliar no entendimento de fenômenos, na
previsão de um evento ou na tomada de decisões. Com a ampla adoção
dessas redes, esses dados aumentaram em volume, variedade e
precisam de processamento rápido, exigindo, por esse motivo, que
novas abordagens no tratamento sejam empregadas. Aos dados que
possuem tais características (volume, variedade e necessidade de
velocidade em seu tratamento), chamamo-los de big data. (França,
2014, p. 8)
5
Logo, percebe-se que, desde um comentário em uma rede social até o
trajeto usado pelo automóvel em um deslocamento guiado pelo GPS, tudo deixa
rastros ou vestígios que podem ser capturados, armazenados e filtrados para
produzir uma imensa quantidade de dados que, depois de filtrados, revelarão
gostos e preferências dos usuários.
O potencial de tratamento dos dados é enorme no âmbito das redes sociais,
haja vista que o interesse das empresas é transformá-los em informação
disponíveis para uso ou para venda. Logo, a existência do Big Data é alicerce da
mineração de dados.
Assim, a incidência dessas tecnologias de tratamento de dados corrobora
o fato de que os hábitos e decisões dos usuários sempre sofreram interferência e
monitoramento, uma vez que gostos e preferências identificadas são produtos
monetizáveis e negociáveis a terceiros que poderão explorar ofertas massivas de
produtos, exibir publicidade segmentada e oportunizar serviços.
É que a possibilidade de transformação do dado bruto em informação
catalogada, indexada, “limpa” e prontamente acessível faz gerar um mercado
altamente lucrativo baseado na expropriação que, por sua vez, alimenta a
mineração de dados, haja vista a necessidade de uma busca cada vez maior das
preferências pessoais do usuário.
A lógica da segmentação e personalização é evidente: para que se possa
oferecer publicidade dirigida e sedutora, é necessário suprimir o espaço para
dados brutos ou genéricos que nada ou pouco revelem sobre as preferências de
consumo (Freitas, 2015, p. 94). Como dito, o processo de agregação de valor ao
dado, para transformá-lo em informação, é um trabalho altamente especializado.
Dessa maneira, as empresas de redes sociais contam com departamentos
próprios de implementação e uso da ferramenta da mineração de dados (data
mining), que é ferramenta ou técnica computacional derivada da Tecnologia da
Informação (TI), que por sua vez adveio diante da necessidade de empresas
alavancarem e potencializarem o processo de criação e desenvolvimento de
capacitação tecnológica (Meirelles, 1994, p. 419).
Logo, por mineração de dados entende-se os procedimentos de “pré-
processamento, extração e exploração de grandes quantidades de dados visando
estabelecer padrões consistentes” (Freitas, 2019, p. 191), como regras de
associação (perfil de usuários) ou sequências temporais (quando um conjunto de
usuários utiliza determinado aplicativo) para, então, poder detectar
6
relacionamentos sistemáticos entre variáveis e determinar novos subconjuntos de
dados.
Todo esse processo visa à obtenção de informação e conhecimento. Para
Castro e Ferrari (2016, p. 4), tem-se que:
7
Além disso, a rede social pode capturar dados referentes ao dispositivo
(nível de bateria, navegador utilizado, nomes e tipos de arquivos e aplicativos, o
movimento do cursor, ID do dispositivo, fuso horário, idiomas, pontos de wifi
próximos, localização GPS (quando ativada), câmera ou fotos contidas no
dispositivo, dados de cookies armazenados no dispositivo etc.
8
grátis para o produto que realmente interessa ao mercado neoliberal e
autorregulado, e que, portanto, vai acabar gerando a demanda, e
consequentemente, a necessária e esperada receita aos fornecedores. Exemplos:
fornecer um mês grátis de Netflix após assinatura do contrato, no qual o usuário
já deixa o número do seu cartão de crédito ou, ainda, dar um aparelho de barbear
de graça caso o cliente compre cinco lâminas juntas que, somado o valor,
ultrapassam o dobro do valor do aparelho.
E o que seria o freemium? Ele tem por base um mecanismo de captura de
dados e funciona calcado na ausência de ressarcimento direto de valores
pecuniários pelo usuário, ou seja: o produto ou serviço é oferecido “gratuitamente”
ao usuário que adquire, ao assinar as cláusulas contratuais, uma licença de uso
que perdura até a extinção do serviço, seja pelo distrato, pela resilição ou
resolução unilateral. Nenhum valor pecuniário é cobrado do usuário por tal licença,
pois o preço é suportado por um terceiro que paga por ele (Anderson, 2009, p.
12).
Nesse sentido, muitos softwares ou aplicativos dispostos atualmente estão
preparados para buscar cada informação que satisfaça os interesses para o qual
fora criado: produtos e serviços como Facebook, Gmail e outros travestem-se da
gratuidade para, colocados à disposição de toda sociedade, coletar cada vez mais
dados que serão transformados em informação, que por sua vez será vendida a
empresas e fornecedores interessados em utilizar dela para seu próprio benefício.
Esta é a lógica do mercado, e os dados na era digital são o mais valioso produto.
Para Anderson (2009, p. 29), isso só é possível devido à capacidade do
mercado em reduzir custos para produtos ou serviços oferecidos em plataformas
digitais. Contudo, a verdade é que tanto o modelo freemium quanto o preço-isca
de negócios possui um custo que precisa ser remunerado de alguma forma:
A cada vez que você faz uma busca no Google, está ajudando a
empresa a melhorar seus algoritmos de localização de anúncios. Em
cada caso, a utilização do serviço cria algo de valor, melhorando o
serviço em si ou criando informações que podem ser úteis em outro
lugar. Sabendo ou não, você está pagando com seu trabalho por algo
que recebe de graça. (Anderson, 2009, p. 29)
10
E como são eles que acabam subsidiando o uso “grátis” para a outra ponta
da cadeia triangularizada (o usuário), verifica-se que a empresa de rede social
acaba exercendo um papel de intermediária ou detentora exclusiva da técnica de
extração e obtenção dos dados segmentados, bem como do monopólio da base
de dados posta a disposição para venda.
O comerciante – ou anunciante – por outro lado, não consegue ter acesso
ao que necessita sem depender e pagar à empresa de rede social. Esta, por sua
vez, depende da continuidade do usuário utilizando o serviço de forma ininterrupta
de forma a produzir dados. Assim, o verdadeiro cliente de uma rede social é quem
paga, por exemplo, ao Facebook para ter seu banner (anúncio) veiculado no feed
(alimentador) de notícias do perfil.
A importância do tema deriva do fato de que é necessário bem
compreendermos a relação negocial havida entre o usuário e o aplicativo para
saber, por exemplo, se determinada empresa tem o direito de impor aos usuários
a mudança unilateral de suas políticas de privacidade, em nome da preservação
dos seus modelos de negócios.
11
4.1 A cauda longa
Por que, afinal, isso acontece? A resposta vem de Barabasi (2009, p. 64),
que descreve a Lei de Potência (ou Cauda Longa) como sendo a responsável por
tornar as redes o que elas são hoje: “A web é uma rede sem escala, dominada
por hubs e nós com grande quantidade de links” (Barabasi, 2009, p. 50 e 146).
A referida lei matemática (potência) difere-se da maioria daquelas que
permitem estabelecer uma média para diversos fatores, tais como altura de uma
pessoa, por exemplo, e que possuem, em sua representação gráfica, o formato
de um sino, ou seja, um pico máximo de valores. É que as leis de potência são
representadas por uma curva decrescente e não têm pico. Isso implica dizer que:
“O caráter distintivo de uma lei de potência não é apenas o fato de haver muitos
eventos pequenos, mas que os inúmeros eventos pequenos coexistam com
poucos eventos de grande magnitude”. Esses eventos extraordinariamente
grandes são simplesmente proibidos em uma curva de sino” (Barabasi, 2009, p.
61).
Sem termos a pretensão de aprofundar a conceituação e a análise de leis
matemáticas que implicam representações em sino, importa esclarecer que elas
permitem estabelecer uma média e ao mesmo tempo estabelecem um limite
numérico da grandeza estudada, que não pode ser ultrapassado; ou seja, o topo
da curva serve a bem representar a tradicional lei mercadológica da escassez. Já
as leis de potência (Cauda Longa) não conhecem a escassez (Anderson, 2006, p.
11), e por isso se adaptam tão bem a explicar a demanda de produtos e serviços
atuais na internet.
Na medida em que a nova conformação de mercado ditada pela era digital
e pela banda larga pôs fim aos velhos entraves do comércio, como necessidade
de economia de custos, de locação de grandes espaços para estoque, de caro
fretamento para transporte de produtos, da existência de lojas físicas com
estruturas limitadas e difíceis de se manter, crescia cada vez mais o acesso do
público a uma gama enorme de produtos que antes não tinham vez nas prateleiras
dos mercados: “Os produtos menos procurados continuavam vendendo pouco,
mas eles eram tão numerosos que, no todo, constituíam um grande negócio”
(Anderson, 2006, p. 9).
O resultado disso é que, se antigamente (e por conta dos referidos
obstáculos) havia o que Chris Anderson (2006, p. 7) chamou de hits, ou seja,
12
poucos produtos, mas que precisavam ser best-sellers em um mercado
estandardizado de massa, a revolução digital rompeu com todas as barreiras do
velho comércio, propiciando o acesso a uma infinitude de opções, logo, de
escolhas que antes não eram possíveis de serem feitas simplesmente porque a
grande maioria de produtos, considerados “medianos” ou não hits, não se dava a
oportunidade de adentrar ao mercado. Nascia aí o “mercado de massa de nichos”
(Anderson, 2006, p. 7).
Esse mercado deu origem a uma curva que Anderson (2006, p. 10) chamou
de The Long Tail (A Cauda Longa): uma tradução da Lei de Potência sustentada
por três constatações: “1- A cauda das variedades disponíveis é muito mais longa
do que supomos; 2 - ela agora é economicamente viável; 3 - todos esses nichos,
quando agregados, podem formar um mercado significativo” (Anderson, 2006, p.
10).
Mercados baseados em leis de potência – ou caudas longas –
necessariamente precisam, para funcionar, de uma infinidade de opções, na
medida em que o público deve ter acesso ao maior número possível de produtos
e serviços para contemplar a maior gama possível de nichos, ou seja, de gostos
e preferências: “a cauda longa nada mais é do que cultura sem os filtros da
escassez econômica” (Anderson, 2006, p. 51).
Percebe-se, desta forma que, em um mercado tradicional regido pelas
curvas de sino, ou seja, pela regra da escassez, isso seria absolutamente
impossível, já que não haveria como alocar tanta quantidade de opções em
espaços de estoque ou lojas limitadas. O advento da banda larga fez ruir a
necessidade de caros espaços de manutenção e exibição de produtos: prateleiras
se transformaram em fotos e descrições virtuais dos produtos.
As lojas físicas transmutaram-se em domínios de internet. Os vendedores
foram substituídos por chatbots (robôs de diálogo) e atendimentos remotos:
começou-se a vivenciar a era da abundância (Anderson, 2006, p. 51). Desta
forma, fica fácil compreender que, quando o assunto é escalabilidade da internet,
o céu virtual é o limite e, desse modo, a cauda longa justifica a importância dos
links e dos hubs, enaltecendo ainda a questão da relevância em redes sociais.
Na medida em que cada link é visibilidade e no mercado da Cauda Longa
as opções de nicho quase infinitas leva a uma natural pulverização da atenção
nas redes, a luta sempre é por relevância e também para se tornar um hub, logo,
13
um chamariz a causar constante concentração de nós (ties). Temos ainda o que
diz Barabasi (2009, p. 52):
Na rede que se encontra por trás da web, muitos nós não populares ou
pouco percebidos, que possuem apenas um pequeno número de links,
são sustentados por esses poucos sites da web altamente
conectados[...]. coletivamente, de certa forma criamos hubs, websites a
que todo mundo se conecta. São muito fáceis de encontrar,
independentemente de onde estejamos na web. Em comparação a
esses hubs, o restante da web é invisível. Para todos os propósitos
práticos, páginas conectadas por apenas um ou dois outros documentos
simplesmente não existem. É quase impossível encontrá-las. Até as
ferramentas de busca lhes são desfavoráveis, ignorando-as quando
rastreiam a web à procura de novos sites mais interessantes. (Barabasi,
2009, p. 53)
14
esteve e sempre estará inexoravelmente interligada em redes ordenadas,
extremamente ligadas, intermediadas por hubs em mercados de nichos (cauda
longa).
O mundo do Direito deve se manter atento a essas questões, pois elas são
relacionadas intimamente com a questão contratual incidente, por exemplo, na
remuneração de youtubers, sem falar nas consequências derivadas da
superexposição na internet, tais como a perda de privacidade e intimidade.
2
Neste sentido, vide processo n. 10575-88.2019.5.03.0003 da 4ª Turma do TST, Relator Ministro
Alexandre Luiz Ramos. Disponível em: <https://www.conjur.com.br/dl/processo10575-
8820195030003.pdf>.
15
Vivemos a era do self made-man americano, aquela do empreendedor
nato. Será isso uma verdade ou apenas um mito? Quantos empregos formais
correm risco por conta da uberização da economia? Quais são os impactos
econômicos, sociais, previdenciários e tributários decorrentes da intermediação
de produtos e serviços?
Fato é que se percebe claramente um crescimento paulatino da tentativa
dos Estados e Governos em regulamentar os chamados serviços disruptivos,
talvez em uma tentativa de racionalizar e dar um uso sustentável às plataformas
que vieram para modificar definitivamente a forma pela qual nos relacionamos
com a tecnologia.
Neste sentido, é notório no Brasil os movimentos legislativos que, após
meses de acirradas discussões, formalmente reconheceram, no Uber, a
legalidade de sua atividade econômica, regulamentando aquele. Mas essa
questão, inclusive, gera muitas curiosidades e dúvidas, pois precisamos nos
perguntar: os serviços que intermediam demanda e oferta necessitam ser
regulamentados? Eles se autorregulam?
Se o Estado se imiscuir na esfera privada para regulamentar todo produto
ou serviço uberizado, qual o risco dessas tecnologias se engessarem ou caírem
na mesmice dos modelos tradicionais, prestando serviços e produtos pouco
criativos, intuitivos e benéficos aos usuários?
De fato, quais são os benefícios e malefícios decorrentes da uberização da
economia? Ao que parece, não há como contentar todos os interesses envolvidos,
pois se de um lado os clientes da plataforma obtêm maior comodidade e facilidade
na obtenção de produtos e serviços, quem os presta fica submetido a uma série
de flexibilizações de tradicionais direitos consagrados no ordenamento jurídico.
O desafio do Direito reside em, justamente em algo tão novo, cunhar
soluções efetivas para os problemas derivados da aplicação das tecnologias sem
tentar subsumir novas e modernas categorias naquelas que são antigas e
estanques, geralmente ensinadas nas tradicionais Academias de Direito.
16
REFERÊNCIAS
_____. Free: Grátis: O Futuro Dos Preços. Rio De Janeiro: Elsevier, 2009.
ALÉM dos Games! Fortnite Foi O Fenômeno Cultural de 2018. UOL, 7 jan. 2019.
Disponível em: <https://jogos.uol.com.br/ultimas-noticias/2019/01/07/alem-dos-
games-fortnite-foi-o-fenomeno-cultural-de-2018.htm>. Acesso em: 11 mar. 2021.
17
FUCS, J. Por que a tarifa zero é inviável. Revista Época, 2 jul. 2013. Disponível
em: <https://epoca.globo.com/tempo/noticia/2013/07/por-que-btarifa-zerob-e-
inviavel.html>. Acesso em: 11 mar. 2021.
HOW Big Data is transforming the world – and your business. Experian, 5 jun.
2020. Disponível em: <https://www.experian.co.uk/blogs/latest-thinking/identity-
and-fraud/the-evolution-of-big-data-the-6vs/>. Acesso em: 11 mar. 2021.
MARR, B. Big Data: Using Smart Big Data, Analytics and Metrics to Make Better
Decisions and Improve Performance. United Kingdom: Wiley, 2015.
MORIN, E. Para Sair Do Século XX. Rio De Janeiro, Nova Fronteira: 1986.
THE World’s Most Valuable Resource Is No Longer Oil, But Data. The Economist,
6 maio 2017. Disponível em:
<https://www.economist.com/leaders/2017/05/06/the-worlds-most-valuable-
resource-is-no-longer-oil-but-data>. Acesso em: 11 mar. 2021.
18