Escolar Documentos
Profissional Documentos
Cultura Documentos
Figura 1 - Evoluo da produo de artigos sobre Big Data no Social Sciences Citation
Index
Fonte: (ZHU, 2013)
Na verdade, h uma srie de mitos sobre Big Data (ver, por exemplo,
(CRAWFORD, 2013)), tais como:
A falsa 'garantia' de que os dados sero anonimizados antes de
serem processados, j que j foi demonstrado que geralmente
possvel desanonimizar os dados ao cruz-los com outras bases de
dados;
4
A falsa promessa de que Big Data vai mudar nossas vidas para
melhor, sabendo que muito do que se faz com ele aperfeioar os
mecanismos de nossa incitao ao consumo;
A falsa ideia de que Big Data o futuro da Cincia, o quinto
paradigma, de que "com dados suficientes, os nmeros falam por si",
descartando a necessidade de modelos, teorias, anlise crtica, etc.
Na verdade, os nmeros, poucos ou muitos, nunca falam; a mente
humana que lhes d significado.
Estes e outros mitos sobre o Big Data tornam-se ainda mais relevantes
nestes dias em que as recentes denncias de vigilncia e a interceptao do
trfego em telefones, emails e redes sociais pela Agncia de Segurana
Nacional (NSA) dos EUA e seu programa PRISM inflamam as preocupaes
com a privacidade no Big Data (GALLAGHER, 2013). No entanto, como se
mostrar a seguir, nossa proposta pedaggica, mais do que meramente
capacitar estudantes em infraestruturas computacionais ou trein-los anlise
preditiva, visa propiciar aos nossos estudantes, futuros profissionais de
Cincias, especialmente de Fsica, uma preparao tanto em termos tcnicos
como em ticos, para os desafios cientficos propostos pelo Big Data ao mundo
real no qual vo exercer suas profisses.
1
http://www.google.com/trends/
6
quartos dos adultos dos EUA usarem a Internet, vrios subgrupos esto sub-
representadas (MOHEBBI et al., 2011).
De fato, em 2013 o Google previu um surto de gripe com quase o dobro
da intensidade reportada pelas autoridades norte-americanas. Vrios
pesquisadores sugerem que uma ampla cobertura da mdia sobre a severa
temporada de gripe, incluindo uma declarao de emergncia de sade pblica
pelo estado de Nova York, teria provocado um grande aumento nas pesquisas
relacionadas gripe por pessoas que no estavam doentes e, com isso,
causado um processo de realimentao nas previses do Google (BUTLER,
2013).
De qualquer forma, tendncias mundiais atualizadas da gripe esto
disponveis online numa pgina especialmente criada, chamada Google Flu
Trends2 (tendncias da gripe).
Em 2012, o Frum Econmico Mundial de Davos publicou seu relatrio
Big Data, Big Impact: New Possibilities for International Development, (WORLD
ECONOMIC FORUM, 2012). Nele, argumenta-se que os dados provenientes
de telefones celulares tem interesse especial, porque, para muitas pessoas de
baixa renda, esta a sua nica forma de tecnologia interativa e, ao mesmo
tempo, ela identifica as necessidades e comportamentos dos usurios
individuais, em vez de simplesmente sobre a populao como um todo. Esse
documento cita uma pesquisa, segundo a qual, conversas relacionadas com a
alimentao no Twitter no s mostraram correlaes muito fortes com a
inflao dos preos dos alimentos, como puderam indicar onde e como as
pessoas j estavam mudando seu comportamento em funo disso.
Cientistas de dados
Segundo Mattmann (2013), para resolver os desafios do Big Data,
necessria uma nova raa denominada cientistas de dados (MATTMANN,
2013). Mas, como sempre, sero precisos educadores especializados para
form-los, os chamados educational data scientists (Buckingham Shum et al.,
2013).
2
http://www.google.org/flutrends/
8
Ensino de Cincias
Entusiastas do Big Data falam no fim da teoria, que o Mtodo
Cientfico est obsoleto (ANDERSON, 2008), que Big Data um novo
paradigma de pesquisa, superando o Qualitativo, o Emprico, o Normativo e a
Simulao (Figura 4),
Como lembra Schwartsman (2013), a dificuldade de obter dados sempre
foi um obstculo para a cincia. Foi para contorn-la que desenvolvemos
conceitos como amostragem e as ferramentas estatsticas para interpret-los.
Mas hoje, o Big Data, em vez das amostragens, pretende trabalhar com toda a
populao.
Como diz Shelly Farnham (DUMBILL et al., 2013), em vez de pensar
como um cientista social, estudando algumas pessoas no laboratrio, est-se
falando agora, na verdade, em analisar os padres de toda uma sociedade, o
que, naturalmente, afeta o tipo de questes ou problemas que se pode
resolver.
3
http://www-01.ibm.com/software/ebusiness/jstart/bigsheets/
12
4
http://www.tableausoftware.com/
5
http://karmasphere.com/what-we-do
6
http://www.revolutionanalytics.com/
7
http://www.windowsazure.com/pt-br/home/features/hdinsight/
8
http://cran.r-project.org/
9
http://www.rstudio.com/
13
Concluso
Acreditamos que esta a primeira proposta de utilizao de Big Data no
Ensino de Cincias no Brasil, com um vis que no meramente de uma
capacitao em infraestruturas computacionais ou de treinamento em anlise
preditiva, mas uma preparao de nossos estudantes, futuros profissionais de
Cincias, tanto em termos tcnicos como em ticos, para os desafios
cientficos propostos pelo Big Data ao mundo real no qual vo exercer suas
profisses, alm de uma melhor compreenso, embasada na prtica do Big
20
Notas
1
Hadoop uma plataforma de software em Java de computao distribuda
voltada para clusters e processamento de grandes massas de dados.
2
MapReduce um modelo de programao para o processamento de grandes
conjuntos de dados, usado para fazer a computao distribuda em clusters
de computadores.
3
Obtidos em
ftp://ftp.ngdc.noaa.gov/STP/SOLAR_DATA/SUNSPOT_NUMBERS/INTERNA
TIONAL/daily/RIDAILY
Referncias
ANDERSON, C. The End of Theory: The Data Deluge Makes the Scientific
Method Obsolete. Wired, n. 16.07, 23. Jun. 2008.
BEULKE, D. Big Data Impacts Data Management: The 5 Vs of Big Data [Blog
post]. 1. Nov. 2011. Disponvel em: <http://davebeulke.com/big-data-impacts-
data-management-the-five-vs-of-big-data/>. Acesso em: 7/5/2013.
BING. Geoflow for Excel: 3D Big Data Visualization Built on Bing Maps
[Blog post]. 30. Apr. 2013. Disponvel em:
<http://www.bing.com/blogs/site_blogs/b/search/archive/2013/04/11/geoflow.as
px?mkt=zh-CN>. Acesso em: 8/5/2013.
BUTLER, D. When Google got flu wrong. Nature, v. 494, n. 7436, p. 155156,
2013.
EYNON, R. Editorial: The rise of Big Data: what does it mean for education,
technology, and media research? Learning, Media and Technology, v. 38, n.
2, p. 14, 2013.
GALLAGHER, S. What the NSA can do with big data. Ars Technica, 11. Jun.
2013.
GANTZ, J.; REINSEL, D. The Digital Universe in 2020: Big Data, Bigger
Digital Shadows, and Biggest Growth in the Far East. Framingham, MA, 2012.
HIGGINBOTHAM, S. Data for doctors: Big data meets a big business [Blog
post]. Disponvel em: <http://gigaom.com/2011/08/08/data-for-doctors-big-data-
meets-a-big-business/>. Acesso em: 15/5/2013.
HURWITZ, J.; NUGENT, A.; HALPER, F.; KAUFMAN, M. Big Data for
Dummies. Hoboken, NJ: John Wiley & Sons, 2013.
KIM, R. IBM makes big data easy for the little guy [Blog post]. Disponvel em:
<http://gigaom.com/2011/08/26/ibm-makes-big-data-easy-for-the-little-guy/>.
Acesso em: 15/5/2013.
LINTOOL [JIMMY LIN]. rationalism vs. empiricism: with big data were (re-
)entering the golden age of empiricism: no doubt the pendulum will swing back
later. [Twitter post]. 28. Sep. 2011. Disponvel em:
<http://twitter.com/lintool/status/119144451967959040>. Acesso em: 22/4/2013.
LOHR, S. Amid the Flood, A Catchphrase Is Born. The New York Times, 12.
Aug. 2012. p. BU3.
PAPERT, S. A. Whats the big idea? Toward a pedagogy of idea power. IBM
Systems Journal, v. 39, n. 3.4, p. 720729, 2000.
SEARLS, D. People will do more with Big Data than big companies can
[Blog post]. 1. May 2013. Disponvel em:
<http://blogs.law.harvard.edu/doc/2013/05/01/people-will-do-more-with-big-
data-than-big-companies-can/>. Acesso em: 7/5/2013.
WORLD ECONOMIC FORUM. Big Data, Big Impact: New Possibilities for
International Development. Cologny, 2012. Disponvel em:
<http://www.weforum.org/reports/big-data-big-impact-new-possibilities-
international-development>. Acesso em: 9/5/2013.
ZHU, J. Big Data for Social Science Research: Hypes, Myths, and Realities.
21. Jan. 2013. Disponvel em:
<http://com.cityu.edu.hk/COMDOC/Seminar/ppt/2013/seminarPPT-2013-01-
21.pdf>. .