Post on 28-Jan-2023
transcript
FACULDADE INTERNACIONAL DE CURITIBA - FACINTER
Curso de Comunicação Social – Jornalismo
MATIAS SEBASTIÃO PERUYERA
“EVERY PICTURE TELLS A STORY”: VISUALIZAÇÕES DE DADOS E SEU USO NO JORNALISMO
CURITIBA
2012
MATIAS SEBASTIÃO PERUYERA
“EVERY PICTURE TELLS A STORY”: VISUALIZAÇÕES DE DADOS E SEU USO NO JORNALISMO
Trabalho de Conclusão de Curso apresentado como requisito parcial para obtenção do grau de bacharel em Comunicação Social com Habilitação em Jornalismo à Faculdade Internacional de Curitiba (Facinter). Orientadora: Profa. MSc. Renata Duarte
CURITIBA
2012
AGRADECIMENTOS
Aos meus colegas do curso de Comunicação da Facinter, pela companhia e apoio
nesses quatro anos da graduação. Foi muito bom percorrer esse caminho juntos.
Aos meus professores, sempre dispostos a tirar dúvidas e apontar caminhos.
Ao Lyn Jannuzzi e demais colegas do departamento de Infografia da Gazeta do
Povo, pela troca incessante de informação e ideias que representou, sem eu
perceber, o começo da minha pesquisa acadêmica.
Ao professor Gustavo Lopes, por ter me ajudado com os artigos que serviram para
consolidar minha participação no mundo da pesquisa.
À professora Renata Duarte, pelas orientações que me deixavam com a cabeça
borbulhando de ideias e entusiasmo.
A meus amigos, por compartilharem do meu entusiasmo, mesmo que às vezes não
entendessem muito bem meus motivos.
Ao Fernando, que acompanhou meus tropeços desde a primeira faculdade.
Ao Tercio, pelos eternos planos de conquistar o mundo.
Finalmente, um agradecimento especial para Basilio, pelo carinho e pela paciência
sem fim.
RESUMO
A atual abundância de informações numéricas das mais variadas origens pode ser usada de várias maneiras pelo jornalismo. O presente Trabalho de Conclusão de Curso trata do uso jornalístico de bases de dados de grandes dimensões e como a visualização pode ser uma maneira adequada para a interpretação desses dados e também para a divulgação da base de dados como um todo. Em primeiro lugar é feita uma análise do papel das bases de dados e das visualizações dentro dos diferentes gêneros jornalísticos. É analisado o uso histórico e atual das bases de dados, com a finalidade de entender sua presença nas redações, além do uso de computadores na produção de matérias dentro do conceito de Reportagem Assistida por Computador (RAC). Essa análise também serve para pensar os diferentes conceitos de base de dados e chegar a um recorte do tipo de base que é usada para realizar visualizações, além da possibilidade de uso de visualizações dentro da RAC e do jornalismo de dados. Em seguida, é analisado o conceito de visualização, sua utilidade no jornalismo, sua relação com a infografia jornalística, e também o processo pelo qual se obtém uma visualização e os conhecimentos necessários para fazê-la. Finalmente, são analisados alguns exemplos de visualizações de meios variados: vídeo, estáticos, interativos. Palavras-chave: visualização de dados, jornalismo em base de dados, RAC, infografia.
ABSTRACT
The current abundance of numerical information from various sources can be used by journalists in many ways. This Graduation Thesis analyzes the journalistic use of large databases and how data visualization can be an appropriate way to understand large ammounts of data and to publish them as well. First, we analyzed the role of databases and data visualizations within the different journalistic genres. Then we examined the historical and current use of databases in order to understand their presence in newsrooms, and the use of computers in the production of news within the concept of Computer Assisted Reporting (CAR). This analysis also aims to think about the different concepts of database and determine what kind of database should be used to make visualizations, plus the ability to use visualizations in the field of CAR and data journalism. Then we analyze the concept of visualization, its usefulness in journalism, its relation to journalistic infographics, and the process and skills necessary to make visualizations. Finally, some examples from diferente media (vídeo, static, interactive) are analyzed. Keywords: data visualization, database journalism, CAR, infographics.
LISTA DE ILUSTRAÇÕES
Fig. 1 Visualização da série "See Something or Say Something", de Eric Fischer,
mostrando a cidade do Rio de Janeiro. Fonte: FISCHER, 2011. ...................... 13
Fig. 2 Exemplo de visualização subjetiva de dados reais, na figura do Professor
Raymundo, personagem de Chico Anysio. Fonte: AUDIÊNCIA, 2012. ............. 36
Fig. 3 Uso de visualizações no infográfico "La ballena Franca" (destaques meus).
Fonte do original: CLARIN, 2012. ...................................................................... 38
Fig. 4 Frame do infográfico em vídeo "How Mariano Rivera Dominates Hitters".
Fonte: CARTER; GRAHAM; WARD, 2010. ....................................................... 45
Fig. 5 trecho da base de dados dos lançamentos de Rivera. Fonte: GONZÁLEZ
VEIRAS, 2010. ................................................................................................... 45
Fig. 6 Imagem do programa feito pela equipe do The New York Times para analisar
a base de dados dos lançamentos de Rivera. Fonte: GONZÁLEZ VEIRAS,
2010. .................................................................................................................. 47
Fig. 7 Dois frames da animação em que são mostrados todos os lançamentos ao
mesmo tempo. Fonte: CARTER; GRAHAM; WARD, 2010. ............................... 48
Fig. 8 Transformação da representação das bolas lançadas. Fonte: CARTER;
GRAHAM; WARD, 2010. ................................................................................... 49
Fig. 9 infográfico publicado na revista Good. Fonte: HUBACEK, 2011. ................... 50
Fig. 10 Detalhe do infográfico "Reading, Writing and Earning Money". É possível ver
as divisões dos estados e três exemplos fornecidos pelo autor para facilitar o
entendimento. .................................................................................................... 51
Fig. 11 Site da base de dados "Os números do estado", dentro da série de matérias
"Retratos do Paraná". Fonte: GAZETA, 2011. ................................................... 53
Fig. 12 Visualização da cidade de Nova York, realizada por Eric Fischer. Fonte:
FISCHER, 2010. ................................................................................................ 55
Fig. 13 Visão geral da visualização feita pela empresa Luminoso. Fonte:
LUMINOSO, 2012. ............................................................................................. 57
Fig. 14 Visão geral da visualização feita por Von Worley. Fonte: VON WORLEY,
2012. .................................................................................................................. 58
Fig. 15 Visualização reorganizada pela popularidade da cor. Fonte: VON WORLEY,
2012. .................................................................................................................. 59
Fig. 16 Visão micro da visualização da Luminoso, mostrando como são exibidas as
palavras menores. .............................................................................................. 60
Fig. 17 Exemplo de uso de hipertexto na visualização de Von Worley. .................... 60
SUMÁRIO
1 Introdução ................................................................................................................................ 10 1.1 Problema ............................................................................................................................. 15 1.2 Hipóteses ............................................................................................................................. 16 1.3 Objetivos .............................................................................................................................. 16 1.3.1 Objetivo geral ............................................................................................................................... 16 1.3.2 Objetivos específicos ................................................................................................................. 16
1.4 Metodologia ........................................................................................................................ 17
2 Bases de dados, visualizações e gêneros jornalísticos .............................................. 19 2.1 No gênero interpretativo ............................................................................................... 19 2.2 No gênero informativo .................................................................................................... 21 2.3 No gênero utilitário .......................................................................................................... 21 2.4 Nos gêneros opinativo e diversional .......................................................................... 22 2.5 Visualizações e gêneros jornalísticos ........................................................................ 22
3 BASES DE DADOS .................................................................................................................... 24 3.1 Breve histórico e conceitos ........................................................................................... 24 3.2 Bases de dados como formato dentro do webjornalismo ................................... 26 3.3 Bases de dados como produto jornalístico .............................................................. 27 3.4 Dados e ferramentas ao alcance de todos ................................................................ 29
4 Visualização: da unidade ao conjunto ............................................................................ 31 4.1 Definição .............................................................................................................................. 31 4.1.1 Quanto é “grande” ...................................................................................................................... 33 4.1.2 O que é “visual” ............................................................................................................................ 34 4.1.3 Quais dados podem ser representados numericamente ........................................... 35
4.2 Diferenças entre visualização e infografia ............................................................... 37
5 Ferramentas e aspectos técnicos ..................................................................................... 39 5.1 Obtenção dos dados ......................................................................................................... 39 5.1.1 Ferramentas para a manipulação dos dados .................................................................. 40
5.2 Apresentação dos dados ................................................................................................. 41 5.2.1 Ferramentas para fazer a apresentação dos dados ..................................................... 42
5.3 Conseguir qualidade técnica na reprodução da visualização ............................ 43 5.3.1 Escolha do suporte ..................................................................................................................... 43
6 Análise de infográficos e visualizações .......................................................................... 45 6.1 How Mariano Rivera Dominates Hitters, the new York Times ......................... 45 6.2 Reading, Writing and Earning Money, Good Magazine ........................................ 50
6.3 Retratos do Paraná – Gazeta do Povo ........................................................................ 53 6.4 Race and Ethnicity: New York – Eric Fischer ........................................................... 54 6.5 XKCD – Color Survey ........................................................................................................ 56
7 Conclusão ................................................................................................................................. 61 REFERÊNCIAS ................................................................................................................................. 64
10
1 INTRODUÇÃO
Entre as diferentes linguagens visuais do jornalismo, a que está ganhando
mais destaque nos últimos tempos é a visualização de dados. Herdeiro da infografia
jornalística, esse formato ganhou força graças a uma combinação de tecnologias:
por um lado, as tecnologias que geram bases de dados cada vez maiores; por outro,
o avanço nas ferramentas que permitem gerar representações gráficas desses
dados. Considerando suas características e os problemas que ela resolve, a
visualização é uma ferramenta que pode – e deve – ganhar espaço no jornalismo.
É cada vez mais comum o surgimento de bases de dados de proporções
gigantescas, mas com informações interessantes do ponto de vista jornalístico. O
problema que elas trazem para o jornalista é que ele deverá saber como lidar com
esse volume de informação tanto para analisar esses dados como para divulgá-los.
Muitas vezes a falta de ferramentas adequadas para a análise dessas bases deixa o
jornalista sem poder descobrir informações latentes e a falta de recursos para exibir
essas informações deixa o leitor somente com a informação passada pelo repórter,
sem acesso à totalidade da informação. A visualização se mostra como uma
possibilidade de apreender essa informação em sua totalidade. Como resume
Nathan Yau:
Encare. Dados podem ser um tédio se você não sabe o que está procurando ou não sabe sequer que há algo a ser procurado. É só um monte de números e palavras que não significam nada além de seus próprios valores. O melhor de estatísticas e visualização é que eles lhe ajudam a procurar além desses valores. Lembre-se, dados são uma representação da vida real. Não é só um balde de números. Há histórias nesse balde. Há significado, verdade e beleza. E assim como na vida real, às vezes as histórias são simples e diretas; e outras vezes são complexas e enroladas. Algumas histórias são adequadas a um livro. Outras têm forma de novela. É com você, estatístico, programador, designer ou cientista dos dados, decidir como contar a história. (YAU, 2011)1
1 Tradução do autor. Texto original: “Face it. Data can be boring if you don’t know what you’re looking for or don’t know that there’s something to look for in the first place. It’s just a mix of numbers and words that mean nothing other than their raw values. The great thing about statistics and visualization is that they help you look beyond that. Remember, data is a representation of real life. It’s not just a bucket of numbers. There are stories in that bucket. There’s meaning, truth, and beauty. And just like real life, sometimes the stories are simple and straightforward; and other times they’re complex and roundabout. Some stories belong in a textbook. Others come in novel form. It’s up to you, the statistician, programmer, designer, or data scientist to decide how to tell the story.”
11
Segundo António Fidalgo, o jornalismo de dados terá mais importância na
produção de notícias relevantes: “a mineração de dados é uma forma de descobrir
relações relevantes entre dados, relações por vezes completamente inesperadas e,
por conseguinte, incontestavelmente de valor noticioso” (FIDALGO, 2007, p. 166).
Sendo assim, a incorporação do uso de bases de dados no jornalismo traz ganhos
que exigem certos conhecimentos para poder aproveitá-los.
A tecnologia mudou as bases de dados tanto no aspecto da sua criação
como no aspecto de sua exploração, navegação e/ou leitura. No primeiro aspecto,
surgiram novas formas de alimentá-las. Bases de dados tradicionais, como as
geradas em um censo de população, têm a possibilidade de ficarem mais complexas
e incluírem mais dados. Novos tipos de bases podem ser criadas com novas
tecnologias, como a de Player Tracking, utilizada pela Fifa na Copa do Mundo de
2010, no qual um sistema gera informações do caminho percorrido pelos jogadores
e pela bola a partir das imagens captadas por quatro câmeras de vídeo. Outro
exemplo é a enxurrada de informações sobre gastos de funcionários públicos,
divulgados por ordem das leis de transparência. A informação enviada à internet
pelos seus usuários, como os metadados2 e tags3 presentes em fotografias postadas
no Flickr, por exemplo, também podem compor uma base de dados extensa para
quem quiser compilar e consolidar os dados. A extração de dados de sistemas
fechados também pode ser considerada uma possibilidade de origem de dados,
mesmo que escondidos em sistemas de difícil acesso e precisando de meios
automatizados para extraí-los.
No aspecto da exploração das bases de dados, a tecnologia facilita tarefas
que, se feitas à mão, levariam muito tempo ou seriam impraticáveis. Manualmente, é
possível pegar um dado aqui ou ali (desde que a base tenha sido planejada para ser
consultada, organizada alfabeticamente ou ter uma interface para fazer consultas,
por exemplo), mas sem a facilidade do computador.
Dependendo do tipo de dados de cada base, há várias maneiras de se
aproximar a ela, ou de minerar 4 seus dados. Uma abordagem possível é a
matemática, possibilitada principalmente por softwares de planilhas, como o
2 Dados anexos a arquivos digitais, como dados de georreferenciamento inclusos em fotografias. 3 Palavras-chave atribuídas a arquivos digitais, como postagens em blogs. 4 Termo que tem sido usado para se referir ao ato de extrair números e dados de sites ou similares, através de programas de computador.
12
Microsoft Excel, e de bancos de dados, como o Microsoft Access. É possível fazer
operações entre seus números, para transformar números absolutos em números
relativos, possíveis de serem comparados entre si; classificar elementos por rank;
contar quantos elementos cumprem ou não uma determinada condição; realizar
buscas por padrões específicos, como o número de um documento; resumir os
dados utilizando médias e medianas; e um longo etcétera.
Esse método gera pistas para a obtenção de novas informações, que podem
ser transmitidas ao público ou podem ser usadas pelo jornalista para guiá-lo no
processo de produção de uma matéria. Esse uso do computador por parte de
jornalistas tem um marco na criação do conceito de Reportagem Assistida por
Computador (GARRISON apud BARBOSA, 2007, p. 109). De qualquer maneira, as
informações provenientes desses métodos podem até resumir os dados presentes
na base, mas em um processo de edição tradicional, no qual há perda de dados. O
cálculo de uma média não representa cada um dos valores. A escolha de quais
valores de uma série serão mostrados tem um certo grau de arbitrariedade, e essa
escolha pode ser útil para o propósito de uma investigação jornalística específica,
mas inútil para outra. Em alguns casos, pode ser interessante que a população em
geral também tenha acesso aos dados, mas algumas bases podem ser complexas
demais para serem compreendidas. A visualização se apresenta como uma
alternativa plausível para melhorar o acesso a esses grandes volumes de dados,
tanto para uso do jornalista como para a divulgação de informações.
Em uma visualização se determina um código visual, com maior ou menor
carga semântica, cujas variáveis gráficas (BERTIN, 1986, p. 186) representam
aspectos numéricos – ou que tenham sido transpostos para uma linguagem
numérica. Uma das premissas de uma visualização, segundo Lev Manovich (2011, p.
157), é que ela contenha e represente graficamente a totalidade da informação
disponível. A visualização manteria, portanto, a mesma característica da base de
dados nela representada de não ter um direcionamento da informação.
As tecnologias informáticas, além de facilitar a produção de visualizações,
permitem também a sua exibição. Dispositivos de altíssima resolução permitem a
exibição dos mais pequenos detalhes, sem perdas de informação visual
(MANOVICH, 2011, p. 165). Refinamentos no processo de impressão (TUFTE, 1990,
p. 81–95) também atingem o mesmo objetivo. Seja em monitores ou meios
impressos, visualizações de dados de alta densidade permitem que os leitores
13
naveguem pelos dados e escolham os que lhes interessam, construindo suas
próprias narrativas (TUFTE, 1990, p. 50). Essa navegação é auxiliada pelo fato de
as visualizações serem geralmente derivadas dos já estabelecidos gráficos
estatísticos presentes na infografia jornalística – como gráficos de pizza, gráficos de
barras ou mapas – o que garante sua usabilidade.
Fig. 1 Visualização da série "See Something or Say Something", de Eric Fischer, mostrando a cidade do Rio de Janeiro. Fonte: FISCHER, 2011.
Apesar da popularização dessas técnicas, o uso por parte do jornalismo
continua limitado. Prova disso é que a quantidade de visualizações feitas por
14
profissionais que reúnem o tino de encontrar informações em bases de dados e têm
as habilidades de programação e design para chegar a um resultado desejado. De
certa maneira, são eles quem deram um pontapé inicial para que o jornalismo
considerasse o uso de visualizações complexas que vão além dos já tradicionais
infográficos. Exemplo desse tipo de trabalho é a visualização “See Something or Say
Something” (Fig. 1), de Eric Fischer (FISCHER, 2011), que mapeou a localização de
fotos publicadas no Flickr5 e de tweets6 no mundo e em várias cidades.
A base de dados da qual Fischer partiu saiu dos próprios sites, que
armazenam dados de geolocalização (latitude e longitude) das fotos e dos tweets.
Fischer criou um programa que localizou os pontos e lhes atribuiu a cor azul ou
vermelha se fossem tweets ou fotos, respectivamente. O resultado é um mapa que
delineia as cidades representadas somente com estas informações, e torna visíveis
padrões de uso da internet em cada cidade. O exemplo é a visualização da cidade
do Rio de Janeiro (Fig. 1), onde é possível ver aglomerações de fotos em pontos
turísticos como o Cristo Redentor e o bairro da Urca, e aglomerações de tweets em
pontos de trânsito como a ponte Rio–Niterói e o aeroporto do Galeão. A quantidade
de informação mostrada nessa visualização é enorme, e seria inútil se exibida de
outra maneira. É a única maneira de descobrir certos padrões. Porém, certas
condições são necessárias para que um material dessas características tenha valor
jornalístico.
Alguns jornais, como o The New York Times e o The Guardian, utilizaram
esse recurso para contar histórias e agora produzem visualizações com frequência,
como uma linguagem estabelecida, mas com cuidados textuais e imagéticos para
garantir que sejam comprendidos pela maior parte da audiência. É essa transição
dos artistas-programadores para o jornalismo que definirá as possibilidades da
visualização como uma linguagem jornalística, ou até como um gênero.
O jornalismo tem se aproveitado cada vez mais de linguagens visuais, como
a infografia, através da qual a visualização começou a entrar nos meios massivos.
Porém, a visualização tem características de linguagem que é necessário
compreender melhor. Sua não linearidade faz com que o processo de edição não
tenha paralelos. Em outras linguagens jornalísticas, como a reportagem, o vídeo, a
5 Site para publicação e compartilhamento de fotografias (www.flickr.com) 6 Cada uma das mensagens publicadas por usuários do Twitter (www.twitter.com)
15
fotografia ou até os infográficos jornalísticos, há decisões de corte, de deixar
material de fora, mas não dentro da ação de um gatekeeper7, e sim por mera
limitação física do tamanho disponível para um texto ou o tempo disponível para
uma matéria. Isso é diferente nas visualizações: uma de suas características é que
não haja cortes nos dados; absolutamente toda a informação disponível é usada na
confecção da imagem final.
Marshall McLuhan (1969, p. 72) afirma que o surgimento de um novo meio
de comunicação altera os meios já existentes. Assim como o rádio foi modificado
pelo surgimento da televisão, a visualização está modificando a infografia jornalística
tradicional, fornecendo-lhe novas possibilidades; e também o jornalismo em si,
oferecendo a possibilidade de apresentar ao leitor uma base de dados em sua
totalidade, o que não era possível até então.
De modo geral, o jornalismo ainda não absorveu essa influência e não
definiu o papel de uma linguagem com essas características. Alguns experimentos,
geralmente realizados por pessoas que combinavam habilidades em design e
programação com curiosidade de construir e explorar bases de dados, encorajaram
que alguns meios experimentassem usar visualizações como recurso jornalístico.
Neste momento, em que o jornalismo está usando cada vez mais esse recurso, é
necessário pensar em melhorar as possibilidades e capacitar o jornalismo – e os
jornalistas – para identificar situações em que visualizações possam ser úteis e o
que é necessário para fazê-las. Também é necessário pensar nas necessidades do
leitor quanto a repertório e capacidade de extrair informação das visualizações
fornecidas.
As características e possibilidades da visualização não têm paralelo nem
precedente. Sua compreensão é fundamental para identificar oportunidades de usá-
la e, quando isso acontecer, ter um mínimo de recursos para realizá-la.
1.1 PROBLEMA
Quais as condições necessárias para que a visualização de dados se afirme
como um formato jornalístico adequado para meios massivos?
7 Termo que se refere a quem decide quais notícias serão divulgadas (BAHIA, 1990).
16
1.2 HIPÓTESES
Para que a visualização de dados se afirme como linguagem jornalística,
principalmente quando for a única forma de comunicar grandes volumes de dados, é
necessário uma atenção especial ao espectro de leitores no que se refere a facilitar
a sua compreensão. Esse apoio ao leitor pode se dar, por exemplo, através de
legendas e explicações sobre como fazer a leitura. Dentro dessa compreensão,
também é necessário considerar que as visualizações sejam adequadas ao suporte
final, seja impresso, web, vídeo ou outro.
Há vários recursos de software que permitem que qualquer pessoa faça
visualizações com facilidade. Porém, ainda é necessário conhecimento prévio do
assunto que se quer abordar, para escolher qual dos modelos pré-existentes é o
mais adequado. E conhecimentos de programação dão a liberdade de não ter que
se adaptar aos formatos predeterminados dos softwares já existentes.
É necessário um conhecimento multidisciplinar para a realização de
visualizações dentro do jornalismo, independente da ferramenta escolhida. É
necessário conhecimento jornalístico para ver o que é interessante, conhecimento
de estatística para escolher os dados corretos e fazer operações entre eles a fim de
gerar números mais úteis, conhecimentos de design para produzir uma visualização
que seja possível de ser reproduzida no suporte escolhido, e os conhecimentos da
própria ferramenta que vai gerar a visualização, seja uma ferramenta específica ou
uma linguagem de programação. O realizador da visualização pode prescindir de
alguns desses conhecimentos, mas, mais cedo ou mais tarde, precisará de ajuda
para suprir o que falta.
1.3 OBJETIVOS
1.3.1 Objetivo geral
Analisar, do ponto de vista comunicacional, as condições necessárias tanto
para a realização de visualizações de dados como para que ela se torne mais uma
linguagem possível dentro do jornalismo.
1.3.2 Objetivos específicos
17
Analisar a relação das bases de dados e suas visualizações com os
diferentes gêneros jornalísticos, para entender as possibilidades que elas têm como
formato jornalístico.
Comparar as diferentes abordagens de bases de dados dentro dos já
usados por diferentes autores. Analisar quais as ferramentas e métodos disponíveis para a realização de
visualizações de acordo com as possibilidades e estruturas de cada meio de
comunicação.
Analisar as possibilidades e limitações das visualizações de diferentes tipos
de dados nos meios de massa e em diferentes suportes, como web, impresso e
vídeo.
Propôr diferentes níveis de conhecimento (multidisciplinar) que os jornalistas
devem ter para realizá-la.
1.4 METODOLOGIA
Para conceitualizar os elementos pesquisados, foi feita pesquisa
bibliográfica, fazendo conexões entre autores das áreas do design da informação e
da comunicação. Essa pesquisa também aportou base teórica para uma posterior
pesquisa descritiva, na qual foram analisados alguns exemplos de visualizações de
dados, tanto publicados em meios jornalísticos como em outros contextos. Essa
diferenciação foi feita para buscar elementos que os veículos jornalísticos teriam
usado para garantir a leitura e entendimento das visualizações, em contrapartida a
um possível maior descompromisso de visualizações que não foram publicados em
meios jornalísticos. Foram escolhidos seis exemplos de visualizações de dados,
sendo três dentro de um contexto de mídia de massa e três que não
necessariamente têm objetivos jornalísticos, mas têm um caráter exploratório.
Dentro da mídia de massa, o principal objeto de pesquisa será o infográfico
em vídeo “How Mariano Rivera Dominates Hitters”, publicado pelo New York Times,
que inclui dois usos de visualização, para exploração dos dados pelos jornalistas e
para a visualização do público (CARTER; GRAHAM; WARD, 2010). Também serão
analisados os infográficos “Reading, Writing and Earning Money”, da revista Good
(HUBACEK, 2011) e “Os números do estado”, base de dados presente na série de
18
reportagens “Retratos do Paraná”, do jornal curitibano Gazeta do Povo (GAZETA,
2011).
No que se refere a visualizações não-jornalísticas, serão analisadas a série
“Race and Ethnicity”, de Eric Fischer (FISCHER, 2010) e duas visualizações da
mesma base de dados (LUMINOSO, 2012 e VON WORLEY, 2012), resultado da
pesquisa “Color Survey”, feita pelo quadrinhista Randall Munroe (MUNROE, 2010).
19
2 BASES DE DADOS, VISUALIZAÇÕES E GÊNEROS JORNALÍSTICOS
Dentro das redações, os gêneros jornalísticos exercem um papel
semelhante ao de um cardápio. O repórter sabe se um assunto vai render uma nota,
uma notícia, ou uma reportagem; um editor solicita uma matéria de análise ou uma
matéria de serviço; opiniões são expressadas através de editoriais e de charges; um
programa de televisão pode ser uma entrevista ou um documentário. A taxonomia
do jornalismo serve para delinear o produto final como um conjunto onde
predominarão produtos de um ou outro tipo, como o jornalismo literário na revista
Piauí8, ou matérias de análise em um jornal econômico.
Encaixar as bases de dados e as visualizações em algum – ou alguns –
gêneros é incluí-las nesse “cardápio”, para que os jornalistas considerem a
possibilidade de usá-las. Discutir os gêneros também serve para decidir qual é a
função de uma visualização: ela pode ter o valor de uma reportagem, ou prestar um
serviço, por exemplo. O ponto de partida para a análise será a taxonomia definida
por José Marques de Melo: informativo, opinativo, interpretativo, diversional e
utilitário (COSTA, 2010, p. 43). Uma primeira leitura encaixaria as base de dados e
as visualizações no jornalismo interpretativo. Porém, não se deve descartar uma
possível apropriação do formato pelos outros gêneros jornalísticos.
2.1 NO GÊNERO INTERPRETATIVO
É consenso entre vários autores o pioneirismo de Alberto Dines ao fundar o
Departamento de Pesquisa e Documentação do Jornal do Brasil (COSTA; LUCHT,
2010, p. 109). Esse fato, que ocorreu em meados dos anos 60, é considerado um
marco do jornalismo interpretativo no Brasil. Também pode ser considerado um
marco do jornalismo em base de dados (BARBOSA, 2007, p. 104), pelo pioneirismo
em facilitar informações aos jornalistas, o que já cria uma relação entre o jornalismo
interpretativo e o jornalismo em base de dados.
Mário Erbolato cita que o jornalismo interpretativo também é “conhecido
como jornalismo em profundidade, jornalismo explicativo ou jornalismo motivacional
(ERBOLATO apud COSTA; LUCHT, 2010, p. 109). Segundo Paulo Roberto Leandro
8 Revista brasileira que se caracteriza por reportagens longas, no estilo do jornalismo literário.
20
e Cremilda Medina, “é realmente o esforço de determinar o sentido de um fato,
através da rede de forças que atuam nele – não a atitude de valoração desse fato ou
de seu sentido, como se faz em jornalismo opinativo” (LEANDRO; MEDINA apud
COSTA; LUCHT, 2010, p. 110). Cabe destacar que Leandro e Medina não
consideravam o jornalismo interpretativo como um gênero separado. Ainda segundo
eles, no jornalismo interpretativo,
as linhas de tempo e espaço se enriquecem: enquanto a notícia registra o aqui, o já, o acontecer, a reportagem interpretativa determina um sentido desse aqui num círculo mais amplo, reconstitui o já no antes e no depois, deixa os limites do acontecer para um estar acontecendo atemporal ou menos presente. Através da complementação de fatos que situem ou interpretem o fato nuclear, através da pesquisa histórica de antecedentes, ou através da busca do humano permanente no acontecimento imediato, a grande reportagem é interpretação do fato jornalístico (ibidem, p. 111).
Costa e Lucht também citam Luiz Beltrão, que fala na interpretação como o
“ato de submeter os dados recolhidos no universo das ocorrências atuais e idéias
atuantes a uma seleção crítica, a fim de proporcionar ao público os que são
realmente significativos” (BELTRÃO apud COSTA; LUCHT, 2010, p. 112). Na
análise de Costa e Lucht dos textos de Beltrão, encontra-se que ele pondera sobre
quem deve fazer a interpretação, se o jornalista ou o público. No primeiro caso, há a
possibilidade de o produto jornalístico ter caráter opinativo disfarçado de
interpretação, o que leva Beltrão a definir jornalismo interpretativo como um
“jornalismo que oferece todos os elementos da realidade, a fim de que a massa, ela
própria, a interprete” (ibidem, p. 113). O resultado seria a “informação em toda a sua
integridade, captada, analisada e selecionada pelo jornalista, ao qual não cabe o
diagnóstico” (idem).
Apesar que a variedade de conceitos e ideias parece confirmar que o
jornalismo interpretativo é “uma categoria carente de configuração estrutural”
(MARQUES DE MELO apud COSTA; LUCHT, 2010, p. 113), encontram-se
afinidades entre os ideais do jornalismo interpretativo e as visualizações, a começar
pelo uso de bases de dados, mesmo que não como formato e sim como apoio ao
jornalista. A ausência de opinião citada por Beltrão e por Leandro e Medina também
é afim à imparcialidade das visualizações. Leandro e Medina citam o
aprofundamento da informação como inerente ao jornalismo interpretativo; a ideia
das bases de dados e visualizações de disponibilizar a totalidade de uma informação
21
é uma maneira de aprofundar o conhecimento, e também é condizente com a ideia
de Beltrão de oferecer ao leitor “todos os elementos da realidade”.
2.2 NO GÊNERO INFORMATIVO
Segundo Nilson Lage, o jornalismo informativo se apoia no tripé
imparcialidade, veracidade e objetividade (LAGE apud COSTA, 2010 p. 48). Sobre a
objetividade, destaca-se com a definição citada por Costa e por Michael Kunczik: “[a
objetividade] é o grau de identidade entre o fato e a sua descrição mediante a
informação” (KOSCHWITZ apud KUNCZIK, 2002, p. 223). Para Marques de Melo, o
jornalismo informativo é a combinação da articulação entre os acontecimentos reais
e sua expressão (MARQUES DE MELO apud COSTA, 2010, p. 50).
Nas bases de dados, essa articulação é reduzida ou inexistente, e portanto
(quase) não há risco de falta de objetividade. Nas visualizações, essa articulação se
dá não pela escolha de quais dados serão exibidos, e sim pela escolha de como
fazer para que os dados sejam exibidos em sua totalidade. A expressão dos
acontecimentos reais se dá através da transformação deles em números e a
transformação desses números em símbolos, como será visto adiante.
Todavia, há possibilidades de perda de objetividade na construção de bases
de dados e de visualizações. Se nas reportagens e matérias escritas o que faz com
que a objetividade varie são “escolhas de sintaxe, de léxico e de temática” (COSTA,
2010, p. 48), nas visualizações e bases de dados essa variação pode acontecer por
uma escolha errada dos dados ou de sua fonte, ou por escolher um tipo de gráfico
que privilegie certo aspecto dos dados e não outro.
2.3 NO GÊNERO UTILITÁRIO
Se concebidas para que o leitor tenha acesso à informação que precisa, as
bases de dados e as visualizações podem ser uma forma de jornalismo de serviço,
mas isso depende da natureza dos dados disponibilizados. Uma base de dados com
o dinheiro gasto pelos deputados tende à função informativa; já um mapa que
mostra quais os cinemas da cidade se aproxima do serviço, já que serve para saber
qual cinema fica mais perto da casa do leitor. Porém, os dados não perdem seu
caráter informativo: esse mapa dos cinemas pode servir também, por exemplo, para
22
tirar conclusões sobre qual região da cidade registra maior concentração de cinemas,
e essas conclusões podem servir para realizar uma análise sobre os fatores sócio-
econômicos próprios dessas regiões.
2.4 NOS GÊNEROS OPINATIVO E DIVERSIONAL
Dentro de um material de natureza opinativa ou diversional, os dados devem
manter sua integridade, e a base ou visualização em si mantêm sua natureza
informativa. A linguagem dos dados comunica uma precisão que não deve ser usada
para transmitir dados errôneos ou subjetivos. Apesar de uma visualização poder ser
usada para expressar valores gerados a partir de subjetividades, a linguagem do
gráfico nos remete a uma precisão. Um gráfico não pode ser subjetivo: em todo caso,
ele mede, objetivamente, subjetividades. Por mais que ele apoie um material
opinativo, as bases de dados (ou as visualizações) devem mantém sua essência
informativa, e nem a opinião do autor nem sua subjetividade devem permear os
dados.
2.5 VISUALIZAÇÕES E GÊNEROS JORNALÍSTICOS
Além da tentativa de encaixar as visualizações e bases de dados em
gêneros, é interessante pensar em como elas se encaixam na classificação de
Marques de Melo do jornalismo informativo: nota, notícia, reportagem e entrevista
(MARQUES DE MELO apud COSTA, 2010, p. 55). Desconsiderando esta última,
passamos à sequência nota-notícia-reportagem. A nota é uma coisa curta, que pode
se transformar em uma notícia. Ambas se caracterizam pela imediatez da
informação em oposição ao aprofundamento típico da reportagem, que é “o relato
ampliado de um acontecimento que já repercutiu no organismo social e produziu
alterações que já são percebidas pela instituição jornalística” (ibidem, p. 53). Pela
natureza de fazer um levantamento e edição de uma base de dados, é possível
considerar que a maioria das bases de dados (e visualizações) se encaixariam na
categoria reportagem. Mesmo em casos que a visualização seja minúscula e
subordinada a uma notícia, a ideia de aprofundamento e pesquisa se mantém. Por
exemplo, uma notícia sobre a alta do dólar pode ser acompanhada por uma
visualização mostrando os valores anteriores, o que implica, em uma escala
23
reduzida, uma pesquisa e um aprofundamento da informação, também
emparentados com o jornalismo interpretativo.
Por serem gêneros que são definidos principalmente pela sua forma, é uma
tarefa complicada encaixar as bases de dados e as visualizações em algum dos
gêneros jornalísticos já existentes. Elas têm afinidade tanto com o gênero
interpretativo como com o informativo, além de poderem ser usadas em contextos
opinativos ou até diversionais. Na maioria dos casos podem ter o peso de uma
reportagem, estar mais próximo da objetividade desejada pelo gênero informativo e
proporcionar a profundidade necessária ao gênero interpretativo.
Mais do que tentar encaixá-las em alguma dessas categorias, o jornalista
deve saber dessas características das bases de dados e das visualizações para
saber quando e como usá-las, assim como sabe quando um artigo opinativo é
adequado a alguma cobertura jornalística. Com isso, as bases de dados e as
visualizações podem – e devem – fazer parte do “cardápio” de um veículo
jornalístico.
Esse delineamento de qualidades das bases de dados e das visualizações
também deve ser considerado no momento de não usá-las. É necessário pensar se
disponibilizar uma base de dados é realmente útil para o leitor, ou se o uso de uma
visualização em um contexto de opinião não vai contradizer o articulista, por
exemplo. Assim como com todos os outros formatos jornalísticos existentes, é
necessário escolher – e editar – corretamente.
24
3 BASES DE DADOS
I read the news today oh, boy Four thousand holes in Blackburn, Lancashire
And though the holes were rather small They had to count them all
Now they know how many holes it takes to fill the Albert Hall (The Beatles, “A Day in the Life”)
O uso das bases de dados por parte do jornalismo está em um processo de
mudança, ficando mais comum dentro da redação e mais visível fora dela. Elas
ganharam cada vez mais espaço nas redações, primeiro como apoio para a
apuração e depois como um lugar para procurar informações que possam apoiar ou
inspirar reportagens. Nessa transição, as bases de dados estão se afirmando como
um novo formato. Por exemplo, é impossível citar, em uma reportagem, a taxa de
analfabetismo de todos os municípios brasileiros; mas é possível fornecer ao leitor
uma ferramenta na qual ele possa consultar a taxa do seu município.
Essas possibilidades implicam na edição e tratamento das informações,
além da criação de uma interface para que o usuário possa navegar e fazer
consultas. Porém, poucos dados podem ser consultados de cada vez. A outra
abordagem possível, que permite a apreensão de todos os dados simultaneamente,
é a visualização. Os dados são a origem de uma visualização e a principal razão de
produzi-las. E o recurso de poder visualizar os dados deveria estar sempre presente
em redações onde sejam usadas informações desse tipo.
3.1 BREVE HISTÓRICO E CONCEITOS
Em primeiro lugar, é necessário pensar nos diferentes definições de base de
dados. Começaremos por um conceito oriundo da ciência da computação, citado por
Manovich:
Nas ciências da computação, a base de dados é definida como uma coleção de dados estruturada. Os dados armazenados em uma base de dados estão organizados para permitir sua rápida busca e recuperação usando um computador e, portanto, a base é tudo exceto uma simples coleção de itens. Diferentes tipos de bases de dados – hierárquicas, de rede, relacionais e orientadas ao objeto – usam diferentes modelos para organizar os dados. […] Eles aparecem como coleções de itens nos quais o usuário
25
pode fazer várias operações: ver, navegar, buscar. (MANOVICH, 2001, p. 194).9
O conceito citado por Manovich é amplo o bastante para incluir os bancos de
dados usados nos primórdios da informatização das redações, entre meados dos
anos 60 e começo dos 70. Nessa época, a função dos bancos de dados era servir
de apoio à redação, em uma espécie de biblioteca digital com enciclopédias,
resumos de artigos, fontes para ajudar na produção de matérias (BARBOSA, 2007,
p. 104).
Esse começo levou ao surgimento da RAC – Reportagem Assistida por
Computador, que é a ideia de usar computadores para obter informação para as
notícias (GARRISON apud BARBOSA, 2007, p. 109). A RAC passou por mutações
em meados dos anos 90, com a popularização da Internet, e continuará mutando, à
medida que novas ferramentas sejam criadas.
Além da maneira de produzir reportagens, o uso de computadores e a
popularização da web também influenciou na maneira de transmiti-las. Isso pode ser
visto comparando as três gerações de webjornalismo (MIELNICZUK, 2003, p. 29): a
primeira, que é a transposição do formato do jornal impresso para a internet; a
segunda, quando começaram a ser usados alguns recursos interativos e a terceira,
onde os recursos próprios da internet começam a ser usados de maneira mais
natural e valorizando a interação com o leitor.
É no webjornalismo de terceira geração que começa a se pensar na base de
dados menos como um depósito das informações de um site de notícias
(MACHADO, 2007, p. 117) e mais como um elemento independente, com caráter
jornalístico e uma edição específica. Em qualquer uma dessas abordagens, a base
de dados é indispensável para a existência do webjornalismo.
Pensando na sua função como repositório de informações de um site, é
necessária para possibilitar o envio e exibição de textos, fotos e vídeos, entre outros,
que componham uma notícia. Essa ideia é coerente com o conceito de Manovich, de
que serão elas quem estruturão os novos objetos midiáticos: “todos os objetos da
9 Tradução do autor. Texto original: “In computer science database is defined as a structured collection of data. The data stored in a database is organized for fast search and retrieval by a computer and therefore it is anything but a simple collection of items. Different types of databases — hierarchical, network, relational and object-oriented — use different models to organize data. […] They appear as a collections of items on which the user can perform various operations: view, navigate, search.”
26
nova mídia, sejam eles criados desde o início em computadores ou convertidos a
partir de fontes analógicas, são compostas de código digital; eles são
representações numéricas.” (MANOVICH, 2011, p. 49).10
É importante destacar que uma base de dados, tanto nos conceitos citados
como no recorte para esta pesquisa, não necessariamente é composta por números;
é possível trabalhar com todo tipo de informações e, inclusive, todo tipo de mídias,
como será visto nos exemplos apresentados no decorrer do trabalho.
Na sua função como um elemento jornalístico, ela é fundamental para
associar outras informações, como outras notícias, através de elementos
hipertextuais, além de cumprir o papel de um arquivo cada vez mais dinâmico e fácil
de acessar, ou até, segundo Machado, como “um espaço para a composição de
narrativas multimídia” (MACHADO, 2007, p. 111).
Nesses dois casos, é possível pensar no meio por onde se tem acesso a
essa base de dados (geralmente um site de notícias, mas também agregadores,
leitores de RSS, ou até SMS) como uma interface entre a base de dados e o leitor. É
possível aplicar a seguinte ideia de Manovich:
Alguns objetos de mídia seguem explicitamente a lógica das bases de dados em sua estrutura enquanto outras não; mas por debaixo da superfície praticamente todos são bases de dados. Geralmente, a criação de um trabalho de novas mídias pode ser entendida como a construção de uma interface para uma base de dados. (MANOVICH, 2001, p. 200)11
Tanto na função de motor como na função jornalística, as bases de dados
são, na maioria dos casos, um elemento invisível ao leitor. Porém, elas estão ficando
cada vez mais em evidência como objeto de mídia, ou, para este trabalho, como
formato jornalístico.
3.2 BASES DE DADOS COMO FORMATO DENTRO DO WEBJORNALISMO
Mielniczuk (2003, p. 39) define seis características do webjornalismo:
interatividade, personalização, hipertextualidade, multimidialidade ou convergência,
10 Tradução do autor. Texto original: “All new media objects, whether they are created from scratch on computers or converted from analog media sources, are composed of digital code; they are numerical representations.” 11 Tradução do autor. Texto original: "Some media objects explicitly follow database logic in their structure while others do not; but behind the surface practically all of them are databases. In general, creating a work in new media can be understood as the construction of an interface to a database."
27
memória e instaneidade ou atualização contínua. Essas características se
encontram presentes também quando deixamos de pensar nas bases de dados
como um motor de um site de notícias e começamos a pensá-las como produto
jornalístico: graças à interação conseguimos informações personalizadas, o
hipertexto faz parte dessa interação, e os dados são preservados e atualizados
constantemente. No que se refere à multimidialidade, podemos considerar que as
bases de dados se juntam às fotografias e vídeos como mais um elemento.
Fidalgo (2007, p. 109), além de reafirmar a validade do formato jornalístico,
considera a base de dados como um conjunto que pode chegar ao infinito. Segundo
ele, as bases de dados podem ser acrescidas de cada vez mais dados,
considerando os novos campos como vértices, arestas e planos de um poliedro que
vai se aproximando da forma de uma esfera, metáfora da totalidade absoluta dos
dados, o que estaria alinhado com a relação de “completude” apontada por Groth
como fundamental para o jornalismo (GROTH apud FIDALGO, 2007, p. 108). Apesar
que Fidalgo se refere à totalidade de informações de um site de notícias, podemos
aplicar esse pensamento às bases de dados editadas. Por exemplo, uma base com
informações de alguns municípios do Paraná pode se expandir até ter informações
de todos os municípios, e talvez de todos os municípios do Brasil, em sintonia com
os conceitos de “completude” e atualização contínua.
3.3 BASES DE DADOS COMO PRODUTO JORNALÍSTICO
McLuhan (1969, p. 38) citava a baixa resolução como uma característica da
televisão. Os espectadores têm que preencher a imagem, imaginar o que está fora
dela, pensar nos detalhes menores que as então grandes linhas que formavam a
imagem não conseguiam mostrar, e, à época, também imaginar as cores. Essa
limitação técnica do suporte é análoga à que acontece com outros suportes e,
consequentemente, com seus produtos jornalísticos.
Textos têm um tamanho limitado pelos projetos gráficos e editoriais de
jornais e sites, além das limitações das mídias, como a limitação de espaço físico
em páginas de mídias impressas e de cansaço ao ler em telas que emitem luz. O
corte de informações em fotografias se dá já na instância do clique, onde a decisão
varia entre o excesso de informação de uma grandeangular e a menor deformação
de uma teleobjetiva. Ajustes de exposição, contraste e saturação das cores também
28
implicam na escolha de informação que vai ficar de fora, e por último, o espaço
destinado a elas em uma publicação, impressa ou online, determina que tantos
detalhes serão visíveis. Infográficos jornalísticos permitem a convivência de
informações em várias linguagens, mas sofrem as mesmas limitações das diferentes
linguagens que eles combinam. Essas possibilidades e limitações exigem processos
de edição específicos, nos quais além da atividade do gatekeeper (BAHIA, 1990)
temos as edições que são necessárias por limitações técnicas dos meios, como a
falta de espaço12.
Pensar a base de dados dentro dos diferentes gêneros jornalísticos pode
ajudar a analisá-la como linguagem. Como o termo “base de dados” diz respeito à
forma que a informação tem, o gênero e/ou a função pode ser definido a partir da
decisão do jornalista do que é necessário mostrar, como será mostrado, e como
sera lida, usada ou visualizada pelo leitor.
Como sua premissa é apresentar ao leitor a totalidade da informação,
Fidalgo aponta o problema de como conjugar a concisão que uma notícia deve ter
com a complexidade inerente à alta densidade de dados, principalmente no que se
refere à sua compreensão: “A alta resolução semântica não deve descambar num
complexo sistema informativo de difícil apreensão” (FIDALGO, 2007, p. 106). Como
solução, Fidalgo propõe uma navegação facilitada pelas diferentes “camadas
semânticas”, que podemos associar com a ideia de layering de Tufte (1990, p. 53)
que veremos mais adiante.
Para este trabalho, consideraremos a base de dados como um conjunto de dados que foram selecionados e editados para um determinado propósito
(grifo meu), como explorá-los para conseguir uma visualização ou divulgá-los ao
público mediante uma interface. Essa edição se dá não na quantidade dos dados,
mas sim nas suas qualidades, como veremos adiante. Note-se que essas bases de
dados não necessariamente estarão online, mesmo que seus dados tenham sido
obtidos dessa maneira.
12 Também é possível fazer esta edição levando em consideração o interesse do leitor como parte de um público alvo, mas isso não será levado em consideração neste trabalho.
29
3.4 DADOS E FERRAMENTAS AO ALCANCE DE TODOS
Estamos passando por um momento no qual se debate se há abundância ou
excesso de dados. Mesmo assim, houve uma melhora no acesso à informação e a
recursos informáticos, como descrito por Dominique Wolton:
Também para o acesso às bases de dados que o progresso é real. Acessar, escolher, circular por si mesmo e fazer a sua própria informação permitem não somente ganhar tempo, mas também acessar “reservas” de conhecimento totalmente imprevisíveis. (WOLTON, 2007, p. 87).
Esse progresso nos dados e nas ferramentas para analisá-los se reflete no
uso desses recursos por parte do jornalismo. A ideia de “fazer a sua própria
informação”, presente já no surgimento da RAC, é reforçada pelos recursos
disponíveis para jornalistas, para o público em geral, e pelos recursos
disponibilizados pelo jornalismo para o público em geral. Essa proposta está
alinhada com a filosofia do Open Data13 e a da transparência política, no qual se
defende que a população em geral tenha acesso aos dados de gastos dos órgãos e
funcionários públicos.
O jornalismo sempre teve a função de ser intermediário entre os dados e os
leitores, mas essa função adquire novos significados com essa enxurrada de dados.
A função tradicional seria a exploração desses dados em busca de notícias, o que
foi facilitado pela tecnologia. E pouco depois a tecnologia facilitou também novas
formas de mostrar essas informações aos leitores, que, segundo Tufte, conseguem
sobreviver à enxurrada:
Nós prosperamos em mundos cheios de informação graças às nossas maravilhosas e cotidianas capacidades para selecionar, editar, isolar, estruturar, destacar, agrupar, formar pares, mesclar, harmonizar, sintetizar, focar, organizar, condensar, reduzir, escolher, categorizar, catalogar, classificar, listar, abstrair, escanear, observar, isolar, discriminar, distinguir, separar, rotular, ordenar, integrar, misturar, verificar, filtrar, ignorar, fazer médias, aproximar, agregar, resumir, dividir em itens, rever, mergulhar, folhear, olhar, ler rapidamente, refinar, enumerar, extrair informações, fazer sinopses e separar o joio do trigo (TUFTE, 1990, p. 50)14.
13 Open Data é a filosofia ou prática que defende que certos tipos de dados estejam disponíveis para a população de modo geral, sem restrições de patentes nem direitos autorais. 14 Tradução do autor. Texto original: “We thrive in information-thick worlds because of our marvelous and everyday capacity to select, edit, single out, structure, high-light, group, pair, merge, harmonize, synthesize, focus, organize, condense, reduce, boil down, choose, categorize, catalog, classify, list, abstract, scan, look into, idealize, isolate, discriminate, distinguish, screen, pigeonhole, pick over, sort,
30
Todos esses fatores apontam para a consolidação das bases de dados
como produto jornalístico. Nesse aspecto, Barbosa aponta um possível cenário
futuro, fruto da evolução das bases de dados como produto jornalístico:
Logo, a nossa tarefa de compreender a atribuição de um novo status para as BDs [Bases de dados] no jornalismo digital nos leva a considerar que as mudanças conformadas a partir da concepção de bases de dados como um formato e metáfora para o jornalismo digital podem gerar o diferencial para essa modalidade, conduzindo-a a uma nova etapa de desenvolvimento. Quem sabe, à quarta geração. (BARBOSA, 2005, p. 11).
Nessa quarta geração prevista por Barbosa certamente há espaço para as
bases de dados como formato jornalístico, e, portanto, para a visualização. Apesar
de bases de dados e visualizações não serem objetos necessariamente ligados ao
jornalismo online, é ali onde encontram espaço e possibilidades para a criação de
novas narrativas e a afirmação do digital como meio.
integrate, blend, inspect, filter, lump, skip, smooth, chunk, average, approximate, cluster, aggregate, outline, summarize, itemize, review, dip into, flip through, browse, glance into, leaf through, skim, refine, enumerate, glean, synopsize, winnow the wheat from the chaff and separate the sheep from the goats.”
31
4 VISUALIZAÇÃO: DA UNIDADE AO CONJUNTO
4.1 DEFINIÇÃO
Apesar de o termo visualização já estar associado ao objeto deste trabalho –
gráficos complexos que representam grandes volumes de dados – tentaremos
chegar a uma definição ampla o suficiente para abarcar tanto os trabalhos já
existentes (como os que serão analisados) como os que possam surgir, em um
processo indutivo, partindo do extremo mais simples, para depois chegarmos a
exemplos mais complexos, como os analisados neste trabalho.
Começaremos com uma pergunta de Tufte: “O mundo é complexo,
dinâmico, multidimensional; o papel é estático, plano. Como representar o rico
mundo visual de experiência e mensuramentos na mera planolândia? (TUFTE, 1990,
p. 9)15.
E com a definição do trabalho de Michael Friendly:
o termo visualização de informação geralmente se aplica à representação visual de coleções de grande escala de informação não numérica, como arquivos e linhas de código em programas, bases de dados bibliográficas, redes de relações na internet, e assim por diante. (FRIENDLY, 2009, p. 2)16
Mais adiante, Friendly fecha um pouco o conceito, se aproximando do foco
deste trabalho:
focamos no domínio, um pouco mais estreito, da visualização de dados, a ciência da representação visual de “dados”, definida como informação que foi abstraída de alguma maneira esquemática, incluindo atributos ou variáveis para as unidades de informação. (FRIENDLY, 2009, p. 2)17
Em “The Language of New Media” (MANOVICH 2007) é possível garimpar
algumas conceituações: “um mapeamento entre dados discretos e uma
15 Tradução do autor. Texto original: “The world is complex, dynamic, multidimensional; the paper is static, flat. How are we to represent the rich visual world of experience and measurement on mere flatland?” 16 Tradução do autor. Texto original: “the term information visualization is generally applied to the visual representation of large-scale collections of non-numerical information, such as files and lines of code in software systems, library and bibliographic databases, networks of relations on the internet, and so forth.” 17 Tradução do autor. Texto original: “we focus on the slightly narrower domain of data visualization, the science of visual representation of “data”, defined as information which has been abstracted in some schematic form, including attributes or variables for the units of information.”
32
representação visual” (p. 148), “comunicação de dados abstratos através do uso de
interfaces visuais interativas” (KEIM et al apud MANOVICH, 2007, p. 148) 18 e
“mapeamento de algumas propriedades dos dados em uma representação visual” (p.
151).
Essas três definições implicam na ideia de comunicar dados através de uma
transposição (da linguagem numérica para a visual) na qual, além de mudar o
código, é necessário editar o corpus (a base de dados) do que queremos evidenciar
para que este se adapte a nosso novo código; ou ainda adaptar o nosso código para
evidenciar melhor o que queremos mostrar do corpus.
Na TED Talk ministrada pelo jornalista e designer David McCandless, do site
Information is Beautiful, ele fala sobre visualizar informação:
através da visualização de informação, nós a transformamos [a informação] em uma paisagem que você pode explorar com seus olhos, uma espécie de mapa da informação. E quando você está perdido na informação, um mapa da informação pode ser útil. […] visualizar informação como esta é uma forma de compressão de conhecimento. É uma maneira e espremer uma quantidade enorme de informação e compreensão em um espaço pequeno (McCANDLESS, 2010).19
Por último, temos a opinião de Antony Unwin:
Porquê visualizar dados é importante? A visualização de dados é boa para limpar dados, para explorar dados […], para identificar tendências e agrupamentos, para encontrar padrões locais, para avaliar modelos de output e para apresentar resultados. A visualização é essencial para a análise exploratória de dados. (UNWIN; THEUS; HOFMANN, 2006, p. 1, 2006)20
É interessante notar o conceito de input–output (entrada e saída) presente
nessas definições, nas quais o input são dados e o output é uma visualização. Isso
também nos remete ao princípio garbage in, garbage out, proveniente da ciência da
18 Manovich cita essa definição para falar de como o termo “visualização” é encarado por autores da ciência da computação 19 Tradução do autor: “By visualizing information, we turn it into a landscape that you can explore with your eyes, a sort of information map. And when you’re lost in information, an information map is kind of useful.” But what it points to is that visualizing information like this is a form of knowledge compression. It;s a way of squeezing an enormous amount of information and understanding into a small space. 20 Tradução do autor: “Why is visualizing data important? Data visualization is good for data cleaning, for exploring data […], for identifying trends and clusters, for spotting local patterns, for evaluating modelling output and for presenting results. Visualization is essential for Exploratory Data Analysis.
33
computação, que diz que a qualidade do output depende da qualidade do input
(LIDWELL; HOLDEN; BUTLER, 2003, p. 94). Esse princípio se aplica às
visualizações (e também às bases de dados, quando usadas como formato): para
que sejam de qualidade, é necessário atentar para a qualidade das bases de dados.
A partir de todas estas definições, podemos tentar definir o termo
“visualização” como uma representação visual de um número geralmente grande de dados que possam ser representados numericamente (grifo meu). Porém,
esta definição gera algumas ambiguidades que servirão para pôr o conceito à prova:
4.1.1 Quanto é “grande”
Podemos pensar que um número de dados é “grande” quando não pode ser
entendido por si só e precisa ser comprendido com a ajuda de recursos como
comparações ou gráficos. O ponto em que um volume de dados se torna
incompreensível varia segundo o leitor, mas podemos afirmar que, à medida que a
quantidade de dados a serem lidos aumenta, a capacidade de apreender seu
significado e poder fazer relações entre eles diminui. É possível comparar dois
dados (a cotação do Dólar Comercial em 2 de janeiro de 2012 foi de R$ 1,86 e na
mesma data de 2011 foi de 1,65), mas a dificuldade aumenta quando colocamos
mais números (a cotação do Dólar Comercial em janeiro de 2012 foi de R$ 1,869 no
dia 2, R$ 1,832 no dia 3, R$ 1,827 no dia 4, R$ 1,841 no dia 5, R$ 1,851 no dia 6,
R$ 1,835 no dia 9, R$ 1,801 no dia 10, R$ 1,801 no dia 11, R$ 1,785 no dia 12,
R$ 1,790 no dia 13, R$ 1,788 no dia 16, R$ 1,780 no dia 17, R$ 1,767 no dia 18,
R$ 1,763 no dia 19, R$ 1,759 no dia 20, R$ 1,7521 no dia 23, R$ 1,753 no dia 24,
R$ 1,7632 no dia 25, R$ 1,744 no dia 26, R$ 1,739 no dia 27, R$ 1,749 no dia 30 e
R$ 1,747 no dia 31).
O número de dados também é “grande” porque a premissa da visualização é
que os dados sejam exibidos em sua totalidade (MANOVICH, 2007, p. 157), sem
que haja cortes. Unwin justifica: “se um conjunto de dados é tão grande, porquê
simplesmente não pegar uma grande amostra? Mas amostras não vão mostrar as
34
exceções, estruturas locais, ou erros sistemáticos nos dados” (UNWIN; THEUS;
HOFMANN, 2006, p. 1)21
4.1.2 O que é “visual”
Quando o Produto Interno Bruto (PIB) é divulgado como variação, e não
como número absoluto, há uma tentativa de representar valores maiores de uma
maneira mais acessível, em um processo de intenções similares às da visualização.
É mais fácil entender que houve um aumento de 7,5% do que saber que em 2009 o
PIB foi de R$ 3,143 trilhões e em 2010 de R$ 3,675 trilhões. Temos então uma
espécie de visualização na qual dados numéricos são simplificados e representados
em linguagem oral. Outro exemplo poderia ser uma comparação oral ou metáfora,
como dizer “o coração é do tamanho de um punho fechado”. Temos então que uma
visualização não precisa, necessariamente, ser “visual”. Os exemplos anteriores
geram uma visualização mental no receptor da mensagem. Temos também a
possibilidade de visualizações sonoras. Um exemplo é o infográfico “The Dow Piano”,
no qual notas mais graves representam níveis mais baixos do índice Dow Jones, a
intensidade do som reflete a quantidade de operações e o ritmo das notas
representa as semanas. (EDLUND, [2011?]). Outras possibilidades são as
explorações sonoras, como o projeto do DJ Ramjac, que sobrepôs, em uma única
faixa sonora, todas as músicas gravadas pelos Beatles (RAMJAC, [2011?]); ou o
trabalho de Mike Lacher, que sobrepôs todos os hits de Billy Joel (LACHER, [2010?]).
Esse tipo de experiência tem pontos em comum com a visualização no que se refere
à busca de padrões, por exemplo. Como mais uma experiência de “visualização não
visual”, temos o projeto de Matthew Epler, “Grand Old Party” (EPLER, 2012), que
consta de uma série de brinquedos sexuais com a forma do gráfico de popularidade
dos pré-candidatos republicanos à presidência dos Estados Unidos. Nesse caso, a
proposta é de uma visualização tátil que faz uma analogia sexual com as
consequências de um governo republicano.
21 Tradução do autor. Texto original: “You might ask, if a dataset is so large, why not just take a big sample? But samples will not pick out outliers, local structures, or systematic errors in the data.”
35
Embora os exemplos citados ainda estejam no campo da exceção, o
surgimento dessas “visualizações não visuais” atentam para que o termo “visual”
não seja encarado literalmente. Isso aumenta as possibilidades da linguagem da
visualização e inclusive permitiria pensar em visualizações acessíveis a deficientes
visuais, por exemplo.
4.1.3 Quais dados podem ser representados numericamente
Como veremos adiante, há várias formas de representação gráfica
adequadas a vários tipos de dados. Mas todas essas representações implicam em
mostrar quantidades. Se os dados surgem como numéricos, não há problemas. Mas
os dados que não sejam numéricos precisam ser transformados em números,
mesmo que esses números sejam uma tentativa de expressar subjetividades (como
podem ser notas de 0 a 10 atribuídas a filmes) ou uma classificação (dividir animais
em vertebrados e invertebrados pode ser transformados nas categorias 1 e 2, por
exemplo). Em toda visualização é comunicada uma quantidade que estará presente
mesmo que representada de diferentes maneiras.
Considerando as ambiguidades da definição, podemos encontrar alguns
exemplos que se encaixariam na ideia de visualização (apesar de serem bem mais
simples do que o tipo de trabalho que será analisado), vejamos:
Uma pesquisa hipotética que aponta que 450 dos 600 entrevistados são
torcedores de determinado time pode ser traduzido como “75% dos entrevistados”, o
que pode ser representado com um gráfico de pizza.
A informação de que o PIB brasileiro cresceu 7,5% em 2009, fruto de
operações matemáticas entre valores de difícil comparação.
Um mapa localizando uma cidade. A localização da cidade pode ser
traduzida em termos de latitude e longitude.
Uma criança mostrando com as mãos o quanto gosta de alguém, ou gesto
similar (Fig. 2).
36
Bono Vox batendo palmas em um certo ritmo, representando o fato que a
cada palma que ele batia uma criança morria na África – ao que alguém da plateia
respondeu “então para de bater!”22
Fig. 2 Exemplo de visualização subjetiva de dados reais, na figura do Professor Raymundo,
personagem de Chico Anysio. Fonte: AUDIÊNCIA, 2012.
Todos os exemplos citados são reduções de vários dados numéricos a um
único valor (que não necessariamente é expressado como número), e têm o objetivo
de melhorar sua compreensão para um receptor. Mesmo não sendo tão necessárias
do ponto de vista da compreensão numérica, facilitam a compreensão, e podem ter
também uma função poética de causar uma reação. Essas visualizações,
extremamente simples, são os elementos para começar a construir visualizações
mais complexas, nas quais o objetivo de esclarecer a infomação não só se mantém
mas se torna mais necessário, já que estamos pensando em milhares ou milhões de
dados em uma única visualização.
Voltemos ao trabalho “See Something or Say Something” (Fig. 1), de Eric
Fischer (2011) para pôr novamente a definição à prova, desta vez com uma
visualização mais complexa. O trabalho mapeia a localização de tweets e de fotos
armazenadas no Flickr. Nele temos um volume grande de tweets e de fotos, que
configuram um número de dados grande, praticamente impossíveis de serem
processados à mão ou lidos. Os dados analisados podem ser representados
22 O fato não é verídico, segundo o site especializado em desmentir rumores Snopes (BONO, 2008), mas foi mantido aqui por ser um bom exemplo.
37
numericamente, já que o lugar onde foi emitido um tweet ou onde foi postada uma
foto no Flickr é transformado em coordenadas GPS já na base de dados dos sites
(ou na própria câmera ou celular, no caso das fotos). Por último, temos que os
dados são representados de maneira visual, com cores definindo o que é cada ponto
e as coordenadas GPS sendo representadas de maneira espacial, refazendo os
mapas das cidades. Esse trabalho reúne as melhores características de uma
visualização, principalmente no que se refere a identificar padrões. Os pontos que
representam fotografias se acumulam em pontos turísticos, e os pontos que
representam tweets são visíveis em lugares de passagem, como o aeroporto do
Galeão e a ponte Rio–Niterói. Notemos ainda que o mapa não aparece, e sim é
delineado pela posição dos pontos.
4.2 DIFERENÇAS ENTRE VISUALIZAÇÃO E INFOGRAFIA
Dada a proximidade das duas atividades e o uso dos termos no presente
trabalho, é necessário fazer uma observação sobre as diferenças entre a infografia e
a visualização. De Pablos define a infografia de uma maneira ampla: “é a
apresentação impressa de um binômio imagem + texto […] qualquer que seja o
suporte onde se apresente essa união informativa: monitor, papel, plástico, barro,
pergaminho, papiro, pedra (DE PABLOS, 1999)23. Um infográfico poderia, então,
conter mais elementos visuais além das visualizações, alguns dos quais apontados
por Gonzalo Peltzer: mapas, símbolos, ilustrações, histórias em quadrinhos, etc24
(PELTZER, 1991).
Para exemplificar, foi escolhido o infográfico "La ballena Franca", de autoria
de Jaime Serra, publicado pelo jornal argentino Clarín em 1995. A obra foi premiada
nos prêmios Malofiej25 como o melhor infográfico dos últimos 20 anos (CLARÍN,
2012), e, por isso, representaria um exemplo de como é um infográfico dentro dos
"cânones" tradicionais da infografia.
23 Tradução do autor. Texto original: "es la presentación impresa de un binomio imagem + texto […], cualquiera que sea el soporte donde se presente esa unión informativa: pantalla, papel, plástico, barro, pergamino, papiro, piedra." 24 Peltzer não usa o termo infográfico ou infografia com o mesmo sentido que De Pablos, mas aqui foram usados os gêneros visuais por ele enumerados por serem bons exemplos das possibilidades de imagens a que De Pablos se refere. 25 Prêmios internacionais de infografia, entregues anualmente na Espanha.
38
Nele, foram destacados quais os elementos que estão dentro do conceito
aqui abordado de visualização, ou seja, que são representações visuais de dados
numéricos. Os outros elementos se encaixam nos elementos visuais apontados por
Peltzer, mas fogem do conceito aqui abordado de visualização.
Fig. 3 Uso de visualizações no infográfico "La ballena Franca" (destaques meus). Fonte do original: CLARIN, 2012.
A definição de De Pablos também incluiria trabalhos como o já visto “See
Something or Say Something” (Fig. 1), já que além da visualização em si, temos um
elemento textual imprescindível para sua compreensão, que é a explicação de como
ler a visualização. Chamar um material com essas características – visualização
densa acompanhada de legendas ou instruções de leitura – de infográfico seria
aceitável, mas no presente trabalho será preferido o termo visualização quando ela
for predominante.
39
5 FERRAMENTAS E ASPECTOS TÉCNICOS
Uma vez definido o que é uma visualização e qual seu possível papel dentro
do jornalismo, é possível começar a considerar quais conhecimentos são
necessários para que ela possa ser feita. É possível relacionar essa necessidade de
conhecimento com a citada por Wolton:
O limite aqui é a competência. O acesso a ‘toda e qualquer informação’ não substitui a competência prévia, para saber qual informação procurar e que uso fazer desta. O acesso direto não suprime a hierarquia do saber e do conhecimento.” (WOLTON, 2007, p. 87)
Transpondo a ideia de Wolton para o campo da visualização de dados,
podemos considerar que essa “competência” é a soma dos diferentes
conhecimentos necessários para realizar uma visualização. E ainda temos a questão
do “acesso direto”: quem faz uma visualização está facilitando o acesso à
informação, reduzindo essa necessidade de competência prévia da qual Wolton fala.
Quem faz uma visualização usa sua competência para que os leitores não precisem
usar as suas. Ben Fry (2008) define sete passos para chegar a uma visualização, que
podem ser agrupados em três fases: obtenção dos dados, escolha da forma de
visualizá-los e conseguir qualidade técnica na visualização. Esse agrupamento foi
feito para poder analisar, simultaneamente, os conhecimentos e ferramentas
necessárias em cada fase. O próprio Fry fala que “não se pode ser escravo desses
passos”26 (FRY, 2008, p. 6), mas serão analisados dessa maneira para abarcar o
maior número possível de situações.
5.1 OBTENÇÃO DOS DADOS
Dentro dos sete passos de Fry, os primeiros quatro estão diretamente
ligados à edição dos dados. O primeiro é obter os dados (acquire): “obtenha os
dados, seja de um arquivo em um disco ou de uma fonte em uma rede” (FRY, 2008,
p. 5)27. Neste momento, a dificuldade é medida pela maneira em que os dados estão
26 Tradução do autor. Texto original: ”these steps can’t be followed slavishly”. 27 Tradução do autor. Texto original: ”Obtain the data, whether from a file on a disk or a source over a network.”
40
disponibilizados. Por exemplo, se os dados estão disponibilizados em formato pdf, é
necessário convertê-los para um formato de texto. Ou, se os dados estiverem em
suporte físico, é necessário digitalizá-los.
O segundo é o processamento dos dados (parse): “dê uma estrutura ao
significado dos dados, e organize-os em categorias” (FRY, 2008, p. 5)28. É uma
primeira filtragem dos dados, útil para saber com que tipos de dados estamos
lidando.
O terceiro passo é filtrar (filter): “exclua tudo exceto as informações de
interesse”29 (FRY, 2008, p. 5). Tanto para este passo como para o anterior, uma
ferramenta útil é a técnica dos cinco cabides de Richard Saul Wurman (2001, p. 40–
45), que diz que há cinco maneiras de organizar a informação: por localização,
alfabética, cronológica ou de hierarquia.
O quarto passo é minerar (mine): “aplique métodos oriundos das estatísticas
ou mineração de dados como uma forma de identificar padrões ou colocar os dados
em um contexto matemático”30 (FRY, 2008, p. 5). Isso inclui cálculo de médias,
medianas, desvios de padrão, transformar números absolutos em relativos. Aqui
devemos cuidar para não haja redução nos dados (MANOVICH, 2007, p. 157).
5.1.1 Ferramentas para a manipulação dos dados
A opção mais óbvia para manipulação de grandes volumes de dados são as
planilhas eletrônicas, como Excel e OpenOffice. É possível usar um software de
banco de dados, como o Microsoft Access ou o sistema MySQL. Também pode ser
necessário o uso de editores de texto capazes de processar grandes volumes de
dados, como o TextWrangler, da BareBones. Em alguns casos, pode ser necessário
fazer uso de linguagens de programação. Yau (2011) cita o uso da linguagem
Python para fazer uma ferramenta específica para extrair dados de um site, na falta
de softwares “prontos” que realizassem essa tarefa.
28 Tradução do autor. Texto original: ”Provide some structure for the data’s meaning, and order it into categories.” 29 Tradução do autor. Texto original: ”Remove all but the data of interest. 30 Tradução do autor. Texto original: ”Apply methods from statistics or data mining as a way to discern patterns or place the data in mathematical context.”
41
5.2 APRESENTAÇÃO DOS DADOS
O quinto passo de Fry é representar (represent). Fry sugere escolher um
modelo de base entre formatos básicos e conhecidos, como gráficos de linha ou de
barras, gráficos de variação de cor, mapas e plantas, e um longo etcétera.
Geralmente essa forma básica escolhida é adequada para mostrar uma das
dimensões da base de dados, e por isso modificações podem ser necessárias, como
aponta Manovich:
Acredito que a maioria das práticas de visualização de informação da segunda metade do século XVIII até hoje seguem o mesmo princípio - reservando arranjo espacial (podemos chamá-lo de “layout”) para as dimensões mais importantes dos dados, e usando outras variáveis visuais para as dimensões remanescentes (MANOVICH, 2007).
Assim como é necessário experimentar com várias formas de representação,
pode ser necessário retornar à edição dos dados.
É neste passo que as informações latentes começam a ficar evidentes. Essa
apresentação dos dados pode ser suficiente se a visualização estiver sendo usada
como ferramenta do jornalista e não como um produto final.
Temos então o sexto passo, refinar (refine), que diz “melhore a
representação básica para deixá-la mais clara e mais atraente”). O refinamento da
visualização pode implicar em mudanças na estrutura básica escolhida, cruzando
características de mais tipos de visualização, ou em mudanças na escolha dos
dados representados, talvez graças à percepção da possibilidade de incluir mais
variáveis visuais para representar mais dados. Novamente pode ser necessário
voltar aos dados, para escolher novos ou substituir dados que não estejam
funcionando.
Deixar a informação mais atraente não quer dizer decorá-la. Tufte é
categórico ao se manifestar contra qualquer tipo de decoração nos dados em si:
Se seconder por trás de chartjunk é menosprezar tanto a informação como a audiência. Os defensores do chartjunk imaginam que números e detalhes são chatos, desinteressantes e tediosos, e precisam de ornamentos para ter
42
vida. A decoração cosmética, que frequentemente distorce os dados, nunca vai salvar a falta de conteúdo (TUFTE, 1990, p. 34). 31
5.2.1 Ferramentas para fazer a apresentação dos dados
Novamente os softwares de planilhas de cálculo são úteis. Eles têm a
possibilidade de gerar gráficos a partir dos números presentes na planilha. Esses
gráficos podem ser impressos ou transpostos para programas de edição de imagens,
como o Adobe Illustrator, para serem finalizados.
Temos também ferramentas de visualização disponíveis na web, que
permitem que o usuário envie seus dados. O usuário precisa escolher algumas
opções que afetarão os dados. Exemplo disso é o site Many Eyes e o site de gerar
nuvens de tags, Wordle. Podemos incluir nesta categoria o software Tableau, que
exige que o usuário baixe um programa para fazer as visualizações antes de
disponibilizá-las no site, e o Google Maps, que disponibiliza APIs que podem ser
úteis.
Tanto as planilhas como as ferramentas da web esbarram em uma questão
levanteda por Fry: “uma ferramenta que tem usos genericos vai produzir somente
gráficos genéricos, que podem ser decepcionantes se os gráficos não se adaptam a
sua base de dados”32(2008, p. vii). Para certas situações, o mais indicado é
construir uma ferramenta específica para as necessidades, e isso pode ser feito com
programação.
Há várias linguagens de programação que podem ser usadas, mas
destacaremos aqui a escolhida por Fry para ensinar a fazer visualizações:
Processing, uma linguagem inicialmente concebida para auxiliar no aprendizado de
programação, e por isso mostrava resultados visuais. Pela sua simplicidade, é fácil
de aprender, o que facilita o acesso por parte de artistas e designers.
31 Tradução do autor. Texto original: “Lurking behind chartjunk is contempt both for information and for the audience. Chartjunk promoters imagine that numbers and details are boring, dull, and tedious, requiring ornament to enliven. Cosmetic decoration, which frequently distorts the data, will naver salvage an underlying lack of content.” 32 Tradução do autor. Texto original: “a tool that has generic uses will produce only generic displays, which can be disappointing if the displays do not suit your data set
43
5.3 CONSEGUIR QUALIDADE TÉCNICA NA REPRODUÇÃO DA VISUALIZAÇÃO
O último passo é a interação (interact): “acrescente métodos para manipular
os dados ou controlar quais aspectos serão visíveis” (FRY, 2008, p. 5).
Considerando que o livro de Fry se trata especificamente de visualizações
construídas na linguagem Processing, que têm a possibilidade de serem interativas,
podemos tornar este passo mais genérico e pensar nele como o momento de avaliar
qual o suporte mais adequado para a visualização gerada.
A interação não é algo obrigatório em uma visualização, e às vezes pode
complicar desnecessariamente a experiência. É o caso do infográfico animado do
lançador Mariano Riviera, publicado pelo NYT (CARTER, S.; GRAHAM R.; WARD,
J., 2010). Shan Carter, editor de interação do jornal, afirma:
“decidimos que seria mais interessante mostrar aos usuários o quê era interessante, mais do que exigir que eles o encontrassem por si mesmos. Estavamos tentando mostrar o que faz de Rivera o melhor – deixar que um usuário navegasse por todos os seus lançamentos não era a maneira mais efetiva de fazer isso.”33 (CARTER apud GONZÁLEZ VEIRAS, 2010)
5.3.1 Escolha do suporte
Como vimos anteriormente, uma visualização é uma forma de output de uma
base de dados editada para esse fim. Esse output pode se dar de três maneiras,
segundo Manovich (2007): estática, típica de suportes impressos; dinâmica, com
presença de elementos animados, mas sem possibilidade de interação; e interativa,
onde o leitor interage fazendo escolhas sobre quais dados ver ou como vê-los.
Notemos que essa classificação não está diretamente ligada ao suporte, já que é
possível que visualizações estáticas sejam usadas na internet ou vídeo, assim como
é possível considerar as possibilidades de interação que um leitor tem com o papel.
Cada uma dessas formas de output tem características que não
necessariamente devem ser pensadas como limitadoras; pelo contrário, devem ser
consideradas as vantagens específicas de cada uma. Visualizações em papel, por
exemplo, podem se aproveitar dos sistemas de pré-impressão, que alcançam uma
33 Tradução do autor. Texto original: “we decided it would be more interesting to show users what was interesting rather than requiring them to find it themselves. We were trying to show what makes Rivera the best — allowing a user to browse all his pitches wasn’t the most effective way of doing that.”
44
qualidade de até 2400 dpi (pontos por polegada) quando se utilizam tintas puras
(TUFTE, 1990, p. 81–95). Já as telas de cristal líquido mais recentes chegam a 326
dpi, como a tela “retina” do iPhone, mas oferecem muito mais possibilidade de cores.
Outra peculiaridade do papel é seu tamanho: uma folha de jornal tem em média 30
centímetros de largura x 52 centímetros de altura, o que equivaleria a uma tela de
cristal líquido de 32 polegadas, mas com uma resolução muito maior. Ainda é
possível escolher as possibilidades de interação – inclusive lúdicas – quando
usamos meios electrónicos, as possibilidades de movimento quando usamos vídeo e
as possibilidades de interação do papel, que passam pela manipulação que o leitor
faz do objecto.
A alta resolução semântica citada anteriormente (FIDALGO, 2006) precisa
ser acompanhada por dispositivos que permitam exibi-la; o que inclui o papel. As
telas de cristal líquido já alcançam 326 pixels por polegada (no caso do iPhone 4,
por exemplo). A tecnologia Oled34 permite telas com uma taxa de contraste de
1:1000000, o que permite maior quantidade de cores e tons perceptíveis. Manovich
cita um dispositivo de visualização, composto de 70 monitores de cristal líquido, que
chega a 35.840 por 8.000 pixels. E a impressão, a rigor, permite resoluções de até
2400 dpi, o que ainda é muito superior às telas. Mesmo que dados representados
graças a essas tecnologias sejam difíceis de serem vistos, é necessário que estejam
ali. O acúmulo de pontos minúsculos gera uma área que significa algo. Esses dados
tem que ser sentidos, mais do que lidos. Estes recursos permitem que as
visualizações sigam o princípio de visualização sem redução de Manovich (2007).
Porém, é possível usar recursos de hipertexto para superar os limites do
suporte e acrescentar camadas de informação: zoom ou mouseover35 para ler dados.
No papel, é possível usar várias folhas de papel e referências. Esses elementos de
hipertexto podem tanto acrescentar camadas de informação como ter uma função
similar à de uma legenda.
O importante é não tentar que um suporte tenha as características de outro.
Não é possível fazer zoom numa folha de jornal, nem mostrar uma imagem do
tamanho de um poster em uma tela de celular.
34 Sigla para Organic Light-Emitting Diode (diodo orgânico de emissor de luz) 35 Ato de passar o cursor do mouse por cima de algum elemento de um produto multimídia, sem clicar.
45
6 ANÁLISE DE INFOGRÁFICOS E VISUALIZAÇÕES
6.1 HOW MARIANO RIVERA DOMINATES HITTERS, THE NEW YORK TIMES
Fig. 4 Frame do infográfico em vídeo "How Mariano Rivera Dominates Hitters". Fonte: CARTER; GRAHAM; WARD, 2010.
O infográfico, publicado em 29 de junho de 2010 no site do jornal nova-iorquino
The New York Times, é apresentado em forma de vídeo, com 2 minutos e 40
segundos de duração. Se trata de um vídeo normal, sem nenhuma possibilidade de
interação. Foi produzido por Shan Carter, Graham Roberts e Joe Ward (CARTER;
GRAHAM; WARD, 2010) e o processo de produção foi descrito pelo chefe de
gráficos do jornal (GONZÁLEZ VEIRAS, 2010).
Fig. 5 trecho da base de dados dos lançamentos de Rivera. Fonte: GONZÁLEZ VEIRAS, 2010.
A base de dados usada consiste nos dados de 1,3 mil lançamentos feitos pelo
jogador Mariano Rivera durante 2009, que foram compilados pela empresa
Complete Game Consulting (Fig. 5). Para visualizar esses dados, a equipe do jornal
46
desenvolveu, usando a linguagem Processing, um pequeno programa para poder
dar forma a esses dados (Fig. 6). “A visualização os ajudou a decidir quais dados
tinham que ser mostrados e como deveriam mostrá-los” (GONZÁLEZ VEIRAS,
2010)36. Segundo um dos autores do infográfico, Shan Carter, em entrevista a
Xaquín González Veiras:
“Escrevemos o aplicativo para poder explorer os dados e experimentar com diferentes modelos de interação”, diz Shan. Apesar de que todos sabemos que há uma certa beleza em explorar os dados por si próprio, “no fim das contas”, continua Shan, “decidimos que seria mais interessante mostrar ao usuário o que era interessante, ao invés de fazê-lo descobrir por si mesmo o relevante. A intenção era mostrar o quê fazia de Rivera o melhor – e deixar o usuário explorar todos seus lançamentos não era a maneira mais eficiente de consegui-lo” (GONZÁLEZ VEIRAS, 2010).37
Decidido o formato do infográfico, outras instâncias de infográficos foram
produzidas, como as animações explicando os diferentes tipos de lançamentos
feitos pelo arremessador Mariano Rivera, e como é difícil para o rebatedor prever
qual tipo será feito. Então, aparece uma visualização animada na qual aparecem
representados ao mesmo tempo todos os lançamentos feitos por Rivera no ano de
2009 (Fig. 4). A partir dessa visualização, é feito um corte que mostra os
lançamentos como uma nuvem de calor do ponto de vista do rebatedor, divididos
pelo tipo de rebatedor – destros ou canhotos –, mostrando que Rivera quase não faz
lançamentos na região onde seria mais fácil que as bolas sejam rebatidas.
A “nuvem” de bolas é congelada e um movimento de câmera posiciona o leitor
no lugar do rebatedor (Fig. 7). Joe Ward, também em entrevista a González Veiras,
explica essa decisão: “É difícil reconhecer o lançamento a tempo para que o
rebatedor mova o taco na direção correta. Por isso decidimos congelá-los nesse
momento, no qual o rebatedor tem que tomar a decisão.” (GONZÁLEZ VEIRAS,
2010).38
36 Tradução do autor. Texto original: “La visualización les ayudó a decidir qué datos había que mostrar y cómo debían mostrarlos”. 37 Tradução do autor. Texto original: “’Escribimos la aplicación para poder explorar los datos y experimentar con distintos modelos de interacción,’ dice Shan. Aunque todos sabemos que hay una cierta belleza en explorar uno mismo los datos, ‘al final,’ continúa Shan, ‘decidimos que sería más interesante mostrar al usuario qué era lo que era interesante, en lugar de hacerlo descubrir por sí mismo lo relevante. La intención era mostrar qué era lo que hacía a Rivera el mejor — y dejar al usuario explorar todos sus lanzamientos no era la manera más efectiva de conseguirlo.’” 38 Tradução do autor. Texto original: “Es difícil reconocer el lanzamiento a tiempo para que el bateador mueva el bate en la dirección correcta. Por eso decimos congelarlos en ese momento, en el que le bateador tiene que tomar la decisión.”.
47
Depois desse congelamento, a imagem das bolas se transforma em uma
representação mais abstrata, em forma de mapa de calor (Fig. 8). A utilização desse
tipo de gráfico dialogando com imagens mais realistas se relaciona com o conceito
de layering (TUFTE, 1990, p. 53) e se aproveita de uma linguagem mais abstrata
para ajudar o leitor a comprender a quantidade de lançamentos.
Como curiosidade, para animar a figura de Rivera foram usados vídeos de
jogos nos quais ele aparecia, para poder reproduzir seus movimentos usando uma
variação da técnica de motion capture39.
Fig. 6 Imagem do programa feito pela equipe do The New York Times para analisar a base de dados dos lançamentos de Rivera. Fonte: GONZÁLEZ VEIRAS, 2010.
39 Técnica que consiste no uso de sensores localizados no corpo para digitalizar os movimentos realizados por uma pessoa. No caso da utilização de videos, essa digitalização se dá pelo rastreamento das diferentes partes do corpo que aparecem no video.
48
Fig. 7 Dois frames da animação em que são mostrados todos os lançamentos ao mesmo tempo. Fonte: CARTER; GRAHAM; WARD, 2010.
49
Fig. 8 Transformação da representação das bolas lançadas. Fonte: CARTER; GRAHAM; WARD, 2010.
Apesar de o vídeo ser um formato pouco convencional para a visualização de
bases de dados, How Mariano Rivera Dominates Hitters apresenta vários aspectos
para entender o uso da visualização por parte do jornalismo.
Note-se que foi feita uma visualização prévia, para uso da equipe de infografia,
o que permitiu tomar as decisões de como seriam visualizados esses dados, em
relação com o uso, já comentado no Capítulo 3, de visualizações para facilitar a
compreensão de dados por parte dos jornalistas.
Apesar da complexidade do produto final, o infográfico mostra uma decisão
interessante de tirar do usuário a possibilidade de interação para que este não se
perca em um material tão complexo. A natureza do vídeo também faz com que o
tempo de leitura da visualização seja determinado pelo autor, que dá ao usuário um
tempo determinado para observar a visualização do mapa de calor, por exemplo.
Uma vez que se optou pelo vídeo, o trabalho inteiro foi construído considerando as
possibilidades únicas do formato: tempo limitado, ausência de interação, narração. O
vídeo-infográfico como um todo e as visualizações em particular são produtos
densos, que comunicam uma quantidade enorme de dados em poucos segundos.
50
6.2 READING, WRITING AND EARNING MONEY, GOOD MAGAZINE
Fig. 9 infográfico publicado na revista Good. Fonte: HUBACEK, 2011.
Publicado em janeiro de 2011 no site da revista Good, o infográfico (Fig. 9)
faz uso de uma visualização que, apesar de não ter sido publicada em um meio
impresso, aproveita a mecânica da impressão e mistura das cores para produzir
nova informação e fazer o leitor compreender como deve ler a visualização. Cada
cor básica do processo de impressão CMYK40 foi usada para representar um dado
do Censo dos Estados Unidos: a quantidade de graduados no segundo grau
(magenta), a quantidade de graduados na universidade (amarelo) e a renda
mediana anual (ciano).
Cada informação deu origem a um mapa, cada um em uma cor primária,
com tons mais claros representando situações piores e tons mais escuros
representando situações melhores. A sobreposição desses mapas causam a mistura
das cores, gerando cores que revelam novas informações. De maneira geral, tons
mais claros representam lugares com menos instrução e menor renda; e tons mais
escuros denotam educação melhor e maior renda. Além disso, tons mais escuros
em um determinado índice fazem com que as cores resultantes mostrem tendências:
condados com cores que tendem para o verde indicam uma quantidade maior de
40 Sigla que se refere às quatro cores usadas no processo de impressão por quatricromia.
51
tinta amarela, ou seja, mais graduados na faculdade. Condados em tons de azul
escuro ou roxo indicam a mistura de tinta magenta (boa taxa de graduados no
segundo grau) e de tinta ciano (renda familiar), mas a ausência de tinta amarela
(graduados na universidade). Condados vermelhos são aqueles que têm alto índice
de graduados tanto no ensino médio como na universidade (tintas magenta e
amarela, que formam a cor vermelha), mas renda relativamente baixa (ausência da
cor ciano).
Fig. 10 Detalhe do infográfico "Reading, Writing and Earning Money". É possível ver as divisões dos
estados e três exemplos fornecidos pelo autor para facilitar o entendimento.
O produto final que foi publicado inclui, além da visualização, várias
explicações de como ler os dados. A mistura das cores funciona no resultado final,
mas era necessário ter certeza que seria interpretado da maneira correta. Para isso,
foram selecionados alguns condados para dar de exemplo, foram isolados e
explicados como a soma de suas cores formavam a nova cor (Fig. 10). Também são
apresentados, em tamanho menor, os mapas separados, junto a uma escala que faz
a correlação entre os valores reais e o tom da cor. Há uma explicação textual, com
uma ilustração mostrando os mapas se sobrepondo e um diagrama mostrando como
as cores formam novas cores quando combinadas. Por fim, o próprio título da página
foi escrito enumerando os dados visualizados e com as cores atribuídas a cada um
deles. É possível notar também o cuidado no mapa principal. A única informação
adicional é uma sutil divisão dos estados, com uma fina linha branca. Não há nomes
52
de estados, nem nenhuma outra indicação que pudesse esconder os dados ou
distrair o leitor de sua análise.
O mapa resultante da operação pode ser lido de maneira macro ou micro
(TUFTE, 1990, p. 37). Em uma explicação simples, podemos dizer que macro é a
leitura do todo e micro é a leitura dos detalhes. Em uma leitura macro, é possível ver
a situação das diferentes regiões dos Estados Unidos: os tons esverdeados da costa
Oeste indicam que há mais pessoas com formação universitária; os tons mais claros
na região do Mississipi indicam baixos níveis tanto de educação como de renda;
próximo a Nova Iorque, as cores se aproximam do preto, enquanto ao norte do país
as cores com mais tinta magenta indicam uma boa educação no segundo grau. Já
em uma leitura micro, é possível consultar a situação de qualquer condado, desde
que o leitor saiba onde ele está localizado. Nos estados do centro e do Leste, a
divisão dos estados em um número maior de condados permite que sejam feitas
leituras mais regionais. Nesses estados, também é possível distinguir as capitais:
geralmente são os condados com índices melhores, e, portanto, com cores mais
escuras. Todas essas conclusões mostram a densidade e possibilidades das
visualizações que permitem uma leitura micro, sobre a qual Tufte diz que “esta fina
textura de refinado detalhamento leva a micro-leituras pessoais, histórias individuais
sobre os dados” (TUFTE, 1990, p. 37).41
Quanto à edição das bases de dados utilizadas, ocorre de duas formas:
primeiro, são selecionados três dados para analisar a correlação entre si. Segundo,
é escolhido o nível geográfico desses dados. Apesar que provavelmente há dados
que detalham a renda e escolaridade das subdivisões de cada condado, ficariam
pequenas demais para serem vistas corretamente, além de as subdivisões de cada
condado serem menos reconhecíveis em um mapa do que os condados.
O texto que apresenta o infográfico diz: “demos uma olhada nas conquistas
educacionais e na renda mediana de toda a nação, para ver onde as pessoas estão
indo à escolar, onde estão ganhando dinheiro, e se há alguma correlação42.” O
41 Tradução do autor. Texto original: “this fine texture of exquisite detail leads to personal micro-readings, individual stories about the data”. 42 Tradução do autor. Texto original: ”We’ve looked at the educational achievement and the median income of the entire nation, to see where people are going to school, where they’re earning money, and if there’s any correlation.”
53
infográfico, em si, não responde a pergunta, mas sim facilita o acesso aos
aproximadamente dez mil números necessários para chegar a essa conclusão.
6.3 RETRATOS DO PARANÁ – GAZETA DO POVO
Fig. 11 Site da base de dados "Os números do estado", dentro da série de matérias "Retratos do Paraná". Fonte: GAZETA, 2011.
Este trabalho contém visualizações de dados, mas também se aproxima do
conceito de base de dados navegável discutido anteriormente. O infográfico reúne
informações sobre os 399 municípios do Paraná e permite visualizar o dado
escolhido em um mapa do estado e em um gráfico de barras (Fig. 11). O usuário
começa por escolher uma das áreas – economia, população, meio ambiente, etc. – e
depois escolhe um dos indicadores para atualizar o ranking de municípios à
esquerda e o mapa do Paraná.
54
Para a construção do infográfico foi utilizado o software Tableau, projetado
para construir infográficos interativos com vários tipos de dados a partir de uma ou
mais bases de dados. É usado um aplicativo específico para construir o infográfico,
que depois é publicado nos servidores da Tableau. Fica então disponível para ser
embutido em um site ou, no caso dos usuários da versão gratuita, consultado no
próprio site da Tableau.
A base de dados disponibilizada através do infográfico foi elaborada a partir de
várias bases de dados menores obtidas em vários órgãos, como IBGE, Datasus,
Ipardes, etc. O processo de edição consistiu em selecionar os dados mais
atualizados que estivessem disponíveis para todos os municípios.
O trabalho não apresenta grandes inovações no que se refere a visualizações,
mas certamente representa a função que um produto jornalístico em base de dados
pode oferecer. Ele concentra bases de dados de diversos órgãos, disponíveis em
vários formatos de arquivo, e as consolida em um único lugar. Além disso, oferece
ao leitor uma interface fácil de navegar para realizar consultas. Oferece a
possibilidade de consultas micro, como saber um dado de um município específico,
e de consultas macro, que é a visualização de todos os dados do estado. O jornal
cumpre um papel de facilitar ao leitor o acesso às bases de dados, tanto na edição
das bases para obter uma base de dados única, como na criação de uma interface
adequada.
6.4 RACE AND ETHNICITY: NEW YORK – ERIC FISCHER
Essa visualização (Fig. 12) é também obra de Eric Fischer, autor da mostrada
anteriormente “See something or say something” (Fig. 1). Em comum com “Reading,
Writing and Making Money” temos que foram usados os dados do Censo dos
Estados Unidos, e também foi usado um código de cores. No trabalho de Fischer,
porém, as cores não são graduadas, e cada uma representa um grupo étnico. O
leitor sabe de que cidade se trata pelo título da imagem. A legenda do mapa está no
espaço para texto que acompanha a imagem, no Flickr: “vermelho são brancos, azul
são negros, verde são asiáticos, laranja são hispânicos, cinza são outros, e cada
55
ponto são 25 pessoas”43 Fischer usa esse código para manter o critério escolhido
por Bill Rankin em outro mapa (RANKIN, 2009). Fischer diz que “estava
impressionado com o mapa de divisões raciais e étnicas de Chicago [feito por] de
Bill Rankin, e queria ver como outras cidades ficariam se fossem mapeadas da
mesma maneira”44 (FISCHER, 2010). O mapa também conta com o traçado das
ruas em cor cinza claro, mas carece de outras indicações, como o mar. Para
pessoas que conheçam a cidade retratada, parece ser suficiente: os usuários do site
colaboram usando o recurso do Flickr de deixar notas marcando um pedaço da
imagem. São os próprios usuários que fazem a análise micro da visualização.
Fig. 12 Visualização da cidade de Nova York, realizada por Eric Fischer. Fonte: FISCHER, 2010.
43 Tradução do autor. Texto original: “Red is White, Blue is Black, Green is Asian, Orange is Hispanic, Gray is Other, and each dot is 25 people.” 44 Tradução do autor. Texto original: “I was astounded by Bill Rankin's map of Chicago's racial and ethnic divides and wanted to see what other cities looked like mapped the same way.“
56
O mapeamento realizado por Fischer não serve somente a quem conhece a
geografia da cidade. Quem não conhece a cidade mapeada não reconhece lugares
da cidade, mas ainda assim consegue apreender informação sobre ela. É possível
reconhecer a densidade populacional das diferentes regiões das cidades, e também
como as diferentes etnias se agrupam, permitindo uma análise sociológica. Também
é possível entender quais os dados disponíveis de cada cidade e o detalhamento e
precisão das informações usadas para a visualização. Essas leituras dizem respeito
à análise macro que é possível fazer dessa visualização.
A escolha do Flickr como suporte para essa visualização também diz respeito a
análise macro e micro. Na página principal, é possível fazer a análise macro, mas
também é disponibilizada a imagem em uma resolução maior, de 3000 x 3000
pixels, que permite observar a visualização em detalhes.
Se essa informação fosse cruzada com outros dados, mais dados ficariam
evidentes. No trabalho que o inspirou, é possível ver a divisão da população por
renda, na qual fica evidente a renda menor das regiões hispânicas e a renda ainda
menor das regiões negras. A diferença entre o trabalho de Rankin e o de Fischer é a
presença de um elemento interativo, que no trabalho de Rankin facilita a
visualização dessas diferenças.
6.5 XKCD – COLOR SURVEY
Em 2010, Randall Munroe, autor do webcomic XKCD, convocou seus
leitores a responderem uma pesquisa sobre cores, na qual deveriam responder o
nome pelo qual chamavam determinadas cores. Aproximadamente 250 mil pessoas
responderam, o que resultou em uma base de dados de aproximadamente 3,7
milhões de respostas. O autor disponibilizou a base de dados para download,
sugerindo para fazerem algo divertido (MUNROE, 2010). Entre os resultados,
destacam-se duas visualizações dessa base: a feita pela empresa Luminoso, da
cidade de Boston (LUMINOSO, 2012), e a feita pelo pesquisador e artista Stephen
von Worley (VON WORLEY, 2012).
57
Fig. 13 Visão geral da visualização feita pela empresa Luminoso. Fonte: LUMINOSO, 2012.
A primeira (Fig. 13) é, essencialmente, uma visualização conhecida como
nuvem de palavras ou tagcloud. Na segunda (Fig. 14), a quantidade de vezes que
cada nome foi citado é representada em um gráfico de bolhas. A característica
comum de ambas visualizações é a possibilidade de interação.
A interatividade presente nas duas visualizações é a reorganização: no
trabalho da Luminoso, é possível reorganizá-los na posição e na escala das palavras
para evidenciar quais as cores mais comuns entre mulheres, quais são cores
relacionadas a comidas, entre outros. Já o trabalho de Von Worley permite organizar
as bolhas somente na horizontal, já que a altura das bolhas foi usada para
determinar quais cores são mais citadas por homens e quais por mulheres, o que é
a intenção principal da visualização. Mesmo assim, é possível reorganizá-las
segundo a popularidade, o tom, brilho, saturação e o comprimento do nome (Fig. 15).
58
Fig. 14 Visão geral da visualização feita por Von Worley. Fonte: VON WORLEY, 2012.
A interatividade da tagcloud é o zoom. Nomes de cores muito populares foram
milhares de vezes mais citadas que outras, o que acarreta em bolhas ou palavras
muito pequenas. Esse problema é contornado com a possibilidade de fazer zoom e
fazer uma leitura em diferentes níveis (Fig. 16). Essa visualização também tem um
sistema de busca para filtrar os nomes das cores.
O trabalho de Von Worley não usa o recurso do zoom, já que até as bolhas
menores são visíveis. Mas se aproveita de uma outra interatividade, que é o
hipertexto que aparece para dar o nome e mais informações da cor ao passar o
mouse por cima da bolha (Fig. 17).
59
Fig. 15 Visualização reorganizada pela popularidade da cor. Fonte: VON WORLEY, 2012.
Os dois trabalhos mostram como a interatividade é um recurso que pode e
deve ser considerado ao fazer uma visualização. Nas duas visualizaçãoes, a
interação serve para fazer novas leituras macro, com a reorganização dos
elementos das visualizações, e também para fazer leituras micro, com os recursos
de zoom ou hipertexto. Claro que só é possível em determinados meios – o mais
comum dos quais é a web – mas isso também deve ser levado em consideração
para conceber e produzir a visualização.
60
Fig. 16 Visão micro da visualização da Luminoso, mostrando como são exibidas as palavras menores.
Fig. 17 Exemplo de uso de hipertexto na visualização de Von Worley.
61
7 CONCLUSÃO
A abundância de dados representa ao mesmo tempo uma oportunidade e
também um problema para o jornalismo. O problema se manifesta, em primeiro lugar,
dentro da redação. Como encontrar o que interessa nessa avalanche de
informações? Como relacionar dados entre si, sem depender de análises alheias
que entreguem ao repórter sua própria interpretação dos dados? Como transformar
esses dados em fonte de informação primária, e não secundária?
Em segundo lugar, temos que é tarefa do jornalismo facilitar o acesso à
informação. E, nesse contexto de abundância de dados, essa tarefa adquire novas
dimensões. Como guiar o leitor através de milhões de dados? Como transmitir ao
leitor as informações latentes nos milhões de gastos registrados por funcionários
públicos, por exemplo?
São possíveis várias abordagens a partir do discutido neste trabalho, mas a
principal obstáculo é a falta de conhecimento técnico para o uso de bancos de dados,
sem falar na elaboração de visualizações. A maioria das redações continua sendo
composta por jornalistas e profissionais de outras áreas que são considerados como
“de apoio” à redação. Somente alguns meios estão investindo na contratação de
profissionais de áreas como estatística e informática, capazes de interpretar e
fornecer os meios para a realização de materiais mais complexos, como aponta
Fidalgo:
O que a possibilidade e a exequibilidade da mineração de dados nos mostram é a necessidade de formar jornalistas que integrados em equipas multidisciplinares de informáticos, especialistas de estatística e de hermenêutica de dados, saibam detectar o valor noticioso das relações e dos padrões extraídos da massa imensa de dados, coligidos a acumulados a uma rapidez estonteante. (FIDALGO, 2007, p. 167)
A multidisciplinariedade é um obstáculo para muitos jornalistas. Como outros
profissionais da comunicação, são geralmente avessos a conhecimentos de ciências
exatas – mesmo que se trate de conhecimentos de matemática aprendidos no
ensino médio. A transição dos meios impressos para o digital e as possibilidades
dessa nova mídia está sendo aproveitada de maneira errada:
A noção de que os jornalistas do futuro serão uma espécie de McGyver, homens ou mulheres de mil e um recursos, trabalhando sozinhos, equipados com uma câmara de vídeo digital, telefone satélite, portátil com software de edição vídeo e html, e ligação sem fios à Internet […] é uma visão futurista do backpack journalist, criticável, e que não esgota, nem
62
preenche, de modo algum, as potencialidades dos novos média. Não é que não haja espaço, para esse tipo de jornalista, mas será apenas um jornalista de factos ou de notícias de ordem inferior e nunca de notícias de ordem superior. (ibidem, p. 166–167)
Confirmando essa falta de aproveitamento do digital, temos que, em uma
análise rápida dos 22 posts sobre visualizações que foram publicados no blog
Flowing Data durante outubro, somente quatro eram sobre visualizações feitas em
jornais: três no The New York Times e uma no Washington Post. Os outros posts se
referiam a trabalhos feitos por programadores independentes e centros de pesquisa,
por exemplo. Esse atraso representa um desperdício de oportunidades de inovação
no processo de elaboração de matérias e outros produtos jornalísticos.
Faltaria ao jornalismo de modo geral e aos jornalistas em particular
vislumbrar as possibilidades do uso de bases de dados e de visualizações no seu
trabalho. A barreira da técnica está cada vez mais fácil de superar, porque as
ferramentas para lidar com bases de dados e visualizações estão cada vez mais
acessíveis, não exigindo conhecimentos de informática avançados nem
computadores potentes. A Reportagem Assistida por Computador ainda é uma
disciplina separada, reservada a quem queira aprendê-la, e não é vista como parte
do jornalismo tradicional. Com isso, o uso de computadores se limita ao
processamento de textos e consulta de fontes na internet. Para alcançar um
jornalismo realmente inovador no conteúdo, na linguagem e nas narrativas, é
necessário pensar em outro uso para o computador e demais tecnologias.
Esse outro uso também deve ser pensado do lado do leitor. É necessário
refletir sobre qual a função das bases de dados e das visualizações como produto
jornalístico, e se interessa ao leitor fazer sua própria navegação e construir suas
próprias narrativas e notícias. Que essa possibilidade exista não quer dizer que seja
uma solução adequada para todos os casos, e sim um formato para ser usado
quando for interessante. É possível que haja problemas para que o leitor comprenda
o formato, mas para isso é necessário um certo didatismo para que ele veja as
possibilidades e vantagens de navegar por uma visualização.
As possibilidades do jornalismo em base de dados, abordadas por vários
autores, ainda não são exploradas em sua plenitude por motivos técnicos. As
visualizações desses dados sofrem do mesmo problema. É necessário que os
jornalistas se capacitem para poder aproveitar esses recursos ao máximo, e fazer do
jornalismo digital um meio realmente novo e não uma mera transposição dos meios
63
tradicionais. E essa capacitação não se limita ao uso de visualizações: essa é
apenas uma entre as muitas oportunidades de inovação que os nem tão novos
meios de comunicação oferecem tanto aos jornalistas quanto aos repórteres.
64
REFERÊNCIAS
AUDIÊNCIA da TV, 28/03: “Escolinha do Professor Raimundo” sobe Ibope da Globo. Disponível em: <http://www.rd1audiencia.com/televisao/audiencia-da-tv-2803-escolinha-do-prof-raimundo-sobe-ibope-da-globo/97414>. Acesso em 11/11/2012. BAHIA, Juarez. Jornal, história e técnica: as técnicas do jornalismo. Volume 2. São Paulo: Editora Ática, 1990. BARBOSA, Suzana (org.). Jornalismo Digital de Terceira Geração. Covilhã: Labcom – Universidade da Beira Interior, 2007. BARBOSA, Suzana. Jornalismo digital e bases de dados: mapeando conceitos e funcionalidades. In: 4º Sopcom – Livro de Actas do 4º Congresso da Associação Portuguesa de Ciências da Comunicação. Aveiro, Portugal: Universidade de Aveiro, 2005. BERTIN, Jacques. A neográfica e o tratamento gráfico da informação. Curitiba: Editora da Universidade Federal do Paraná, 1986. BONO of Contention. Disponível em: <http://www.snopes.com/music/artists/bono. asp>. Acesso em 09/06/2012. CARTER, S.; GRAHAM R.; WARD, J. How Mariano Rivera Dominates Hitters. The New York Times, 29/6/2010. Disponível em <http://www.nytimes.com/interactive/ 2010/06/29/magazine/rivera-pitches.html>. Acesso em 7/4/2012. CLARÍN. Eligieron una infografía de Clarín como la mejor de los últimos 20 años. Buenos Aires, 2012. Disponível em:<http://www.clarin.com/sociedad/Eligieron-infografia-Clarin-mejor-ultimos_0_677932336.html>. Acesso em 12/11/2012. COSTA, Lailton; LUCHT, Janine. Gênero Interpretativo. In: ASSIS, Francisco de; MARQUES DE MELO, José. Gêneros jornalísticos no Brasil. São Bernardo do Campo: Universidade Metodista de São Paulo, 2010. COSTA, Lailton. Gêneros Jornalísticos. In: ASSIS, Francisco de; MARQUES DE MELO, José. Gêneros jornalísticos no Brasil. São Bernardo do Campo: Universidade Metodista de São Paulo, 2010. DE PABLOS, José Manuel. Infoperiodismo - el periodista como creador de infografía. Madri, Espanha: Editorial Síntesis, 1999. EDLUND, Bård. The Dow Piano. CNN Money, [2011?]. Disponível em: <http://money.cnn.com/markets/storysupplement/dow_piano>. Acesso em 09/06/2012. EPLER, Matthew. Grand Old Party. Disponível em <http://mepler.com/Grand-Old-Party>. Acesso em 4/6/2012. FIDALGO, António. A resolução semântica no jornalismo online. In: BARBOSA, Suzana (org.). Jornalismo Digital de Terceira Geração. Covilhã, Labcom – Universidade da Beira Interior, 2007. FISCHER, Eric. Race and ethnicity: New York City. [San Francisco], 2010. Disponível em <http://www.flickr.com/photos/walkingsf/4981444199>. Acesso em 7/4/2012.
65
FISCHER, Eric. See Something or Say Something: Rio de Janeiro. [San Francisco], 2011. Disponível em <http://www.flickr.com/photos/walkingsf/59263533 58/>. Acesso em 7/4/2012. FRIENDLY, Michael. Milestones in the history of thematic cartography, statistical graphics, and data visualization. 2009. Disponível em: <http://euclid.psych.yorku.ca/SCS/Gallery/milestone/milestone.pdf>. Acesso em 09/06/2012. FRY, Ben. Visualizing Data. Sebastopol: O’Reilly Media, 2008. GAZETA do Povo. Os números do estado. Curitiba, 2011. Disponível em <www.gazetadopovo.com.br/vidaecidadania/retratosparana/indicadores>. Acesso em 13/10/2012. GONZÁLEZ VEIRAS, Xaquín. Cómo se hizo: los lanzamientos de Mariano Rivera. Disponível em <http://www.xocas.com/blog/?p=758>. Acesso em 7/4/2012. HUBACEK, Gregory. Reading, Writing and Earning Money. 2011. In: Good Magazine. Los Angeles, 13/1/2011. Disponível em <http://www.good.is/post/america-s-richest-counties-and-best-educated-counties/>. Acesso em 7/4/2012. KUNCZIK, Michael. Conceitos de Jornalismo. São Paulo: Universidade de São Paulo, 2002. LACHER, Mike. All Of Billy Joel's Greatest Hits Played At Once . Disponível em: <http://youtu.be/FcvVPuJVKcs>. Acesso em 09/06/2012. LIDWELL, William; HOLDEN, Kritina; BUTLER, Jill. Universal Principles of Design. Gloucester, EUA: Editora Rockport, 2003. LUMINOSO. Visualizing the XKCD Color Survey. Boston, Estados Unidos, 2012. Disponível em <http://www.luminoso.com/colors>. Acesso em 12/11/2012. MACHADO, Elias. O Banco de Dados como espaço para composição de narrativas. In: BARBOSA, Suzana (org.). Jornalismo Digital de Terceira Geração. Covilhã, Labcom – Universidade da Beira Interior, 2007. MANOVICH, Lev. O que é visualização? In: Estudos em Jornalismo e Mídia - Vol. 8 Nº 1. Florianópolis, 2011. Disponível em <http://www.periodicos.ufsc.br/index.php/ jornalismo/article/view/1984-6924.2010v8n1p146/18947>. Acesso em 7/4/2012. MANOVICH, Lev. The Language of New Media. [Massachussets]: [MIT Press], [2001?]. McCANDLESS, David. The Beauty of Data Visualization. Disponível em: <http://www.ted.com/talks/david_mccandless_the_beauty_of_data_visualization.html>. Acesso em 09/06/2012. MCLUHAN, Marshall. Os Meios de Comunicação como Extensões do Homem. São Paulo, Cultrix, 1969. MIELNICZUK, Luciana. Jornalismo na web: uma contribuição para o estudo do formato da notícia na escrita hipertextual. Salvador, UFBA, 2003. MUNROE, Randall. Color Survey Results. Massachussets, Estados Unidos, 2010. Disponível em <http://blog.xkcd.com/2010/05/03/color-survey-results>. Acesso em 12/11/2012. PELTZER, Gonzalo. Jornalismo Iconográfico. Lisboa, Portugal: Planeta Editora, 1991.
66
RAMJAC. All Together Now - Everything the Beatles ever did. [2011?]. Disponível em: <http://soundcloud.com/ramjac/beatlescompletebkwds>. Acesso em 09/06/2012. RANKIN, Bill. Chicago Boundaries. 2009. Disponível em <http://www.radicalcartography.net/index.html?chicagodots>. Acesso em 12/11/2012. TUFTE, Edward. Envisioning Information. Connecticut: Graphic Press, 1990. UNWIN, A.; THEUS, M.; HOFMANN, H. Graphics of Large Datasets. Nova Iorque: Springer, 2006. VON WORLEY, Steve. His And Hers Colors. Estados Unidos, 2012. Disponível em <http://www.datapointed.net/visualizations/color/men-women-color-names-d3/>. Acesso em 12/11/2012. WOLTON, Dominique. Internet, e depois? Porto Alegre, Sulina, 2007. WURMAN, S. Angustia Informativa. Buenos Aires: Prentice Hall, 2001. YAU, Nathan. Visualize This. 2011.