Visualizações de dados e seu uso no jornalismo.

transcript

FACULDADE INTERNACIONAL DE CURITIBA - FACINTER

Curso de Comunicação Social – Jornalismo

MATIAS SEBASTIÃO PERUYERA

“EVERY PICTURE TELLS A STORY”: VISUALIZAÇÕES DE DADOS E SEU USO NO JORNALISMO

CURITIBA

MATIAS SEBASTIÃO PERUYERA

“EVERY PICTURE TELLS A STORY”: VISUALIZAÇÕES DE DADOS E SEU USO NO JORNALISMO

Trabalho de Conclusão de Curso apresentado como requisito parcial para obtenção do grau de bacharel em Comunicação Social com Habilitação em Jornalismo à Faculdade Internacional de Curitiba (Facinter). Orientadora: Profa. MSc. Renata Duarte

CURITIBA

A todos vocês que formam a família que eu escolhi.

AGRADECIMENTOS

Aos meus colegas do curso de Comunicação da Facinter, pela companhia e apoio

nesses quatro anos da graduação. Foi muito bom percorrer esse caminho juntos.

Aos meus professores, sempre dispostos a tirar dúvidas e apontar caminhos.

Ao Lyn Jannuzzi e demais colegas do departamento de Infografia da Gazeta do

Povo, pela troca incessante de informação e ideias que representou, sem eu

perceber, o começo da minha pesquisa acadêmica.

Ao professor Gustavo Lopes, por ter me ajudado com os artigos que serviram para

consolidar minha participação no mundo da pesquisa.

À professora Renata Duarte, pelas orientações que me deixavam com a cabeça

borbulhando de ideias e entusiasmo.

A meus amigos, por compartilharem do meu entusiasmo, mesmo que às vezes não

entendessem muito bem meus motivos.

Ao Fernando, que acompanhou meus tropeços desde a primeira faculdade.

Ao Tercio, pelos eternos planos de conquistar o mundo.

Finalmente, um agradecimento especial para Basilio, pelo carinho e pela paciência

sem fim.

“Now these points of data make a beautiful line”

(Jonathan Coulton, “Still Alive”)

RESUMO

A atual abundância de informações numéricas das mais variadas origens pode ser usada de várias maneiras pelo jornalismo. O presente Trabalho de Conclusão de Curso trata do uso jornalístico de bases de dados de grandes dimensões e como a visualização pode ser uma maneira adequada para a interpretação desses dados e também para a divulgação da base de dados como um todo. Em primeiro lugar é feita uma análise do papel das bases de dados e das visualizações dentro dos diferentes gêneros jornalísticos. É analisado o uso histórico e atual das bases de dados, com a finalidade de entender sua presença nas redações, além do uso de computadores na produção de matérias dentro do conceito de Reportagem Assistida por Computador (RAC). Essa análise também serve para pensar os diferentes conceitos de base de dados e chegar a um recorte do tipo de base que é usada para realizar visualizações, além da possibilidade de uso de visualizações dentro da RAC e do jornalismo de dados. Em seguida, é analisado o conceito de visualização, sua utilidade no jornalismo, sua relação com a infografia jornalística, e também o processo pelo qual se obtém uma visualização e os conhecimentos necessários para fazê-la. Finalmente, são analisados alguns exemplos de visualizações de meios variados: vídeo, estáticos, interativos. Palavras-chave: visualização de dados, jornalismo em base de dados, RAC, infografia.

ABSTRACT

The current abundance of numerical information from various sources can be used by journalists in many ways. This Graduation Thesis analyzes the journalistic use of large databases and how data visualization can be an appropriate way to understand large ammounts of data and to publish them as well. First, we analyzed the role of databases and data visualizations within the different journalistic genres. Then we examined the historical and current use of databases in order to understand their presence in newsrooms, and the use of computers in the production of news within the concept of Computer Assisted Reporting (CAR). This analysis also aims to think about the different concepts of database and determine what kind of database should be used to make visualizations, plus the ability to use visualizations in the field of CAR and data journalism. Then we analyze the concept of visualization, its usefulness in journalism, its relation to journalistic infographics, and the process and skills necessary to make visualizations. Finally, some examples from diferente media (vídeo, static, interactive) are analyzed. Keywords: data visualization, database journalism, CAR, infographics.

LISTA DE ILUSTRAÇÕES

Fig. 1 Visualização da série "See Something or Say Something", de Eric Fischer,

mostrando a cidade do Rio de Janeiro. Fonte: FISCHER, 2011. ...................... 13

Fig. 2 Exemplo de visualização subjetiva de dados reais, na figura do Professor

Raymundo, personagem de Chico Anysio. Fonte: AUDIÊNCIA, 2012. ............. 36

Fig. 3 Uso de visualizações no infográfico "La ballena Franca" (destaques meus).

Fonte do original: CLARIN, 2012. ...................................................................... 38

Fig. 4 Frame do infográfico em vídeo "How Mariano Rivera Dominates Hitters".

Fonte: CARTER; GRAHAM; WARD, 2010. ....................................................... 45

Fig. 5 trecho da base de dados dos lançamentos de Rivera. Fonte: GONZÁLEZ

VEIRAS, 2010. ................................................................................................... 45

Fig. 6 Imagem do programa feito pela equipe do The New York Times para analisar

a base de dados dos lançamentos de Rivera. Fonte: GONZÁLEZ VEIRAS,

2010. .................................................................................................................. 47

Fig. 7 Dois frames da animação em que são mostrados todos os lançamentos ao

mesmo tempo. Fonte: CARTER; GRAHAM; WARD, 2010. ............................... 48

Fig. 8 Transformação da representação das bolas lançadas. Fonte: CARTER;

GRAHAM; WARD, 2010. ................................................................................... 49

Fig. 9 infográfico publicado na revista Good. Fonte: HUBACEK, 2011. ................... 50

Fig. 10 Detalhe do infográfico "Reading, Writing and Earning Money". É possível ver

as divisões dos estados e três exemplos fornecidos pelo autor para facilitar o

entendimento. .................................................................................................... 51

Fig. 11 Site da base de dados "Os números do estado", dentro da série de matérias

"Retratos do Paraná". Fonte: GAZETA, 2011. ................................................... 53

Fig. 12 Visualização da cidade de Nova York, realizada por Eric Fischer. Fonte:

FISCHER, 2010. ................................................................................................ 55

Fig. 13 Visão geral da visualização feita pela empresa Luminoso. Fonte:

LUMINOSO, 2012. ............................................................................................. 57

Fig. 14 Visão geral da visualização feita por Von Worley. Fonte: VON WORLEY,

2012. .................................................................................................................. 58

Fig. 15 Visualização reorganizada pela popularidade da cor. Fonte: VON WORLEY,

2012. .................................................................................................................. 59

Fig. 16 Visão micro da visualização da Luminoso, mostrando como são exibidas as

palavras menores. .............................................................................................. 60

Fig. 17 Exemplo de uso de hipertexto na visualização de Von Worley. .................... 60

SUMÁRIO

1 Introdução ................................................................................................................................ 10 1.1 Problema ............................................................................................................................. 15 1.2 Hipóteses ............................................................................................................................. 16 1.3 Objetivos .............................................................................................................................. 16 1.3.1 Objetivo geral ............................................................................................................................... 16 1.3.2 Objetivos específicos ................................................................................................................. 16

1.4 Metodologia ........................................................................................................................ 17

2 Bases de dados, visualizações e gêneros jornalísticos .............................................. 19 2.1 No gênero interpretativo ............................................................................................... 19 2.2 No gênero informativo .................................................................................................... 21 2.3 No gênero utilitário .......................................................................................................... 21 2.4 Nos gêneros opinativo e diversional .......................................................................... 22 2.5 Visualizações e gêneros jornalísticos ........................................................................ 22

3 BASES DE DADOS .................................................................................................................... 24 3.1 Breve histórico e conceitos ........................................................................................... 24 3.2 Bases de dados como formato dentro do webjornalismo ................................... 26 3.3 Bases de dados como produto jornalístico .............................................................. 27 3.4 Dados e ferramentas ao alcance de todos ................................................................ 29

4 Visualização: da unidade ao conjunto ............................................................................ 31 4.1 Definição .............................................................................................................................. 31 4.1.1 Quanto é “grande” ...................................................................................................................... 33 4.1.2 O que é “visual” ............................................................................................................................ 34 4.1.3 Quais dados podem ser representados numericamente ........................................... 35

4.2 Diferenças entre visualização e infografia ............................................................... 37

5 Ferramentas e aspectos técnicos ..................................................................................... 39 5.1 Obtenção dos dados ......................................................................................................... 39 5.1.1 Ferramentas para a manipulação dos dados .................................................................. 40

5.2 Apresentação dos dados ................................................................................................. 41 5.2.1 Ferramentas para fazer a apresentação dos dados ..................................................... 42

5.3 Conseguir qualidade técnica na reprodução da visualização ............................ 43 5.3.1 Escolha do suporte ..................................................................................................................... 43

6 Análise de infográficos e visualizações .......................................................................... 45 6.1 How Mariano Rivera Dominates Hitters, the new York Times ......................... 45 6.2 Reading, Writing and Earning Money, Good Magazine ........................................ 50

6.3 Retratos do Paraná – Gazeta do Povo ........................................................................ 53 6.4 Race and Ethnicity: New York – Eric Fischer ........................................................... 54 6.5 XKCD – Color Survey ........................................................................................................ 56

7 Conclusão ................................................................................................................................. 61 REFERÊNCIAS ................................................................................................................................. 64

1 INTRODUÇÃO

Entre as diferentes linguagens visuais do jornalismo, a que está ganhando

mais destaque nos últimos tempos é a visualização de dados. Herdeiro da infografia

jornalística, esse formato ganhou força graças a uma combinação de tecnologias:

por um lado, as tecnologias que geram bases de dados cada vez maiores; por outro,

o avanço nas ferramentas que permitem gerar representações gráficas desses

dados. Considerando suas características e os problemas que ela resolve, a

visualização é uma ferramenta que pode – e deve – ganhar espaço no jornalismo.

É cada vez mais comum o surgimento de bases de dados de proporções

gigantescas, mas com informações interessantes do ponto de vista jornalístico. O

problema que elas trazem para o jornalista é que ele deverá saber como lidar com

esse volume de informação tanto para analisar esses dados como para divulgá-los.

Muitas vezes a falta de ferramentas adequadas para a análise dessas bases deixa o

jornalista sem poder descobrir informações latentes e a falta de recursos para exibir

essas informações deixa o leitor somente com a informação passada pelo repórter,

sem acesso à totalidade da informação. A visualização se mostra como uma

possibilidade de apreender essa informação em sua totalidade. Como resume

Nathan Yau:

Encare. Dados podem ser um tédio se você não sabe o que está procurando ou não sabe sequer que há algo a ser procurado. É só um monte de números e palavras que não significam nada além de seus próprios valores. O melhor de estatísticas e visualização é que eles lhe ajudam a procurar além desses valores. Lembre-se, dados são uma representação da vida real. Não é só um balde de números. Há histórias nesse balde. Há significado, verdade e beleza. E assim como na vida real, às vezes as histórias são simples e diretas; e outras vezes são complexas e enroladas. Algumas histórias são adequadas a um livro. Outras têm forma de novela. É com você, estatístico, programador, designer ou cientista dos dados, decidir como contar a história. (YAU, 2011)1

1 Tradução do autor. Texto original: “Face it. Data can be boring if you don’t know what you’re looking for or don’t know that there’s something to look for in the first place. It’s just a mix of numbers and words that mean nothing other than their raw values. The great thing about statistics and visualization is that they help you look beyond that. Remember, data is a representation of real life. It’s not just a bucket of numbers. There are stories in that bucket. There’s meaning, truth, and beauty. And just like real life, sometimes the stories are simple and straightforward; and other times they’re complex and roundabout. Some stories belong in a textbook. Others come in novel form. It’s up to you, the statistician, programmer, designer, or data scientist to decide how to tell the story.”

Segundo António Fidalgo, o jornalismo de dados terá mais importância na

produção de notícias relevantes: “a mineração de dados é uma forma de descobrir

relações relevantes entre dados, relações por vezes completamente inesperadas e,

por conseguinte, incontestavelmente de valor noticioso” (FIDALGO, 2007, p. 166).

Sendo assim, a incorporação do uso de bases de dados no jornalismo traz ganhos

que exigem certos conhecimentos para poder aproveitá-los.

A tecnologia mudou as bases de dados tanto no aspecto da sua criação

como no aspecto de sua exploração, navegação e/ou leitura. No primeiro aspecto,

surgiram novas formas de alimentá-las. Bases de dados tradicionais, como as

geradas em um censo de população, têm a possibilidade de ficarem mais complexas

e incluírem mais dados. Novos tipos de bases podem ser criadas com novas

tecnologias, como a de Player Tracking, utilizada pela Fifa na Copa do Mundo de

2010, no qual um sistema gera informações do caminho percorrido pelos jogadores

e pela bola a partir das imagens captadas por quatro câmeras de vídeo. Outro

exemplo é a enxurrada de informações sobre gastos de funcionários públicos,

divulgados por ordem das leis de transparência. A informação enviada à internet

pelos seus usuários, como os metadados2 e tags3 presentes em fotografias postadas

no Flickr, por exemplo, também podem compor uma base de dados extensa para

quem quiser compilar e consolidar os dados. A extração de dados de sistemas

fechados também pode ser considerada uma possibilidade de origem de dados,

mesmo que escondidos em sistemas de difícil acesso e precisando de meios

automatizados para extraí-los.

No aspecto da exploração das bases de dados, a tecnologia facilita tarefas

que, se feitas à mão, levariam muito tempo ou seriam impraticáveis. Manualmente, é

possível pegar um dado aqui ou ali (desde que a base tenha sido planejada para ser

consultada, organizada alfabeticamente ou ter uma interface para fazer consultas,

por exemplo), mas sem a facilidade do computador.

Dependendo do tipo de dados de cada base, há várias maneiras de se

aproximar a ela, ou de minerar 4 seus dados. Uma abordagem possível é a

matemática, possibilitada principalmente por softwares de planilhas, como o

2 Dados anexos a arquivos digitais, como dados de georreferenciamento inclusos em fotografias. 3 Palavras-chave atribuídas a arquivos digitais, como postagens em blogs. 4 Termo que tem sido usado para se referir ao ato de extrair números e dados de sites ou similares, através de programas de computador.

Microsoft Excel, e de bancos de dados, como o Microsoft Access. É possível fazer

operações entre seus números, para transformar números absolutos em números

relativos, possíveis de serem comparados entre si; classificar elementos por rank;

contar quantos elementos cumprem ou não uma determinada condição; realizar

buscas por padrões específicos, como o número de um documento; resumir os

dados utilizando médias e medianas; e um longo etcétera.

Esse método gera pistas para a obtenção de novas informações, que podem

ser transmitidas ao público ou podem ser usadas pelo jornalista para guiá-lo no

processo de produção de uma matéria. Esse uso do computador por parte de

jornalistas tem um marco na criação do conceito de Reportagem Assistida por

Computador (GARRISON apud BARBOSA, 2007, p. 109). De qualquer maneira, as

informações provenientes desses métodos podem até resumir os dados presentes

na base, mas em um processo de edição tradicional, no qual há perda de dados. O

cálculo de uma média não representa cada um dos valores. A escolha de quais

valores de uma série serão mostrados tem um certo grau de arbitrariedade, e essa

escolha pode ser útil para o propósito de uma investigação jornalística específica,

mas inútil para outra. Em alguns casos, pode ser interessante que a população em

geral também tenha acesso aos dados, mas algumas bases podem ser complexas

demais para serem compreendidas. A visualização se apresenta como uma

alternativa plausível para melhorar o acesso a esses grandes volumes de dados,

tanto para uso do jornalista como para a divulgação de informações.

Em uma visualização se determina um código visual, com maior ou menor

carga semântica, cujas variáveis gráficas (BERTIN, 1986, p. 186) representam

aspectos numéricos – ou que tenham sido transpostos para uma linguagem

numérica. Uma das premissas de uma visualização, segundo Lev Manovich (2011, p.

157), é que ela contenha e represente graficamente a totalidade da informação

disponível. A visualização manteria, portanto, a mesma característica da base de

dados nela representada de não ter um direcionamento da informação.

As tecnologias informáticas, além de facilitar a produção de visualizações,

permitem também a sua exibição. Dispositivos de altíssima resolução permitem a

exibição dos mais pequenos detalhes, sem perdas de informação visual

(MANOVICH, 2011, p. 165). Refinamentos no processo de impressão (TUFTE, 1990,

p. 81–95) também atingem o mesmo objetivo. Seja em monitores ou meios

impressos, visualizações de dados de alta densidade permitem que os leitores

naveguem pelos dados e escolham os que lhes interessam, construindo suas

próprias narrativas (TUFTE, 1990, p. 50). Essa navegação é auxiliada pelo fato de

as visualizações serem geralmente derivadas dos já estabelecidos gráficos

estatísticos presentes na infografia jornalística – como gráficos de pizza, gráficos de

barras ou mapas – o que garante sua usabilidade.

Fig. 1 Visualização da série "See Something or Say Something", de Eric Fischer, mostrando a cidade do Rio de Janeiro. Fonte: FISCHER, 2011.

Apesar da popularização dessas técnicas, o uso por parte do jornalismo

continua limitado. Prova disso é que a quantidade de visualizações feitas por

profissionais que reúnem o tino de encontrar informações em bases de dados e têm

as habilidades de programação e design para chegar a um resultado desejado. De

certa maneira, são eles quem deram um pontapé inicial para que o jornalismo

considerasse o uso de visualizações complexas que vão além dos já tradicionais

infográficos. Exemplo desse tipo de trabalho é a visualização “See Something or Say

Something” (Fig. 1), de Eric Fischer (FISCHER, 2011), que mapeou a localização de

fotos publicadas no Flickr5 e de tweets6 no mundo e em várias cidades.

A base de dados da qual Fischer partiu saiu dos próprios sites, que

armazenam dados de geolocalização (latitude e longitude) das fotos e dos tweets.

Fischer criou um programa que localizou os pontos e lhes atribuiu a cor azul ou

vermelha se fossem tweets ou fotos, respectivamente. O resultado é um mapa que

delineia as cidades representadas somente com estas informações, e torna visíveis

padrões de uso da internet em cada cidade. O exemplo é a visualização da cidade

do Rio de Janeiro (Fig. 1), onde é possível ver aglomerações de fotos em pontos

turísticos como o Cristo Redentor e o bairro da Urca, e aglomerações de tweets em

pontos de trânsito como a ponte Rio–Niterói e o aeroporto do Galeão. A quantidade

de informação mostrada nessa visualização é enorme, e seria inútil se exibida de

outra maneira. É a única maneira de descobrir certos padrões. Porém, certas

condições são necessárias para que um material dessas características tenha valor

jornalístico.

Alguns jornais, como o The New York Times e o The Guardian, utilizaram

esse recurso para contar histórias e agora produzem visualizações com frequência,

como uma linguagem estabelecida, mas com cuidados textuais e imagéticos para

garantir que sejam comprendidos pela maior parte da audiência. É essa transição

dos artistas-programadores para o jornalismo que definirá as possibilidades da

visualização como uma linguagem jornalística, ou até como um gênero.

O jornalismo tem se aproveitado cada vez mais de linguagens visuais, como

a infografia, através da qual a visualização começou a entrar nos meios massivos.

Porém, a visualização tem características de linguagem que é necessário

compreender melhor. Sua não linearidade faz com que o processo de edição não

tenha paralelos. Em outras linguagens jornalísticas, como a reportagem, o vídeo, a

5 Site para publicação e compartilhamento de fotografias (www.flickr.com) 6 Cada uma das mensagens publicadas por usuários do Twitter (www.twitter.com)

fotografia ou até os infográficos jornalísticos, há decisões de corte, de deixar

material de fora, mas não dentro da ação de um gatekeeper7, e sim por mera

limitação física do tamanho disponível para um texto ou o tempo disponível para

uma matéria. Isso é diferente nas visualizações: uma de suas características é que

não haja cortes nos dados; absolutamente toda a informação disponível é usada na

confecção da imagem final.

Marshall McLuhan (1969, p. 72) afirma que o surgimento de um novo meio

de comunicação altera os meios já existentes. Assim como o rádio foi modificado

pelo surgimento da televisão, a visualização está modificando a infografia jornalística

tradicional, fornecendo-lhe novas possibilidades; e também o jornalismo em si,

oferecendo a possibilidade de apresentar ao leitor uma base de dados em sua

totalidade, o que não era possível até então.

De modo geral, o jornalismo ainda não absorveu essa influência e não

definiu o papel de uma linguagem com essas características. Alguns experimentos,

geralmente realizados por pessoas que combinavam habilidades em design e

programação com curiosidade de construir e explorar bases de dados, encorajaram

que alguns meios experimentassem usar visualizações como recurso jornalístico.

Neste momento, em que o jornalismo está usando cada vez mais esse recurso, é

necessário pensar em melhorar as possibilidades e capacitar o jornalismo – e os

jornalistas – para identificar situações em que visualizações possam ser úteis e o

que é necessário para fazê-las. Também é necessário pensar nas necessidades do

leitor quanto a repertório e capacidade de extrair informação das visualizações

fornecidas.

As características e possibilidades da visualização não têm paralelo nem

precedente. Sua compreensão é fundamental para identificar oportunidades de usá-

la e, quando isso acontecer, ter um mínimo de recursos para realizá-la.

1.1 PROBLEMA

Quais as condições necessárias para que a visualização de dados se afirme

como um formato jornalístico adequado para meios massivos?

7 Termo que se refere a quem decide quais notícias serão divulgadas (BAHIA, 1990).

1.2 HIPÓTESES

Para que a visualização de dados se afirme como linguagem jornalística,

principalmente quando for a única forma de comunicar grandes volumes de dados, é

necessário uma atenção especial ao espectro de leitores no que se refere a facilitar

a sua compreensão. Esse apoio ao leitor pode se dar, por exemplo, através de

legendas e explicações sobre como fazer a leitura. Dentro dessa compreensão,

também é necessário considerar que as visualizações sejam adequadas ao suporte

final, seja impresso, web, vídeo ou outro.

Há vários recursos de software que permitem que qualquer pessoa faça

visualizações com facilidade. Porém, ainda é necessário conhecimento prévio do

assunto que se quer abordar, para escolher qual dos modelos pré-existentes é o

mais adequado. E conhecimentos de programação dão a liberdade de não ter que

se adaptar aos formatos predeterminados dos softwares já existentes.

É necessário um conhecimento multidisciplinar para a realização de

visualizações dentro do jornalismo, independente da ferramenta escolhida. É

necessário conhecimento jornalístico para ver o que é interessante, conhecimento

de estatística para escolher os dados corretos e fazer operações entre eles a fim de

gerar números mais úteis, conhecimentos de design para produzir uma visualização

que seja possível de ser reproduzida no suporte escolhido, e os conhecimentos da

própria ferramenta que vai gerar a visualização, seja uma ferramenta específica ou

uma linguagem de programação. O realizador da visualização pode prescindir de

alguns desses conhecimentos, mas, mais cedo ou mais tarde, precisará de ajuda

para suprir o que falta.

1.3 OBJETIVOS

1.3.1 Objetivo geral

Analisar, do ponto de vista comunicacional, as condições necessárias tanto

para a realização de visualizações de dados como para que ela se torne mais uma

linguagem possível dentro do jornalismo.

1.3.2 Objetivos específicos

Analisar a relação das bases de dados e suas visualizações com os

diferentes gêneros jornalísticos, para entender as possibilidades que elas têm como

formato jornalístico.

Comparar as diferentes abordagens de bases de dados dentro dos já

usados por diferentes autores. Analisar quais as ferramentas e métodos disponíveis para a realização de

visualizações de acordo com as possibilidades e estruturas de cada meio de

comunicação.

Analisar as possibilidades e limitações das visualizações de diferentes tipos

de dados nos meios de massa e em diferentes suportes, como web, impresso e

vídeo.

Propôr diferentes níveis de conhecimento (multidisciplinar) que os jornalistas

devem ter para realizá-la.

1.4 METODOLOGIA

Para conceitualizar os elementos pesquisados, foi feita pesquisa

bibliográfica, fazendo conexões entre autores das áreas do design da informação e

da comunicação. Essa pesquisa também aportou base teórica para uma posterior

pesquisa descritiva, na qual foram analisados alguns exemplos de visualizações de

dados, tanto publicados em meios jornalísticos como em outros contextos. Essa

diferenciação foi feita para buscar elementos que os veículos jornalísticos teriam

usado para garantir a leitura e entendimento das visualizações, em contrapartida a

um possível maior descompromisso de visualizações que não foram publicados em

meios jornalísticos. Foram escolhidos seis exemplos de visualizações de dados,

sendo três dentro de um contexto de mídia de massa e três que não

necessariamente têm objetivos jornalísticos, mas têm um caráter exploratório.

Dentro da mídia de massa, o principal objeto de pesquisa será o infográfico

em vídeo “How Mariano Rivera Dominates Hitters”, publicado pelo New York Times,

que inclui dois usos de visualização, para exploração dos dados pelos jornalistas e

para a visualização do público (CARTER; GRAHAM; WARD, 2010). Também serão

analisados os infográficos “Reading, Writing and Earning Money”, da revista Good

(HUBACEK, 2011) e “Os números do estado”, base de dados presente na série de

reportagens “Retratos do Paraná”, do jornal curitibano Gazeta do Povo (GAZETA,

2011).

No que se refere a visualizações não-jornalísticas, serão analisadas a série

“Race and Ethnicity”, de Eric Fischer (FISCHER, 2010) e duas visualizações da

mesma base de dados (LUMINOSO, 2012 e VON WORLEY, 2012), resultado da

pesquisa “Color Survey”, feita pelo quadrinhista Randall Munroe (MUNROE, 2010).

2 BASES DE DADOS, VISUALIZAÇÕES E GÊNEROS JORNALÍSTICOS

Dentro das redações, os gêneros jornalísticos exercem um papel

semelhante ao de um cardápio. O repórter sabe se um assunto vai render uma nota,

uma notícia, ou uma reportagem; um editor solicita uma matéria de análise ou uma

matéria de serviço; opiniões são expressadas através de editoriais e de charges; um

programa de televisão pode ser uma entrevista ou um documentário. A taxonomia

do jornalismo serve para delinear o produto final como um conjunto onde

predominarão produtos de um ou outro tipo, como o jornalismo literário na revista

Piauí8, ou matérias de análise em um jornal econômico.

Encaixar as bases de dados e as visualizações em algum – ou alguns –

gêneros é incluí-las nesse “cardápio”, para que os jornalistas considerem a

possibilidade de usá-las. Discutir os gêneros também serve para decidir qual é a

função de uma visualização: ela pode ter o valor de uma reportagem, ou prestar um

serviço, por exemplo. O ponto de partida para a análise será a taxonomia definida

por José Marques de Melo: informativo, opinativo, interpretativo, diversional e

utilitário (COSTA, 2010, p. 43). Uma primeira leitura encaixaria as base de dados e

as visualizações no jornalismo interpretativo. Porém, não se deve descartar uma

possível apropriação do formato pelos outros gêneros jornalísticos.

2.1 NO GÊNERO INTERPRETATIVO

É consenso entre vários autores o pioneirismo de Alberto Dines ao fundar o

Departamento de Pesquisa e Documentação do Jornal do Brasil (COSTA; LUCHT,

2010, p. 109). Esse fato, que ocorreu em meados dos anos 60, é considerado um

marco do jornalismo interpretativo no Brasil. Também pode ser considerado um

marco do jornalismo em base de dados (BARBOSA, 2007, p. 104), pelo pioneirismo

em facilitar informações aos jornalistas, o que já cria uma relação entre o jornalismo

interpretativo e o jornalismo em base de dados.

Mário Erbolato cita que o jornalismo interpretativo também é “conhecido

como jornalismo em profundidade, jornalismo explicativo ou jornalismo motivacional

(ERBOLATO apud COSTA; LUCHT, 2010, p. 109). Segundo Paulo Roberto Leandro

8 Revista brasileira que se caracteriza por reportagens longas, no estilo do jornalismo literário.

e Cremilda Medina, “é realmente o esforço de determinar o sentido de um fato,

através da rede de forças que atuam nele – não a atitude de valoração desse fato ou

de seu sentido, como se faz em jornalismo opinativo” (LEANDRO; MEDINA apud

COSTA; LUCHT, 2010, p. 110). Cabe destacar que Leandro e Medina não

consideravam o jornalismo interpretativo como um gênero separado. Ainda segundo

eles, no jornalismo interpretativo,

as linhas de tempo e espaço se enriquecem: enquanto a notícia registra o aqui, o já, o acontecer, a reportagem interpretativa determina um sentido desse aqui num círculo mais amplo, reconstitui o já no antes e no depois, deixa os limites do acontecer para um estar acontecendo atemporal ou menos presente. Através da complementação de fatos que situem ou interpretem o fato nuclear, através da pesquisa histórica de antecedentes, ou através da busca do humano permanente no acontecimento imediato, a grande reportagem é interpretação do fato jornalístico (ibidem, p. 111).

Costa e Lucht também citam Luiz Beltrão, que fala na interpretação como o

“ato de submeter os dados recolhidos no universo das ocorrências atuais e idéias

atuantes a uma seleção crítica, a fim de proporcionar ao público os que são

realmente significativos” (BELTRÃO apud COSTA; LUCHT, 2010, p. 112). Na

análise de Costa e Lucht dos textos de Beltrão, encontra-se que ele pondera sobre

quem deve fazer a interpretação, se o jornalista ou o público. No primeiro caso, há a

possibilidade de o produto jornalístico ter caráter opinativo disfarçado de

interpretação, o que leva Beltrão a definir jornalismo interpretativo como um

“jornalismo que oferece todos os elementos da realidade, a fim de que a massa, ela

própria, a interprete” (ibidem, p. 113). O resultado seria a “informação em toda a sua

integridade, captada, analisada e selecionada pelo jornalista, ao qual não cabe o

diagnóstico” (idem).

Apesar que a variedade de conceitos e ideias parece confirmar que o

jornalismo interpretativo é “uma categoria carente de configuração estrutural”

(MARQUES DE MELO apud COSTA; LUCHT, 2010, p. 113), encontram-se

afinidades entre os ideais do jornalismo interpretativo e as visualizações, a começar

pelo uso de bases de dados, mesmo que não como formato e sim como apoio ao

jornalista. A ausência de opinião citada por Beltrão e por Leandro e Medina também

é afim à imparcialidade das visualizações. Leandro e Medina citam o

aprofundamento da informação como inerente ao jornalismo interpretativo; a ideia

das bases de dados e visualizações de disponibilizar a totalidade de uma informação

é uma maneira de aprofundar o conhecimento, e também é condizente com a ideia

de Beltrão de oferecer ao leitor “todos os elementos da realidade”.

2.2 NO GÊNERO INFORMATIVO

Segundo Nilson Lage, o jornalismo informativo se apoia no tripé

imparcialidade, veracidade e objetividade (LAGE apud COSTA, 2010 p. 48). Sobre a

objetividade, destaca-se com a definição citada por Costa e por Michael Kunczik: “[a

objetividade] é o grau de identidade entre o fato e a sua descrição mediante a

informação” (KOSCHWITZ apud KUNCZIK, 2002, p. 223). Para Marques de Melo, o

jornalismo informativo é a combinação da articulação entre os acontecimentos reais

e sua expressão (MARQUES DE MELO apud COSTA, 2010, p. 50).

Nas bases de dados, essa articulação é reduzida ou inexistente, e portanto

(quase) não há risco de falta de objetividade. Nas visualizações, essa articulação se

dá não pela escolha de quais dados serão exibidos, e sim pela escolha de como

fazer para que os dados sejam exibidos em sua totalidade. A expressão dos

acontecimentos reais se dá através da transformação deles em números e a

transformação desses números em símbolos, como será visto adiante.

Todavia, há possibilidades de perda de objetividade na construção de bases

de dados e de visualizações. Se nas reportagens e matérias escritas o que faz com

que a objetividade varie são “escolhas de sintaxe, de léxico e de temática” (COSTA,

2010, p. 48), nas visualizações e bases de dados essa variação pode acontecer por

uma escolha errada dos dados ou de sua fonte, ou por escolher um tipo de gráfico

que privilegie certo aspecto dos dados e não outro.

2.3 NO GÊNERO UTILITÁRIO

Se concebidas para que o leitor tenha acesso à informação que precisa, as

bases de dados e as visualizações podem ser uma forma de jornalismo de serviço,

mas isso depende da natureza dos dados disponibilizados. Uma base de dados com

o dinheiro gasto pelos deputados tende à função informativa; já um mapa que

mostra quais os cinemas da cidade se aproxima do serviço, já que serve para saber

qual cinema fica mais perto da casa do leitor. Porém, os dados não perdem seu

caráter informativo: esse mapa dos cinemas pode servir também, por exemplo, para

tirar conclusões sobre qual região da cidade registra maior concentração de cinemas,

e essas conclusões podem servir para realizar uma análise sobre os fatores sócio-

econômicos próprios dessas regiões.

2.4 NOS GÊNEROS OPINATIVO E DIVERSIONAL

Dentro de um material de natureza opinativa ou diversional, os dados devem

manter sua integridade, e a base ou visualização em si mantêm sua natureza

informativa. A linguagem dos dados comunica uma precisão que não deve ser usada

para transmitir dados errôneos ou subjetivos. Apesar de uma visualização poder ser

usada para expressar valores gerados a partir de subjetividades, a linguagem do

gráfico nos remete a uma precisão. Um gráfico não pode ser subjetivo: em todo caso,

ele mede, objetivamente, subjetividades. Por mais que ele apoie um material

opinativo, as bases de dados (ou as visualizações) devem mantém sua essência

informativa, e nem a opinião do autor nem sua subjetividade devem permear os

dados.

2.5 VISUALIZAÇÕES E GÊNEROS JORNALÍSTICOS

Além da tentativa de encaixar as visualizações e bases de dados em

gêneros, é interessante pensar em como elas se encaixam na classificação de

Marques de Melo do jornalismo informativo: nota, notícia, reportagem e entrevista

(MARQUES DE MELO apud COSTA, 2010, p. 55). Desconsiderando esta última,

passamos à sequência nota-notícia-reportagem. A nota é uma coisa curta, que pode

se transformar em uma notícia. Ambas se caracterizam pela imediatez da

informação em oposição ao aprofundamento típico da reportagem, que é “o relato

ampliado de um acontecimento que já repercutiu no organismo social e produziu

alterações que já são percebidas pela instituição jornalística” (ibidem, p. 53). Pela

natureza de fazer um levantamento e edição de uma base de dados, é possível

considerar que a maioria das bases de dados (e visualizações) se encaixariam na

categoria reportagem. Mesmo em casos que a visualização seja minúscula e

subordinada a uma notícia, a ideia de aprofundamento e pesquisa se mantém. Por

exemplo, uma notícia sobre a alta do dólar pode ser acompanhada por uma

visualização mostrando os valores anteriores, o que implica, em uma escala

reduzida, uma pesquisa e um aprofundamento da informação, também

emparentados com o jornalismo interpretativo.

Por serem gêneros que são definidos principalmente pela sua forma, é uma

tarefa complicada encaixar as bases de dados e as visualizações em algum dos

gêneros jornalísticos já existentes. Elas têm afinidade tanto com o gênero

interpretativo como com o informativo, além de poderem ser usadas em contextos

opinativos ou até diversionais. Na maioria dos casos podem ter o peso de uma

reportagem, estar mais próximo da objetividade desejada pelo gênero informativo e

proporcionar a profundidade necessária ao gênero interpretativo.

Mais do que tentar encaixá-las em alguma dessas categorias, o jornalista

deve saber dessas características das bases de dados e das visualizações para

saber quando e como usá-las, assim como sabe quando um artigo opinativo é

adequado a alguma cobertura jornalística. Com isso, as bases de dados e as

visualizações podem – e devem – fazer parte do “cardápio” de um veículo

jornalístico.

Esse delineamento de qualidades das bases de dados e das visualizações

também deve ser considerado no momento de não usá-las. É necessário pensar se

disponibilizar uma base de dados é realmente útil para o leitor, ou se o uso de uma

visualização em um contexto de opinião não vai contradizer o articulista, por

exemplo. Assim como com todos os outros formatos jornalísticos existentes, é

necessário escolher – e editar – corretamente.

3 BASES DE DADOS

I read the news today oh, boy Four thousand holes in Blackburn, Lancashire

And though the holes were rather small They had to count them all

Now they know how many holes it takes to fill the Albert Hall (The Beatles, “A Day in the Life”)

O uso das bases de dados por parte do jornalismo está em um processo de

mudança, ficando mais comum dentro da redação e mais visível fora dela. Elas

ganharam cada vez mais espaço nas redações, primeiro como apoio para a

apuração e depois como um lugar para procurar informações que possam apoiar ou

inspirar reportagens. Nessa transição, as bases de dados estão se afirmando como

um novo formato. Por exemplo, é impossível citar, em uma reportagem, a taxa de

analfabetismo de todos os municípios brasileiros; mas é possível fornecer ao leitor

uma ferramenta na qual ele possa consultar a taxa do seu município.

Essas possibilidades implicam na edição e tratamento das informações,

além da criação de uma interface para que o usuário possa navegar e fazer

consultas. Porém, poucos dados podem ser consultados de cada vez. A outra

abordagem possível, que permite a apreensão de todos os dados simultaneamente,

é a visualização. Os dados são a origem de uma visualização e a principal razão de

produzi-las. E o recurso de poder visualizar os dados deveria estar sempre presente

em redações onde sejam usadas informações desse tipo.

3.1 BREVE HISTÓRICO E CONCEITOS

Em primeiro lugar, é necessário pensar nos diferentes definições de base de

dados. Começaremos por um conceito oriundo da ciência da computação, citado por

Manovich:

Nas ciências da computação, a base de dados é definida como uma coleção de dados estruturada. Os dados armazenados em uma base de dados estão organizados para permitir sua rápida busca e recuperação usando um computador e, portanto, a base é tudo exceto uma simples coleção de itens. Diferentes tipos de bases de dados – hierárquicas, de rede, relacionais e orientadas ao objeto – usam diferentes modelos para organizar os dados. […] Eles aparecem como coleções de itens nos quais o usuário

pode fazer várias operações: ver, navegar, buscar. (MANOVICH, 2001, p. 194).9

O conceito citado por Manovich é amplo o bastante para incluir os bancos de

dados usados nos primórdios da informatização das redações, entre meados dos

anos 60 e começo dos 70. Nessa época, a função dos bancos de dados era servir

de apoio à redação, em uma espécie de biblioteca digital com enciclopédias,

resumos de artigos, fontes para ajudar na produção de matérias (BARBOSA, 2007,

p. 104).

Esse começo levou ao surgimento da RAC – Reportagem Assistida por

Computador, que é a ideia de usar computadores para obter informação para as

notícias (GARRISON apud BARBOSA, 2007, p. 109). A RAC passou por mutações

em meados dos anos 90, com a popularização da Internet, e continuará mutando, à

medida que novas ferramentas sejam criadas.

Além da maneira de produzir reportagens, o uso de computadores e a

popularização da web também influenciou na maneira de transmiti-las. Isso pode ser

visto comparando as três gerações de webjornalismo (MIELNICZUK, 2003, p. 29): a

primeira, que é a transposição do formato do jornal impresso para a internet; a

segunda, quando começaram a ser usados alguns recursos interativos e a terceira,

onde os recursos próprios da internet começam a ser usados de maneira mais

natural e valorizando a interação com o leitor.

É no webjornalismo de terceira geração que começa a se pensar na base de

dados menos como um depósito das informações de um site de notícias

(MACHADO, 2007, p. 117) e mais como um elemento independente, com caráter

jornalístico e uma edição específica. Em qualquer uma dessas abordagens, a base

de dados é indispensável para a existência do webjornalismo.

Pensando na sua função como repositório de informações de um site, é

necessária para possibilitar o envio e exibição de textos, fotos e vídeos, entre outros,

que componham uma notícia. Essa ideia é coerente com o conceito de Manovich, de

que serão elas quem estruturão os novos objetos midiáticos: “todos os objetos da

9 Tradução do autor. Texto original: “In computer science database is defined as a structured collection of data. The data stored in a database is organized for fast search and retrieval by a computer and therefore it is anything but a simple collection of items. Different types of databases — hierarchical, network, relational and object-oriented — use different models to organize data. […] They appear as a collections of items on which the user can perform various operations: view, navigate, search.”

nova mídia, sejam eles criados desde o início em computadores ou convertidos a

partir de fontes analógicas, são compostas de código digital; eles são

representações numéricas.” (MANOVICH, 2011, p. 49).10

É importante destacar que uma base de dados, tanto nos conceitos citados

como no recorte para esta pesquisa, não necessariamente é composta por números;

é possível trabalhar com todo tipo de informações e, inclusive, todo tipo de mídias,

como será visto nos exemplos apresentados no decorrer do trabalho.

Na sua função como um elemento jornalístico, ela é fundamental para

associar outras informações, como outras notícias, através de elementos

hipertextuais, além de cumprir o papel de um arquivo cada vez mais dinâmico e fácil

de acessar, ou até, segundo Machado, como “um espaço para a composição de

narrativas multimídia” (MACHADO, 2007, p. 111).

Nesses dois casos, é possível pensar no meio por onde se tem acesso a

essa base de dados (geralmente um site de notícias, mas também agregadores,

leitores de RSS, ou até SMS) como uma interface entre a base de dados e o leitor. É

possível aplicar a seguinte ideia de Manovich:

Alguns objetos de mídia seguem explicitamente a lógica das bases de dados em sua estrutura enquanto outras não; mas por debaixo da superfície praticamente todos são bases de dados. Geralmente, a criação de um trabalho de novas mídias pode ser entendida como a construção de uma interface para uma base de dados. (MANOVICH, 2001, p. 200)11

Tanto na função de motor como na função jornalística, as bases de dados

são, na maioria dos casos, um elemento invisível ao leitor. Porém, elas estão ficando

cada vez mais em evidência como objeto de mídia, ou, para este trabalho, como

formato jornalístico.

3.2 BASES DE DADOS COMO FORMATO DENTRO DO WEBJORNALISMO

Mielniczuk (2003, p. 39) define seis características do webjornalismo:

interatividade, personalização, hipertextualidade, multimidialidade ou convergência,

10 Tradução do autor. Texto original: “All new media objects, whether they are created from scratch on computers or converted from analog media sources, are composed of digital code; they are numerical representations.” 11 Tradução do autor. Texto original: "Some media objects explicitly follow database logic in their structure while others do not; but behind the surface practically all of them are databases. In general, creating a work in new media can be understood as the construction of an interface to a database."

memória e instaneidade ou atualização contínua. Essas características se

encontram presentes também quando deixamos de pensar nas bases de dados

como um motor de um site de notícias e começamos a pensá-las como produto

jornalístico: graças à interação conseguimos informações personalizadas, o

hipertexto faz parte dessa interação, e os dados são preservados e atualizados

constantemente. No que se refere à multimidialidade, podemos considerar que as

bases de dados se juntam às fotografias e vídeos como mais um elemento.

Fidalgo (2007, p. 109), além de reafirmar a validade do formato jornalístico,

considera a base de dados como um conjunto que pode chegar ao infinito. Segundo

ele, as bases de dados podem ser acrescidas de cada vez mais dados,

considerando os novos campos como vértices, arestas e planos de um poliedro que

vai se aproximando da forma de uma esfera, metáfora da totalidade absoluta dos

dados, o que estaria alinhado com a relação de “completude” apontada por Groth

como fundamental para o jornalismo (GROTH apud FIDALGO, 2007, p. 108). Apesar

que Fidalgo se refere à totalidade de informações de um site de notícias, podemos

aplicar esse pensamento às bases de dados editadas. Por exemplo, uma base com

informações de alguns municípios do Paraná pode se expandir até ter informações

de todos os municípios, e talvez de todos os municípios do Brasil, em sintonia com

os conceitos de “completude” e atualização contínua.

3.3 BASES DE DADOS COMO PRODUTO JORNALÍSTICO

McLuhan (1969, p. 38) citava a baixa resolução como uma característica da

televisão. Os espectadores têm que preencher a imagem, imaginar o que está fora

dela, pensar nos detalhes menores que as então grandes linhas que formavam a

imagem não conseguiam mostrar, e, à época, também imaginar as cores. Essa

limitação técnica do suporte é análoga à que acontece com outros suportes e,

consequentemente, com seus produtos jornalísticos.

Textos têm um tamanho limitado pelos projetos gráficos e editoriais de

jornais e sites, além das limitações das mídias, como a limitação de espaço físico

em páginas de mídias impressas e de cansaço ao ler em telas que emitem luz. O

corte de informações em fotografias se dá já na instância do clique, onde a decisão

varia entre o excesso de informação de uma grandeangular e a menor deformação

de uma teleobjetiva. Ajustes de exposição, contraste e saturação das cores também

implicam na escolha de informação que vai ficar de fora, e por último, o espaço

destinado a elas em uma publicação, impressa ou online, determina que tantos

detalhes serão visíveis. Infográficos jornalísticos permitem a convivência de

informações em várias linguagens, mas sofrem as mesmas limitações das diferentes

linguagens que eles combinam. Essas possibilidades e limitações exigem processos

de edição específicos, nos quais além da atividade do gatekeeper (BAHIA, 1990)

temos as edições que são necessárias por limitações técnicas dos meios, como a

falta de espaço12.

Pensar a base de dados dentro dos diferentes gêneros jornalísticos pode

ajudar a analisá-la como linguagem. Como o termo “base de dados” diz respeito à

forma que a informação tem, o gênero e/ou a função pode ser definido a partir da

decisão do jornalista do que é necessário mostrar, como será mostrado, e como

sera lida, usada ou visualizada pelo leitor.

Como sua premissa é apresentar ao leitor a totalidade da informação,

Fidalgo aponta o problema de como conjugar a concisão que uma notícia deve ter

com a complexidade inerente à alta densidade de dados, principalmente no que se

refere à sua compreensão: “A alta resolução semântica não deve descambar num

complexo sistema informativo de difícil apreensão” (FIDALGO, 2007, p. 106). Como

solução, Fidalgo propõe uma navegação facilitada pelas diferentes “camadas

semânticas”, que podemos associar com a ideia de layering de Tufte (1990, p. 53)

que veremos mais adiante.

Para este trabalho, consideraremos a base de dados como um conjunto de dados que foram selecionados e editados para um determinado propósito

(grifo meu), como explorá-los para conseguir uma visualização ou divulgá-los ao

público mediante uma interface. Essa edição se dá não na quantidade dos dados,

mas sim nas suas qualidades, como veremos adiante. Note-se que essas bases de

dados não necessariamente estarão online, mesmo que seus dados tenham sido

obtidos dessa maneira.

12 Também é possível fazer esta edição levando em consideração o interesse do leitor como parte de um público alvo, mas isso não será levado em consideração neste trabalho.

3.4 DADOS E FERRAMENTAS AO ALCANCE DE TODOS

Estamos passando por um momento no qual se debate se há abundância ou

excesso de dados. Mesmo assim, houve uma melhora no acesso à informação e a

recursos informáticos, como descrito por Dominique Wolton:

Também para o acesso às bases de dados que o progresso é real. Acessar, escolher, circular por si mesmo e fazer a sua própria informação permitem não somente ganhar tempo, mas também acessar “reservas” de conhecimento totalmente imprevisíveis. (WOLTON, 2007, p. 87).

Esse progresso nos dados e nas ferramentas para analisá-los se reflete no

uso desses recursos por parte do jornalismo. A ideia de “fazer a sua própria

informação”, presente já no surgimento da RAC, é reforçada pelos recursos

disponíveis para jornalistas, para o público em geral, e pelos recursos

disponibilizados pelo jornalismo para o público em geral. Essa proposta está

alinhada com a filosofia do Open Data13 e a da transparência política, no qual se

defende que a população em geral tenha acesso aos dados de gastos dos órgãos e

funcionários públicos.

O jornalismo sempre teve a função de ser intermediário entre os dados e os

leitores, mas essa função adquire novos significados com essa enxurrada de dados.

A função tradicional seria a exploração desses dados em busca de notícias, o que

foi facilitado pela tecnologia. E pouco depois a tecnologia facilitou também novas

formas de mostrar essas informações aos leitores, que, segundo Tufte, conseguem

sobreviver à enxurrada:

Nós prosperamos em mundos cheios de informação graças às nossas maravilhosas e cotidianas capacidades para selecionar, editar, isolar, estruturar, destacar, agrupar, formar pares, mesclar, harmonizar, sintetizar, focar, organizar, condensar, reduzir, escolher, categorizar, catalogar, classificar, listar, abstrair, escanear, observar, isolar, discriminar, distinguir, separar, rotular, ordenar, integrar, misturar, verificar, filtrar, ignorar, fazer médias, aproximar, agregar, resumir, dividir em itens, rever, mergulhar, folhear, olhar, ler rapidamente, refinar, enumerar, extrair informações, fazer sinopses e separar o joio do trigo (TUFTE, 1990, p. 50)14.

13 Open Data é a filosofia ou prática que defende que certos tipos de dados estejam disponíveis para a população de modo geral, sem restrições de patentes nem direitos autorais. 14 Tradução do autor. Texto original: “We thrive in information-thick worlds because of our marvelous and everyday capacity to select, edit, single out, structure, high-light, group, pair, merge, harmonize, synthesize, focus, organize, condense, reduce, boil down, choose, categorize, catalog, classify, list, abstract, scan, look into, idealize, isolate, discriminate, distinguish, screen, pigeonhole, pick over, sort,

Todos esses fatores apontam para a consolidação das bases de dados

como produto jornalístico. Nesse aspecto, Barbosa aponta um possível cenário

futuro, fruto da evolução das bases de dados como produto jornalístico:

Logo, a nossa tarefa de compreender a atribuição de um novo status para as BDs [Bases de dados] no jornalismo digital nos leva a considerar que as mudanças conformadas a partir da concepção de bases de dados como um formato e metáfora para o jornalismo digital podem gerar o diferencial para essa modalidade, conduzindo-a a uma nova etapa de desenvolvimento. Quem sabe, à quarta geração. (BARBOSA, 2005, p. 11).

Nessa quarta geração prevista por Barbosa certamente há espaço para as

bases de dados como formato jornalístico, e, portanto, para a visualização. Apesar

de bases de dados e visualizações não serem objetos necessariamente ligados ao

jornalismo online, é ali onde encontram espaço e possibilidades para a criação de

novas narrativas e a afirmação do digital como meio.

integrate, blend, inspect, filter, lump, skip, smooth, chunk, average, approximate, cluster, aggregate, outline, summarize, itemize, review, dip into, flip through, browse, glance into, leaf through, skim, refine, enumerate, glean, synopsize, winnow the wheat from the chaff and separate the sheep from the goats.”

4 VISUALIZAÇÃO: DA UNIDADE AO CONJUNTO

4.1 DEFINIÇÃO

Apesar de o termo visualização já estar associado ao objeto deste trabalho –

gráficos complexos que representam grandes volumes de dados – tentaremos

chegar a uma definição ampla o suficiente para abarcar tanto os trabalhos já

existentes (como os que serão analisados) como os que possam surgir, em um

processo indutivo, partindo do extremo mais simples, para depois chegarmos a

exemplos mais complexos, como os analisados neste trabalho.

Começaremos com uma pergunta de Tufte: “O mundo é complexo,

dinâmico, multidimensional; o papel é estático, plano. Como representar o rico

mundo visual de experiência e mensuramentos na mera planolândia? (TUFTE, 1990,

p. 9)15.

E com a definição do trabalho de Michael Friendly:

o termo visualização de informação geralmente se aplica à representação visual de coleções de grande escala de informação não numérica, como arquivos e linhas de código em programas, bases de dados bibliográficas, redes de relações na internet, e assim por diante. (FRIENDLY, 2009, p. 2)16

Mais adiante, Friendly fecha um pouco o conceito, se aproximando do foco

deste trabalho:

focamos no domínio, um pouco mais estreito, da visualização de dados, a ciência da representação visual de “dados”, definida como informação que foi abstraída de alguma maneira esquemática, incluindo atributos ou variáveis para as unidades de informação. (FRIENDLY, 2009, p. 2)17

Em “The Language of New Media” (MANOVICH 2007) é possível garimpar

algumas conceituações: “um mapeamento entre dados discretos e uma

15 Tradução do autor. Texto original: “The world is complex, dynamic, multidimensional; the paper is static, flat. How are we to represent the rich visual world of experience and measurement on mere flatland?” 16 Tradução do autor. Texto original: “the term information visualization is generally applied to the visual representation of large-scale collections of non-numerical information, such as files and lines of code in software systems, library and bibliographic databases, networks of relations on the internet, and so forth.” 17 Tradução do autor. Texto original: “we focus on the slightly narrower domain of data visualization, the science of visual representation of “data”, defined as information which has been abstracted in some schematic form, including attributes or variables for the units of information.”

representação visual” (p. 148), “comunicação de dados abstratos através do uso de

interfaces visuais interativas” (KEIM et al apud MANOVICH, 2007, p. 148) 18 e

“mapeamento de algumas propriedades dos dados em uma representação visual” (p.

Essas três definições implicam na ideia de comunicar dados através de uma

transposição (da linguagem numérica para a visual) na qual, além de mudar o

código, é necessário editar o corpus (a base de dados) do que queremos evidenciar

para que este se adapte a nosso novo código; ou ainda adaptar o nosso código para

evidenciar melhor o que queremos mostrar do corpus.

Na TED Talk ministrada pelo jornalista e designer David McCandless, do site

Information is Beautiful, ele fala sobre visualizar informação:

através da visualização de informação, nós a transformamos [a informação] em uma paisagem que você pode explorar com seus olhos, uma espécie de mapa da informação. E quando você está perdido na informação, um mapa da informação pode ser útil. […] visualizar informação como esta é uma forma de compressão de conhecimento. É uma maneira e espremer uma quantidade enorme de informação e compreensão em um espaço pequeno (McCANDLESS, 2010).19

Por último, temos a opinião de Antony Unwin:

Porquê visualizar dados é importante? A visualização de dados é boa para limpar dados, para explorar dados […], para identificar tendências e agrupamentos, para encontrar padrões locais, para avaliar modelos de output e para apresentar resultados. A visualização é essencial para a análise exploratória de dados. (UNWIN; THEUS; HOFMANN, 2006, p. 1, 2006)20

É interessante notar o conceito de input–output (entrada e saída) presente

nessas definições, nas quais o input são dados e o output é uma visualização. Isso

também nos remete ao princípio garbage in, garbage out, proveniente da ciência da

18 Manovich cita essa definição para falar de como o termo “visualização” é encarado por autores da ciência da computação 19 Tradução do autor: “By visualizing information, we turn it into a landscape that you can explore with your eyes, a sort of information map. And when you’re lost in information, an information map is kind of useful.” But what it points to is that visualizing information like this is a form of knowledge compression. It;s a way of squeezing an enormous amount of information and understanding into a small space. 20 Tradução do autor: “Why is visualizing data important? Data visualization is good for data cleaning, for exploring data […], for identifying trends and clusters, for spotting local patterns, for evaluating modelling output and for presenting results. Visualization is essential for Exploratory Data Analysis.

computação, que diz que a qualidade do output depende da qualidade do input

(LIDWELL; HOLDEN; BUTLER, 2003, p. 94). Esse princípio se aplica às

visualizações (e também às bases de dados, quando usadas como formato): para

que sejam de qualidade, é necessário atentar para a qualidade das bases de dados.

A partir de todas estas definições, podemos tentar definir o termo

“visualização” como uma representação visual de um número geralmente grande de dados que possam ser representados numericamente (grifo meu). Porém,

esta definição gera algumas ambiguidades que servirão para pôr o conceito à prova:

4.1.1 Quanto é “grande”

Podemos pensar que um número de dados é “grande” quando não pode ser

entendido por si só e precisa ser comprendido com a ajuda de recursos como

comparações ou gráficos. O ponto em que um volume de dados se torna

incompreensível varia segundo o leitor, mas podemos afirmar que, à medida que a

quantidade de dados a serem lidos aumenta, a capacidade de apreender seu

significado e poder fazer relações entre eles diminui. É possível comparar dois

dados (a cotação do Dólar Comercial em 2 de janeiro de 2012 foi de R$ 1,86 e na

mesma data de 2011 foi de 1,65), mas a dificuldade aumenta quando colocamos

mais números (a cotação do Dólar Comercial em janeiro de 2012 foi de R$ 1,869 no

dia 2, R$ 1,832 no dia 3, R$ 1,827 no dia 4, R$ 1,841 no dia 5, R$ 1,851 no dia 6,

R$ 1,835 no dia 9, R$ 1,801 no dia 10, R$ 1,801 no dia 11, R$ 1,785 no dia 12,

R$ 1,7632 no dia 25, R$ 1,744 no dia 26, R$ 1,739 no dia 27, R$ 1,749 no dia 30 e

R$ 1,747 no dia 31).

O número de dados também é “grande” porque a premissa da visualização é

que os dados sejam exibidos em sua totalidade (MANOVICH, 2007, p. 157), sem

que haja cortes. Unwin justifica: “se um conjunto de dados é tão grande, porquê

simplesmente não pegar uma grande amostra? Mas amostras não vão mostrar as

exceções, estruturas locais, ou erros sistemáticos nos dados” (UNWIN; THEUS;

HOFMANN, 2006, p. 1)21

4.1.2 O que é “visual”

Quando o Produto Interno Bruto (PIB) é divulgado como variação, e não

como número absoluto, há uma tentativa de representar valores maiores de uma

maneira mais acessível, em um processo de intenções similares às da visualização.

É mais fácil entender que houve um aumento de 7,5% do que saber que em 2009 o

PIB foi de R$ 3,143 trilhões e em 2010 de R$ 3,675 trilhões. Temos então uma

espécie de visualização na qual dados numéricos são simplificados e representados

em linguagem oral. Outro exemplo poderia ser uma comparação oral ou metáfora,

como dizer “o coração é do tamanho de um punho fechado”. Temos então que uma

visualização não precisa, necessariamente, ser “visual”. Os exemplos anteriores

geram uma visualização mental no receptor da mensagem. Temos também a

possibilidade de visualizações sonoras. Um exemplo é o infográfico “The Dow Piano”,

no qual notas mais graves representam níveis mais baixos do índice Dow Jones, a

intensidade do som reflete a quantidade de operações e o ritmo das notas

representa as semanas. (EDLUND, [2011?]). Outras possibilidades são as

explorações sonoras, como o projeto do DJ Ramjac, que sobrepôs, em uma única

faixa sonora, todas as músicas gravadas pelos Beatles (RAMJAC, [2011?]); ou o

trabalho de Mike Lacher, que sobrepôs todos os hits de Billy Joel (LACHER, [2010?]).

Esse tipo de experiência tem pontos em comum com a visualização no que se refere

à busca de padrões, por exemplo. Como mais uma experiência de “visualização não

visual”, temos o projeto de Matthew Epler, “Grand Old Party” (EPLER, 2012), que

consta de uma série de brinquedos sexuais com a forma do gráfico de popularidade

dos pré-candidatos republicanos à presidência dos Estados Unidos. Nesse caso, a

proposta é de uma visualização tátil que faz uma analogia sexual com as

consequências de um governo republicano.

21 Tradução do autor. Texto original: “You might ask, if a dataset is so large, why not just take a big sample? But samples will not pick out outliers, local structures, or systematic errors in the data.”

Embora os exemplos citados ainda estejam no campo da exceção, o

surgimento dessas “visualizações não visuais” atentam para que o termo “visual”

não seja encarado literalmente. Isso aumenta as possibilidades da linguagem da

visualização e inclusive permitiria pensar em visualizações acessíveis a deficientes

visuais, por exemplo.

4.1.3 Quais dados podem ser representados numericamente

Como veremos adiante, há várias formas de representação gráfica

adequadas a vários tipos de dados. Mas todas essas representações implicam em

mostrar quantidades. Se os dados surgem como numéricos, não há problemas. Mas

os dados que não sejam numéricos precisam ser transformados em números,

mesmo que esses números sejam uma tentativa de expressar subjetividades (como

podem ser notas de 0 a 10 atribuídas a filmes) ou uma classificação (dividir animais

em vertebrados e invertebrados pode ser transformados nas categorias 1 e 2, por

exemplo). Em toda visualização é comunicada uma quantidade que estará presente

mesmo que representada de diferentes maneiras.

Considerando as ambiguidades da definição, podemos encontrar alguns

exemplos que se encaixariam na ideia de visualização (apesar de serem bem mais

simples do que o tipo de trabalho que será analisado), vejamos:

Uma pesquisa hipotética que aponta que 450 dos 600 entrevistados são

torcedores de determinado time pode ser traduzido como “75% dos entrevistados”, o

que pode ser representado com um gráfico de pizza.

A informação de que o PIB brasileiro cresceu 7,5% em 2009, fruto de

operações matemáticas entre valores de difícil comparação.

Um mapa localizando uma cidade. A localização da cidade pode ser

traduzida em termos de latitude e longitude.

Uma criança mostrando com as mãos o quanto gosta de alguém, ou gesto

similar (Fig. 2).

Bono Vox batendo palmas em um certo ritmo, representando o fato que a

cada palma que ele batia uma criança morria na África – ao que alguém da plateia

respondeu “então para de bater!”22

Fig. 2 Exemplo de visualização subjetiva de dados reais, na figura do Professor Raymundo,

personagem de Chico Anysio. Fonte: AUDIÊNCIA, 2012.

Todos os exemplos citados são reduções de vários dados numéricos a um

único valor (que não necessariamente é expressado como número), e têm o objetivo

de melhorar sua compreensão para um receptor. Mesmo não sendo tão necessárias

do ponto de vista da compreensão numérica, facilitam a compreensão, e podem ter

também uma função poética de causar uma reação. Essas visualizações,

extremamente simples, são os elementos para começar a construir visualizações

mais complexas, nas quais o objetivo de esclarecer a infomação não só se mantém

mas se torna mais necessário, já que estamos pensando em milhares ou milhões de

dados em uma única visualização.

Voltemos ao trabalho “See Something or Say Something” (Fig. 1), de Eric

Fischer (2011) para pôr novamente a definição à prova, desta vez com uma

visualização mais complexa. O trabalho mapeia a localização de tweets e de fotos

armazenadas no Flickr. Nele temos um volume grande de tweets e de fotos, que

configuram um número de dados grande, praticamente impossíveis de serem

processados à mão ou lidos. Os dados analisados podem ser representados

22 O fato não é verídico, segundo o site especializado em desmentir rumores Snopes (BONO, 2008), mas foi mantido aqui por ser um bom exemplo.

numericamente, já que o lugar onde foi emitido um tweet ou onde foi postada uma

foto no Flickr é transformado em coordenadas GPS já na base de dados dos sites

(ou na própria câmera ou celular, no caso das fotos). Por último, temos que os

dados são representados de maneira visual, com cores definindo o que é cada ponto

e as coordenadas GPS sendo representadas de maneira espacial, refazendo os

mapas das cidades. Esse trabalho reúne as melhores características de uma

visualização, principalmente no que se refere a identificar padrões. Os pontos que

representam fotografias se acumulam em pontos turísticos, e os pontos que

representam tweets são visíveis em lugares de passagem, como o aeroporto do

Galeão e a ponte Rio–Niterói. Notemos ainda que o mapa não aparece, e sim é

delineado pela posição dos pontos.

4.2 DIFERENÇAS ENTRE VISUALIZAÇÃO E INFOGRAFIA

Dada a proximidade das duas atividades e o uso dos termos no presente

trabalho, é necessário fazer uma observação sobre as diferenças entre a infografia e

a visualização. De Pablos define a infografia de uma maneira ampla: “é a

apresentação impressa de um binômio imagem + texto […] qualquer que seja o

suporte onde se apresente essa união informativa: monitor, papel, plástico, barro,

pergaminho, papiro, pedra (DE PABLOS, 1999)23. Um infográfico poderia, então,

conter mais elementos visuais além das visualizações, alguns dos quais apontados

por Gonzalo Peltzer: mapas, símbolos, ilustrações, histórias em quadrinhos, etc24

(PELTZER, 1991).

Para exemplificar, foi escolhido o infográfico "La ballena Franca", de autoria

de Jaime Serra, publicado pelo jornal argentino Clarín em 1995. A obra foi premiada

nos prêmios Malofiej25 como o melhor infográfico dos últimos 20 anos (CLARÍN,

2012), e, por isso, representaria um exemplo de como é um infográfico dentro dos

"cânones" tradicionais da infografia.

23 Tradução do autor. Texto original: "es la presentación impresa de un binomio imagem + texto […], cualquiera que sea el soporte donde se presente esa unión informativa: pantalla, papel, plástico, barro, pergamino, papiro, piedra." 24 Peltzer não usa o termo infográfico ou infografia com o mesmo sentido que De Pablos, mas aqui foram usados os gêneros visuais por ele enumerados por serem bons exemplos das possibilidades de imagens a que De Pablos se refere. 25 Prêmios internacionais de infografia, entregues anualmente na Espanha.

Nele, foram destacados quais os elementos que estão dentro do conceito

aqui abordado de visualização, ou seja, que são representações visuais de dados

numéricos. Os outros elementos se encaixam nos elementos visuais apontados por

Peltzer, mas fogem do conceito aqui abordado de visualização.

Fig. 3 Uso de visualizações no infográfico "La ballena Franca" (destaques meus). Fonte do original: CLARIN, 2012.

A definição de De Pablos também incluiria trabalhos como o já visto “See

Something or Say Something” (Fig. 1), já que além da visualização em si, temos um

elemento textual imprescindível para sua compreensão, que é a explicação de como

ler a visualização. Chamar um material com essas características – visualização

densa acompanhada de legendas ou instruções de leitura – de infográfico seria

aceitável, mas no presente trabalho será preferido o termo visualização quando ela

for predominante.

5 FERRAMENTAS E ASPECTOS TÉCNICOS

Uma vez definido o que é uma visualização e qual seu possível papel dentro

do jornalismo, é possível começar a considerar quais conhecimentos são

necessários para que ela possa ser feita. É possível relacionar essa necessidade de

conhecimento com a citada por Wolton:

O limite aqui é a competência. O acesso a ‘toda e qualquer informação’ não substitui a competência prévia, para saber qual informação procurar e que uso fazer desta. O acesso direto não suprime a hierarquia do saber e do conhecimento.” (WOLTON, 2007, p. 87)

Transpondo a ideia de Wolton para o campo da visualização de dados,

podemos considerar que essa “competência” é a soma dos diferentes

conhecimentos necessários para realizar uma visualização. E ainda temos a questão

do “acesso direto”: quem faz uma visualização está facilitando o acesso à

informação, reduzindo essa necessidade de competência prévia da qual Wolton fala.

Quem faz uma visualização usa sua competência para que os leitores não precisem

usar as suas. Ben Fry (2008) define sete passos para chegar a uma visualização, que

podem ser agrupados em três fases: obtenção dos dados, escolha da forma de

visualizá-los e conseguir qualidade técnica na visualização. Esse agrupamento foi

feito para poder analisar, simultaneamente, os conhecimentos e ferramentas

necessárias em cada fase. O próprio Fry fala que “não se pode ser escravo desses

passos”26 (FRY, 2008, p. 6), mas serão analisados dessa maneira para abarcar o

maior número possível de situações.

5.1 OBTENÇÃO DOS DADOS

Dentro dos sete passos de Fry, os primeiros quatro estão diretamente

ligados à edição dos dados. O primeiro é obter os dados (acquire): “obtenha os

dados, seja de um arquivo em um disco ou de uma fonte em uma rede” (FRY, 2008,

p. 5)27. Neste momento, a dificuldade é medida pela maneira em que os dados estão

26 Tradução do autor. Texto original: ”these steps can’t be followed slavishly”. 27 Tradução do autor. Texto original: ”Obtain the data, whether from a file on a disk or a source over a network.”

disponibilizados. Por exemplo, se os dados estão disponibilizados em formato pdf, é

necessário convertê-los para um formato de texto. Ou, se os dados estiverem em

suporte físico, é necessário digitalizá-los.

O segundo é o processamento dos dados (parse): “dê uma estrutura ao

significado dos dados, e organize-os em categorias” (FRY, 2008, p. 5)28. É uma

primeira filtragem dos dados, útil para saber com que tipos de dados estamos

lidando.

O terceiro passo é filtrar (filter): “exclua tudo exceto as informações de

interesse”29 (FRY, 2008, p. 5). Tanto para este passo como para o anterior, uma

ferramenta útil é a técnica dos cinco cabides de Richard Saul Wurman (2001, p. 40–

45), que diz que há cinco maneiras de organizar a informação: por localização,

alfabética, cronológica ou de hierarquia.

O quarto passo é minerar (mine): “aplique métodos oriundos das estatísticas

ou mineração de dados como uma forma de identificar padrões ou colocar os dados

em um contexto matemático”30 (FRY, 2008, p. 5). Isso inclui cálculo de médias,

medianas, desvios de padrão, transformar números absolutos em relativos. Aqui

devemos cuidar para não haja redução nos dados (MANOVICH, 2007, p. 157).

5.1.1 Ferramentas para a manipulação dos dados

A opção mais óbvia para manipulação de grandes volumes de dados são as

planilhas eletrônicas, como Excel e OpenOffice. É possível usar um software de

banco de dados, como o Microsoft Access ou o sistema MySQL. Também pode ser

necessário o uso de editores de texto capazes de processar grandes volumes de

dados, como o TextWrangler, da BareBones. Em alguns casos, pode ser necessário

fazer uso de linguagens de programação. Yau (2011) cita o uso da linguagem

Python para fazer uma ferramenta específica para extrair dados de um site, na falta

de softwares “prontos” que realizassem essa tarefa.

28 Tradução do autor. Texto original: ”Provide some structure for the data’s meaning, and order it into categories.” 29 Tradução do autor. Texto original: ”Remove all but the data of interest. 30 Tradução do autor. Texto original: ”Apply methods from statistics or data mining as a way to discern patterns or place the data in mathematical context.”

5.2 APRESENTAÇÃO DOS DADOS

O quinto passo de Fry é representar (represent). Fry sugere escolher um

modelo de base entre formatos básicos e conhecidos, como gráficos de linha ou de

barras, gráficos de variação de cor, mapas e plantas, e um longo etcétera.

Geralmente essa forma básica escolhida é adequada para mostrar uma das

dimensões da base de dados, e por isso modificações podem ser necessárias, como

aponta Manovich:

Acredito que a maioria das práticas de visualização de informação da segunda metade do século XVIII até hoje seguem o mesmo princípio - reservando arranjo espacial (podemos chamá-lo de “layout”) para as dimensões mais importantes dos dados, e usando outras variáveis visuais para as dimensões remanescentes (MANOVICH, 2007).

Assim como é necessário experimentar com várias formas de representação,

pode ser necessário retornar à edição dos dados.

É neste passo que as informações latentes começam a ficar evidentes. Essa

apresentação dos dados pode ser suficiente se a visualização estiver sendo usada

como ferramenta do jornalista e não como um produto final.

Temos então o sexto passo, refinar (refine), que diz “melhore a

representação básica para deixá-la mais clara e mais atraente”). O refinamento da

visualização pode implicar em mudanças na estrutura básica escolhida, cruzando

características de mais tipos de visualização, ou em mudanças na escolha dos

dados representados, talvez graças à percepção da possibilidade de incluir mais

variáveis visuais para representar mais dados. Novamente pode ser necessário

voltar aos dados, para escolher novos ou substituir dados que não estejam

funcionando.

Deixar a informação mais atraente não quer dizer decorá-la. Tufte é

categórico ao se manifestar contra qualquer tipo de decoração nos dados em si:

Se seconder por trás de chartjunk é menosprezar tanto a informação como a audiência. Os defensores do chartjunk imaginam que números e detalhes são chatos, desinteressantes e tediosos, e precisam de ornamentos para ter

vida. A decoração cosmética, que frequentemente distorce os dados, nunca vai salvar a falta de conteúdo (TUFTE, 1990, p. 34). 31

5.2.1 Ferramentas para fazer a apresentação dos dados

Novamente os softwares de planilhas de cálculo são úteis. Eles têm a

possibilidade de gerar gráficos a partir dos números presentes na planilha. Esses

gráficos podem ser impressos ou transpostos para programas de edição de imagens,

como o Adobe Illustrator, para serem finalizados.

Temos também ferramentas de visualização disponíveis na web, que

permitem que o usuário envie seus dados. O usuário precisa escolher algumas

opções que afetarão os dados. Exemplo disso é o site Many Eyes e o site de gerar

nuvens de tags, Wordle. Podemos incluir nesta categoria o software Tableau, que

exige que o usuário baixe um programa para fazer as visualizações antes de

disponibilizá-las no site, e o Google Maps, que disponibiliza APIs que podem ser

úteis.

Tanto as planilhas como as ferramentas da web esbarram em uma questão

levanteda por Fry: “uma ferramenta que tem usos genericos vai produzir somente

gráficos genéricos, que podem ser decepcionantes se os gráficos não se adaptam a

sua base de dados”32(2008, p. vii). Para certas situações, o mais indicado é

construir uma ferramenta específica para as necessidades, e isso pode ser feito com

programação.

Há várias linguagens de programação que podem ser usadas, mas

destacaremos aqui a escolhida por Fry para ensinar a fazer visualizações:

Processing, uma linguagem inicialmente concebida para auxiliar no aprendizado de

programação, e por isso mostrava resultados visuais. Pela sua simplicidade, é fácil

de aprender, o que facilita o acesso por parte de artistas e designers.

31 Tradução do autor. Texto original: “Lurking behind chartjunk is contempt both for information and for the audience. Chartjunk promoters imagine that numbers and details are boring, dull, and tedious, requiring ornament to enliven. Cosmetic decoration, which frequently distorts the data, will naver salvage an underlying lack of content.” 32 Tradução do autor. Texto original: “a tool that has generic uses will produce only generic displays, which can be disappointing if the displays do not suit your data set

5.3 CONSEGUIR QUALIDADE TÉCNICA NA REPRODUÇÃO DA VISUALIZAÇÃO

O último passo é a interação (interact): “acrescente métodos para manipular

os dados ou controlar quais aspectos serão visíveis” (FRY, 2008, p. 5).

Considerando que o livro de Fry se trata especificamente de visualizações

construídas na linguagem Processing, que têm a possibilidade de serem interativas,

podemos tornar este passo mais genérico e pensar nele como o momento de avaliar

qual o suporte mais adequado para a visualização gerada.

A interação não é algo obrigatório em uma visualização, e às vezes pode

complicar desnecessariamente a experiência. É o caso do infográfico animado do

lançador Mariano Riviera, publicado pelo NYT (CARTER, S.; GRAHAM R.; WARD,

J., 2010). Shan Carter, editor de interação do jornal, afirma:

“decidimos que seria mais interessante mostrar aos usuários o quê era interessante, mais do que exigir que eles o encontrassem por si mesmos. Estavamos tentando mostrar o que faz de Rivera o melhor – deixar que um usuário navegasse por todos os seus lançamentos não era a maneira mais efetiva de fazer isso.”33 (CARTER apud GONZÁLEZ VEIRAS, 2010)

5.3.1 Escolha do suporte

Como vimos anteriormente, uma visualização é uma forma de output de uma

base de dados editada para esse fim. Esse output pode se dar de três maneiras,

segundo Manovich (2007): estática, típica de suportes impressos; dinâmica, com

presença de elementos animados, mas sem possibilidade de interação; e interativa,

onde o leitor interage fazendo escolhas sobre quais dados ver ou como vê-los.

Notemos que essa classificação não está diretamente ligada ao suporte, já que é

possível que visualizações estáticas sejam usadas na internet ou vídeo, assim como

é possível considerar as possibilidades de interação que um leitor tem com o papel.

Cada uma dessas formas de output tem características que não

necessariamente devem ser pensadas como limitadoras; pelo contrário, devem ser

consideradas as vantagens específicas de cada uma. Visualizações em papel, por

exemplo, podem se aproveitar dos sistemas de pré-impressão, que alcançam uma

33 Tradução do autor. Texto original: “we decided it would be more interesting to show users what was interesting rather than requiring them to find it themselves. We were trying to show what makes Rivera the best — allowing a user to browse all his pitches wasn’t the most effective way of doing that.”

qualidade de até 2400 dpi (pontos por polegada) quando se utilizam tintas puras

(TUFTE, 1990, p. 81–95). Já as telas de cristal líquido mais recentes chegam a 326

dpi, como a tela “retina” do iPhone, mas oferecem muito mais possibilidade de cores.

Outra peculiaridade do papel é seu tamanho: uma folha de jornal tem em média 30

centímetros de largura x 52 centímetros de altura, o que equivaleria a uma tela de

cristal líquido de 32 polegadas, mas com uma resolução muito maior. Ainda é

possível escolher as possibilidades de interação – inclusive lúdicas – quando

usamos meios electrónicos, as possibilidades de movimento quando usamos vídeo e

as possibilidades de interação do papel, que passam pela manipulação que o leitor

faz do objecto.

A alta resolução semântica citada anteriormente (FIDALGO, 2006) precisa

ser acompanhada por dispositivos que permitam exibi-la; o que inclui o papel. As

telas de cristal líquido já alcançam 326 pixels por polegada (no caso do iPhone 4,

por exemplo). A tecnologia Oled34 permite telas com uma taxa de contraste de

1:1000000, o que permite maior quantidade de cores e tons perceptíveis. Manovich

cita um dispositivo de visualização, composto de 70 monitores de cristal líquido, que

chega a 35.840 por 8.000 pixels. E a impressão, a rigor, permite resoluções de até

2400 dpi, o que ainda é muito superior às telas. Mesmo que dados representados

graças a essas tecnologias sejam difíceis de serem vistos, é necessário que estejam

ali. O acúmulo de pontos minúsculos gera uma área que significa algo. Esses dados

tem que ser sentidos, mais do que lidos. Estes recursos permitem que as

visualizações sigam o princípio de visualização sem redução de Manovich (2007).

Porém, é possível usar recursos de hipertexto para superar os limites do

suporte e acrescentar camadas de informação: zoom ou mouseover35 para ler dados.

No papel, é possível usar várias folhas de papel e referências. Esses elementos de

hipertexto podem tanto acrescentar camadas de informação como ter uma função

similar à de uma legenda.

O importante é não tentar que um suporte tenha as características de outro.

Não é possível fazer zoom numa folha de jornal, nem mostrar uma imagem do

tamanho de um poster em uma tela de celular.

34 Sigla para Organic Light-Emitting Diode (diodo orgânico de emissor de luz) 35 Ato de passar o cursor do mouse por cima de algum elemento de um produto multimídia, sem clicar.

6 ANÁLISE DE INFOGRÁFICOS E VISUALIZAÇÕES

6.1 HOW MARIANO RIVERA DOMINATES HITTERS, THE NEW YORK TIMES

Fig. 4 Frame do infográfico em vídeo "How Mariano Rivera Dominates Hitters". Fonte: CARTER; GRAHAM; WARD, 2010.

O infográfico, publicado em 29 de junho de 2010 no site do jornal nova-iorquino

The New York Times, é apresentado em forma de vídeo, com 2 minutos e 40

segundos de duração. Se trata de um vídeo normal, sem nenhuma possibilidade de

interação. Foi produzido por Shan Carter, Graham Roberts e Joe Ward (CARTER;

GRAHAM; WARD, 2010) e o processo de produção foi descrito pelo chefe de

gráficos do jornal (GONZÁLEZ VEIRAS, 2010).

Fig. 5 trecho da base de dados dos lançamentos de Rivera. Fonte: GONZÁLEZ VEIRAS, 2010.

A base de dados usada consiste nos dados de 1,3 mil lançamentos feitos pelo

jogador Mariano Rivera durante 2009, que foram compilados pela empresa

Complete Game Consulting (Fig. 5). Para visualizar esses dados, a equipe do jornal

desenvolveu, usando a linguagem Processing, um pequeno programa para poder

dar forma a esses dados (Fig. 6). “A visualização os ajudou a decidir quais dados

tinham que ser mostrados e como deveriam mostrá-los” (GONZÁLEZ VEIRAS,

2010)36. Segundo um dos autores do infográfico, Shan Carter, em entrevista a

Xaquín González Veiras:

“Escrevemos o aplicativo para poder explorer os dados e experimentar com diferentes modelos de interação”, diz Shan. Apesar de que todos sabemos que há uma certa beleza em explorar os dados por si próprio, “no fim das contas”, continua Shan, “decidimos que seria mais interessante mostrar ao usuário o que era interessante, ao invés de fazê-lo descobrir por si mesmo o relevante. A intenção era mostrar o quê fazia de Rivera o melhor – e deixar o usuário explorar todos seus lançamentos não era a maneira mais eficiente de consegui-lo” (GONZÁLEZ VEIRAS, 2010).37

Decidido o formato do infográfico, outras instâncias de infográficos foram

produzidas, como as animações explicando os diferentes tipos de lançamentos

feitos pelo arremessador Mariano Rivera, e como é difícil para o rebatedor prever

qual tipo será feito. Então, aparece uma visualização animada na qual aparecem

representados ao mesmo tempo todos os lançamentos feitos por Rivera no ano de

2009 (Fig. 4). A partir dessa visualização, é feito um corte que mostra os

lançamentos como uma nuvem de calor do ponto de vista do rebatedor, divididos

pelo tipo de rebatedor – destros ou canhotos –, mostrando que Rivera quase não faz

lançamentos na região onde seria mais fácil que as bolas sejam rebatidas.

A “nuvem” de bolas é congelada e um movimento de câmera posiciona o leitor

no lugar do rebatedor (Fig. 7). Joe Ward, também em entrevista a González Veiras,

explica essa decisão: “É difícil reconhecer o lançamento a tempo para que o

rebatedor mova o taco na direção correta. Por isso decidimos congelá-los nesse

momento, no qual o rebatedor tem que tomar a decisão.” (GONZÁLEZ VEIRAS,

2010).38

36 Tradução do autor. Texto original: “La visualización les ayudó a decidir qué datos había que mostrar y cómo debían mostrarlos”. 37 Tradução do autor. Texto original: “’Escribimos la aplicación para poder explorar los datos y experimentar con distintos modelos de interacción,’ dice Shan. Aunque todos sabemos que hay una cierta belleza en explorar uno mismo los datos, ‘al final,’ continúa Shan, ‘decidimos que sería más interesante mostrar al usuario qué era lo que era interesante, en lugar de hacerlo descubrir por sí mismo lo relevante. La intención era mostrar qué era lo que hacía a Rivera el mejor — y dejar al usuario explorar todos sus lanzamientos no era la manera más efectiva de conseguirlo.’” 38 Tradução do autor. Texto original: “Es difícil reconocer el lanzamiento a tiempo para que el bateador mueva el bate en la dirección correcta. Por eso decimos congelarlos en ese momento, en el que le bateador tiene que tomar la decisión.”.

Depois desse congelamento, a imagem das bolas se transforma em uma

representação mais abstrata, em forma de mapa de calor (Fig. 8). A utilização desse

tipo de gráfico dialogando com imagens mais realistas se relaciona com o conceito

de layering (TUFTE, 1990, p. 53) e se aproveita de uma linguagem mais abstrata

para ajudar o leitor a comprender a quantidade de lançamentos.

Como curiosidade, para animar a figura de Rivera foram usados vídeos de

jogos nos quais ele aparecia, para poder reproduzir seus movimentos usando uma

variação da técnica de motion capture39.

Fig. 6 Imagem do programa feito pela equipe do The New York Times para analisar a base de dados dos lançamentos de Rivera. Fonte: GONZÁLEZ VEIRAS, 2010.

39 Técnica que consiste no uso de sensores localizados no corpo para digitalizar os movimentos realizados por uma pessoa. No caso da utilização de videos, essa digitalização se dá pelo rastreamento das diferentes partes do corpo que aparecem no video.

Fig. 7 Dois frames da animação em que são mostrados todos os lançamentos ao mesmo tempo. Fonte: CARTER; GRAHAM; WARD, 2010.

Fig. 8 Transformação da representação das bolas lançadas. Fonte: CARTER; GRAHAM; WARD, 2010.

Apesar de o vídeo ser um formato pouco convencional para a visualização de

bases de dados, How Mariano Rivera Dominates Hitters apresenta vários aspectos

para entender o uso da visualização por parte do jornalismo.

Note-se que foi feita uma visualização prévia, para uso da equipe de infografia,

o que permitiu tomar as decisões de como seriam visualizados esses dados, em

relação com o uso, já comentado no Capítulo 3, de visualizações para facilitar a

compreensão de dados por parte dos jornalistas.

Apesar da complexidade do produto final, o infográfico mostra uma decisão

interessante de tirar do usuário a possibilidade de interação para que este não se

perca em um material tão complexo. A natureza do vídeo também faz com que o

tempo de leitura da visualização seja determinado pelo autor, que dá ao usuário um

tempo determinado para observar a visualização do mapa de calor, por exemplo.

Uma vez que se optou pelo vídeo, o trabalho inteiro foi construído considerando as

possibilidades únicas do formato: tempo limitado, ausência de interação, narração. O

vídeo-infográfico como um todo e as visualizações em particular são produtos

densos, que comunicam uma quantidade enorme de dados em poucos segundos.

6.2 READING, WRITING AND EARNING MONEY, GOOD MAGAZINE

Fig. 9 infográfico publicado na revista Good. Fonte: HUBACEK, 2011.

Publicado em janeiro de 2011 no site da revista Good, o infográfico (Fig. 9)

faz uso de uma visualização que, apesar de não ter sido publicada em um meio

impresso, aproveita a mecânica da impressão e mistura das cores para produzir

nova informação e fazer o leitor compreender como deve ler a visualização. Cada

cor básica do processo de impressão CMYK40 foi usada para representar um dado

do Censo dos Estados Unidos: a quantidade de graduados no segundo grau

(magenta), a quantidade de graduados na universidade (amarelo) e a renda

mediana anual (ciano).

Cada informação deu origem a um mapa, cada um em uma cor primária,

com tons mais claros representando situações piores e tons mais escuros

representando situações melhores. A sobreposição desses mapas causam a mistura

das cores, gerando cores que revelam novas informações. De maneira geral, tons

mais claros representam lugares com menos instrução e menor renda; e tons mais

escuros denotam educação melhor e maior renda. Além disso, tons mais escuros

em um determinado índice fazem com que as cores resultantes mostrem tendências:

condados com cores que tendem para o verde indicam uma quantidade maior de

40 Sigla que se refere às quatro cores usadas no processo de impressão por quatricromia.

tinta amarela, ou seja, mais graduados na faculdade. Condados em tons de azul

escuro ou roxo indicam a mistura de tinta magenta (boa taxa de graduados no

segundo grau) e de tinta ciano (renda familiar), mas a ausência de tinta amarela

(graduados na universidade). Condados vermelhos são aqueles que têm alto índice

de graduados tanto no ensino médio como na universidade (tintas magenta e

amarela, que formam a cor vermelha), mas renda relativamente baixa (ausência da

cor ciano).

Fig. 10 Detalhe do infográfico "Reading, Writing and Earning Money". É possível ver as divisões dos

estados e três exemplos fornecidos pelo autor para facilitar o entendimento.

O produto final que foi publicado inclui, além da visualização, várias

explicações de como ler os dados. A mistura das cores funciona no resultado final,

mas era necessário ter certeza que seria interpretado da maneira correta. Para isso,

foram selecionados alguns condados para dar de exemplo, foram isolados e

explicados como a soma de suas cores formavam a nova cor (Fig. 10). Também são

apresentados, em tamanho menor, os mapas separados, junto a uma escala que faz

a correlação entre os valores reais e o tom da cor. Há uma explicação textual, com

uma ilustração mostrando os mapas se sobrepondo e um diagrama mostrando como

as cores formam novas cores quando combinadas. Por fim, o próprio título da página

foi escrito enumerando os dados visualizados e com as cores atribuídas a cada um

deles. É possível notar também o cuidado no mapa principal. A única informação

adicional é uma sutil divisão dos estados, com uma fina linha branca. Não há nomes

de estados, nem nenhuma outra indicação que pudesse esconder os dados ou

distrair o leitor de sua análise.

O mapa resultante da operação pode ser lido de maneira macro ou micro

(TUFTE, 1990, p. 37). Em uma explicação simples, podemos dizer que macro é a

leitura do todo e micro é a leitura dos detalhes. Em uma leitura macro, é possível ver

a situação das diferentes regiões dos Estados Unidos: os tons esverdeados da costa

Oeste indicam que há mais pessoas com formação universitária; os tons mais claros

na região do Mississipi indicam baixos níveis tanto de educação como de renda;

próximo a Nova Iorque, as cores se aproximam do preto, enquanto ao norte do país

as cores com mais tinta magenta indicam uma boa educação no segundo grau. Já

em uma leitura micro, é possível consultar a situação de qualquer condado, desde

que o leitor saiba onde ele está localizado. Nos estados do centro e do Leste, a

divisão dos estados em um número maior de condados permite que sejam feitas

leituras mais regionais. Nesses estados, também é possível distinguir as capitais:

geralmente são os condados com índices melhores, e, portanto, com cores mais

escuras. Todas essas conclusões mostram a densidade e possibilidades das

visualizações que permitem uma leitura micro, sobre a qual Tufte diz que “esta fina

textura de refinado detalhamento leva a micro-leituras pessoais, histórias individuais

sobre os dados” (TUFTE, 1990, p. 37).41

Quanto à edição das bases de dados utilizadas, ocorre de duas formas:

primeiro, são selecionados três dados para analisar a correlação entre si. Segundo,

é escolhido o nível geográfico desses dados. Apesar que provavelmente há dados

que detalham a renda e escolaridade das subdivisões de cada condado, ficariam

pequenas demais para serem vistas corretamente, além de as subdivisões de cada

condado serem menos reconhecíveis em um mapa do que os condados.

O texto que apresenta o infográfico diz: “demos uma olhada nas conquistas

educacionais e na renda mediana de toda a nação, para ver onde as pessoas estão

indo à escolar, onde estão ganhando dinheiro, e se há alguma correlação42.” O

41 Tradução do autor. Texto original: “this fine texture of exquisite detail leads to personal micro-readings, individual stories about the data”. 42 Tradução do autor. Texto original: ”We’ve looked at the educational achievement and the median income of the entire nation, to see where people are going to school, where they’re earning money, and if there’s any correlation.”

infográfico, em si, não responde a pergunta, mas sim facilita o acesso aos

aproximadamente dez mil números necessários para chegar a essa conclusão.

6.3 RETRATOS DO PARANÁ – GAZETA DO POVO

Fig. 11 Site da base de dados "Os números do estado", dentro da série de matérias "Retratos do Paraná". Fonte: GAZETA, 2011.

Este trabalho contém visualizações de dados, mas também se aproxima do

conceito de base de dados navegável discutido anteriormente. O infográfico reúne

informações sobre os 399 municípios do Paraná e permite visualizar o dado

escolhido em um mapa do estado e em um gráfico de barras (Fig. 11). O usuário

começa por escolher uma das áreas – economia, população, meio ambiente, etc. – e

depois escolhe um dos indicadores para atualizar o ranking de municípios à

esquerda e o mapa do Paraná.

Para a construção do infográfico foi utilizado o software Tableau, projetado

para construir infográficos interativos com vários tipos de dados a partir de uma ou

mais bases de dados. É usado um aplicativo específico para construir o infográfico,

que depois é publicado nos servidores da Tableau. Fica então disponível para ser

embutido em um site ou, no caso dos usuários da versão gratuita, consultado no

próprio site da Tableau.

A base de dados disponibilizada através do infográfico foi elaborada a partir de

várias bases de dados menores obtidas em vários órgãos, como IBGE, Datasus,

Ipardes, etc. O processo de edição consistiu em selecionar os dados mais

atualizados que estivessem disponíveis para todos os municípios.

O trabalho não apresenta grandes inovações no que se refere a visualizações,

mas certamente representa a função que um produto jornalístico em base de dados

pode oferecer. Ele concentra bases de dados de diversos órgãos, disponíveis em

vários formatos de arquivo, e as consolida em um único lugar. Além disso, oferece

ao leitor uma interface fácil de navegar para realizar consultas. Oferece a

possibilidade de consultas micro, como saber um dado de um município específico,

e de consultas macro, que é a visualização de todos os dados do estado. O jornal

cumpre um papel de facilitar ao leitor o acesso às bases de dados, tanto na edição

das bases para obter uma base de dados única, como na criação de uma interface

adequada.

6.4 RACE AND ETHNICITY: NEW YORK – ERIC FISCHER

Essa visualização (Fig. 12) é também obra de Eric Fischer, autor da mostrada

anteriormente “See something or say something” (Fig. 1). Em comum com “Reading,

Writing and Making Money” temos que foram usados os dados do Censo dos

Estados Unidos, e também foi usado um código de cores. No trabalho de Fischer,

porém, as cores não são graduadas, e cada uma representa um grupo étnico. O

leitor sabe de que cidade se trata pelo título da imagem. A legenda do mapa está no

espaço para texto que acompanha a imagem, no Flickr: “vermelho são brancos, azul

são negros, verde são asiáticos, laranja são hispânicos, cinza são outros, e cada

ponto são 25 pessoas”43 Fischer usa esse código para manter o critério escolhido

por Bill Rankin em outro mapa (RANKIN, 2009). Fischer diz que “estava

impressionado com o mapa de divisões raciais e étnicas de Chicago [feito por] de

Bill Rankin, e queria ver como outras cidades ficariam se fossem mapeadas da

mesma maneira”44 (FISCHER, 2010). O mapa também conta com o traçado das

ruas em cor cinza claro, mas carece de outras indicações, como o mar. Para

pessoas que conheçam a cidade retratada, parece ser suficiente: os usuários do site

colaboram usando o recurso do Flickr de deixar notas marcando um pedaço da

imagem. São os próprios usuários que fazem a análise micro da visualização.

Fig. 12 Visualização da cidade de Nova York, realizada por Eric Fischer. Fonte: FISCHER, 2010.

43 Tradução do autor. Texto original: “Red is White, Blue is Black, Green is Asian, Orange is Hispanic, Gray is Other, and each dot is 25 people.” 44 Tradução do autor. Texto original: “I was astounded by Bill Rankin's map of Chicago's racial and ethnic divides and wanted to see what other cities looked like mapped the same way.“

O mapeamento realizado por Fischer não serve somente a quem conhece a

geografia da cidade. Quem não conhece a cidade mapeada não reconhece lugares

da cidade, mas ainda assim consegue apreender informação sobre ela. É possível

reconhecer a densidade populacional das diferentes regiões das cidades, e também

como as diferentes etnias se agrupam, permitindo uma análise sociológica. Também

é possível entender quais os dados disponíveis de cada cidade e o detalhamento e

precisão das informações usadas para a visualização. Essas leituras dizem respeito

à análise macro que é possível fazer dessa visualização.

A escolha do Flickr como suporte para essa visualização também diz respeito a

análise macro e micro. Na página principal, é possível fazer a análise macro, mas

também é disponibilizada a imagem em uma resolução maior, de 3000 x 3000

pixels, que permite observar a visualização em detalhes.

Se essa informação fosse cruzada com outros dados, mais dados ficariam

evidentes. No trabalho que o inspirou, é possível ver a divisão da população por

renda, na qual fica evidente a renda menor das regiões hispânicas e a renda ainda

menor das regiões negras. A diferença entre o trabalho de Rankin e o de Fischer é a

presença de um elemento interativo, que no trabalho de Rankin facilita a

visualização dessas diferenças.

6.5 XKCD – COLOR SURVEY

Em 2010, Randall Munroe, autor do webcomic XKCD, convocou seus

leitores a responderem uma pesquisa sobre cores, na qual deveriam responder o

nome pelo qual chamavam determinadas cores. Aproximadamente 250 mil pessoas

responderam, o que resultou em uma base de dados de aproximadamente 3,7

milhões de respostas. O autor disponibilizou a base de dados para download,

sugerindo para fazerem algo divertido (MUNROE, 2010). Entre os resultados,

destacam-se duas visualizações dessa base: a feita pela empresa Luminoso, da

cidade de Boston (LUMINOSO, 2012), e a feita pelo pesquisador e artista Stephen

von Worley (VON WORLEY, 2012).

Fig. 13 Visão geral da visualização feita pela empresa Luminoso. Fonte: LUMINOSO, 2012.

A primeira (Fig. 13) é, essencialmente, uma visualização conhecida como

nuvem de palavras ou tagcloud. Na segunda (Fig. 14), a quantidade de vezes que

cada nome foi citado é representada em um gráfico de bolhas. A característica

comum de ambas visualizações é a possibilidade de interação.

A interatividade presente nas duas visualizações é a reorganização: no

trabalho da Luminoso, é possível reorganizá-los na posição e na escala das palavras

para evidenciar quais as cores mais comuns entre mulheres, quais são cores

relacionadas a comidas, entre outros. Já o trabalho de Von Worley permite organizar

as bolhas somente na horizontal, já que a altura das bolhas foi usada para

determinar quais cores são mais citadas por homens e quais por mulheres, o que é

a intenção principal da visualização. Mesmo assim, é possível reorganizá-las

segundo a popularidade, o tom, brilho, saturação e o comprimento do nome (Fig. 15).

Fig. 14 Visão geral da visualização feita por Von Worley. Fonte: VON WORLEY, 2012.

A interatividade da tagcloud é o zoom. Nomes de cores muito populares foram

milhares de vezes mais citadas que outras, o que acarreta em bolhas ou palavras

muito pequenas. Esse problema é contornado com a possibilidade de fazer zoom e

fazer uma leitura em diferentes níveis (Fig. 16). Essa visualização também tem um

sistema de busca para filtrar os nomes das cores.

O trabalho de Von Worley não usa o recurso do zoom, já que até as bolhas

menores são visíveis. Mas se aproveita de uma outra interatividade, que é o

hipertexto que aparece para dar o nome e mais informações da cor ao passar o

mouse por cima da bolha (Fig. 17).

Fig. 15 Visualização reorganizada pela popularidade da cor. Fonte: VON WORLEY, 2012.

Os dois trabalhos mostram como a interatividade é um recurso que pode e

deve ser considerado ao fazer uma visualização. Nas duas visualizaçãoes, a

interação serve para fazer novas leituras macro, com a reorganização dos

elementos das visualizações, e também para fazer leituras micro, com os recursos

de zoom ou hipertexto. Claro que só é possível em determinados meios – o mais

comum dos quais é a web – mas isso também deve ser levado em consideração

para conceber e produzir a visualização.

Fig. 16 Visão micro da visualização da Luminoso, mostrando como são exibidas as palavras menores.

Fig. 17 Exemplo de uso de hipertexto na visualização de Von Worley.

7 CONCLUSÃO

A abundância de dados representa ao mesmo tempo uma oportunidade e

também um problema para o jornalismo. O problema se manifesta, em primeiro lugar,

dentro da redação. Como encontrar o que interessa nessa avalanche de

informações? Como relacionar dados entre si, sem depender de análises alheias

que entreguem ao repórter sua própria interpretação dos dados? Como transformar

esses dados em fonte de informação primária, e não secundária?

Em segundo lugar, temos que é tarefa do jornalismo facilitar o acesso à

informação. E, nesse contexto de abundância de dados, essa tarefa adquire novas

dimensões. Como guiar o leitor através de milhões de dados? Como transmitir ao

leitor as informações latentes nos milhões de gastos registrados por funcionários

públicos, por exemplo?

São possíveis várias abordagens a partir do discutido neste trabalho, mas a

principal obstáculo é a falta de conhecimento técnico para o uso de bancos de dados,

sem falar na elaboração de visualizações. A maioria das redações continua sendo

composta por jornalistas e profissionais de outras áreas que são considerados como

“de apoio” à redação. Somente alguns meios estão investindo na contratação de

profissionais de áreas como estatística e informática, capazes de interpretar e

fornecer os meios para a realização de materiais mais complexos, como aponta

Fidalgo:

O que a possibilidade e a exequibilidade da mineração de dados nos mostram é a necessidade de formar jornalistas que integrados em equipas multidisciplinares de informáticos, especialistas de estatística e de hermenêutica de dados, saibam detectar o valor noticioso das relações e dos padrões extraídos da massa imensa de dados, coligidos a acumulados a uma rapidez estonteante. (FIDALGO, 2007, p. 167)

A multidisciplinariedade é um obstáculo para muitos jornalistas. Como outros

profissionais da comunicação, são geralmente avessos a conhecimentos de ciências

exatas – mesmo que se trate de conhecimentos de matemática aprendidos no

ensino médio. A transição dos meios impressos para o digital e as possibilidades

dessa nova mídia está sendo aproveitada de maneira errada:

A noção de que os jornalistas do futuro serão uma espécie de McGyver, homens ou mulheres de mil e um recursos, trabalhando sozinhos, equipados com uma câmara de vídeo digital, telefone satélite, portátil com software de edição vídeo e html, e ligação sem fios à Internet […] é uma visão futurista do backpack journalist, criticável, e que não esgota, nem

preenche, de modo algum, as potencialidades dos novos média. Não é que não haja espaço, para esse tipo de jornalista, mas será apenas um jornalista de factos ou de notícias de ordem inferior e nunca de notícias de ordem superior. (ibidem, p. 166–167)

Confirmando essa falta de aproveitamento do digital, temos que, em uma

análise rápida dos 22 posts sobre visualizações que foram publicados no blog

Flowing Data durante outubro, somente quatro eram sobre visualizações feitas em

jornais: três no The New York Times e uma no Washington Post. Os outros posts se

referiam a trabalhos feitos por programadores independentes e centros de pesquisa,

por exemplo. Esse atraso representa um desperdício de oportunidades de inovação

no processo de elaboração de matérias e outros produtos jornalísticos.

Faltaria ao jornalismo de modo geral e aos jornalistas em particular

vislumbrar as possibilidades do uso de bases de dados e de visualizações no seu

trabalho. A barreira da técnica está cada vez mais fácil de superar, porque as

ferramentas para lidar com bases de dados e visualizações estão cada vez mais

acessíveis, não exigindo conhecimentos de informática avançados nem

computadores potentes. A Reportagem Assistida por Computador ainda é uma

disciplina separada, reservada a quem queira aprendê-la, e não é vista como parte

do jornalismo tradicional. Com isso, o uso de computadores se limita ao

processamento de textos e consulta de fontes na internet. Para alcançar um

jornalismo realmente inovador no conteúdo, na linguagem e nas narrativas, é

necessário pensar em outro uso para o computador e demais tecnologias.

Esse outro uso também deve ser pensado do lado do leitor. É necessário

refletir sobre qual a função das bases de dados e das visualizações como produto

jornalístico, e se interessa ao leitor fazer sua própria navegação e construir suas

próprias narrativas e notícias. Que essa possibilidade exista não quer dizer que seja

uma solução adequada para todos os casos, e sim um formato para ser usado

quando for interessante. É possível que haja problemas para que o leitor comprenda

o formato, mas para isso é necessário um certo didatismo para que ele veja as

possibilidades e vantagens de navegar por uma visualização.

As possibilidades do jornalismo em base de dados, abordadas por vários

autores, ainda não são exploradas em sua plenitude por motivos técnicos. As

visualizações desses dados sofrem do mesmo problema. É necessário que os

jornalistas se capacitem para poder aproveitar esses recursos ao máximo, e fazer do

jornalismo digital um meio realmente novo e não uma mera transposição dos meios

tradicionais. E essa capacitação não se limita ao uso de visualizações: essa é

apenas uma entre as muitas oportunidades de inovação que os nem tão novos

meios de comunicação oferecem tanto aos jornalistas quanto aos repórteres.

REFERÊNCIAS

AUDIÊNCIA da TV, 28/03: “Escolinha do Professor Raimundo” sobe Ibope da Globo. Disponível em: <http://www.rd1audiencia.com/televisao/audiencia-da-tv-2803-escolinha-do-prof-raimundo-sobe-ibope-da-globo/97414>. Acesso em 11/11/2012. BAHIA, Juarez. Jornal, história e técnica: as técnicas do jornalismo. Volume 2. São Paulo: Editora Ática, 1990. BARBOSA, Suzana (org.). Jornalismo Digital de Terceira Geração. Covilhã: Labcom – Universidade da Beira Interior, 2007. BARBOSA, Suzana. Jornalismo digital e bases de dados: mapeando conceitos e funcionalidades. In: 4º Sopcom – Livro de Actas do 4º Congresso da Associação Portuguesa de Ciências da Comunicação. Aveiro, Portugal: Universidade de Aveiro, 2005. BERTIN, Jacques. A neográfica e o tratamento gráfico da informação. Curitiba: Editora da Universidade Federal do Paraná, 1986. BONO of Contention. Disponível em: <http://www.snopes.com/music/artists/bono. asp>. Acesso em 09/06/2012. CARTER, S.; GRAHAM R.; WARD, J. How Mariano Rivera Dominates Hitters. The New York Times, 29/6/2010. Disponível em <http://www.nytimes.com/interactive/ 2010/06/29/magazine/rivera-pitches.html>. Acesso em 7/4/2012. CLARÍN. Eligieron una infografía de Clarín como la mejor de los últimos 20 años. Buenos Aires, 2012. Disponível em:<http://www.clarin.com/sociedad/Eligieron-infografia-Clarin-mejor-ultimos_0_677932336.html>. Acesso em 12/11/2012. COSTA, Lailton; LUCHT, Janine. Gênero Interpretativo. In: ASSIS, Francisco de; MARQUES DE MELO, José. Gêneros jornalísticos no Brasil. São Bernardo do Campo: Universidade Metodista de São Paulo, 2010. COSTA, Lailton. Gêneros Jornalísticos. In: ASSIS, Francisco de; MARQUES DE MELO, José. Gêneros jornalísticos no Brasil. São Bernardo do Campo: Universidade Metodista de São Paulo, 2010. DE PABLOS, José Manuel. Infoperiodismo - el periodista como creador de infografía. Madri, Espanha: Editorial Síntesis, 1999. EDLUND, Bård. The Dow Piano. CNN Money, [2011?]. Disponível em: <http://money.cnn.com/markets/storysupplement/dow_piano>. Acesso em 09/06/2012. EPLER, Matthew. Grand Old Party. Disponível em <http://mepler.com/Grand-Old-Party>. Acesso em 4/6/2012. FIDALGO, António. A resolução semântica no jornalismo online. In: BARBOSA, Suzana (org.). Jornalismo Digital de Terceira Geração. Covilhã, Labcom – Universidade da Beira Interior, 2007. FISCHER, Eric. Race and ethnicity: New York City. [San Francisco], 2010. Disponível em <http://www.flickr.com/photos/walkingsf/4981444199>. Acesso em 7/4/2012.

FISCHER, Eric. See Something or Say Something: Rio de Janeiro. [San Francisco], 2011. Disponível em <http://www.flickr.com/photos/walkingsf/59263533 58/>. Acesso em 7/4/2012. FRIENDLY, Michael. Milestones in the history of thematic cartography, statistical graphics, and data visualization. 2009. Disponível em: <http://euclid.psych.yorku.ca/SCS/Gallery/milestone/milestone.pdf>. Acesso em 09/06/2012. FRY, Ben. Visualizing Data. Sebastopol: O’Reilly Media, 2008. GAZETA do Povo. Os números do estado. Curitiba, 2011. Disponível em <www.gazetadopovo.com.br/vidaecidadania/retratosparana/indicadores>. Acesso em 13/10/2012. GONZÁLEZ VEIRAS, Xaquín. Cómo se hizo: los lanzamientos de Mariano Rivera. Disponível em <http://www.xocas.com/blog/?p=758>. Acesso em 7/4/2012. HUBACEK, Gregory. Reading, Writing and Earning Money. 2011. In: Good Magazine. Los Angeles, 13/1/2011. Disponível em <http://www.good.is/post/america-s-richest-counties-and-best-educated-counties/>. Acesso em 7/4/2012. KUNCZIK, Michael. Conceitos de Jornalismo. São Paulo: Universidade de São Paulo, 2002. LACHER, Mike. All Of Billy Joel's Greatest Hits Played At Once . Disponível em: <http://youtu.be/FcvVPuJVKcs>. Acesso em 09/06/2012. LIDWELL, William; HOLDEN, Kritina; BUTLER, Jill. Universal Principles of Design. Gloucester, EUA: Editora Rockport, 2003. LUMINOSO. Visualizing the XKCD Color Survey. Boston, Estados Unidos, 2012. Disponível em <http://www.luminoso.com/colors>. Acesso em 12/11/2012. MACHADO, Elias. O Banco de Dados como espaço para composição de narrativas. In: BARBOSA, Suzana (org.). Jornalismo Digital de Terceira Geração. Covilhã, Labcom – Universidade da Beira Interior, 2007. MANOVICH, Lev. O que é visualização? In: Estudos em Jornalismo e Mídia - Vol. 8 Nº 1. Florianópolis, 2011. Disponível em <http://www.periodicos.ufsc.br/index.php/ jornalismo/article/view/1984-6924.2010v8n1p146/18947>. Acesso em 7/4/2012. MANOVICH, Lev. The Language of New Media. [Massachussets]: [MIT Press], [2001?]. McCANDLESS, David. The Beauty of Data Visualization. Disponível em: <http://www.ted.com/talks/david_mccandless_the_beauty_of_data_visualization.html>. Acesso em 09/06/2012. MCLUHAN, Marshall. Os Meios de Comunicação como Extensões do Homem. São Paulo, Cultrix, 1969. MIELNICZUK, Luciana. Jornalismo na web: uma contribuição para o estudo do formato da notícia na escrita hipertextual. Salvador, UFBA, 2003. MUNROE, Randall. Color Survey Results. Massachussets, Estados Unidos, 2010. Disponível em <http://blog.xkcd.com/2010/05/03/color-survey-results>. Acesso em 12/11/2012. PELTZER, Gonzalo. Jornalismo Iconográfico. Lisboa, Portugal: Planeta Editora, 1991.

RAMJAC. All Together Now - Everything the Beatles ever did. [2011?]. Disponível em: <http://soundcloud.com/ramjac/beatlescompletebkwds>. Acesso em 09/06/2012. RANKIN, Bill. Chicago Boundaries. 2009. Disponível em <http://www.radicalcartography.net/index.html?chicagodots>. Acesso em 12/11/2012. TUFTE, Edward. Envisioning Information. Connecticut: Graphic Press, 1990. UNWIN, A.; THEUS, M.; HOFMANN, H. Graphics of Large Datasets. Nova Iorque: Springer, 2006. VON WORLEY, Steve. His And Hers Colors. Estados Unidos, 2012. Disponível em <http://www.datapointed.net/visualizations/color/men-women-color-names-d3/>. Acesso em 12/11/2012. WOLTON, Dominique. Internet, e depois? Porto Alegre, Sulina, 2007. WURMAN, S. Angustia Informativa. Buenos Aires: Prentice Hall, 2001. YAU, Nathan. Visualize This. 2011.

Visualizações de dados e seu uso no jornalismo.

Documents