Skip to content

Como foi o meu #odhd aqui no Sertão

dezembro 7, 2010

No sábado passado rolou no mundo todo o Open Data Hackaton Day, uma maratona de programação, design e discussão sobre a liberdade de informação e o uso dos dados governamentais em projetos para ampliar a transparência e participação popular. A idéia surgiu cerca de um mês atrás (eu só vi duas semanas atrás) e conseguiu resultar em alguns projetos interessantes.  Enquanto em alguns países, como a Inglaterra, os projetos focavam no que fazer com os dados que o governo já libera em formatos abertos e facilmente processáveis, aqui no Brasil e em diversos lugares do mundo a primeira peleja era para conseguir obter os dados, colocá-los em um formato utilizável por máquina para daí bolar algum aplicativo com tais dados. A dificuldade no Brasil para a obtenção dos dados é tanta que um das atividades mais importantes do dia (e a única da qual consegui contribuir de alguma maneira) foi a redação de um manifesto reivindicando a aprovação do Projeto de Lei 41/2010 que deve, em breve, começar a ser divulgado.

Aqui em Serra Talhada acabou não dando para reunir um grupo, pela coincidência com a semana de provas e pelo calor lembre-se-que-o-sertanejo-deve-ser-um-forte que reduziu o metabolismo de todo mundo. Mas, por teimosia, por curiosidade e para tentar pegar o embalo do dia para marcar o começo de um interesse de pesquisa nessa área, insisti em trabalhar na idéia que tinha falado em um post anterior: criar um mapa dos dados da educação no Brasil, usando indicadores de qualidade como o IDEB (Índice de Desenvolvimento da Educação Básica) e dados de investimento, como os repasses do FUNDEB. Boa parte da semana anterior com a obtenção e preparação dos dados, que  estão espalhados por todo lugar e nos formatos mais diversos, procurando ferramentas para usar na análise dos dados e, por fim, re-aprendendo a mexer no Chuck Norris dos softwares de estatística, o R. A primeira idéia mais óbvia era fazer um mapa coroplético (aprendi o termo nesses dias!) usando a interface de programação (API) do Google Maps ou então a maravilhosa biblioteca Protovis da Universidade de Stanford, mas quando tive tempo para procurar alguma coisa vi que o uso do Google Maps não era tão trivial como eu queria que fosse (ou seja, bastasse colocar o nome da cidade e ele fazia o serviço…) e para fazer esse tipo de mapa, tanto lá quanto no Protovis, eu precisaria arrumar dados dos desenhos das fronteiras dos municípios e convertê-los para um formato específico. Bem, para resumir, isso resultou em mais algumas pelejas, pois os dados que encontrei no IBGE (obtidos e publicados com o meu e o seu dinheiro) estavam em um formato proprietário, projetado para ser usado em um software cujo custo está na casa dos cinco dígitos e eu não consegui arrumar logo um jeito de convertê-los. No dia mesmo do #odhd, tentei a API de visualização do Google, que prometia um pouco da mágica que eu queria antes (só linkar uma planilha com os dados e voilà), mas os resultados foram meio decepcionantes, muito sem sal comparados com o que podia ser feito com o Protovis. Além do mais não dava para colocá-los aqui no WordPress e eu não ia migrar o Beco3 para um hosting próprio de uma hora para a outra só por causa de um gráfico mais ou menos.

Mas aí, eis que ontem, dois dias depois do #odhd propriamente dito, esbarrei em um artigo sobre como fazer visualização em mapas usando R e outro, do mesmo autor, sobre como fazer gráficos animados com R + ImageMagick, e o autor ainda me dava o link de uma fonte perfeita dos dados geográficos que eu estava procurando, “prêt-a-porter”, disponível em diversos formatos, o das das divisões territoriais brasileiras até o nível de município. Enfim, juntando tudo isso depois de apanhar um pouco com o R, consegui fazer alguma coisa para não deixar o #odhd Serra Talhada passar ser um resultado de programação sequer. Então aí vai. Primeiro, um mapinha animado da evolução do IDEB em Pernambuco. Cliquem para vê-lo em movimento:

Evolução do IDEB em Pernambuco de 2005 a 2009

Evolução do IDEB em Pernambuco de 2005 a 2009 (Cliquem para ver em movimento)

(Dito de passagem, é interessante observar que o mapa permite a surpreendente conclusão de que o ensino fundamental da rede pública no Sertão, a região mais pobre do estado, é melhor do que o do Agreste e da Zona da Mata.)

Depois, torrando um pouco mais o processador modesto do meu netbook nessa verão infernal do Sertão, um mapão do IDEB de cada município do Brasil inteiro:

IDEB 2009 por município - Brasil

IDEB 2009 por município, visão do Brasil inteiro, outra paleta de cores

Só com os dados do IDEB daria ainda para fazer várias outras visualizações, como grau de variação da nota entre 2005 e 2009 (aqui a variação do IDEB em Pernambuco) ou entrar mais nos dados obtidos e pensar algo com a diferença das notas de matemática e português. A análise ficaria interessante se desse para usar também dados do investimento em educação. Foi o que tentei fazer usando os dados dos repasses do FUNDEB, mas só tinha os dados de 2010 (falta de paciência de fazer o download manual dos arquivos de cada estado para cada um dos cinco anos anteriores: 5×27 arquivos) e o FUNDEB não corresponde ao investimento total feito em cada município (na verdade é inversamente proporcional ao investimento feito pelos estados), portanto é difícil usá-lo em uma correlação. Então fica na lista de coisas para fazer encontrar um método para incorporar fatores econômicos na análise e poder, por exemplo, destacar municípios cujo avanço na educação vai além do que seria esperado só levando em conta sua riqueza e o volume de investimentos. E também fica para a próxima, incorporar tudo isso num site, usando uma ferramenta como o Protovis, para permitir mais interação e flexibilidade.

BECO 3’s REPORT: Mapa da violência no Rio – De que lado está o Estado?!

novembro 30, 2010

Galera, parei aqui no Beco 3 para degustar uma pinga acompanhada de uma porção de “salamina” e fazer um desabafo sobre a guerra civil no Rio!

Que semana punk! Terrorismo urbano, helicóptros por toda parte, blindados na rua, cenas de guerra na cidade maravilhosa! É tudo muito estranho, acho que nunca tivemos a oportunidade de acompanhar as ações da polícia e dos traficantes de tão perto. Ao mesmo tempo, tantas informações e imagens transmitidas em tempo real não esclarecem que diabos está acontecendo!

O problema é que não estamos recebendo grande parte das informações relevantes. Esse bombardeio de notícias, as cenas violentas e o discurso maniqueísta da mídia tem servido para gerar desorientação e sentimentos contraditórios. Quero muito acreditar que é possível mudar a realidade do Rio. Até acho que alguma coisa vai mudar mesmo depois dessas ocupações, só não sei se será para melhor. Passei os últimos dias me informando sobre a ocupação dos morros e a política de segurança do Estado nos últimos anos e me deparei com dados desconcertantes!

Atualmente, as 94 favelas da cidade do Rio de Janeiro são controladas pelos seguintes grupos: Comando Vermelho (27), Amigos dos Amigos (16), Terceiro Comando Puro (16), Milícias (18), UPPs (15, incluindo as 2 ocupações do Complexo da Penha e do Alemão na última semana).

Um breve histórico
O Comando Vermelho (CV) surgiu em 1979 e se tornou a facção do tráfico mais poderosa nos anos 90, apesar de ter perdido territórios para a sua rival Terceiro Comando Puro (TCP) nos anos 80. O TCP é fruto de um racha violento entre os líderes do CV. A facção Amigos dos Amigos (ADA) se formou nos presídios durante os anos 1994 a 1998 e se tornou um grande aliado do TCP. O objetivo de ambos é diminuir o controle do CV. As mílicias cariocas surgiram na década de 70 e são formadas por bombeiros e policiais (ativos ou aposentados) que atuam em conjunto com lideranças das comunidades, o sindicato dos guardadores de carros, a guarda municipal e políticos. A primeira Unidade de Polícia Pacificadora (UPP) foi inaugurada em dezembro de 2008 no morro Dona Marta em Botafogo. As UPPs fazem parte do programa de segurança pública do governo Sérgio Cabral. Este é o conceito de UPP apresentado no site oficial (http://upprj.com/wp/?page_id=20):
“A Unidade de Polícia Pacificadora é um novo modelo de Segurança Pública e de policiamento que
promove a aproximação entre a população e a polícia, aliada ao fortalecimento de políticas sociais nas comunidades”.

Pois é, o modelo das UPPs é o resultado da atuação truculenta do governador Sérgio Cabral, contradizendo a sua definição.

Alguns exemplos da atuação do Governo Cabral
Não é a primeira vez que a política de segurança do secretário Beltrame, o Complexo do Alemão e da Penha ocupam as primeiras páginas do noticiário. O ano de 2007 foi marcado por ocupações bem diferentes das que acompanhamos nos últimos dias. Em maio, essas áreas foram ocupadas por policiais civis, militares e soldados da Força Nacional com o objetivo de viabilizar as obras do PAC, garantir a segurança dos Jogos Pan-Americanos e a apreensão de armas, drogas e traficantes. No dia 27 de junho, os jornais noticiaram a maior operação realizada no Complexo do Alemão e da Penha motivada pela busca aos responsáveis pelo assassinato de dois policiais em Oswaldo Cruz. Nesta data, 19 pessoas morreram com uma média de 3,84 tiros cada. A ONU enviou um relator especializado em execuções para visitar a região e analisar estas mortes. O relatório concluiu que as mortes foram de fato execuções. A OAB divulgou em nota oficial que 11 entre as 19 pessoas mortas não tinham nenhuma relação com o tráfico. O saldo final da ocupação foram 44 mortes entre os dias 2 de maio até 19 de julho. Em reposta, Beltrame desqualificou o relatório da ONU apontando falhas técnicas e afirmando que os planos de ocupação foram feitos a partir de dados reunidos por informantes e fotos aéreas da região com uma antecedência de 2 meses. Ele concluiu que a operação foi bem sucedida, mas admitiu que durante a ocupação apenas o cerco aos acessos dos complexos foram mantidos, mas os traficantes ainda dominavam a região.

No ano de 2009, os traficantes do Morro de São João, integrantes do CV, e os traficantes do Morro dos Macacos, integrantes do ADA, se enfrentaram por mais de 6 meses sem qualquer intervenção policial. Há relatos de pelo menos uma tentativa de invasão ao Morro São João e duas tentativas de invasão ao Morro dos Macacos. No mês de outubro ocorreu a segunda tentativa que resultou na morte de 10 pessoas e no incêndio de 8 ônibus. Só então a Polícia Militar (PM) entrou no confronto e o caso ganhou destaque na mídia após a derrubada de um helicóptero da PM e mais 17 mortes em apenas um final de semana.

Nesse mesmo ano, houve também uma disputa violenta entre os traficantes da ADA e do TCP na Vila Vintém. Segundo Maurício Campos, integrante da Rede de Comunidades, 30 pessoas morreram nesse confronto que não teve interferência da polícia e nem recebeu atenção da mídia.

Diversas entidades de direitos humanos e movimentos contra a violência consideram que a volta dos confrontos entre as facções criminosas no Rio de Janeiro é uma consequência da estratégia equivocada e truculenta da política de segurança de Beltrame. Ele assumiu a secretaria de segurança pública em 2007 e adotou como prioridade a desarticulação do Comando Vermelho por esta ser a maior facção criminosa. Me parece que esta estratégia está desequilibrando o tráfico e estimulando a guerra entre as facções. A obrigação do Estado é combater todas as facções criminosas, do contrário, o governo assume o papel de mais uma facção na disputa de poder. Concentrar os esforços da segurança do Estado em combates ao tráfico de drogas e armas nas comunidades pobres não tem sido muito eficiente. Talvez resultados mais eficazes sejam obtidos se forem combatidos os segmentos os segmentos corruptos das polícias e os segmentos responsáveis pelo fluxo internacional de armas e drogas. Essas críticas são respaldadas pela distribuição das UPPs e a estatística dos crimes cometidos na cidade. Dá só uma olhada:

No site oficial das UPPs, mencionado acima, o Governo informa que “ao recuperar territórios ocupados há décadas por traficantes e, recentemente, por milicianos, as UPPs levam a paz às comunidades do Morro Santa Marta (Botafogo – Zona Sul); Cidade de Deus (Jacarepaguá – Zona Oeste), Jardim Batam (Realengo – Zona Oeste); Babilônia e Chapéu Mangueira (Leme – Zona Sul); Pavão-Pavãozinho e Cantagalo (Copacabana e Ipanema – Zona Sul); Tabajaras e Cabritos (Copacabana – Zona Sul); Providência (Centro); Borel (Tijuca – Zona Norte); Andaraí (Tijuca);  Formiga (Tijuca); Salgueiro (Tijuca); e Turano (Tijuca).”

Faltou incluir a UPP do Morro dos Macacos inaugurada hoje. Com esta UPP, o Estado passa a contar com 13 unidades, dentre elas, 11 UPPs foram instaladas em morros controlados pelo CV e as outras 2 foram instaladas em morros controlados ADA. E excluir os milicianos já que até o momento não há nenhuma UPP nos territórios das milícias. A distribuição das UPPs entre as 94 favelas é a seguinte: a Zona Norte possui 60 favelas e 8 UPPs, a Zona Oeste possui 20 favelas e 2 UPPs, a Zona Sul possui 14 favelas e 3 UPPs. Infelizmente, o site oficial não esclarece quais foram os critérios utilizados na escolha das localidades das UPPs e também não há nenhuma informação sobre o planejamento das próximas unidades. Mas, estes poucos dados indicam duas prioridades do governo: desarticular o CV e privilegiar a Zona Sul da cidade.

Consultei o Instituto de Segurança Pública (http://www.isp.rj.gov.br/Conteudo.asp?ident=150) e comparei os dados desde dezembro/2008 e verifiquei que tanta a incidência de crimes bem como as atividades policiais não sofreram alterações significativas desde a implementação das UPPs. Talvez os boatos sobre o aumento dos crimes na Baixada, Niterói e no interior não seja verdadeiros. Segundo as estatísticas, não houve aumento nas atividades criminosas nem policiais nessas áreas. Por outro lado, talvez seja o boato de que o tráfico de drogas continua no Dona Marta pode ser verdadeiro.

Será que o CV continua tão poderoso assim? Essa facção perdeu muitos territórios e boa parte dos seus líderes estão presos e mortos. Independente do poderio do CV, está claro que Beltrame precisa repensar as suas prioridades e combater os avanços das outras 3 facções criminosas que dominam diversas áreas da cidade. Por exemplo, todas as 7 favelas na região de Bangú são controladas pelas milícias, 6 entre as 11 favelas na Barra e Jacarepaguá são territórios do TCP, o Complexo da Maré é um verdadeiro inferno porque foi dividido entre o CV, o TCP e o ADA, o Vidigal e a Rocinha são domínios do APA.

Desde o domingo, dia 21, cerca de 102 veículos incendiados e diversas pessoas foram feridas nesses atentados. A polícia montou uma operação em represália à onda de crimes em diversas partes da cidade e concentrou a maior parte do seu contingente no Complexo da Penha e do Alemão.

A atuação da polícia resultou na apreensão de muitas armas, drogas, veículos e dinheiro do tráfico (Dinheiro mesmo foi apreendido na Vila Cruzeiro, já no Alemão…). Até agora foram encontrados 47 toneladas de maconha, cerca de de uma tonelada de cocaína e uma pequena quantidade de crack. Cadê o pó e o crack do Alemão? Segundo Beltrame, o Complexo do Alemão é o maior reduto do tráfico carioca e até agora só encontraram 230kg de cocaína lá.

Outra pergunta que não quer calar, cadê os traficantes? O ex-capitão do Bope, Rodrigo Pimentel, afirmou no RJ Tv que a secretaria de segurança sabia que os dutos de esgoto do Complexo do Alemão eram uma rota de fuga possível desde a operação realizada em 2007. É inegável que a polícia estava ciente disso, pois o próprio Rodrigo participou da operação de 2007. Então, o que será que aconteceu? Por que os traficantes não foram encontrados? Hoje cedo, fiquei chocada ao ouvir a notícia de que foi graças à denúncia de moradores que a polícia descobriu que traficantes tentariam fugir pela tubulação da rede de esgoto. Mesmo assim, apenas 8 criminosos foram pegos enquanto fugiam pelos bueiros. A polícia estimava a presença de 500 a 600 traficantes no Complexo do Alemão e entre o dia 21 até agora foram presas 123 pessoas, 130 foram detidas e 37 estão mortas.

Qual é a motivação desses atos de terrorismo por parte do tráfico? A hipótese de que esses ataques se devem à insatisfação com a instalação das UPPs virou uma certeza sem maiores evidências e não se discute mais esse assunto. A pergunta seguinte é em relação à autoria dos ataques. Outra hipótese assumida como certeza precipitadamente. A polícia se concentra nas comunidades dominadas pelo Comando Vermelho (CV), mas não há provas suficientes para garantir que esta facção é a única ou a principal responsável pelos caos na cidade. Atos de terrorismo urbano já foram praticados por outras facções. Na madrugada de 05 de fevereiro, 15 veículos foram incendiados em Ramos e 50 carros no pátio da delegacia de Roubos e Furtos em Irajá. A autoria desses atos foi atribuída às milícias da região que deixaram bilhetes condenando a instalação de UPPs. Porém, por alguma razão, as investigações policiais e a atenção da mídia durou poucos dias. A suspeita do acordo entre as facções rivais do Comando Vermelho e Amigos dos Amigos (ADA), reforça a suspeita de que o CV não está atuando sozinho. Corre também o boato de que o CV não é uma facção lá muito generosa ($$) com a polícia.

Enfim, que diabos está acontecendo nesta cidade? De que lado está o Estado? Tá rolando um acordo entre o Estado e algumas facções do tráfico? Isso já aconteceu em administrações anteriores. O Estado tá querendo “mostrar serviço” para as agências financiadoras e patrocinadores da Copa 2014 e das Olimpíadas 2016? Alguma sugestão, galera?

Me sinto mal por colocar estas questões, quero acreditar que temos a chance de mudar a realidade do Rio de Janeiro. No fundo, não consigo deixar de acreditar que a cidade vai ficará um pouco mais segura de fato, mas tem tantas coisas sem explicação. Já passamos por tanta coisa aqui nesse Rio de “Janeura”, uma cidade que registra cerca de 17 homícidios/dia, por isso, é difícil cair no discurso maniqueísta da imprensa. Sabemos que muitos policiais estão na folha de pagamento do tráfico. Não tô esculachando o trabalho dos caras. Mas, não podemos negar que muitas informações estão sendo omitidas. Admiro o trabalho dos verdadeiros policiais! A maioria desses caras sai para trabalhar sem treinamento e armamento adequado, ganha em média R$ 900 por mês, tem que esconder sua farda para não sofrer represália do tráfico e/ou dos vizinhos. Bom, talvez seja cedo demais para entendernos a situação. De qualquer forma, no atual estado de coisas, qualquer apreensão de armas, drogas e prisão já é muita coisa!!

As Três Leis dos Dados Abertos

novembro 25, 2010

No rastro da pesquisa para fazer o post sobre Governo 2.0 encontrei esse interessante blog de ativismo pela abertura de dados governamentais, escrito por David Eaves. Ele fez um texto sobre Dados Abertos, que vai na direção do que eu falava no post citado e cuja importância aumenta com o movimento do OpenDataDay.

Durante os últimos anos tornei-me cada vez mais envolvido no movimento pelo governo aberto e, mais especificamente, pela defesa dos Dados Abertos, o compartilhamento livre com os cidadãos da informação que o governo coleta e gera para que eles possam analizá-la, adaptá-la e usá-la eles mesmos. Meu interesse nesse espaço vem da escrita e de trabalhos que fiz sobre como a tecnologia, sistemas abertos e mudança de gerações vão transformar o governo. Mais cedo neste ano, eu comecei a aconselhar o Prefeito e o Conselho da Cidade de Vancouver, ajudando-os a passar a Moção Aberta (que a equipe do governo chama de Open3) e criar o Portal de Dados Abertos de Vancouver, o primeiro portal municipal de dados abertos no Canadá. Mais recentemente, o Governo da Austrália me solicitou para participar do Grupo de Referência Internacional para sua Força Tarefa de Governo 2.0.

Obviamente o movimento do governo aberto é bastante amplo, mas meu trabalho recente me levou a tentar destilar a essência da parte Dados Abertos desse movimento, o que, em última instância, nós precisamos e estamos pedindo. Consequentemente, quando estava apresentando o painel na Conferência para Parlamentares: Transparência na Era Digital na Semana Direito de Saber organizada pelo Comissário de Informação do Governo do Canadá eu compartilhei meu melhor resultado até agora nessa destilação: as três leis dos Dados Governamentais Abertos.

As Três Leis dos Dados Governamentais Abertos

  1. Se não pode ser buscado ou indexado, não existe
  2. Se não está disponível em um formato aberto e legível por máquina, não pode engajar
  3. Se a legislação não permite que seja readaptado, não delega poder (empower).

Para explicar, (1) basicamente significa: posso encontrar o dado? Se o Google (ou qualquer outra ferramenta de busca) não pode encontrá-lo, ele essencialmente não existe para a maioria dos cidadãos. Então, é melhor garantir que você esteja otimizado para ser vasculhado por todo tipo de robô de busca.

Depois que eu os encontrei, (2) observa que, para ser útil, eu preciso ser capaz de usar (ou brincar com) os dados. Consequentemente, eu preciso ser capaz de puxar ou baixar os dados em um formato útil (por exemplo, uma API, uma assinatura de RSS ou um arquivo documentado). Cidadãos precisam de dados em um formato que deixe misturá-los com o Google Maps ou com outros conjuntos de dados, analizá-los no OpenOffice ou convertê-los para um padrão de sua escolha e usá-los em qualquer programa que quiserem. Cidadãos que não podem usar e brincar com informação são cidadãos que estão desengajados e marginalizados da discussão.

Finalmente, mesmo se eu posso encontrá-lo e usá-lo, (3) sublinha que eu preciso de uma estrutura legal que me permita compartilhar o que eu criei, ser capaz de mobilizar outros cidadãos, prover novos serviços ou apenas apontar um fato interessante. Isso significa que a informação e os dados precisam estar licenciados de forma a permitir o uso mais livre possível ou, idealmente, não ter nenhuma licença. O melhor dado e informação governamental é aquele que não pode ser protegido por copyright. Conjuntos de dados que são licenciados de uma maneira que efetivamente previne os cidadãos de compartilharem seus trabalhos uns com os outros não lhes dá poder, mas sim silencia e censura.

Encontrar, usar e compartilhar. Isso é o que queremos.

Claro, uma rápida busca na internet mostrou que outros também já pensaram sobre isso também. Existe esse excelente 8 Princípios para os Dados Governamentais Abertos que são mais detalhados e talvez mais adequados para uma conversa a nível de CEO. Mas para falar a políticos eu achei a simplicidade desses três arrazoados mais forte; é uma lista simples que eles podem lembrar e demandar.

Hackers pela democracia

novembro 24, 2010

Por coincidência, depois de ter publicado o post sobre a importância de abertura dos dados do governo, vi uma notícia no Nassif (ripada da FSP) sobre o mutirão Transparência Hackday durante o 2º Forum de Cultura Digital. A motivação do movimento é aumentar a transparência e accountability da classe política e criar mecanismos tecnológicos para superar as dificuldades de acesso aos dados pelos meios oficiais ou a falta de mecanismos para a participação dos cidadãos. A principal atividade é a criação de robôs de busca (spiders ou crawlers) para extrair em um formato manipulável os dados que estão escondidos no fundo dos sites estatais. Com esse tipo de extração de dados o site Congresso Aberto consegue, por exemplo, fazer essa análise detalhada de cada votação por partido e região, com alguns gráficos bem instrutivos. Outros gráficos interessantes que mostram o que pode ser feito com acesso aos dados: uma distribuição espacial das posições dos partidos em relação ao governo ou uma representação bastante instrutiva da presença em votações por partido, na qual nota-se uma baixa presença da oposição (e de onde se tira mais argumento para mostrar que se Lula massacrou a oposição foi grande parte culpa dela mesma). Outro hack interessante foi a clonagem do Blog do Planalto para permitir o envio de comentários, o que não é possível no original. Note-se que, apesar de o blog original não ser aberto a comentários, foi a adoção de uma licença aberta, a Creative Commons, que permitiu fazer a clonagem dentro da lei. Mais informações sobre o #thackday no blog do Tiago Dória.

Para quem perdeu esse hackday, mas gostou da idéia e quer entrar na próxima, o Eaves do Canadá junto com várias pessoas, inclusive os organizadores do hackday aqui, está combinando uma Maratona Internacional de Dados Abertos para Sábado, dia 4 de Dezembro. A idéia é participar com projetos que usem criativamente os Dados Abertos de alguns governos ou então, o que parece mais o caso no Brasil, ajude a coletar dados de sites governamentais e construir um banco de dados em um formato facilmente manipulável. O mais importante aqui são as idéias. Minhas habilidades de programação andam  horrivelmente enferrujadas, mas não é preciso nada do outro mundo e é fácil engajar pessoas que implementem as idéias. O mais difícil é ter uma noção geral dos dados que podem ser coletados e pensar em todas relações interessantes que podem ser feitas. Aqui em Serra Talhada temos um curso de informática e espero engajar alguns alunos na proposta, assim quem não sabe programar mas tem boas idéias pode ajudar bastante.

E, claro, essa Maratona é um ótimo treino para as Olimpíadas da Hackeação de Dados Abertos: o concurso Apps for Development patrocinado pelo Banco Mundial para o melhor aplicativo que use os dados abertos do BM seja para aumentar a consciência a respeito de uma das Metas do Milênio, seja para contribuir para o progresso na busca dessas Metas. E a gente pode crowdsource o que já foi crowdsourceado, criando um bom grupo unindo hackers e pessoas que não sabem programar, mas que têm boas idéias. Comentem aí, pô!

Como se faz um Governo 2.0 de verdade – Parte 1

novembro 23, 2010

E-government ou Governo 2.0 não é só colocar dados online, mas também usar formatos abertos e outros mecanismos para que esses dados possam ser processados pela multidão. Esse é o diferencial do portal Data.gov do governo dos EUA e de outros portais nacionais e o que ainda falta aqui.

Ficar inventando termos com Nãoseioquê 2.0, surfando a onda de uma das melhores buzzwords dos últimos tempos, a Web 2.0, já é muito 2004 e hoje em dia pega até meio mal. Porém quando Obama caiu na tentação da moda e prometeu, em 2008, criar um Governo 2.0, poucas vezes o termo foi tão bem empregado. A distinção original entre as duas versões da Web estava ligada, no essencial, a uma mudança do papel do usuário diante do conteúdo e ao surgimento de uma produção colaborativa desse conteúdo, iconizada em sites como a Wikipedia ou o Youtube, e Obama estava, não sei o quanto conscientemente, apontando para uma outra forma de relação entre governo e sociedade por meio das novas tecnologias de informação.

Quando a gente pensa em governo eletrônico, ainda mais quando lembramos da reputação dos nossos políticos, uma das primeiras utilizações de TI que vêm à mente é como um catalizador da transparência, publicando dados das contas do governo, detalhes do orçamento etc. De uma certa forma, o Brasil já deu um bom passo nessa direção, chegando a fazer da abertura das contas online uma exigência legal na nova redação da Lei de Responsabilidade Fiscal. E o melhor exemplo, segundo esse ótimo índice da transparência, vem do próprio Governo Federal, que mantém o Portal da Transparência com um grau de detalhamento que permite saber até, por exemplo, cada mínima despesa do meu departamento neste ano. Isso é ótimo e tem que ser mesmo cobrado dos governos. É ótimo, mas ainda é muito 1.0.

Então o que danado seria um Governo 2.0?

Bem, Obama parece que sabia o que estava falando quando usou o termo Governo 2.0, tanto que ofereceu um dos melhores exemplos do próximo passo em transparência e publicidade dos dados do governo: o site Data.gov.

Obama pagando de nerd com um sabre de luz

Só um presidente nerd entenderia o que é um Governo 2.0 mesmo

Nele estão reunidos em único lugar e em um formato padronizado os mais diversos dados das várias agências do governo sobre atrasos de vôos, relatórios do clima, patentes, orçamento, locais de recreação, destino de espécies ameaçadas etc. No Brasil a pessoa interessada e persistente até pode sair procurando pelos sites do governo e encontrar dados oficiais sobre o clima, a situação do tráfego aéreo, patentes e orçamento, mas tem uma diferença crucial entre essa informação e a do Data.gov. Imagine que você seja um gestor, um pesquisador  ou um jornalista interessado em saber se o dinheiro para a educação está sendo bem gasto. Com a divulgação atualmente disponível nos sites do Governo Federal alguém mais esforçado e rato de Google consegue encontrar algumas informações quantificadas sobre educação, como notas no IDEB, e também informações do investimento em educação por município. Usando isso mais algumas outras informações, como o número de crianças matriculadas, você poderia fazer uma correlação entre as notas e o investimento por aluno, criando um indicador de eficiência dos gastos. Mas antes disso você precisaria criar uma maneira de extrair os dados desses sites e traduzi-los para um mesmo formato antes de fazer o seu processamento estatístico. Mesmo que você faça um programinha crawler para extrair os dados dos sites do governo (se conseguir. No IPEA, a navegação toda usa javascript!), o trabalho ainda é meio braçal, já que o método que você usou nesse caso não vai funcionar para correlacionar dados de outras bases e/ou em outros formatos, como, por exemplo, ocorrências climáticas e abstenção nas eleições.

Alguns dados públicos são mais públicos que outros e é nisso que o Data.gov se diferencia. Além de unificar em um só lugar todos os dados do governo, os dados são disponibilizados em formatos abertos padronizados, como CSV, XML ou RDF, acessíveis diretamente em um endereço da internet. Isso permite que você crie o link para os dados direto de uma planilha ou então tome vergonha na cara e use logo o Chuck Norris dos softwares de estatística, gratuito e usado para trabalho pesado por várias mega-empresas. Melhor ainda, um nerd amigo pode fazer o favor de criar uma interface amigável para a manipulação dos dados, como faz o DataMasher com diversos datasets do Data.gov, e qualquer um pode se aventurar na análise dos dados.

Disso decorre a maior vantagem do modelo do Data.gov, a que o faz merecer o rótulo de e-Gov 2.0: o diagnóstico torna-se descentralizado. Aquela análise sobre o investimento na educação pode ser feita pelo MEC, pelos governos municipais, pelo diretor de escola preocupado com seus resultados ou, mais interessante ainda, por uma associação de alunos, pela UNE, pelos pais dos alunos, por jornalistas, por uma ONG estrangeira ligada à educação, enfim, por qualquer sujeito interessado no problema. Ou seja, a liberação do máximo de dados governamentais possibilita a crowdsourcing não só da fiscalização do governo, mas também do diagnóstico do país em diversos aspectos. Ao invés de termos um pequeno grupo de funcionários do MEC olhando para todos os problemas da educação no país inteiro, temos um número potencialmente bem maior de pessoas processando os dados e fazendo as sinapses necessárias. Ou melhor ainda: as pessoas criariam voluntariamente aplicativos que facilitariam ou automatizariam essa análise de dados em diversas áreas, podendo, por exemplo, criar sistemas de alerta antecipado para doenças similares ao genial Google Trends para gripe. O Governo entraria com o trabalho de reunir, padronizar e disponibilizar os dados e os nerds devolveriam aplicativos que facilitariam a vida do próprio governo.

Mas não necessariamente o resultado precisa ter essa utilidade limitada. Em última instância temos direito de acesso aos dados porque pagamos por eles e isso se estende também aos dados de pesquisas financiadas pelo governo. E não é possível prever tudo o que pode ser feito por esses dados além dos usos óbvios no controle do governo e no planejamento da ação estatal. Dados públicos padronizados podem ser usados para criar um planejador de rota de metrô para iPhone ou, então, um mapa nacional de banheiros públicos cujo potencial de utilidade é óbvio.

Amanhã continuo com alguns exemplos interessantes de como os dados públicos do Data.gov e de outros sites similares ao redor do mundo podem ser usados.

(Quem bateu aqui pela primeira vez e gosta desse assunto pode achar interessante um post anterior sobre sites brasileiros que fiscalizam o trabalho parlamentar)

Transparência: lucrando com o inevitável

novembro 22, 2010

Tem gente com quem não funcionam argumentos bonitinhos usando palavras como cidadania, transparência, participação ou democracia. Tem gente que leu Hobbes na maternidade, já saiu roubando lanche do coleguinha no maternal e hoje não tem Kant nem papo de “um mundo melhor” que dê jeito. Por isso sempre sinto um alívio quanto encontro um artigo como o do Clive Thompson na Wired para nos fornecer argumentos na única linguagem que esse povo entende: lucro. A tese do texto é mais ou menos a seguinte: sua privacidade já era e, em um cargo como o de CEO ou algum mandato político, suas ações já vão ser dissecadas de todo jeito na internet, então, amigo, entre no modo está-no-inferno-abraça-o-capeta e asuma o controle do jogo escancarando-se online.

Mas aqui está o paradoxo interessante: a economia da reputação cria um incentivo para ser mais aberto, não menos. Dado que o comentário na internet é inescapável, a única maneira de influenciá-lo é sendo parte dele. Ser transparente, abrir-se, postar material interessante com frequência é a única maneira de conquistar links positivos para si e assim influenciar sua reputação googleável. Publicar mais evasão ou material exagerado de RP não vai funcionar, porque as pessoas ou vão ignorá-lo e não vão criar links para isso ou, pior, criticar essa jogada e sacralizar  estas críticas no alto dos seus resultados no Google.

Seria lindo que os políticos entendessem isso e continuassem ou amplificassem durante o mandato o uso das redes sociais ao invés de só lhe darem uma pseudo-atenção durante as eleições. O autor sonha com o dia em que o “primeiro candidato do MySpace ganhar a confiança do eleitorado postando sobre toda reunião a portas fechadas, lobistas inoportunos e sessões de estratégia de campanha”. Alguém manda o link da matéria para a @dilmabr?

Internets: novo espaço público ou cada um no seu quadrado?

novembro 20, 2010

No #debatenokia organizado pela querida Clarissa em Recife, no começo do mês, boa parte da diversão, como tinha que ser num evento voltado à tecnologia, estava na troca de mensagens pelo twitter (comigo avacalhando geral) e alguns SMS. Acabaram aparecendo muitas questões interessantes sobre arte e tecnologia que valeriam um post inteiro mas uma discussão que eu queria ter transformado em um post há mais tempo e que tem a ver com o post anterior sobre ciberdemocracia surgiu nessa troca de tweets em resposta à Cla (_amora_):

http://twitter.com/#!/_amora_/status/29506546613

Como eu falei no outro post, antes das últimas eleições talvez eu fosse mais otimista quanto à força da tecnologia para nos levar inexoravelmente rumo a um maior consenso, mas o alerta que eu puxei no tweet de resposta era uma preocupação sobre se o mundo virtual também não permitia a criação de guetos que não se comunicam entre si. A internet aumenta o acesso à informação e à pluralidade de informação mas por si só não nos leva a nos abrirmos para essa pluralidade. Essa facilidade de disseminar informação também serviu para os emails terroristas contra a Dilma, serviu para a Mayara Petruso e sua gangue virtual, serve para os evangélicos se articularem contra projetos como o que criminaliza a homofobia ou o que flexibiliza a permissão legal para o aborto. E tem um fator adicional nesse processo que eu quero há tempos dissecar num post próprio: a informação movida pelo medo, pela desrazão, que apela ao lado mais reptílico do nosso cérebro, se impõe a nós e se espalha mais rápido do que idéias baseadas em uma argumentação sólida e detalhada. Se idéias são replicadores numa luta darwiniana para dominar o ecossistema, como Dawkins descreveu ao criar a idéia de meme, idéias que apelam aos nossos instintos e que convencem imediatamente, mal passando pela consciência, têm uma vantagem evidente. Por isso, segundo Dawkins, a religião funciona um vírus.

Bem, mas esse post era só para [testar esse esqueminha de incorporar tweets no post e] dizer que, como tudo nesse mundo, a idéia do meu tweet esperadamente não era original é já tinha um nome e um artigo a respeito: ciberbalcanização, em homenagem àquela região menor que a Bahia onde tem tanta confusão. O objetivo do artigo é contrapor à idéia de uma Aldeia Global formada pelas novas tecnologias de informação e comunicação o risco de uma balcanização, isto é, da criação de grupos isolados que reforçam sua identidade por contraposição aos outros grupos. O argumento geral é que a TI só acelera a satisfação das preferências de interação social e a tendência é o cabra consumir mais do que ele já gosta ao invés de ampliar suas interações. E, nostra culpa, isso aconteceu um bocado nas eleições: faça um retrospecto do que você leu, quem você seguiu e retuitou e note o quanto você leu sobre o que você já concordava em comparação com o que foi dito em defesa do outro candidato. E nos outros assuntos também a tendência seria rumo a uma superespecialização como a que se tem na ciência, com o risco de perder uma “cross-pollination” entre áreas diferentes que levou a tantas descobertas revolucionárias.

Mas os autores não querem ser catastrofistas. No fundo o problema está nas preferências do usuário, pois como dizem, “tecnologias aperfeiçoadas aumentaram a velocidade de transmissão de informação e a largura de banda através de todas as distâncias exceto as últimas 12 polegadas – entre o monitor e o cérebro” e, como também enfatizam, um interesse pela diversidade também é mais satisfeito pelas novas tecnologias, agindo numa direção inversa à da balcanização. De fato, hoje o custo de experimentar a diversidade é menor: você pode sem custo ter uma idéia de como é rock do Kazaquistão ou procurar saber como parece um haikai em polonês (pierwszy cieply wiatr/wraca wspomnienie domu/i usmiech matki), ou, com uma ajudinha do governo, ler artigos caros de qualquer área, buscando a tal cross-pollination científica, e assim por diante. Quando o custo da informação era maior e eu tinha que fazer escolhas de como aplicar melhor o meu dinheiro aí sim a tendência era que eu focasse nas minhas preferências, naquilo que já sei que gosto e/ou que funciona. Mas, no final das contas, tudo acaba por depender do cabra querer procurar a diversidade. A conclusão meio que pode ser: quem já era balcanizado, incapaz de consenso e cabeça fechada vai ficar ainda mais, vai se fechar ainda mais em um gueto e quem quer aumentar o seu conhecimento vai ter mais oportunidades e vai globalizar sua mente cada vez mais. Quem é inteligente vai ficar mais inteligente, quem é tapado vai ficar mais tapado. Maravilha..rs

Bem, todo bom filósofo é um troll profissional, vide Sócrates enchendo o saco em toda festinha que ele ia, então é por isso que essa crítica ao oba-oba dos ciberotimistas é interessante. Não é pra ser apocalíptico. A cyberbalcanização não é um destino inevitável, mas pelo menos está ali como um risco real, que serve para lembrar que o consenso, o progresso, o triunfo da democracia e das Luzes não são um dado automático da tecnologia e sim o resultado de um esforço. Como eu disse no outro post, o espaço público nas internets é um Ideal (® Kant) e  o resultado de uma construção tanto quanto em qualquer outro meio. A tecnologia pode espertamente nos ajudar nisso, com mecanismos de auto-organização e regulação como o sistema de moderação do Slashdot e isso é um bom assunto para outros posts. Mas, por enquanto, já dá para adotar uma sugestão ótima e de baixo custo a partir de uma afirmação do artigo: “Corollary 4 — With greater connectivity, a taste for randomness or diversity unbalkanizes interaction”. Vamos criar o movimento Leia todo dia um artigo aleatório da Wikipédia! ou Leia todo um dia um site aleatório! ou ouça música que você nunca ouviu, num shuffle cósmico, se bem que não achei nenhum site que realmente faça isso…

(Poxa, o site aleatório que caiu pra mim foi esse: http://www.kerneltrap.org/ Eu bem que tentei fugir da balcanização, mas assim não dá…)