Mbabel: Eleições municipais

  • Por Érica Azzellini

Ao utilizar a ferramenta Mbabel para geração de rascunhos automáticos de verbetes na Wikipédia para eleições, é necessário atentar-se para as particularidades de eleições municipais e eleições estaduais. As diferenças entre esses dois tipos de eleições afetam a modelagem de itens no Wikidata.

narrativa estruturada de eleições municipais deve ser utilizada como suporte para a elaboração de verbetes de eleições na página de testes do editor. Ela gera automaticamente um rascunho de verbete que deverá conter informações, de acordo com dados disponíveis em seus respetivos itens estruturados no Wikidata, como data e local da eleição, número de eleitores aptos e de abstenções por turno, quantidade de votos válidos, votos nulos e votos em branco, candidatos, candidatos eleitos e seus respectivos vices (no caso de prefeitos), partidos e coligações. As seções sugeridas para esse tipo de verbete são: antecedentescampanha e análise. O rascunho estruturado de eleições municipais contém tabelas automáticas com os resultados da eleiçãointrodução estruturadainfocaixa automáticasugestões de seções, referênciasnavbox e categorias. Cabe ao usuário a devida revisão do rascunho em sua página de testes antes da publicação do verbete no domínio principal.

Recomenda-se o uso do Mbabel para a geração de rascunhos de verbetes de eleições em municípios brasileiros com mais de 100 mil habitantes. Vale ressaltar que as eleições municipais estão sujeitas a 2º turno em municípios com mais de 200 mil habitantes, de forma que é necessário verificar as diferenças possíveis na estruturação de dados no Wikidata entre eleições com apenas um turno ou com dois turnos. Nas eleições municipais, há a possibilidade de segundo turno para eleger os candidatos aos cargos de prefeito e vice-prefeito. O cargo de vereador é decidido por sistema proporcional, sem que haja um segundo turno.

Mbabel_Eleição_municipal_com_turno_único_estruturação_Wikidata
Modelo de estruturação de itens no Wikidata para eleição municipal de turno único. No exemplo, eleição municipal de Açailândia em 2016. Por Érica Azzellini, em CC-BY-SA-4.0
Mbabel_Eleição_municipal_com_dois_turnos_estruturação_Wikidata
Modelo de estruturação de itens no Wikidata para eleição municipal com dois turnos. No exemplo, eleição municipal de Volta Redonda em 2016. Por Érica Azzellini, em CC-BY-SA-4.0
Anúncios

Wikidata Lab XIV: Modelagem com estruturação intencional

  • Por Érica Azzellini

Na 14ª edição do Wikidata Lab, realizada em 25/04 no CEPID NeuroMat, apresentei os avanços na ferramenta Mbabel com as narrativas estruturadas de eleições. Com o meu orientador, notei que tais avanços poderiam proporcionar reflexões e discussões sobre modelagem no Wikidata para projetos amplos que envolvem a coordenação de mais de um item. Com isso, apresentei durante o evento como essa coordenação de qids se dá na ferramenta Mbabel para o desenvolvimento da narrativa estruturada de eleições – que contém texto completo, infocaixa automática, tabelas com resultados das eleições, categorias, referências etc. – e como a mesma lógica pode ser utilizada para outros projetos envolvendo a integração Wikidata-Wikipédia.

Na parte prática do evento, organizamos a modelagem intencional do Prêmio Pulitzer e começamos a elaborar a narrativa estruturada para prêmios.

No vídeo, você confere a apresentação do Wikidata Lab XIV: Modelagem com estruturação intencional:

 

 

Mbabel: como estruturar eleições brasileiras no Wikidata

  • Por Érica Azzellini

Wikidata é um banco de dados estruturado que opera a partir de entidades de itens e propriedades. Itens são marcados pela letra Q, seguida de sequência numérica única (Qid), enquanto que propriedades são marcadas pela letra P, também seguida de sequência numérica própria (Pid). Uma declaração no Wikidata consiste na elaboração semântica de um item a partir do arranjo de propriedades. Qualificadores também auxiliam na atribuição de sentido das declarações.

No Wikidata, as eleições foram organizadas basicamente em um item para a eleição geral e em outros itens ligados a esse com as informações específicas para a eleição de cada cargo, conforme os diagramas nas seções abaixo. Embora a ferramenta Mbabel para eleições brasileiras não faça uso necessariamente de todos os itens no botão para geração de rascunhos automáticos, é importante que todos os itens estejam cadastrados no Wikidata para que aqueles utilizados no botão da ferramenta estejam operando adequadamente, seguindo as normas de estruturação do Wikidata.

Tribunal Superior Eleitoral disponibiliza dados sobre eleições estaduais e municipais, que podem ser utilizados como fonte no preenchimento de itens no Wikidata.

Os itens que tratam da eleição geral, devem conter as seguintes propriedades cadastradas:

  • P31 instância de (eleição Q40231)
  • P17 país (Brasil Q155)
  • P1001 pertencente à jurisdição (Estado ou município correspondente)
  • P155 precedido por (eleição estadual/municipal anterior)
  • P156 seguido por (eleição estadual/municipal posterior, caso exista)
  • P585 data de ocorrência (ano da eleição)
  • P541 cargo disputado (governador, vice-governador, senador, deputado federal, deputado estadual ou prefeito, vice-prefeito, vereador)
  • P1867 eleitores aptos (quantidade)
  • P527 composto de (indicação de itens no Wikidata de 1º e de 2º turno, sem que haja necessidade de utilização quando possui turno único)

Já os itens que tratam da eleição por cargo, devem conter as seguintes propriedades cadastradas:

  • P31 instância de eleição (Q40231)
  • P361 parte de (eleições estaduais no Acre em 2014 – 1º turno)
  • P17 país Brasil (Q155)
  • P1001 pertencente à jurisdição (Estado ou município correspondente)
  • P585 data de ocorrência (dia, mês e ano)
  • P541 cargo disputado (apenas um cargo: ou senador, ou deputado federal, ou deputado estadual etc.)
  • P991 candidatos eleitos (nome do candidato eleito, com número de votos recebidos, partido e coligação política como qualificadores)
  • P726 candidatos (nome do candidato, com votos recebidos, partido e coligação política como qualificadores)
  • P1867 eleitores aptos (quantidade)
  • P5043 número de abstenções (quantidade)
  • P5044 número de votos nulos (quantidade)
  • P1697 número total de votos válidos (quantidade)
  • P5045 número de votos em branco (quantidade)

Os itens são arranjados entre si a partir da utilização de propriedades como “composto de” (P527), “parte de” (P361), “seguido por” (P156) e “precedido por” (P155). Por exemplo, a Eleição municipal de Açailândia em 2016 (Q61870782) é composta pelos itens Eleição municipal de Açailândia em 2016 para Prefeito (Q61868798) e Eleição municipal de Açailândia em 2016 para Vereador (Q61868593). Da mesma forma, tanto o item sobre a eleição para o cargo de prefeito em Açailândia quanto o item sobre a eleição para o cargo de vereador no município possuem a propriedade “parte de” (P361), que os conecta ao item da eleição geral Q61870782.

Nas eleições em que há segundo turno, é necessário que cada turno tenha um item geral no Wikidata. Tais itens devem ser conectados com itens específicos para a eleição do cargo sujeito à segundo turno. No caso de eleições estaduais, há segundo turno para eleger governadores e seus respectivos vices. Com isso, o item geral do primeiro turno deve como valor na propriedade “instância de“(P31) “turno de votação”, com o qualificador “ordem na série – 1” e na propriedade “cargo disputado” (P541) todos os cargos da eleição: governador, vice-governador, senador, deputado federal e deputado estadual como valores. Já no item geral do segundo turno, deve constar como valor na propriedade “instância de “(P31) “turno de votação”, com o qualificador “ordem na série – 2” e na propriedade “cargo disputado” (P541) apenas os cargos de governador e de vice-governador como valor. A propriedade “data de ocorrência” (P585) deve constar em ambos os itens, sendo preenchida com dia, mês e ano. Já a mesma propriedade no item geral da eleição deve ser preenchido apenas com o ano no caso de eleições com dois turnos.

Jornalismo Computacional na Faculdade Cásper Líbero – Parte 2

  • Por Érica Azzellini

No dia 08/04, foi a vez da aula prática sobre Jornalismo Computacional na Faculdade Cásper Líbero para alunos da matéria de Jornalismo Multimídia, ministrada pelo professor João Alexandre Peschanski. Em nosso primeiro encontro, tratei de aspectos teóricos de web semântica e potencialidades para jornalistas com as narrativas estruturadas, expondo o desenvolvimento do projeto com a ferramenta Mbabel que desenvolvo no CEPID NeuroMat.

Como tarefa de casa, sugeri que os alunos criassem itens sobre políticos no Wikidata, para que entendessem a lógica do banco de dados semântico.

Nos reunimos no laboratório de informática da Faculdade Cásper Líbero para utilizarmos a ferramenta Mbabel e criar verbetes para eleições municipais de 2016 automaticamente. Para a maioria dos alunos, foi o primeiro contato ativo na Wikipédia. Éder Porto, membro da equipe NeuroMat, facilitou a tarefa organizando a lista de verbetes a serem criados pelos alunos na atividade.

A proposta era que os alunos criassem o rascunho dos verbetes com a ferramenta Mbabel, a fim de compreender o funcionamento da comunicação computacional, e em seguida adicionassem seções nos verbetes voltadas para o contexto e análise da eleição – temáticas que dependem da percepção humana para serem redigidos. A prática foi bastante produtiva, de forma que ampliamos a quantidade e melhoramos a qualidade da informação sobre eleições municipais na Wikipédia em uma única manhã com o esforço coletivo de alunos de jornalismo.

As instruções para as atividades realizadas podem ser acessadas na Wikiversidade.

Jornalismo Computacional na Faculdade Cásper Líbero – Parte 1

  • Por Érica Azzellini

Por conta de minha pesquisa no CEPID NeuroMat, fui convidada a dar duas aulas para os alunos de Jornalismo da Faculdade Cásper Líbero na matéria de Jornalismo Multimídia, ministrada pelo professor João Alexandre Peschanski.

A aula de 01/04 foi dedicada ao aspecto teórico do Jornalismo Computacional (JC). A ideia era que os alunos compreendessem as possíveis definições de Jornalismo Computacional e aprendessem noções de práticas na web semântica a partir de experimentações com o Wikidata.

Para isso, foi dado o contexto no qual surge a ideia de Jornalismo Computacional; possíveis definições de JC propostas por acadêmicos; como JC se diferencia de outros jornalismos digitais; as potencialidades de narrativas estruturadas dentro do JC – especialmente no que diz respeito a softwares NLG. Os exemplos práticos ficaram a cargo da ferramenta Mbabel. Com isso, introduzi os alunos ao universo Wikimedia e às integrações possíveis do Wikidata, banco de dados semântico, com a Wikipédia em um contexto de comunicação computacional.

O ppt da apresentação está disponível aqui.

Os alunos também responderam um questionário sobre data literacy que deverá ser utilizado para elaboração de um trabalho acadêmico posterior sobre Wikidata e educação.

Mbabel para eleições brasileiras

  • Por Érica Azzellini

A ferramenta Mbabel também pode ser utilizada para gerar rascunhos estruturados de eleições estaduais e eleições municipais no Brasil. Verbetes sobre eleições tendem a ser muito semelhantes, uma vez devem indicar em quantos turnos se deu aquela eleição, para quais cargos os candidatos estavam concorrendo, quais candidatos foram eleitos e com quantos votos válidos, nulos e brancos, além do partido e das coligações dos candidatos etc. Também são verbetes que ficam mais completos com a inserção de tabelas com os dados dos resultados da eleição.

Com isso, a ferramenta Mbabel pode auxiliar o editor tanto na elaboração de texto quanto de outros recursos de visualização da informação compatíveis com a estrutura de um verbete da Wikipédia. A proposta é disponibilizar à comunidade de usuários uma ferramenta que gera automaticamente rascunhos de verbetes de eleições brasileiras já com tabelas dos resultados das eleições, a fim de reduzir trabalho manual e possíveis erros. Também é um exercício de exploração entre as potenciais integrações entre Wikipédia e Wikidata.

Diferente dos templates de museus, livros e filmes, por exemplo, os rascunhos estruturados de eleições requerem a coordenação de mais de um item Wikidata por vez. Nos próximos posts, vamos detalhar melhor os processos de estruturação de itens no Wikidata para a geração de textos automáticos na Wikipédia mais complexos e completos.

Jornalismo Computacional e narrativas estruturadas na Revista Texto Livre

  • Por Érica Azzellini

O artigo As potencialidades de narrativas estruturadas para o Jornalismo Computacional: Competências jornalísticas na elaboração de textos gerados com banco de dados foi publicado na Revista Texto Livre. A revista é uma publicação da Faculdade de Letras da Universidade Federal de Minas Gerais, dedicada a discussões e reflexões em torno de temáticas das Humanidades Digitais.  O texto publicado é fruto da pesquisa realizada no contexto de bolsa do programa Mídia Ciência da FAPESP no CEPID NeuroMat.

Resumo: 

Neste artigo, explora-se as competências digitais desenvolvidas por jornalistas no contexto informacional do Big Data que levantam a viabilidade de intersecção entre Ciências da Computação e Jornalismo. Nesse sentido, autores propõem diferentes entendimentos sobre o Jornalismo Computacional, campo hipotético no qual a prática jornalística agrega um direcionamento técnico, o que expande o horizonte de entendimento da relação do jornalista com a construção narrativa no ambiente de abundância de dados. Observa-se nesse cenário a emergência de experimentações com narrativas estruturadas, entendidas como textos verbais automatizados a partir de moldes pré-determinados que processam dados de bancos de dados estruturados. Com isso, o artigo reflete sobre os softwares de Natural Language Generation (NLG) na composição de notícias e apresenta resultados do desenvolvimento da ferramenta Mbabel para geração de rascunhos estruturados para verbetes temáticos na Wikipédia a partir do banco de dados Wikidata.

O artigo completo está disponível aqui.