Preparação para o Wikidata Lab XII

Pôster do Wikidata Lab XII
Pôster do Wikidata Lab XII

* Por Giovanna Fontenelle

No dia 21 de fevereiro de 2019, apresentarei um Wikidata Lab sobre reconciliação de metadados. Como todas as edições deste evento, o intuito é treinar wikimedistas para a integração do Wikidata com a Wikipédia em português. Nesse caso, o Wikidata Lab, na edição XII, abordará especialmente o uso da ferramenta OpenRefine para a curadoria e reconciliação dados.

Para a atividade prática do evento, que se realizará à tarde, estão programados dois carregamentos para grupos distintos de wikimedistas. O primeiro será com metadados de rascunhos da pintura Independência ou Morte, outras obras do Pedro Américo e alguns quadros faltantes e importantes do acervo, para a parceria NeuroMat com o Museu Paulista, no contexto do GLAM. O segundo grupo ficará com o carregamento dos metadados do Museu do Índio, disponíveis no portal Tainacan.

O evento acontecerá das 9h30 às 16h30 e terá transmissão ao vivo pelo canal do NeuroMat no YouTube. Durante a parte da manhã, será apresentada a aula teórica. Em seguida, teremos a pausa para os lances e retornaremos para atividades práticas à tarde.

Mbabel: Narrativa estruturada para sismos

  • Por Érica Azzellini

A narrativa estruturada de sismos deve ser utilizada como suporte para a elaboração de verbetes sobre sismos em sua página de testes. Ela gera automaticamente um rascunho de verbete que deverá conter informações como data e país de ocorrência do sismo, magnitude na escala Richter, magnitude de momento sísmico, escala de intensidade de Mercalli, altitude e profundidade, coordenadas geográficas e número de mortos e de feridos, de acordo com dados disponíveis em seu respectivo item no Wikidata. As seções sugeridas para esse tipo de verbete são geologia, danos e vítimas e repercussão. Um exemplo de criação de verbete sobre sismos pode ser executado com o qid Q40355642, correspondente ao Sismo de Puebla de 2017, seguido de “sismo” para chamar o template narrativo adequado. Após clicar em “gerar esboço de sismo”, é necessário clicar em “mostrar previsão” para visualizar e editar o rascunho estruturado. A predefinição com a estrutura narrativa de sismo em Lua está disponível aqui.

Raspagem de dados: Raspagem dos atributos e valores de interesse (PARTE III)

Por Renan Costa Laiz

Essa é a terceira e última postagem de uma coleção de três textos que tem como objetivo dar uma introdução à raspagem de dados. Assim, essa coleção não tem o intuito de ensinar o leitor a realizar uma raspagem por conta própria, mas dar um visão geral sobre o assunto e alguns direcionamentos sobre o tema. As postagens estão divididas em:

  1. Raspagem de dados: Introdução (PARTE I)
  2. Raspagem de dados: Obtenção das URLs de interesse (PARTE II)
  3. Raspagem de dados: Raspagem dos atributos e valores de interesse (PARTE III)

Da postagem anterior temos agora uma lista com todos os links que nos interessam, links das obras de arte que devem ser explorados afim de finalizar o nosso objetivo: extrair os atributos e valores dessas páginas. A página de uma obra tem a seguinte estrutura:

Nesse site específico, ao abrirmos o código fonte da página acima, podemos perceber que os atributos e seus valores estão separados em basicamente três seções, na qual iremos representá-las apenas pelo primeiro atributo delas:

Seção no canto inferior esquerdo que possui o atributo “Classificação”
Seção superior que possui o atributo “Ano”
Seção central que possui o atributo “Assinatura”

Na primeira imagem estamos interessados em obter o atributo “Classificação”, entre as tags <span></span>, e “Desenho”, entre as tags <a></a>. Novamente, recorremos às funções das bibliotecas do Python, como a Beautiful Soup, para fazer a extração apenas das palavras de interesse, ignorando as tags. Repetindo o mesmo processo para cada uma das categorias, temos todos os atributos e valores de interesse de uma obra. Para conseguir extrair todo o conteúdo do site, deve-se repetir esse processo para cada uma das páginas que obtivémos na parte anterior. Com os atributos e valores de todas as obras armazenados, agora só nos resta exportar esses valores para uma planilha (ou qualquer outro formato desejável), utilizando bibliotecas da linguagem de programação, e o scrapping estará finalizado.

Para mais informações sobre raspagem de dados, assista ao vídeo apresentado pela bolsista do CEPID NeuroMat Verônica Stocco no WikidataLab XVII, realizado no CEPID NeuroMat:

Mbabel: Narrativa estruturada para filmes

  • Por Érica Azzellini

A narrativa estruturada de filmes deve ser utilizada como suporte para a elaboração de verbetes sobre filmes em sua página de testes. Ela gera automaticamente um rascunho de verbete que deverá conter informações como elenco, direção, ano de lançamento, país de origem, tópico principal da obra, personagens, trilha sonora, prêmios recebidos, bilheteria, custo de produção etc., de acordo com dados disponíveis em seu respectivo item no Wikidata. As seções sugeridas para esse tipo de verbete são sinopse, elenco, produção e prêmios e recepção. Um exemplo de criação de verbete sobre filmes pode ser executado com o qid Q44578, correspondente ao filme Titanic (1997), seguido de “filme” para chamar a narrativa estruturada adequada. Após clicar em “gerar esboço de obra de arte”, é necessário clicar em “mostrar previsão” para visualizar e editar o rascunho estruturado. A predefinição da narrativa estruturada de filmes em Lua está disponível aqui.

Exposição NeuroMat: o que aprendi

* Por Giovanna Fontenelle

No contexto das atividades práticas da minha bolsa de Jornalismo Científico, está vislumbrado o registro das atividades da exposição entre o CEPID NeuroMat e o Parque de Ciência e Tecnologia da USP. Esses registros foram realizados ao longo da minha bolsa de diversas formas.

Em primeiro lugar, participei de várias reuniões com os membros do CEPID NeuroMat para decidir sobre o que falaria a exposição. Nessas ocasiões, tive a oportunidade de entender melhor as atividades e projetos científicos desenvolvidos pelo laboratório, principalmente sobre o Jogo do Goleiro e suas vertentes teóricas; e sobre o Córtex e as áreas de neuroanatomia e fisiologia.

Já em segundo lugar, participei de reuniões entre os membros do NeuroMat com a administração do Parque CienTec. Nessas ocasiões, consegui aprender muito sobre as condições das instituições museológicas de cunho público no estado de São Paulo, além de descobrir como se monta e projeta uma exposição de grande porte, principalmente ao ar livre.

Em terceiro lugar, também obtive a oportunidade de entender o processo e produzir de fato um catálogo de exposição. Além disso, ao produzir e acompanhar o registro em vídeo das reuniões, também desenvolvi e melhorei as minhas técnicas de edição de vídeo. 

Por fim, acredito que tive a oportunidade de expandir meus conhecimentos sobre as iniciativas museológicas, sobretudo em uma dimensão educacional não só acadêmica, mas como de caráter formativo também. Ou seja: a difusão e a passagem do conhecimento científico não só para pares, como também para crianças e adolescentes.

Newsletter de dezembro na Wikimedia Outreach

* Por Giovanna Fontenelle

No mês de dezembro de 2018, produzi um relato publicado como uma newsletter na plataforma Wikimedia Outreach. Neste artigo, descrevi o trabalho desenvolvido pelo Google, o Google Arts & Culture, na Pinacoteca do Estado de São Paulo e no Museu Paulista da USP e como este projeto se alinha e é reaproveitado pelo GLAM-Wiki desta segunda instituição. 

Ambas as iniciativas são discutidas nos meus artigos acadêmicos, desenvolvidos no contexto da bolsa de Jornalismo Científico no CEPID NeuroMat, sobre “Novas Mídias na Construção de Projetos Museológicos”: o “A obra de arte na era das convergências digitais” e “Os acervos na era das convergências digitais”.

Na newsletter, em primeiro lugar, abordei as particularidades do site, as suas ramificações e ferramentas, como o gigapixel e o Street View. Em seguida, utilizei o exemplo da Pinacoteca como um caso ilustrativo na plataforma com relação ao Brasil.

Em seguida, falei sobre a questão do reaproveitamento das obras em gigapixel pelo GLAM do Museu Paulista no Commons.

Para ver a publicação na íntegra, acesse este link.

Mbabel: Narrativa estruturada para livros

  • Por Érica Azzellini 

A narrativa estruturada de livros deve ser utilizada como suporte para a elaboração de verbetes sobre livros em sua página de testes. Ela gera automaticamente um rascunho de verbete que deverá conter informações como autor, data de publicação, gênero literário, país de origem, personagens, tema principal da obra, prêmios recebidos etc., de acordo com dados disponíveis em seu respectivo item no Wikidata. As seções sugeridas para esse tipo de verbete são conteúdo, publicação e recepção. Um exemplo de criação de verbete sobre livros pode ser executado com o qid Q15228, correspondente ao livro O Senhor dos Anéis, de J. R. R. Tolkien, seguido por “livro” para chamar o template narrativo adequado. A predefinição da narrativa estruturada de livros em Lua está disponível aqui.