Versões audíveis de pinturas no Projeto Wikipédia da Faculdade Cásper Líbero

* Por Giovanna Fontenelle

Entre as várias atividades wiki da equipe de difusão do CEPID NeuroMat (também conhecida como Wiki Movimento Brasil) está o Projeto Wikipédia da Faculdade Cásper Líbero em 2018, desenvolvido por João Alexandre Peschanski, supervisor de comunicação do CEPID NeuroMat e professor da Faculdade Cásper Líbero. Nesta iniciativa, alunos da instituição realizam atividades, entre elas a produção e carregamento de versões audíveis de pinturas na Wikimedia Commons.

Este projeto está sendo realizado pelo segundo ano seguido. Em 2017, foram produzidos áudios sobre obras de artes de diversos museus. Já em 2018, o foco foram os quadros do Museu Paulista da USP, carregados pela equipe de difusão do NeuroMat, através da iniciativa GLAM ligada ao museu.

O intuito do principal do projeto é contribuir para a acessibilidade de obras de arte na internet, sobretudo nas plataformas Wikimedia, que também são muito relevantes na área de formação educacional. Por isso, o projeto conta com o apoio da ONG Laramara, que presta serviços à pessoas com deficiência visual, e da equipe educativa do Museu Paulista.

Para o bom desenvolvimento e produção desses conteúdos, os alunos foram orientados a seguir determinadas regras e a considerar as necessidades de ouvintes com deficiência visual. Estas orientações foram repassadas em cinco aulas, ministradas por Giovanna Fontenelle, bolsista de Jornalismo Científico no CEPID NeuroMat e ex-aluna da faculdade.

Dessa vez, o projeto das versões audíveis foi realizado com dois cursos da Cásper Líbero. Jornalismo produziu 90 versões audíveis e de Rádio, TV e Internet, 60. Cada aluno ficou responsável por dois quadros e, consequentemente, pela produção e carregamento de dois arquivos.

No curso de Jornalismo, as atividades foram coordenadas por Peschanski, que é professor de Ciência Política na instituição. Em RTVI, a coordenação também contou com a ajuda da professora de radiojornalismo, Filomena Salemme.

Para encontrar todos as audiodescrições e outras atividades já feitas no projeto, acesse este link. Já os arquivos produzidos pelo curso de Jornalismo, em 2018, estão disponíveis aqui e, os de RTVI, aqui.

 

Anúncios

Raspagem de dados: Introdução (PARTE I)

Por Renan Costa Laiz

Esta é a primeira postagem de uma coleção de três textos que tem como objetivo dar uma introdução à raspagem de dados. Assim, essa coleção não tem o intuito de ensinar o leitor a realizar uma raspagem por conta própria, mas dar um visão geral sobre o assunto e alguns direcionamentos sobre o tema. As postagens estão divididas em:

  1. Raspagem de dados: Introdução (PARTE I)
  2. Raspagem de dados: Obtenção das URLs de interesse (PARTE II)
  3. Raspagem de dados: Raspagem dos atributos e valores de interesse (PARTE III)

A raspagem de dados web, “web scraping” em inglês, nada mais é do que o processo de obtenção, muitas vezes em massa, de dados e informações de um website utilizando, principalmente, linguagens de programação. Na internet é possível encontrar programas que fazem o trabalho da raspagem de dados, porém eles são, muitas vezes, programas limitados e pagos. Para contornar tais problemas, é aconselhável que o interessado em realizar a raspagem crie seu próprio programa para o trabalho da obtenção dos dados ou informações, sendo Python uma linguagem de programação muito utilizada para esse fim.

Conhecer como o website está organizado para a realização da raspagem é fundamental, uma vez que cada site possui uma maneira própria de organizar o seu conteúdo, tornando alguns dos programas já disponíveis limitados, uma vez que os websites não possuem um formato universal de como disponibilizarão os seus conteúdos. Assim, é interessante ter algum conhecimento prévio sobre HTML e CSS, afim de se poder ter um domínio de como o site está organizado.

Mais do que saber como um site está organizado, é importante reconhecer se ele está estruturado, isso é, se as informações presentes no site possuem um padrão, afim de que se possa utilizar um único programa para a obtenção de todas as informações que temos interesse.

Também é importante notar que, como essa postagem refere-se à criação de um programa próprio para realizar o trabalho de raspagem, é necessário possuir algum conhecimento de programação. O conhecimento em programação é, felizmente, bastante difundido na internet através de sites e cursos gratuitos.

Dois procedimentos são essenciais ao se realizar uma raspagem de dados. A primeira é saber se o conteúdo de interesse está protegido por direitos autorais. Para isso, é necessário informar-se sobre quais são as possíveis ações que podem ser tomadas a respeito do conteúdo extraído. Se o conteúdo estiver protegido, deve-se antes contatar os detentores dos direitos de tal.

O segundo procedimento fundamental é ter responsabilidade ao se fazer uma raspagem de dados, evitando múltiplas requisições a um servidor em um curto período de tempo. Múltiplas requisições podem levar um servidor à instabilidade, derrubando o site que está sofrendo múltiplos acessos ou, ainda, fazendo o servidor requisitado bloquear o IP da máquina por suspeitar de um possível ataque. Para evitar isso, é recomendado que seja incluído um intervalo de tempo razoável entre as requisições.