Relatório Técnico
Tarefas desenvolvidas no intuito de recuperar e disponibilizar as informações do CD-Rom Boletim da Filmoteca Ultramarina Portuguesa:
Recuperação do texto:
- revisão e reestruturação dos conteúdos, efetuada, quando possível, com recurso a scripts automáticos programados em Python;
- adaptação dos conteúdos a formatos web;
- preparação para a codificação automática dos conteúdos.
Transformação em base de dados (em curso):
- estudo do plano editorial;
- identificação dos marcadores mais usuais na descrição de cada espécime documental;
- desenvolvimento de scripts em Python (por vezes, mais de um por volume) para o reconhecimento dos vários componentes das entradas (cota, data, local, instituição arquivística...) e de maneira a grafá-los com maior uniformidade.
Revisão de conteúdos (em curso):
- verificação e correção dos resultados obtidos através dos scripts automáticos;
- introdução de três novos campos classificativos: "cidade", "entidade custodial" e "fundo/ tipo de unidade ou coleção".
Entre os CD-Roms já restaurados, este é certamente o mais complexo e o que demanda maior trabalho no tratamento de dados, por causa das próprias características editoriais do Boletim.
Ivo Santos