Metodologia open source reaproveita e preserva acervos digitalizados legados
A apresentação de Murilo Souza, profissional de organização de arquivos do AC/SIARQ, despertou interesse dos participantes do V Congresso Internacional de Arquivos Digitais, realizado entre seis e oito de maio na Fundação Oswaldo Cruz (Fiocruz), no Rio de Janeiro. O evento foi uma iniciativa da Casa de Oswaldo Cruz e da Fiocruz e do Instituto de Investigaciones Bibliotecológicas y de la Información da Universidade Nacional Autônoma do México (UNAM). De co-autoria de Andressa Cristiani Piconi, diretora de Tecnologia da Informação do AC/SIARQ, o trabalho levado ao congresso abordou um modelo de ação semi-automatizado desenvolvido para reaproveitar objetos digitais existentes, integrando-os a uma estrutura de gestão arquivística confiável.
Diversas instituições arquivísticas, ao implementarem seus repositórios, a exemplo do Repositório Digital de Documentos Arquivísticos Permanentes e Sistema Informatizado de Acervos Permanentes da Unicamp (ReDiSAP), se deparam com conjuntos documentais digitalizados anteriormente, sem as devidas padronizações. A inviabilidade econômica ou a própria morosidade em digitalizar todo esse passivo novamente são desafios nada incomuns. A metodologia apresentada constitui, portanto, um caminho acessível e escalável para recuperação e salvaguarda de seu patrimônio digital legado sob critérios técnicos rigorosos. Ao utilizá-la, o usuário terá, como resultado, pacotes de informação padronizados, com todas as informações de processamento registradas dentro do próprio pacote, como para garantia de autenticidade e da transparência do processo.
Conforme Murilo, são duas frentes de atuação: a padronização do fluxo de trabalho de acordo com as especificidades do acervo e o desenvolvimento de uma biblioteca python própria, denominada perpetua. A ferramenta, em fase de consolidação, foi desenvolvida e testada no âmbito do AC/SIARQ. “Houve muita sinergia entre as áreas de tecnologia da informação e arquivo para que a metodologia funcionasse em tarefas como inventário recursivo, padronização de nomenclatura por expressões regulares, normalização de formatos para preservação e verificação de conformidade do pacote no pré-arquivamento”. Ele destaca a eficiência do resultado. “Aproveitamos esse passivo e processamos por completo um fundo com milhares objetos digitais sem necessidade de novos gastos com digitalização”, comemora.
Em fase de consolidação, a metodologia já está sendo replicada em outras instituições, como o Memorial Digital da Pandemia de COVID-19, iniciativa conduzida pelo Centro Cultural do Ministério da Saúde (CCMS), em parceria com a BIREME, centro da Organização Pan-Americana da Saúde (OPAS/OMS), e pelo Centro de Humanidades Digitais (CHD) da Unicamp.










