Self-contained, self-referenced, and self-documented digital documents in PDF format to support extended publication

Authors

Keywords:

Self-contained document, Self-referenced document, Self-documenting document, Expanded publication, Digital document in PDF format

Abstract

The context and use of archival documents change over time, making them active agents in a society with new dynamics. Digital documents in PDF format, whether self-contained, self-referenced, or self-documented, are required in many areas such as extended publishing. Objectives: to investigate the conceptual elements and computational tools appropriate for creating self-contained, self-referenced, and self-documented digital documents in PDF format, complying with FAIR principles and in an expanded publication context; and create a procedural flow to adapt digital documents in PDF format, from course completion work, to become self-contained and self-documenting. Methods: descriptive exploratory research and bibliographic survey. The scenario for experimenting was a collection of course conclusion works. Results: conceptual presentation of the characterizations of self-contained, self-referenced, and self-documented documents and their pertinence with the FAIR principles and extended publication; choice of three tools for incorporating attachments and metadata and validation for the PDF/A standard, based on 12 functions designed considering aspects relevant to the research context; procedural flow with use demonstration to guide the user in depositing the course completion work. Conclusions: Documents with attachments and embedded metadata are important as support for extended publication due to the linking of their content to their supplementary data.

Downloads

Download data is not yet available.

Author Biographies

Henrique Cristovão, Universidade Federal do Espírito Santo, ES, Brasil.

Doutor em Ciência da Informação na Universidade de Brasília (UnB) com estágio de pesquisa (Doutorado Sanduíche) no Institute for Human & Machine Cognition (IHMC/EUA). Mestre em Informática na Universidade Federal do Espírito Santo (UFES). Bacharel em Matemática Aplicada e Computacional na UFES. Professor Adjunto na UFES, Departamento de Arquivologia. Líder do grupo de pesquisa Organização e Recuperação de Conhecimento em Rede (NetKOR), registrado no CNPq. Participa dos grupos de pesquisa: Observatório da Informação Arquivística Digital, Tecnologias da Informação e Comunicação Aplicadas à Saúde, e Inteligência Cooperativa em Redes Sociais Complexas. Editor do Brazilian Journal of Production Engineering (BJPE) na área Informação e Conhecimento. Membro da Associação Nacional de Pesquisa e Pós-Graduação em Ciência da Informação (ANCIB). Linhas de pesquisa atuais: Networked Knowledge Organization Systems, Knowledge Discovery (NKOS), Web Semântica e Linked Open Data, Modelagem Conceitual, Análise de Redes Complexas, e Organização e Gestão do Conhecimento.

Link Currículo Lattes - http://lattes.cnpq.br/5035919384923489

Willian Alves Batista, Universidade Federal do Espírito Santo, ES, Brasil.

Bacharel em Arquivologia na Universidade Federal do Espírito Santo (UFES). Projetos desenvolvidos, apoio na organização de arquivos institucionais na Secretaria de Avaliação Institucional da UFES e Monitoria especial e temporária para o Centro de Ciências Jurídicas e Econômicas da UFES.
Link Currículo Lattes - http://lattes.cnpq.br/9673198241662286

 

Bruna Morêto Sibaldo Rocha, Universidade Federal do Espírito Santo, ES, Brasil.

Bacharelanda em Arquivologia na Universidade Federal do Espírito Santo (UFES). Iniciação científica na área de metadados de arquivos por um ano. Monitoria na matéria de Preservação e Conservação de Documentos I.
Link Currículo Lattes - http://lattes.cnpq.br/2366566452976746.

 

 

References

ABNT NBR ISO. ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS. NBR ISO 19005-1:2009: Gerenciamento de documentos: Formato eletrônico de arquivo de documento para preservação de longo prazo, parte 1: uso do PDF 1.4 (PDF/A-1).

ABNT NBR ISO. ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS. NBR ISO 23081-1:2019: Informação e documentação: Processos de gestão de documentos de arquivo: Metadados para documentos de arquivo. Parte 1: Princípios. Rio de Janeiro.

ADOBE ACROBAT. O que é um PDF?. 2022. Disponível em: https://www.adobe.com/br/acrobat/about-adobe-pdf.html. Acesso em: 22 ago. 2022.

ARQUIVO NACIONAL. Política de preservação digital. Arquivo Nacional, v. 2. 2016. Disponível em: http://www.siga.arquivonacional.gov.br/images/an_digital/and_politica_preservacao_digital.pdf.Acesso em: 22 ago. 2022.

BRASIL. Portaria MEC nº 1.224, de 18 de dezembro de 2013. Institui normas sobre a manutenção e guarda do Acervo Acadêmico das Instituições de Educação Superior (IES) pertencentes ao sistema federal de ensino. Diário Oficial da União, Brasília, DF, 18 dez. 2013.

BRASIL. Decreto nº 10.278, de 18 de março de 2020. Regulamenta o disposto no inciso X do caput do art. 3º da Lei nº 13.874, de 20 de setembro de 2019, e no art. 2º-A da Lei nº 12.682, de 9 de julho de 2012 [...]. Diário Oficial da União, Brasília, DF, 18 mar. 2020.

CÂMARA TÉCNICA DE DOCUMENTOS ELETRÔNICOS. Glossário. Disponível em: https://www.gov.br/conarq/pt-br/assuntos/camaras-tecnicas-setoriais-inativas/camara-tecnica-de-documentos-eletronicos-ctde/glosctde_2020_08_07.pdf . Acesso em: 22 ago. 2022.

CHINOSI, Michele; TROMBETTA, Alberto. BPMN: An introduction to the standard. Computer Standards & Interfaces, v. 34, n. 1, p. 124–134, 2012. DOI: 10.1016/j.csi.2011.06.002.

CONARQ. Orientação técnica nº 4: recomendações de uso do PDF/A para documentos arquivísticos. 2016. Disponível em: http://conarq.gov.br/images/ctde/Orientacoes/Orientacao_tecnica_4.pdf . Acesso em: 22 ago. 2022.

CONARQ. Glossário: documentos arquivísticos digitais (8ª versão). Rio de Janeiro: Conselho Nacional de Arquivos - CONARQ/Câmara Técnica de Documentos Eletrônicos - CTDE, 2020. Disponível em: https://www.gov.br/conarq/pt-br/assuntos/camaras-tecnicas-setoriais-inativas/camara-tecnica-de-documentos-eletronicos-ctde/glosctde_2020_08_07.pdf. Acesso em: 22 ago. 2022.

COOK, Terry. Arquivologia e pós-modernismo: novas formulações para velhos conceitos. Informação Arquivística, v. 1, n. 1, p. 26, 2012. Disponível em: https://www.brapci.inf.br/_repositorio/2015/12/pdf_deb3461ca4_0000018241.pdf. Acesso em: 22 ago. 2022.

CREATIVE COMMONS. Embedded metadata with XMP. 2015. Disponível em: https://wiki.creativecommons.org/images/f/ff/Creativecommons-embedded-metadata-with-xmp_eng.pdf. Acesso em: 22 ago. 2022.

DURANTI, Luciana. Registros documentais contemporâneos como provas de ação. Revista Estudos Históricos,v. 7, n. 13, p. 49–64, 1994. Disponível em: http://bibliotecadigital.fgv.br/ojs/index.php/reh/article/view/1976. Acesso em: 22 ago. 2022.

KIMURA, Akiko; MAY, Peter. PDF format preservation assessment, part 2: PDF/A profile. British Library, 2019. Disponível em: https://wiki.dpconline.org/images/2/22/PDFA_Assessment_v1.0.pdf. Acesso em: 22 ago. 2022.

LOC. PDF/A-1, PDF for long-term preservation, use of PDF 1.4. Sustainability of Digital Formats: Planning for Library of Congress Collections. 2019a. Disponível em: https://www.loc.gov/preservation/digital/formats/fdd/fdd000125. Acesso em: 22 ago. 2022.

LOC. PDF/A-2, PDF for long-term preservation, use of ISO 32000-1 (PDF 1.7). Sustainability of Digital Formats: Planning for Library of Congress Collections. 2019b. Disponível em: https://www.loc.gov/preservation/digital/formats/fdd/fdd000319. Acesso em: 22 ago. 2022.

LOC. PDF/A Family, PDF for long-term Preservation. Sustainability of Digital Formats: Planning for Library of Congress Collections. 2020a. Disponível em: https://www.loc.gov/preservation/digital/formats/fdd/fdd000318. Acesso em: 22 ago. 2022.

LOC. PDF/A-3, PDF for long-term preservation, use of ISO 32000-1, with embedded files. Sustainability of Digital Formats: Planning for Library of Congress Collections. 2020b. Disponível em: https://www.loc.gov/preservation/digital/formats/fdd/fdd000360. Acesso em: 22 ago. 2022.

LOC. PDF/A-4, PDF for long-term preservation, use of ISO 32000-2. Sustainability of Digital Formats: Planning for Library of Congress Collections. 2020c. Disponível em: https://www.loc.gov/preservation/digital/formats/fdd/fdd000532. Acesso em: 22 ago. 2022.

LOC. PDF 2.0, ISO 32000-2 (2017, 2020). Sustainability of Digital Formats: Planning for Library of Congress Collections. 2020d. Disponível em: https://www.loc.gov/preservation/digital/formats/fdd/fdd000474. Acesso em: 22 ago. 2022.

NISO. ISO 16684-1:2019 graphic technology, extensible metadata platform (XMP) specification, part 1: data model, serialization and core properties. 2019. Disponível em: https://www.iso.org/standard/75163.html. Acesso em: 22 ago. 2022.

PDFTTRON. What are the different versions of PDF/A?. 2019a. Disponível em: https://pdftron.com/blog/pdfa-format/what-are-the-different-types-of-pdfa. Acesso em: 22 ago. 2022.

PDFTRON. How to pick the right version of PDF/A. 2019b. Disponível em: https://pdftron.com/blog/pdfa-format/how-to-pick-right-version-of-pdfa. Acesso em: 22 ago. 2022.

RODRIGUES, Fernando de Assis; SANT’ANA, Ricardo César Gonçalves. Publicação Ampliada no Contexto de Teses e Dissertações. Informação & Tecnologia, Marília/João Pessoa, v. 3, n. 1, p. 4–26, 2016. Disponível em: https://periodicos.ufpb.br/ojs/index.php/itec/article/view/38248. Acesso em: 22 ago. 2022.

RONDINELLI, R. C. O documento arquivístico ante a realidade digital: uma revisão conceitual necessária. Rio de Janeiro: FGV, 2013.

SAA. Portable Document Format (PDF). In: Archives Teminology, Society of American Archivists. 2005a. Disponível em: https://dictionary.archivists.org/entry/portable-document-format.html. Acesso em: 22 ago. 2022.

SAA. Metadata. In: Archives Teminology, Society of American Archivists (SAA). 2005b. Disponível em: https://dictionary.archivists.org/entry/portable-document-format.html. Acesso em: 22 ago. 2022.

SALES, Luana Farias; DE SOUZA, Rosali Fernandez; SAYÃO, Luís Fernando. Publicação ampliada: um novo modelo de publicação científica voltada para os desafios de uma ciência orientada por dados. In: ENCONTRO NACIONAL DE PESQUISA E PÓS-GRADUAÇÃO EM CIÊNCIA DA INFORMAÇÃO (ENANCIB), 15., 2014. [Anais eletrônicos...]. Belo Horizonte, 27 a 31 de outubro de 2014. Disponível em: https://ridi.ibict.br/handle/123456789/824. Acesso em: 22 ago. 2022.

SAYÃO, Luís Fernando; SALES, Luana Farias. Curadoria digital e dados de pesquisa. AtoZ: novas práticas em informação e conhecimento, v. 5, n. 2, p. 67–71, 2016. DOI: 10.5380/atoz.v5i2.49708.

VASILESCU, Ramona. PDF/A standard for long term archiving. Computer Science Series, v. 7, n. 1, p. 8, 2009. Disponível em: https://arxiv.org/ftp/arxiv/papers/0906/0906.0867.pdf . Acesso em: 22 ago. 2022.

WHEATLEY, Paul; MAY, Peter; PENNOCK, Maureen; KIMURA, Akiko; WHIBLEY, Simon; RUSSO, David. PDF format preservation assessment, part 1: PDF. British Library, 2019. Disponível em: https://wiki.dpconline.org/images/f/ff/PDF_Assessment_v1.5.pdf . Acesso em: 22 ago. 2022.

ZENG, Marcia L. Metadata basics. 2020. Disponível em: http://metadataetc.org/metadatabasics/ . Acesso em: 22 ago. 2022.

Published

2023-07-06 — Updated on 2023-07-06

Versions

How to Cite

Cristovão, H., Alves Batista, W., & Morêto Sibaldo Rocha, B. (2023). Self-contained, self-referenced, and self-documented digital documents in PDF format to support extended publication. ÁGORA: Arquivologia Em Debate, 33(67), 1–25. Retrieved from https://agora.emnuvens.com.br/ra/article/view/1151

Issue

Section

Articles