Premessa
Questa risorsa intende delineare l’insieme delle procedure per la digitalizzazione di documenti di formato bidimensionale, in conformità con le buone pratiche e standard nazionali e internazionali per una riproduzione di qualità dei documenti.
Selezione dei documenti
I documenti vanno scelti sulla base dei criteri di selezione definiti dal progetto prestando particolare attenzione agli aspetti legali connessi (leggi in materia di diritto d'autore, tutela della privacy...). Da questo punto di vista, eventuali criticità devono essere sottoposte al parere di un consulente legale.
I criteri di selezione in genere valutano:
- valore storico e culturale
- unicità e rarità
- alta richiesta
- materiale senza vincoli legali o con permessi di digitalizzazione ottenuti
- accesso ristretto dovuto allo stato di conservazione, al valore e alla localizzazione
- valore aggiunto tramite l’accesso in linea, la creazione di collezioni virtuali, l’aumento di interesse per materiale poco o non conosciuto
In alcuni casi può essere utile effettuare una ricognizione del materiale per determinare la quantità, la tipologia, il formato e lo stato di conservazione dei documenti. Queste informazioni possono servire per le successive attività di conservazione, catalogazione e digitalizzazione.
Approfondimenti
Aspetti legali
Per digitalizzare dei documenti è fondamentale porre attenzione alla problematica relativa al diritto d'autore sia per i materiali originali che per le risorse digitali.
È necessario prendere in esame: le caratteristiche dell’opera da trattare, la titolarità dei diritti (chi è il titolare dei diritti, esiste una tutela e di che tipo), le azioni che si vogliono compiere sull’opera (quali sono, quali diritti intervengono, si è autorizzati a procedere), le eventuali criticità e le possibili soluzioni.
Devono essere escluse le opere che ricadono sotto la tutela del diritto d’autore e le opere già digitalizzate in altre raccolte e accessibili al pubblico mediante la rete al fine di evitare le duplicazioni e contenere i costi.
Approfondimenti
Conservazione dei documenti
La digitalizzazione non sostituisce l’impegno alla cura e alla conservazione degli originali.
È importante che la valutazione dello stato di conservazione degli originali venga effettuata prima della digitalizzazione e che qualsiasi eventuale trattamento sui materiali originali venga eseguito dopo un sopralluogo di personale esperto.
Approfondimenti
Northeast Document Conservation Center (NDCC) – Preservation leaflets
Principi dell'IFLA per la cura e il trattamento dei materiali di biblioteca
The British Library, Preservation Advisory Centre - Photographic material
The Library of Congress – Collections care
Digitalizzazione
La digitalizzazione è il processo di trasformazione/conversione di un oggetto analogico (testo, immagine, audio, video) in un formato digitale, interpretabile da un computer.
La natura e le dimensioni degli originali determinano la scelta del sistema di ripresa, del sistema di illuminazione e delle modalità di trattamento (trasporto, apertura dei volumi, manipolazione).
La qualità delle immagini definita nel progetto determina i requisiti hardware e software del sistema di ripresa, i tempi di acquisizione ed elaborazione delle immagini, l’occupazione di memoria nei supporti di memorizzazione da gestire e conservare.
Digitalizzazione in-house o in outsourcing
La scelta della digitalizzazione all’interno dell’istituzione (in-house) o l’affidamento del servizio all’esterno (outsourcing) ha da considerare i vantaggi e gli svantaggi delle due modalità.
Servizio all’interno (in-house) | Servizio all’esterno (outsourcing) | |
---|---|---|
Vantaggi |
|
|
Svantaggi |
|
|
Raccomandazioni | Il servizio all’interno è indicato se:
|
Il servizio all’esterno è indicato se:
|
La digitalizzazione in outsourcing può essere eseguita nei locali della biblioteca o presso una ditta selezionata.
Il flusso delle attività di digitalizzazione in outsourcing comprende:
- definizione dei parametri di digitalizzazione
- preparazione di un’indagine di mercato o di una gara di appalto
- esame degli aspetti tecnico-logistici
- eventuale predisposizione del set di digitalizzazione
- preparazione dei documenti
- formazione del personale e degli operatori coinvolti per il controllo di qualità
- realizzazione di un prototipo
- digitalizzazione
- controllo di qualità
- ricollocazione dei documenti
- consegna del prodotto finito
Il flusso delle attività di digitalizzazione in-house comprende:
- definizione dei parametri di digitalizzazione
- acquisto dell’attrezzatura necessaria
- formazione del personale e degli operatori coinvolti
- esame degli aspetti tecnico-logistici
- eventuale predisposizione del set di digitalizzazione
- preparazione dei documenti
- realizzazione di un prototipo
- digitalizzazione
- controllo di qualità
- ricollocazione dei documenti
Scelta della strumentazione
Il sistema di acquisizione (sorgente di luce, ottica, sensore, software di acquisizione e di calibrazione) deve garantire la qualità di immagine richiesta dal progetto e non danneggiare i documenti originali.
In particolare il sistema di illuminazione deve essere a luce fredda senza emissione di UV e IR.
Per i documenti antichi o di pregio dovrà essere garantito l'utilizzo di un supporto atto a non danneggiare il documento (rivolgendo verso l'alto la superficie da digitalizzare e con piano basculante o supporto a V).
Si riportano alcune indicazioni generali sul sistema di ripresa:
- Scanner a letto piano sono usati per documenti a fogli singoli, o documenti rilegati che possono essere aperti con facilità, più piccoli o uguali al formato A3 (420 x 297 mm).
Questi documenti comprendono: materiale a stampa (es. volantini, manifesti, brochures), manoscritti (es. lettere), mappe in buone condizioni, musica a stampa, stampe (es. incisioni, acqueforti, litografie), disegni a penna e inchiostro senza aggiunta di acquarello o tempera (es. vignette), materiale fotografico (es. stampe alla gelatina in bianco e nero e a colori, stampe all’albumina). - Scanner per pellicole e diapositive
- Scanner planetario o Fotocamera digitale sono usati per documenti rilegati, documenti di particolare natura, documenti più grandi del formato A3.
Questi documenti comprendono: volumi rilegati (es. libri, album, musica a stampa, atlanti), documenti fragili, quadri ad olio, la maggior parte delle opere d’arte su carta (es. acquarelli, disegni), materiale grafico e opere d’arte realizzate con sostanze sfaldabili e friabili (es. pastelli, carboncini, matita morbida), acquarelli con stesura spessa, a tempera o con vernici, mappe grandi o fragili, manoscritti (es. diari rilegati, documenti ripiegati), pergamene, materiale fotografico (es. stampe di grandi dimensioni; procedimenti fotografici storici, come dagherrotipi o ambrotipi), materiale tridimensionale (es. tessuti, sculture, oggetti).
Acquisizione digitale
Il risultato della digitalizzazione è la creazione di file destinati alla lunga conservazione, file”master”, e di file frutto di elaborazioni successive, file “derivati”, destinati alla fruizione da parte degli utenti, in genere via Web.
Il file master (“master di conservazione”, “master di archiviazione”) è il file che rappresenta la miglior copia prodotta da una digitalizzazione, dove con “migliore” si intende che incontra gli obiettivi di un particolare progetto. Questi obiettivi possono variare a seconda della tipologia dei documenti.
I criteri da utilizzare nella creazione del file master devono garantire la riproduzione fedele del documento in vista della sua conservazione digitale a lungo termine o della necessità di una stampa di alta qualità, assicurando di non dover ripetere la digitalizzazione in futuro.
I file derivati sono prodotti a partire dal file master e ottimizzati per differenti fruizioni da parte dell’utente, ad esempio per la visualizzazione nel browser, per essere convertiti in testo via OCR oppure per la visualizzazione in una postazione dedicata. Sono normalmente ridimensionati e compressi, anche con perdita di informazione (ad es. immagini in formato JPEG, audio in formato Mp3), per la più comoda fruizione ottenibile senza un’eccessiva perdita di qualità.
Di seguito si riportano le indicazioni per la digitalizzazione di file immagine, cioè il prodotto della digitalizzazione di documenti testuali, grafici o tridimensionali.
File immagine
Le seguenti specifiche sono da prendersi come indicazioni generali, da adattare caso per caso realizzando il miglior compromesso tra qualità e costi.
Immagini di elevata qualità, sia in termini di risoluzione sia in termini di profondità di colore, implicano anche elevati costi di acquisizione (attrezzatura e personale qualificato) e di gestione (dimensione dei file da conservare). D’altra parte la scelta dei parametri di digitalizzazione dovrà essere sufficiente a ricostruire fedelmente il livello di dettaglio del documento.
La densità di campionamento, ovvero la quantità di pixel che rappresenta l’unità di lunghezza, deve quindi essere valutata non solo in base alla dimensione del documento, ma anche in base all’importanza del documento originale e alle risorse disponibili.
File master
- È archiviato così come lo restituisce lo strumento di acquisizione.
- Il documento deve essere ripreso nella sua interezza. Attorno al documento, si lascia un bordo di qualche millimetro che permetta di leggere il contorno del documento.
- Per i libri verrà prodotto un file immagine per ciascuna pagina: ciascun verso e recto di ciascuna carta, comprese le carte di guardia, anche se prive di informazioni, e le carte bianche; tutte le parti componenti la legatura: piatti, dorso, tagli, (in modo da mostrare capitelli, fermagli, borchie, cantonali). Per le mappe e per i materiali di archivio, il verso andrà digitalizzato solo nel caso in cui presenti delle informazioni.
- Se l’originale è montato su un supporto che riporta informazioni (es. una fotografia montata su cartoncino con il marchio del fotografo), la digitalizzazione deve comprendere anche il supporto.
- Ogni documento deve essere digitalizzato affiancato da scala cromatica, scala di grigi e scala metrica, poste all’esterno dell’immagine riprodotta e all’interno dell’inquadratura complessiva. Nel caso di volume è sufficiente posizionare le scale una sola volta su una carta o pagina (che verrà digitalizzata 2 volte, una con le scale e una senza).
- In presenza di lacerazioni, di fori di tarlo o ossidazione degli inchiostri, le carte devono essere mascherate con carta bianca in modo da evitare di riprendere il contenuto sottostante.
File derivati
Dai file derivati dovranno essere rimosse le scale cromatiche, di grigi e metriche.
I file derivati dovranno essere bilanciati per luminosità, contrasto e saturazione al fine di correggere eventuali aberrazioni cromatiche dovute alle condizioni di acquisizione, sulla base dei campioni restituiti dalle scale di colore e di grigi.
Tale bilanciamento deve mirare alla riproduzione fedele delle caratteristiche cromatiche dell’originale, non ad un arbitrario miglioramento estetico.
Per le specifiche tecniche di file master e derivati si vedano le tabelle a pagina 9, 10, 11 delle Linee guida sulla digitalizzazione di Phaidra.
Nomenclatura dei file
In generale il nome di ciascun file sarà una stringa di caratteri composta da più parti, avente in essa le informazioni necessarie ad identificare in maniera univoca il documento del progetto a cui l’immagine si riferisce. I nomi dei file saranno completati con l'estensione adeguata (tif, jpg, pdf, xml).
Nelle memorie di massa i file immagine saranno distribuiti in più cartelle, in modo da preservare l'ordinamento complessivo dei materiali.
La nomenclatura delle cartelle e dei file è una stringa di campi (Codice Biblioteca, Segnatura...) separati da trattino (-). Laddove la segnatura contenga trattini (-), spazi o caratteri speciali, vengono rimpiazzati da un punto (.).
Per materiale grafico e materiale di archivio che viene digitalizzato su entrambi i lati, far seguire alla numerazione progressiva dei file “-r” per il recto, “-v” per il verso.
Per i libri, coperta anteriore e posteriore vanno nominate in modo che si presentino nello stesso ordine che hanno nel documento fisico. Eventuali dorso o altre parti del documento originale (tagli, dettagli della legatura...) devono presentarsi alla fine.
L'immagine che include le scale di colore e di grigio ed il righello, deve essere nominata in modo che sia l'ultimo file della cartella e alla numerazione progressiva del file va aggiunta una "-c".
Per ulteriori approdondimenti si vedano le pagine 12, 13, 14, 15 delle Linee guida sulla digitalizzazione di Phaidra.
Memorizzazione e conservazione dei dati
La collezione delle immagini consistente in cartelle e file sarà memorizzata su supporti di memorizzazione ottici o magnetici, come CD, DVD, disco rigido esterno.
Si raccomanda di salvare i dati in un duplice supporto - di marca o serie differente -, tenere i supporti in due luoghi distinti, verificare periodicamente i dati, trasferire periodicamente i dati su un nuovo supporto.
La durata dei supporti è comunque influenzata da diversi fattori (le norme ISO 18923:2000 e 18925:2013 indicano i parametri per la buona conservazione dei supporti).
É fondamentale mantenere le risorse digitali create nel tempo al fine di evitare di rifare l’oneroso lavoro di digitalizzazione, pertanto è necessario mettere in atto procedure per assicurare che gli oggetti digitali rimangano usabili e accessibili indipendentemente dai cambiamenti tecnologici futuri.
L’usabilità e l’accessibilità degli oggetti digitali nel tempo è garantita dal formato dei file (standard per i formati, dimensioni del file, tempo di trasmissione in rete, modalità di visualizzazione delle immagini…), dai media di archiviazione e dal digital repository. É di fondamentale importanza l’utilizzo di standard aperti per facilitare l’interoperabilità con altri sistemi e quindi l’accesso ai metadati attraverso altri service provider (es. Europeana).
Controllo della qualità
Il controllo della qualità è finalizzato ad assicurare la buona leggibilità a video di tutto il contenuto informativo presente negli originali, dovrebbe essere documentato ed effettuato durante l’intero processo di digitalizzazione. Oltre il controllo a video può essere utile effettuare delle prove di stampa per verificare la resa dell’immagine su carta.
La pianificazione del controllo di qualità comprende:
- la preparazione adeguata dell’ambiente (configurazione hardware, software di visualizzazione, condizioni di visualizzazione, ecc.)
- la definizione a priori delle caratteristiche di “accettabile” e “non accettabile”
- le modalità di verifica (tutto il prodotto o un campione, tutti i file o solo i master, qualità visuale a schermo e a stampa, ecc.)
L’ispezione visuale di un’immagine di solito riguarda:
- correttezza dell’inquadratura e dell’esposizione, assenza di eventuali deformazioni e/o aberrazioni ottiche
- contenimento della tolleranza cromatica
- profondità e profilo colore
- dimensione e formato digitale
- eventuali presenze di elementi che compromettono la fedeltà della riproduzione (es. riflessi luminosi, ecc.);
- nome del file
Approfondimenti
Besser, Howard - Introduction to Imaging
Cornell University Library - Digital preservation management resource
Cornell University Library - Moving theory into practice: digital imaging tutorial
Digital Library Federation (DFL) - Draft benchmark for digital reproductions of printed books and serial publications
Digital Library Federation (DLF)- Guides to quality in visual resource imaging
Federal Agencies Digitization Initiative (FADGI), Still Image Working Group - Technical Guidelines for Digitizing Cultural Heritage Materials: Creation of Raster Image Master Files
Metadati
I metadati sono informazioni strutturate su qualsiasi tipo di risorsa, che vengono usate per individuare, descrivere, gestire o consentire l'accesso a quella risorsa.
Non c’è uno standard di metadati che soddisfi tutti i bisogni di tutti i tipi di collezioni e repository.
In genere, gli schemi di metadati includono le seguenti informazioni:
- Metadati descrittivi: descrivono il contenuto di una risorsa e ne consentono il recupero
- Metadati amministrativi: contengono informazioni sulla gestione e sull’amministrazione di una risorsa (es. gestione dei diritti, metadati di preservazione, metadati tecnici …)
- Metadati strutturali: descrivono le relazioni tra gli oggetti digitali (es. l’ordine delle pagine in un libro digitalizzato)
Da Guida alle buone pratiche a cura del Gruppo di lavoro di Minerva n. 6
"Scopo dell’utilizzo dei metadati descrittivi
Definizione dell’argomento
Prima di selezionare un modello di metadati per un dato progetto di digitalizzazione, è necessario riesaminare i materiali che dovranno essere descritti attraverso questi metadati. Questo servirà non solo a individuare eventuali modelli di metadati già esistenti, ma anche a evidenziare qualsiasi omissione o differenza tra ciò che può essere trattato da un modello esistente e i metadati di cui avete bisogno per il vostro progetto.
Consigli pratici
È molto importante l’uso di metadati idonei al fine di consentire la ricerca e il recupero dei materiali delle collezioni digitali. Questo risulta ancora più vero nel caso che l’obiettivo complessivo sia compiere ricerche su una molteplicità di collezioni, archiviate in differenti luoghi (come cataloghi comuni a più biblioteche o musei ecc.)
Attualmente vi sono già moltissimi modelli di metadati, perciò ogni progetto deve scegliere un modello calzante con i suoi obiettivi. In ogni caso è preferibile evitare di crearne uno nuovo, a meno che gli standard esistenti non siano sufficienti a coprire i bisogni del vostro progetto.
Il tempo speso per stilare le caratteristiche principali del materiale da digitalizzare e per individuarne attributi e descrittori, sarà tempo speso bene. Il modello risultante potrà allora essere comparato con l’ambito di applicazione e le caratteristiche dei modelli di metadati esistenti.
Devono essere individuati gli eventuali dizionari controllati (per esempio, per descrivere un luogo o un artista). Esistono già diversi vocabolari, tali da far aumentare notevolmente il successo di una ricerca. Per i dettagli vedere oltre la sezione sugli standard di metadati e i vocabolari controllati."
Approfondimenti
M. Baca (edited by) - Introduction to metadata
Dublin Core Metadata Element Set, Version 1.1
National Information Standards Organization (NISO) - Understanding metadata