Digitalizacija kulturnog nasleđa, od starih knjiga i arhivske građe, do fotografija, karata i plakata, često se u javnosti zamišlja kao jednostavan proces. U praksi, to je mnogo složeniji i skuplji posao nego što deluje na prvi pogled. Da bi se jedna biblioteka, arhiv ili muzej digitalizovali u skladu sa međunarodnim standardima, potrebno je uložiti u savremenu opremu, kvalifikovane stručnjake i infrastrukturu koja obezbeđuje bezbedno čuvanje i dostupnost digitalnih fajlova dugi niz godina.
Najveći deo troškova u projektima digitalizacije otpada na tri glavne kategorije: opremu i softver, ljudski rad i tehničku infrastrukturu. Cena svake od tih stavki zavisi od mnogo faktora, od kvaliteta i osetljivosti građe, preko obima posla i standarda koji se primenjuju, do nivoa automatizacije. Postoje međunarodne smernice koje propisuju kako se obezbeđuje kvalitet digitalnog zapisa, poput onih koje su razvili američki FADGI (Federal Agencies Digital Guidelines Initiative) i NARA (National Archives and Records Administration), kao i Međunarodna federacija bibliotečkih udruženja (International Federation of Library Associations and Institutions – IFLA). One definišu tehničke standarde, ali ne i cene, jer troškovi zavise od tržišta i konkretnih zahteva svake ustanove.
Oprema i softver
Digitalizacija kulturne baštine zahteva specijalizovanu opremu koja omogućava visoku preciznost i sigurnost pri radu sa starim i osetljivim materijalima. Za knjige i povezanu građu koriste se tzv. nadstojeći planetarni skeneri sa V-kolevkom, koji omogućavaju snimanje bez oštećenja korica i lomljenja stranica. Za masovne projekte primenjuju se automatski „page-turner“ sistemi, odnosno roboti koji samostalno okreću stranice i mogu da obrade i do 2.500 stranica na sat. Takvi uređaji, poput modela Treventus ScanRobot 2.0 MDS, spadaju u visokoprofesionalnu klasu i koštaju više desetina hiljada evra, proizvođači retko javno objavljuju cene, jer zavise od konfiguracije i obima narudžbine.
Za manje projekte, institucije često koriste poluprofesionalne sisteme, kao što je Atiz BookDrive DIY Model B, čija se cena kreće oko 8.500 evra. U taj iznos ne ulaze kamere i računari, koji se nabavljaju posebno, pa cena ukupne investicija raste u zavisnosti od tehničke opreme koja se koristi. U srednjem segmentu nalaze se skeneri brendova kao što su Zeutschel i Bookeye, koji nude širok spektar konfiguracija i opcija, a njihova se cena određuje individualno prema potrebama ustanove.
Osim samih skenera, neophodna je i prateća oprema: radne stanice sa monitorima visoke rezolucije, kolor-metri za preciznu kalibraciju boja, UPS uređaji koji štite opremu od prekida napajanja, i specijalno osvetljenje koje omogućava ujednačen kvalitet snimanja. Svaki od ovih elemenata ima svoju cenu i direktno zavisi od standarda kvaliteta koji ustanova želi da postigne.
Softver je jednako važan kao i oprema. Bez odgovarajućih programa, digitalni fajlovi ostaju „sirovi“ i neupotrebljivi. Potrebni su alati za ispravljanje perspektive i deformacija stranica, kontrolu kvaliteta slike, optičko prepoznavanje teksta (OCR) i rukopisa (ICR), kao i sistemi za unos i upravljanje metapodacima, podacima koji omogućavaju pretragu i katalogizaciju. Softver se najčešće nabavlja u paketu sa opremom ili kao institucionalna licenca koja omogućava upotrebu na više radnih stanica.
Ljudski rad
Iako se digitalizacija često doživljava kao automatizovan proces, najveći deo posla obavljaju ljudi. Svaki projekat zahteva tim specijalizovanih stručnjaka: konzervatore koji pripremaju i čiste građu, operatere koji rade na skenerima, tehničare koji obrađuju fajlove i proveravaju rezultate OCR-a, bibliotekare ili arhiviste koji unose i proveravaju metapodatke, kao i vođu projekta koji koordinira čitav proces.
Troškovi ljudskog rada najviše variraju. Kod jednostavne dokumentacije, na primer, administrativnih dokumenata koji se skeniraju u niskoj rezoluciji, cena može biti između 0,03 i 0,07 evra po strani. Za knjige i građu koja zahteva pažljivo rukovanje i viši kvalitet slike, cene rastu na 0,08–0,25 evra, dok povezane knjige sa dodatnim OCR-om i metapodacima dostižu 0,12–0,35 evra po strani. Kada se radi o akademskim projektima sa detaljnim proverama i ručnim lektorisanjem OCR rezultata, troškovi mogu dostići 0,40 do 1,20 evra po stranici.
Neke institucije, poput Narodne biblioteke Srbije, nude javne usluge reprodukcije po fiksnoj ceni od 0,30 evra po strani (za stabilnu građu i osnovni nivo kvaliteta), što se može uzeti kao praktičan reper za domaće uslove.
Drugim rečima, cena po strani nije fiksna vrednost već zavisi od više faktora: kvaliteta koji se zahteva, vrste građe, dubine obrade i nivoa kontrole. Dok se masovni projekti kreću u rasponu od nekoliko centi po stranici, složeni projekti sa retkom i osetljivom građom mogu koštati i više evra po sranici.
Infrastruktura i održavanje
Troškovi ne prestaju onog trenutka kada se materijal skenira. Naprotiv, čuvanje digitalnih kopija zahteva stalna ulaganja u infrastrukturu. Svi digitalni fajlovi moraju biti bezbedno uskladišteni, redovno proveravani, kopirani i obnavljani, jer svaka tehnička greška, kvar diska, korupcija fajla, zastarelost formata, može značiti gubitak neprocenjive građe.
Institucije obično kombinuju aktivni sloj (primarno skladište sa čestim pristupom) i rezervne kopije koje se čuvaju na fizički odvojenim lokacijama. Cena skladištenja zavisi od količine podataka i učestalosti pristupa. Na primer, u javnim oblacima poput Amazon S3 Standard, cena je oko 0,021 evro po gigabajtu mesečno za prve količine podataka, dok su jeftinije klase (namenjene za dugoročno čuvanje) povoljnije, ali naplaćuju pristup i povraćaj podataka.
Jedna stranica skenirana u visokom kvalitetu (300 DPI, TIFF format) može zauzimati više megabajta, a kada se saberu master fajl i nekoliko derivata (različite verzije za pristup), to lako preraste u terabajte podataka. Prema priručniku Digital Preservation Coalition, institucije bi uvek trebalo da prave najmanje dve kopije, primarnu i rezervnu, i da planiraju redovnu proveru integriteta podataka.
Koliko košta digitalizovati milion stranica
Za digitalizaciju jednog miliona stranica mešovite građe (knjige, dokumenti, fotografije) prosečni trošak skeniranja i osnovnog OCR-a iznosi oko 0,08 evra po strani, što daje ukupno oko 80.000 evra. Amortizacija i servis opreme srednje klase (npr. V-kolevka sistem vredan oko 3.000 evra) dodaju 0,01–0,02 evra po strani, dok trošak skladištenja od 2 terabajta podataka (što odgovara tom obimu građe) iznosi približno 180 evra godišnje u evropskom ili lokalnom oblaku.
Na osnovu tih proračuna, jasno se vidi da ljudski rad čini najveći deo ukupnih troškova, dok se ulaganje u opremu amortizuje kroz godine i veći obim projekata. Ključni faktori koji najviše utiču na cenu su standard kvaliteta (broj FADGI „zvezdica“), tip građe (povezana knjiga ili labavi dokumenti), dubina metapodataka i zahtev za ručnim proverama. Što su standardi stroži i učešće ljudi veće, to je cena viša.
Digitalizacija kulturne baštine nije luksuz, već način da se znanje i identitet sačuvaju za buduće generacije. Ali to ima svoju cenu. Iako se može činiti da „digitalno“ znači „jeftinije“, stvarnost pokazuje suprotno: kvalitetno očuvanje digitalnih kopija zahteva ozbiljna ulaganja, stručnost i dugoročno planiranje. Investicija u dobru opremu, obučene stručnjake i pouzdanu infrastrukturu ne donosi brzu dobit, ali obezbeđuje ono najvrednije, da istorija, jezik i kultura ne postanu nevidljive.
Milena Šović, M.Sc.,CSM, CSPO
AI Implementation Specialist & Content Trainer



