V příspěvku jsou popsány kroky, které povedou k vytvoření strategie dlouhodobé ochrany dat sklizených z internetu v rámci projektu WebArchiv, která je nutným předpokladem k jejich ochraně v řádu desítek let. Tato strategie obsahuje pravidla a postupy, které zajistí dlouhodobou použitelnost a přístup archivních dat. V současné době je datům sklizeným z internetu v rámci projektu WebArchiv poskytována pouze ochrana na úrovni bit-streamu, která není v delším časovém horizontu dostatečná. Článek pojednává nejen o dosud provedených krocích v Národní knihovně (analýza formátů), na základě kterých bude vytvořen profil kolekce, ale i o krocích budoucích jako je definování určené skupiny, implementaci některých z plánovacích nástrojů a evaluaci potenciálních ochranných řešení.
Current bit stream data preservation practice in Web Archive of National Library of the Czech Republic is insufficient in long term. Presented paper describes steps leading to the Long Term Preservation policy for our collection. It introduces strategies, best practices and actions required for long term usability and accessibility. It also mentions accomplished actions such file format analysis, enabling us to create the collection profile. Among planned steps is designated community description, planning tools implementation and evaluation of preservation solutions.
WebArchiv; archivace webu; profil kolekce; určená skupina; dlouhodobá ochrana digitálních dokumentů
WebArchiv project; web archiving; collection profile; designated community; long term preservation
Tento článek vznikl díky podpoře MK ČR na rozvoj Národní knihovny České republiky jako výzkumné organizace.
[2] ČSN ISO 14721. Systémy pro přenos dat a informací z kosmického prostoru - Otevřený archivační informační systém - Referenční model. Praha: Úřad pro technickou normalizaci, metrologii a státní zkušebnictví, Srpen 2014.
[3] ČSN ISO 16363. Systémy pro přenos dat a informací z kosmického prostoru - Audit a certifikace důvěryhodných digitálních úložišť. Praha: Úřad pro technickou normalizaci, metrologii a státní zkušebnictví, Říjen 2014.
[4] DAY, M. The Long-Term Preservation of Web Content. In: MASANÈS, J., ed. Web archiving. New York: Springer, c2006, s. 177-199. ISBN 978-3-540-23338-1.
[6] LAKSHMI, V. a S. C. JINDAL. Digital libraries. Delhi: Isha Books, 2004. ISBN 81-820-5109-6.