Uživatelské nástroje

Nástroje pro tento web


aks:prevod_dat

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
aks:prevod_dat [2019/09/27 13:38] lindaaks:prevod_dat [2020/09/24 12:49] (aktuální) epub
Řádek 1: Řádek 1:
 ====== -#20 Převod dat ====== ====== -#20 Převod dat ======
  
-Podobně jako stěhování domácnosti je změna knihovního softwaru příležitostí k „úklidu“ a k rozhodnutí, co s sebou chceme „stěhovat“ a kam přesně chceme či můžeme data v novém prostoru umístit. Proto je před přechodem na jiný software užitečné provést nejen revizi knihovního fondu, ale také analýzu stávajících dat a jejich kvality a případně je vyčistit. Důležitá může být také analýza softwaru z hlediska možného mapování na nový software.+Podobně jako stěhování domácnosti je změna knihovního softwaru příležitostí k „úklidu“ a k rozhodnutí, co s sebou chceme „stěhovat“ a kam přesně chceme či můžeme data v novém prostoru umístit. Proto je před přechodem na jiný software užitečné provést nejen revizi knihovního fondu, ale také analýzu stávajících dat a jejich kvality a případně je vyčistit. Důležitá je také analýza toho, jakým způsobem jsou na sebe ve stávajícím softwaru navázány jednotlivé údaje a zda jsou tyto návaznosti v souladu s návazností údajů v novém softwaru.
  
 <WRAP center round box> <WRAP center round box>
  
-**[[aks:priprava_dat_a_knihovniho_fondu|Přípravné kroky zahrnující revizi fondu a „úklid dat“]] pomohou zbytečně nepřenášet do nového softwaru nepotřebná data a informace. Tím se mimo jiné zmenšuje pravděpodobnost výskytu chyb při exportu a importu**, protože nekvalitní záznamy, duplicitní záznamy a některé další chyby mohou při převodu (migraci) dat působit problémy automatického zpracování dat.+**Díky [[aks:priprava_dat_a_knihovniho_fondu|přípravným krokům zahrnujícím revizi fondu a „úklid dat“]] nebudete do nového softwaru přenášt nepotřebná data a informace. Tím se mimo jiné zmenšuje pravděpodobnost výskytu chyb při exportu a importu**, protože nekvalitní záznamy, duplicitní záznamy a některé další chyby mohou při převodu (migraci) dat působit problémy automatického zpracování dat.
  
 „Úklid dat“ může v některých případech také přispět ke znatelným úsporám nákladů vynaložených na jejich převod do nového softwaru. „Úklid dat“ může v některých případech také přispět ke znatelným úsporám nákladů vynaložených na jejich převod do nového softwaru.
Řádek 13: Řádek 13:
  
  
-===== - Mapování dat (a činností) mezi různými softwary =====+===== - Porovnání návaznosti činností =====
  
 Převod některých dat nemusí být úplně jednoduchý, protože návaznosti dat a činností se v jednotlivých softwarech mohou lišit. Ať už se chystáte na převod dat vlastními silami nebo jej bude provádět dodavatel softwaru či jiný subjekt, nezapomeňte se zaměřit zejména na tyto oblasti: Převod některých dat nemusí být úplně jednoduchý, protože návaznosti dat a činností se v jednotlivých softwarech mohou lišit. Ať už se chystáte na převod dat vlastními silami nebo jej bude provádět dodavatel softwaru či jiný subjekt, nezapomeňte se zaměřit zejména na tyto oblasti:
Řádek 25: Řádek 25:
  
 <WRAP center round tip> <WRAP center round tip>
-mapováním dat mezi různými softwary a s převodem dat si obvykle poradí dodavatel softwaru či jiný subjekt zajišťující převod dat. Potřebuje k tomu však součinnost knihovny. Proto je důležité, aby knihovna měla [[aks:pracovni_postupy_a_procesy|zmapované používané postupy a probíhající procesy]] a věděla, která data k nim potřebuje a jakým způsobem s nimi pracuje.+přípravou podkladů pro převod dat a s jejich vlastním převodem si obvykle poradí dodavatel softwaru či jiný subjekt zajišťující převod dat. Potřebuje k tomu však součinnost knihovny. Proto je důležité, aby knihovna měla [[aks:pracovni_postupy_a_procesy|zmapované používané postupy a probíhající procesy]] a věděla, která data k nim potřebuje a jakým způsobem s nimi pracuje.
  
  
Řádek 36: Řádek 36:
  
  
-==== - Kontrola kvality bibliografických/autoritních záznamů a údajů o jednotkách ====+==== - Kontrola kvality bibliografických autoritních záznamů ====
  
 Bibliografické a autoritní záznamy jsou podstatné nejen z hlediska převodu do nového softwaru, ale také z hlediska zapojení do kooperativních projektů. Proto je nutné věnovat jejich kvalitě velkou pozornost. Tato data jsou obvykle exportována a importována ve formátu typu MARC (na rozdíl od dalších dat, především údajů o čtenářích, výpůjčkách, rezervacích, platbách a akvizici; ta jsou obvykle exportována a importována ve formátu CSV nebo TSV, případně v dalších formátech). Pokud nejsou bibliografické a autoritní záznamy dostatečně kvalitní (např. kvůli nedodržování katalogizačních standardů), může to při přechodu na nový software způsobit značné problémy. Bibliografické a autoritní záznamy jsou podstatné nejen z hlediska převodu do nového softwaru, ale také z hlediska zapojení do kooperativních projektů. Proto je nutné věnovat jejich kvalitě velkou pozornost. Tato data jsou obvykle exportována a importována ve formátu typu MARC (na rozdíl od dalších dat, především údajů o čtenářích, výpůjčkách, rezervacích, platbách a akvizici; ta jsou obvykle exportována a importována ve formátu CSV nebo TSV, případně v dalších formátech). Pokud nejsou bibliografické a autoritní záznamy dostatečně kvalitní (např. kvůli nedodržování katalogizačních standardů), může to při přechodu na nový software způsobit značné problémy.
Řádek 45: Řádek 45:
   * kontrolu kvality záznamů z hlediska používaných standardů.   * kontrolu kvality záznamů z hlediska používaných standardů.
 Pokud knihovna používá knihovní software, který splňuje všechny knihovní standardy (mj. formát MARC 21 a kódování UTF-8), a zároveň při katalogizaci dodržuje požadované standardy (RDA, ISBD), je pravděpodobné, že stav dat je vyhovující a při jejich převodu nedojde k závažnějším problémům.((Problémy kvality údajů o knihovních jednotkách do značné míry souvisejí s aktuálním stavem fondu. Část problémů s kvalitou dat může vyřešit revize fondu, která předchází převodu dat.)) Pokud knihovna používá knihovní software, který splňuje všechny knihovní standardy (mj. formát MARC 21 a kódování UTF-8), a zároveň při katalogizaci dodržuje požadované standardy (RDA, ISBD), je pravděpodobné, že stav dat je vyhovující a při jejich převodu nedojde k závažnějším problémům.((Problémy kvality údajů o knihovních jednotkách do značné míry souvisejí s aktuálním stavem fondu. Část problémů s kvalitou dat může vyřešit revize fondu, která předchází převodu dat.))
-==== - Problémy kvality bibliografických/autoritních záznamů způsobené omezením softwaru ====+==== - Problémy způsobené omezením softwaru ====
 V ČR se okrajově stále využívají některé starší knihovní softwary, které nesplňují některý z knihovních standardů, např. nepodporují strukturu záznamu ve formátu MARC nebo podporují pouze UNIMARC a nikoliv MARC 21, nepodporují kódování UTF-8 apod. V takových případech je nutné před převodem dat nebo při něm provést automatickou konverzi do jiného formátu či kódování, případně jinou formu úpravy záznamů. V ČR se okrajově stále využívají některé starší knihovní softwary, které nesplňují některý z knihovních standardů, např. nepodporují strukturu záznamu ve formátu MARC nebo podporují pouze UNIMARC a nikoliv MARC 21, nepodporují kódování UTF-8 apod. V takových případech je nutné před převodem dat nebo při něm provést automatickou konverzi do jiného formátu či kódování, případně jinou formu úpravy záznamů.
  
 Automaticky lze řešit i některé opakovaně se vyskytující katalogizační chyby, např. problémy s interpunkcí podle ISBD. Dodavatelé nebo provozovatelé knihovních softwarů obvykle mají k dispozici konverzní programy pro převod dat z formátu UNIMARC do formátu MARC 21. Jsou také schopni vytvořit konverzní programy na míru dané knihovně. Ta však musí počítat se součinnosti při analýze a testování těchto konverzí.  Automaticky lze řešit i některé opakovaně se vyskytující katalogizační chyby, např. problémy s interpunkcí podle ISBD. Dodavatelé nebo provozovatelé knihovních softwarů obvykle mají k dispozici konverzní programy pro převod dat z formátu UNIMARC do formátu MARC 21. Jsou také schopni vytvořit konverzní programy na míru dané knihovně. Ta však musí počítat se součinnosti při analýze a testování těchto konverzí. 
  
-Z hlediska možnosti provedení automatické konverze dat mohou být problematické některé starší softwary, které mají limitovaný počet znaků, takže některé údaje jsou zkrácené. V takových případech je obvykle třeba provést manuální úpravu záznamů.+Z hlediska možnosti provedení automatické konverze dat mohou být problematické některé starší softwary, v nichž je omezen počet znaků, takže některé údaje jsou zkrácené. V takových případech je obvykle třeba provést manuální úpravu záznamů.
  
-==== - Problémy kvality bibliografických/autoritních záznamů způsobené chybným zpracováním záznamů ve formátu MARC ====+==== - Problémy způsobené chybným zpracováním ====
 Důvodů, proč jsou v některých knihovnách méně kvalitní záznamy, může být více. Např.: Důvodů, proč jsou v některých knihovnách méně kvalitní záznamy, může být více. Např.:
   * záznamy pocházejí z retrokonverzí, tudíž nesplňují požadavky na minimální záznam do Souborného katalogu ČR, případě vůbec nejsou ve struktuře formátu MARC;   * záznamy pocházejí z retrokonverzí, tudíž nesplňují požadavky na minimální záznam do Souborného katalogu ČR, případě vůbec nejsou ve struktuře formátu MARC;
Řádek 65: Řádek 65:
  
 <WRAP center round tip> <WRAP center round tip>
-Pokud má knihovna nekvalitní bibliografické záznamy a přitom velikost fondu je maximálně dva až tři tisíce knihovních jednotek a zároveň jde o běžnou knižní produkci, je obvykle efektivnější knihovní jednotky zkatalogizovat znovu. Stažení záznamu prostřednictvím protokolu Z39.50 s připojením exemplářů je obvykle rychlejší než výběrová ruční oprava záznamů. Náklady na stažení záznamů tedy mohou být mnohem nižší než náklady na manuální opravy záznamů a/nebo vytvoření programu pro jejich hromadnou opravu.+Pokud má knihovna nekvalitní bibliografické záznamy a přitom velikost fondu je maximálně dva až tři tisíce knihovních jednotek a zároveň jde o běžnou knižní produkci, bývá efektivnější knihovní jednotky zkatalogizovat znovu. Stažení záznamu prostřednictvím protokolu Z39.50 s připojením exemplářů je obvykle rychlejší než výběrová ruční oprava záznamů. Náklady na stažení záznamů tedy mohou být mnohem nižší než náklady na manuální opravy záznamů a/nebo vytvoření programu pro jejich hromadnou opravu.
 </WRAP> </WRAP>
  
Řádek 106: Řádek 106:
     * z jakých dalších softwarů nebo systémů bude nutné převádět data a jak (v jakých formátech) je možné tato data exportovat.     * z jakých dalších softwarů nebo systémů bude nutné převádět data a jak (v jakých formátech) je možné tato data exportovat.
 ===== - Nástroje pro kontrolu a čištění dat ===== ===== - Nástroje pro kontrolu a čištění dat =====
-Pro kontrolu a čištění dat lze použít jak běžně dostupné, tak specializované nástroje. Může jít o tabulkové procesory, speciální softwary nebo nástroje, které jsou součástí některých knihovních softwarů. +Pro kontrolu a čištění dat lze použít jak běžně dostupné, tak specializované nástroje. Může jít o tabulkové procesory, speciální nástroje nebo nástroje, které jsou součástí některých knihovních softwarů. 
-==== Tabulkové zobrazení dat ====+==== Tabulkové procesory ====
 Tabulkový procesor (např. MS Excel, LibreOffice nebo Apache OpenOffice) lze využít zejména pro data vyexportovaná z databáze knihovního softwaru ve formátu CSV, TSV apod. Zobrazení dat v tabulce díky automatické i vizuální kontrole dat umožňuje jednoduše a rychle odhalit některé druhy chyb (např. nesprávné typy či délky polí, duplicity či chybějící údaje). Tabulkový procesor (např. MS Excel, LibreOffice nebo Apache OpenOffice) lze využít zejména pro data vyexportovaná z databáze knihovního softwaru ve formátu CSV, TSV apod. Zobrazení dat v tabulce díky automatické i vizuální kontrole dat umožňuje jednoduše a rychle odhalit některé druhy chyb (např. nesprávné typy či délky polí, duplicity či chybějící údaje).
 <WRAP center round tip> <WRAP center round tip>
Řádek 113: Řádek 113:
 </WRAP> </WRAP>
  
-==== - Speciální softwary ====+==== - Speciální nástroje ====
  
 **MarcEdit** je [[https://marcedit.reeset.net/|volně dostupný nástroj]] původně určený pro editaci záznamů ve formátu MARC. V editoru záznamů je možné provádět kontrolu polí, deduplikaci záznamů, hromadné mazání, editaci nebo doplnění polí, podpolí, indikátorů apod. **MarcEdit** je [[https://marcedit.reeset.net/|volně dostupný nástroj]] původně určený pro editaci záznamů ve formátu MARC. V editoru záznamů je možné provádět kontrolu polí, deduplikaci záznamů, hromadné mazání, editaci nebo doplnění polí, podpolí, indikátorů apod.
Řádek 120: Řádek 120:
 Existuje i řada dalších nástrojů, které je možné využít pro práci s daty. Některé z nich jsou však určeny spíše pro programátory. Těm, kdo by případně chtěli získat další informace o těchto softwarech, doporučujeme knihu //Migrating library data: a practical manual// (viz Doporučené zdroje níže). Existuje i řada dalších nástrojů, které je možné využít pro práci s daty. Některé z nich jsou však určeny spíše pro programátory. Těm, kdo by případně chtěli získat další informace o těchto softwarech, doporučujeme knihu //Migrating library data: a practical manual// (viz Doporučené zdroje níže).
  
-==== - Nástroje dostupné rámci jednotlivých softwarů ====+==== - Nástroje v knihovních softwarech ====
 Podpora pro hromadnou úpravu nebo kontrolu dat a údajů bývá součástí knihovních softwarů. Může jít např. o následující funkce((Nabídka funkcí a jejich možnosti se ovšem v jednotlivých knihovních softwarech liší.)): Podpora pro hromadnou úpravu nebo kontrolu dat a údajů bývá součástí knihovních softwarů. Může jít např. o následující funkce((Nabídka funkcí a jejich možnosti se ovšem v jednotlivých knihovních softwarech liší.)):
     * hromadná úprava bibliografických dat;     * hromadná úprava bibliografických dat;
Řádek 134: Řádek 134:
 ===== Doporučené zdroje ===== ===== Doporučené zdroje =====
 Pro ty, kdo připravují převod dat vlastními silami, doporučujeme knihu: Pro ty, kdo připravují převod dat vlastními silami, doporučujeme knihu:
-BANERJEE, Kyle a Bonnie PARKS (eds.). //[[https://aleph.nkp.cz/F/?func=direct&doc_number=007556895&local_base=SKC|Migrating library data: a practical manual]]//. Chicago: Neal-Schuman, 2017. xix, 251 s. ISBN 978-0-8389-1503-5.+BANERJEE, Kyle a Bonnie PARKS (eds.). //[[https://aleph.nkp.cz/F/?func=direct&amp;doc_number=007556895&amp;local_base=SKC|Migrating library data: a practical manual]]//. Chicago: Neal-Schuman, 2017. xix, 251 s. ISBN 978-0-8389-1503-5.
  
 </WRAP> </WRAP>
aks/prevod_dat.1569584284.txt.gz · Poslední úprava: 2019/09/27 13:38 autor: linda