ABS spouští prohledávání přímo v textech archiválií

Vážení badatelé,

nová služba eBadatelny, kterou od listopadu můžete využít, Vám umožní z pohodlí domova bádat ve spisech nejenom podle jmen, ale také například podle míst či hesel spojených s historickými událostmi. Veškeré naskenované archiválie jsou nyní k dispozici ve strojově čitelném textu, což umožňuje výrazně snazší hledání.

Pro ABS to znamenalo naskenované dokumenty zpracovat technologií OCR (optické rozpoznávání znaků, z anglického Optical Character Recognition). Do této doby bylo možné vyhledávat jen v textech inventářů a v rejstříkových a jiných datových záznamech (tzv. lustracích). Nyní to jde přímo v jednotlivých stránkách digitalizovaných archiválií. OCR dobře rozpoznává tištěné texty, takže se používá hlavně v knihovnách. U archiválií je jeho použití mnohem těžší, naše předlohy jsou nesrovnatelně náročnější, i tak Vám ale mohou výsledky velmi pomoci. Nově se dají dopátrat souvislosti, které se dříve objevily jen náhodou, při dlouhém pročítání dokumentů. Navíc lze najít v archiváliích i osoby, které byste podle dosavadních databázových záznamů nevyhledali.

Naskenovaných a do fulltextu převedených stran je k dispozici zhruba 8 milionů. Z celkového obsahu Archivu bezpečnostních složek je to ovšem jen menšina. V eBadatelně zdaleka není všechno, a navíc žádné OCR není dokonalé, takže stále platí, že pokud něco hledáte, je dobré zaslat archivu žádost jako doposud. Přestože jsme nové vyhledávání rozsáhle testovali, je možné, že zpočátku zájem přesáhne kapacitní možnosti naší techniky. V prvních týdnech tedy nelze vyloučit občasné výkonnostní výkyvy. Budeme se snažit o co nejrychlejší reakci, abychom vbrzku zabezpečili optimální a stabilní provoz eBadatelny.

Více informací najdete v Tiskové zprávě a na zvláštních stránkách věnovaných eBadatelně.

Doufáme, že Vám tato novinka pomůže ve Vašem bádání.

Případné dotazy k používání můžete směrovat na e-mail: badatelna.struha@abscr.cz