Otevřená data
„Open Data“ logo free for non-commercial use, DMCA
Jako výzkumná data označujeme veškeré informace spojené s vědeckou činností, a to jak digitální, tak digitalizované či nedigitální. Nejčastěji jsou to textové dokumenty, tabulky, obrázky a fotografie, audio- a videonahrávky, laboratorní deníky, terénní poznámky, záznamy z diářů, software, dotazníky a jejich vyhodnocení, přepisy rozhovorů, vzorky, exempláře či artefakty.
Otevřená jsou taková data, která mohou být jakkoliv, kýmkoliv a kdykoliv použita nebo šířena, a to opakovaně a za jakýmkoliv účelem. Právě otevřenost dat je jednou ze základních podmínek poskytovatelů financí (například Horizon Europe a další). Kromě toho má otevřenost dat zásadní výhody:
- Výsledky výzkumu lze kriticky zkoumat a ověřovat
- Zveřejnění dat znamená vyšší citační ohlas
- Existující veřejná data nemusí být znovu vytvářena pro navazující výzkum nebo analýzy
- Využitím dat z různých zdrojů dochází k novým poznatkům
- Výzkumný proces může být rychlejší a efektivnější, případně levnější
Otevřená data musí odpovídat zásadě FAIR a jsou tedy:
- Findable – vyhledatelná: data a související materiály musí být uloženy na spolehlivém vhodném místě, musí mít dostatečně podrobná popisná metadata a také jedinečný a trvalý identifikátor, například identifikátor digitálního objektu DOI (Digital Object Identifier).
- Accessible – dostupná: veškerá metadata i data by měla být srozumitelná lidem i počítačům za jasně daných podmínek, data by měla být uložena v důvěryhodném repozitáři a volně ke stažení. Pokud nelze zpřístupnit data, měla by být otevřeně dostupná metadata.
- Interoperable – interoperabilní: metadata by měla používat standardizované formáty a jazyky, standardy pro popis dat a řízených slovníků. Zároveň je důležité prolinkování mezi metadaty datové sady a metadaty dalších souvisejících publikací a výstupů, i propojení s autory, institucemi, dalšími projekty a výstupy.
- Reusable – opakovaně využitelná: data jsou opatřena co nejméně restriktivní licencí, která opakované využití umožňuje; mají bohatý metadatový popis, k dispozici jsou jasné instrukce a informace o přístupnosti, původu a způsobu získání dat. Jsou respektovány standardy obvyklé v daném oboru.
Ne všechna otevřená data jsou FAIR (OPEN ≠ FAIR)
Obvyklá mylná představa je, že data, která vyhovují FAIR, musí být současně bez omezení otevřená. Cílem je vždy zpřístupnění dat dle principu „as open as possible, as closed as necessary“ – tedy „tak otevřeně, jak jen to je možné, tak omezeně, jak je to nezbytně nutné“. Ve výsledku je žádoucí zveřejňovat všechna data kromě těch, kde to znemožňují právní aspekty. Existuje řada případů, kdy nelze data ve výchozím nastavení otevřít, například data, na která se vztahují práva duševního vlastnictví nebo data, která jsou svou povahou citlivá – především ta, jež obsahují osobní údaje. Taková data je možné zveřejnit pouze tehdy, provedeme-li jejich anonymizaci. A pro splnění FAIR principů postačí, když budou zveřejněna metadata.
Volně dostupné a otevřené zdroje
Google Books - databáze knih z celého světa obsahující nejen záznamy, ale mnohdy i plné texty.
Google Scholar - vyhledávač záznamů i plných textů studijních materiálů napříč všemi obory.
RePEc - digitální knihovna tvořená dobrovolníky ze 75 zemí zaměřená na ekonomické obory.