1 Uvod
Pri pripravi seznama podatkovnih virov sem sistematično pregledala številna javno dostopna spletna mesta, ki omogočajo dostop do zbirk podatkov povezanih z analizo voda.
Iskanja sem se lotila iz treh smeri:
- Pregled obstoječih sorodnih študij, publikacij, ki ponujajo sistematičen pregled dostopnih podatkovnih virov, povezanih z analizo voda.
- Neposredno iskanje spletnih portalov, podatkovnih baz in strani, ki se ukvarjajo z monitoringom, analizo in raziskavami voda ter omogočajo dostop do podatkov.
→ izvedeno s pomočjo spletnih iskalnikov (Google) in AI asistentov (ChatGPT, Gemini)
- Identifikacija znanstvenih študij (zlasti tistih, ki uporabljajo strojno učenje, modeliranje podatkov, napovedno analitiko), povezanih z analizo voda, in ekstrakcija podatkovnih virov, ki jih te študije navajajo.
→ iskanje na platformah Google Scholar, ScienceDirect, SpringerLink, MDPI, PLOS, PubMed, Web of Science
→ osredotočeno na študije objavljene v zadnjih 5-10 letih
2 Ključne ugotovitve
2.1 Problematika dostopnosti in uniformnosti podatkovnih virov
- Zbiranje in objavljanje podatkov poteka znotraj razdrobljenega sistema nadzornih teles (globalne, regionalne, državne, lokalne organizacije in agencije), ki nadzorujejo in upravljajo z naravnimi viri ali se ukvarjajo z okoljskimi (tudi socio-ekonomskimi) problematikami in raziskavami.
- Podatki se zbirajo za različne namene, po različnih merilih in v različnem obsegu, shranjujejo in objavljajo pa v številnih formatih in na različnih platformah. Standardizacija in zagotavljanje kakovosti podatkov pogosto nista ustrezno urejena.
- Podatki so pogosto javno dosegljivi, a otežena dostopnost (kompleksnost ekstrakcije surovih podatkov, normalizacija podatkov) in heterogenost omejujeta uporabo v namene, ki se razlikujejo od primarnega namena uporabe (za katerega so bili zbrani).
- Nekatere organizacije upravljajo z obsežnim naborom podatkov, a podatke kondenzirajo in objavljajo v obliki zbirnih poročil in statističnih povzetkov (npr. WHO, UNICEF, ZN, WISE-Freshwater) ali v formatih, ki se jih ne da enostavno ponovno uporabiti (.pdf). Dostop do izvornih podatkov pogosto ni omogočen.
- Količina, vsebinska razsežnost (časovna in prostorska) in dostopnost zbranih podatkov je v bolj razvitih državah nesorazmerno večja kot v manj razvitih državah in regijah. Največ podatkovnih baz vzdržujejo Severna Amerika, Evropa in Avstralija. Drugod po svetu se bodisi zbira velike količine podatkov, a so baze zaprte ali povsem nedostopne (Azija), bodisi zbiranja podatkov v zadostnem obsegu ni (Afrika, Južna Amerika).
<aside>
Reference:
https://journals.plos.org/water/article?id=10.1371%2Fjournal.pwat.0000166
https://journals.plos.org/water/article?id=10.1371/journal.pwat.0000017
https://www.worldscientific.com/doi/10.1142/S0219467826500336
</aside>