Vikiandmed

Allikas: Vikipeedia
Mine navigeerimisribale Mine otsikasti
Wikidata logo
Wikidata avaleht

Vikiandmed (ingl k Wikidata) on vabatahtlike kaastööliste koostöös toimetatav teadmusbaas, mis on mõeldud olema Vikipeedia ja sõsarprojektide ühiselt jagatud andmeallikas. Kuna baasis olevad andmed litsentsitakse avalikku omandisse, siis on Vikiandmed piiramatult kasutatavad ka kolmandatele osapooltele. Teadmusbaas kasutab Wikibase tarkvara ning teadmusbaasi haldab Wikimedia Foundation.

Vikiandmed on Vikipeedia taristu mõttes analoogne Wikimedia Commonsiga, mis on Vikipeedia ja sõsarprojektide ühiselt jagatud meediapank.

Teadmuspanga kontseptsioon[muuda | muuda lähteteksti]

Vikiandmed on iseseisev struktureeritud linkandmete projekt, mille eesmärgiks on luua universaalne andmeontoloogia ning täita see ajakohase ning usaldusväärse andmesisuga autoriteetsetest andmeallikatest. Ulatuslike andmetega täidetud ja ajakohane teadmuspank oleks Vikipeedia jaoks vahend sisu kvaliteedi tagamisel ning Vikiandmetes kasutatav semantilistest kolmikutest koosnev subjekt-predikaat andmestruktuur võimaldaks andmesisu abil genereerida väiteid ning lauseid mistahes keeles ning panna sellega aluse uue põlvkonna andmepõhisele entsüklopeediale.[1][2]

Wikidata arenduses seati esialgu eesmärgiks juurutada andmete kasutamist Vikipeedias kolmes faasis:

  1. Vikipeedia keeleversioonide vaheliste keelelinkide lahendamine Vikiandmete baasil
  2. Vikipeedia eri infokastides esitatud andmete lahendamine Vikiandmete baasil
  3. Vikipeedia artiklites esitatud väidete jm andmesisu sidumine Vikiandmetega[3][4]

2018. aasta alguses on Wikidata seisus, kus loodavate andmeüksuste ning kasutajate arv tõuseb kiiresti[5] ning lahendamist ootavad küsimused ülemontoloogia loomisega ning selle kureerimisega[6], ka põhjustavad arutelusid andmeallikate viidatus ning automaatsed andmete importimise ja uuendamise vahendid ning nende haldus[7]. Seejuures on Wikidata juba võtnud üle DBpedia ja Freebase'i ülesanded ning on laialdaselt kasutusel eri infoühiskonna teenuste juures, ka on Wikidatas olemas terviklikud andmehulgad eri valdkondadest, nt geneetikast.[8]

Andmete struktuur[muuda | muuda lähteteksti]

Andmeüksus ulmekirjanik Douglas Admsi kirje näitel

Andmed on Vikiandmete teadmusbaasis esitatud andmeüksustena (ingl k item). Igal üksusel on unikaalne identifikaator kujul Q1234567, üksus võib olla nii konkreetne objekt või isik, liiginimi, mõiste vmt, st mistahes mis on olemas ning unikaalsena identifitseeritav. Iga üksuse juurde kuuluvad avaldused (ingl k statement) selle üksuse kohta, mis on väljendatud omadustena (ingl k property või attribute), mille abil omistatakse üksustele väärtusi (ingl k value). Väärtused võivad olla nt arvandmed, pildid, aga ka teised Wikidata andmeüksused.

Ka omadused on varustatud unikaalsete identifikaatoriga kujul P12345 ning need seovad omavahel andmeüksusi ja andmeid või andmeüksusi üksteisega ning annavad sellega teadmuspangas talletatud väidetele sisu. Kui andmeüksused võivad olla semantilise kolmiku mõttes subjekti ja predikaadi positsioonis, siis omadused on alati koopula ehk siduva verbi positsioonis.[9][10]

Wikidata tavakasutaja puutub kokku peamiselt andmeüksuste loomise või nende muutmisega, nt uute avalduste lisamisega olemasolevatele üksustele vmt. Omaduste loomine on aga juba seotud Wikidata spetsiifilise ontoloogiaga ning uue omaduse loomise ettepanek tähendab, et olemasolev ontoloogia ei ole maailma kirjeldamiseks piisav ning vajab täiendamist. Uute omaduste loomise taotlused vaadatakse Wikidata kaastööliste poolt ühiselt läbi ning kui nende järele on vajadus, siis need kinnitatakse.[11]

Arenduslugu[muuda | muuda lähteteksti]

Wikidata sai alguse 30. oktoobril 2012[12] ning oli Wikimedia Foundationi esimene uus projekt alates 2006. aastast. Esimese faasina loodi andmebaas intervikilinkidest, millele Vikipeedia eri keeleversioonidel puudus ligipääs. Wikidata lingistikku rakendati esimest korda 14. jaanuaril 2013 ungarikeelses Vikipeedias[13]. 30. jaanuaril järgnesid heebrea ja itaalia Vikipeediad[14], 13. veebruaril inglise Vikipeedia. Kõigis ülejäänud keeleversioonides (sh eestikeelses Vikipeedias) võeti Wikidata kasutusele 6. märtsil 2013[15].

Wikidata üks kolmest eesmärgist on pakkuda ühisest allikast teatud andmetüüpe (nt sünnikuupäevi) Wikimedia projektidele nagu Vikipeedia. Intervikilinkide järel on Wikidata töö teise faasi jõudmisel hakatud pakkuma ka teisi andmetüüpe, sh lisaks Wikimedia Commonsi pildifailidele, geograafilistele koordinaatidele, kuupäevadele jmt ka linkandmeid paljudest autoriteetsetest avaandmete kogudest. Vikipeedia keeleversioonidel on neile andmetele täielik ligipääs alates aprillist 2016.[16]

Kolmandas faasis hakatakse Vikipeedias olevaid nimekirju, tabeleid jm andmetel põhinevat sisu automaatselt genereerima Wikidata põhjal ning üleminek sellesse faasi alles käib.

Viited[muuda | muuda lähteteksti]

  1. Wikimedia hea uue ilma lävepakul: pööre andmepõhisele entsüklopeediale, Wikimedia Eesti blogi, 17. veebruar 2018
  2. Claudia Müller-Birn. "Peer-production system or collaborative ontology engineering effort: what is Wikidata?". OpenSym '15 Proceedings of the 11th International Symposium on Open Collaboration, 2015. Vaadatud 18. märts 2018.
  3. Wikidata, Meta-Wiki, Lydia Pintscheri muudatus 14:14, 2 August 2012
  4. "Data Revolution for Wikipedia". Wikimedia Deutschland. 30. märts 2012. Originaali arhiivikoopia seisuga 11. september 2012. Vaadatud 11. september 2012. 
  5. Martin Poulter. "Report from Wikimania". Bodleian Digital Library blog, 14. september 2017.
  6. "Wikidata:WikiProject Ontology". Wikidata koduleht.
  7. Navino Evans. "Importing data into Wikidata – Current challenges and ideas for future development". Histropedia blogi, 30. november 2017.
  8. Sebastian Burgstaller-Muehlbacher. "Wikidata as a semantic framework for the Gene Wiki initiative". Database, Volume 2016, 1 January 2016.
  9. "Wikidata:Wikipedia — Understanding Wikidata". Wikidata koduleht.
  10. "Wikidata:Glossary". Wikidata koduleht.
  11. "Wikidata:Property proposal". Wikidata veebileht.
  12. Wikidata (arhiveeritud 30. oktoobri 2012 seisuga aadressil http://www.webcitation.org/6BnYRmONz)
  13. Pintscher, Lydia (14. jaanuar 2013). "First steps of Wikidata in the Hungarian Wikipedia". Wikimedia Deutschland. Vaadatud 15. jaanuar 2013. 
  14. Pintscher, Lydia. "Wikidata coming to the next two Wikipedias". Wikimedia Deutschland. Vaadatud 31. jaanuar 2013. 
  15. Pintscher, Lydia (6. märts 2013). "Wikidata now live on all Wikipedias". Wikimedia Deutschland. Vaadatud 8. märts 2013. 
  16. Lydia, Pintscher (27. aprill 2016). "Wikidata support: arbitrary access is here". Commons:Village pump. Vaadatud 1. veebruar 2018. 

Välislingid[muuda | muuda lähteteksti]