Ce-o fi WEB 3.0, Web-ul Semantic? Ce sunt RTF, FOAF, YAGO, SPARQL ? Citisem despre ele la un moment dat, dar sa fim seriosi: la noi, la atei, pana nu atingi ceva - acel ceva nu exista! 😀 Asa ca a mai trecut un timp pana am dat peste DBpedia si toate cele de mai sus au inceput sa "se intrupeze". 

Una din ideile de baza ale Web-ului 3.0 e ca exista informatie foarte multa in spatiul virtual dar nu e valorificata la maxim. Daca datele existente ar fi publicate utilizand limbaje standardizate de clasificare a informatiilor (si aici 'intervin' acronimele amintite anterior: RDF, FOAF), atunci respectivele date ar putea fi mai bine exploatate.

DBpedia reprezinta tocmai rezultatul punerii in practica a ideii de mai sus. Mai concret, informatia din Wikipedia este reclasificata utilizand RDF (Resource Description Framework) ba chiar si interlink-ata cu alte baze de date oarecum similare ca principii de clasificare (YAGO - Yet Another Great Ontology). In forma rezultata, informatia poate fi interogata (utilizand limbajul de interogare SPARQL). Depinde doar de imaginatia utilizatorului in a crea interogari din cele mai complexe asupra - practic intregii informatii din Wikipedia. Sunt cateva exemple simpatice pe site-ul DBpedia - spre exemplu cum sa construiesti interogarea SPARQL pentru a afla numele filmelor aparute inainte de 1989 in care a jucat Tom Cruise si care au avut incasari mai mari de x mil. de dolari.

Ne-am propus in cele ce urmeaza sa exemplificam utilizarea datelor de tip web 3.0 in aplicatii de tip harta (sa nu uitam totusi care e ocupatia noastra de baza 😉).

Pentru a crea harti folosind datele din DBpedia e nevoie (bineinteles!) ca rezultatele interogarii sa contina si elemente care pot fi localizate (tari, localitati, adrese). Acum un an de zile, mai in joaca mai in serios, am creat o harta a formatiilor rock din Statele Unite, geocodand informatia referitoare la localitatea in care s-a format fiecare trupa in parte. Rezultatul, utilizand ArcGIS Online il puteti vizualiza aici - US Rock Map. E si o harta tematica cantitativa tip choropleth - fiecare stat american fiind clasificat in functie de numarul de formatii rock pe care le-a dat posteritatii.

Dar sa revenim pe plaiuri mioritice si sa ne ancoram in meandrele concretului. In mod cert 😲 v-ati intrebat ce au in comun Robert Turcescu sau Ion Ramaru cu Elie Wiesel sau Baruch Kimmerling; - Dacian Varga sau Ciprian Suciu cu Gheorghe Hagi sau Simona Halep; - Florin Salam sau Paula Mitrache cu Georges Boulanger sau George Enescu... Raspunsul e simplu - toti sunt prezenti in:

Harta personalitatilor nascute in Romania 

Pe langa faptul ca prezinta personalitatile pe harta Romaniei dupa locul nasterii - este si o harta tematica cantitativa - tip heatmap - indicand zonele care au dat un numar mai ridicat de personalitati.

Acum, sigur - e discutabila incadrarea la 'personalitati' pentru multi din cei ce apar pe harta. Dar cine suntem noi sa contestam Wikipedia?

De asemeni, e ciudat cum unele personalitati apar, respectiv nu apar intre rezultatele interogarii in functie de datele pe care editorii Wikipedia le-au trecut la locul nasterii (spre exemplu Matei Corvin are locul nasterii Cluj-Napoca/Romania - ceea ce e incorect din punct de vedere istoric, in timp ce pentru Mihai Eminescu regasim: Botosani/Moldova ceea ce e corect din punct de vedere istoric, dar impiedica afisarea rezultatului pentru interogarea SPARQL - cel putin asa cum am formulat-o). 

Aceste probleme (sigur, unele pot fi surmontate printr-o analiza mai riguroasa a seturilor de date si crearea unei interogari mai complexe) sunt si problemele pe care vizionarii WEB 3.0 le-au imaginat. Ei au atras atentia inca de la inceput asupra provocarilor Web-ului Semantic: Imensitatea, Neclaritatea, Incertitudinea, Lipsa de Coerenta si chiar Minciuna care caracterizeaza sau pot caracteriza informatiile de pe World Wide Web.

Cu toate acestea, imi doresc sa avem cat mai curand si DBpedia in limba romana, intrucat e evident ca Wikipedia in limba romana in ceea ce priveste elementele locale are un continut mai voluminos. Cine stie? Se va ivi poate un grup de entuziasti, ar putea aparea o colaborare inter-universitara intre una autohtona si Universitatile din Leipzig si din Manheim ('parintii' DBpediei) ... - eu mi-am facut datoria si am lansat provocarea 😀

 

Pentru harta am utilizat:
- date: DBpedia
- software:  - interogare - SPARQL
- geocodare - QGIS - plugin-ul mmqgis
- afisare: OpenLayers

Pentru cei interesati - interogarea SPARQL utilizata o gasiti aici. Sigur, mai suporta imbunatatiri - asteptam recomandari.

Comments powered by CComment

Prin apasarea butonului "Accept" va exprimati acordul utilizarii cookie-urilor in scopuri analitice sau publicitare.