A mai internetezők a Google és a Microsoft keresőjét használják: a Google-n történik a keresések 76 százaléka, az MSN Searchnek be kell érnie 17 százalékkal. A jövőben egy harmadik, ma még nem létező versenyző lehet a piacvezető – feltéve, hogy a két cégnél nem lépnek túl a mostani technológiákon.
Ami már kevés
A mai keresők alapvetően úgy működnek, hogy a megadott keresőszavak alapján a szavakat tartalmazó dokumentumokat “dobják ki”, és bizonyos elvek szerint rangsorolják. Az ilyen jellegű keresések még mindig nem elég hatékonyak, az új keresők azonban újabb és újabb igényeknek felelnek meg.
Tom Mitchell, az American Association of Artificial Intelligence volt elnöke úgy véli, a következő keresőgeneráció legfeljebb öt év múlva megjelenik. Azok a keresők képesek lesznek arra, hogy bizonyos tényeket, információkat egyedül kiszűrjenek egy weboldalról, összefüggéseket hozzanak létre, és rendszerezzenek adott kulcsszavak alapján. A kutatók mesterséges intelligenciát adnak a jövő keresőjének, megtanítják neki, hogyan olvassa el és értelmezze a szöveget. A már most is létező alkalmazások képesek arra, hogy az oldalon lévő szövegtengerből 95 százalékos biztonsággal megtaláljanak egy dátumot, vagy kiszűrjék egy adott beosztású alkalmazott, vezető nevét.
“Amikor nekiállunk valamit keresni a weben, akkor lényegében egy kérdést teszünk fel, például azt, hogy hány óráig van nyitva az okmányiroda, vagy hogy milyen egyetemeken létezik meteorológia szak” – folytatja Tom Mitchell. A mesterséges intelligenciával felvértezett, az adott tényeket megtaláló kereső képes lesz komplexebb keresésekre, kérdéseink megválaszolására, utasításaink követésére.
Mondjuk, azt szeretnénk eldönteni, hova felvételizzünk. Fő szakunk a környezetvédelem lenne, viszont nem szeretnénk egy zajos, zsúfolt egyetemre járni, és az is érdekel, hány diákja van az intézménynek. A környezetvédelmi szakokat indító főiskolákat könnyen megtaláljuk hagyományos keresővel is, de mélyre kell ássunk ahhoz, hogy a tanulók létszámát is megtudjuk. A jövő intelligens keresőjének a következő utasítást adhatjuk: mutasd meg azokat az egyetemeket, ahol környezetvédelmet tanulhatok, rangsorold őket a diákok száma alapján, a legkisebb létszámú főiskolával kezdve. Az olvasni képes, a tényeket kiszűrni tudó és az összefüggéseket meglátó kereső lesz alkalmas a feladat végrehajtására – és Mitchell szerint éppen ilyen keresőn dolgoznak.
Egy gyakorlati példa
Edina felhívja testvérét, Pétert azzal az információval, hogy édesanyjukat szakorvoshoz kell vinni kivizsgálásra, majd kéthetente gyógytornára. Péter beleegyezik, hogy ő is segítsen testvérének, így Edina rögtön utasítja szemantikus websegédjét, állítsa össze a menetrendet, figyelembe véve a saját és testvére heti programját. A segéd az édesanyja orvosának segédjétől megkapja a szükséges kezelési menetrendet, megkeresi 30 kilométeres körzetben az összes intézményt, ahol a kezelést elvégezhetik, figyelembe veszi a testvérek programját, és pillanatokon belül egy tervvel áll elő. Péternek nem tetszik a terv, mivel az egyik kórház túl távol van édesanyja otthonától és csúcsidőben kell visszahozni, tehát korábbi időpontokat kér. Az új adatok birtokában a segéd alternatív tervet dolgoz ki, korai időpontokkal és kisebb távolságokkal. Ugyanakkor két figyelmeztetést is kiad: a délelőtti órákban, két kevésbe fontosnak minősített találkozót át kell helyeznie vagy le kell mondania. Péter más időpontokra helyezteti át a találkozókat, a terv máris készen áll.
A W3C konzorcium a szemantikus web felépítésén fáradozik. A távolabbi jövőben a cél olyan web kifejlesztése, amely a jelenlegit kiegészítve működne, és ahol az információnak pontosabban meghatározott értelmet adnak; ez elősegíti majd a számítógép és emberek együttműködését. A mostani világháló emberek dokumentumainak tárolási közege, nem pedig automatikusan, a számítógép által feldolgozható adat- és információhalmazok helye.
A szemantikus web létezéséhez szükséges két fontos technológiát máris kifejlesztettek: az egyik az eXtensible Markup Language (XML) a másik a Resource Description Framework (RDF). Az XML a HTML egy változata, és megengedi, hogy mindenki rugalmasan hozhassa létre a saját tagjeit, a szkriptek és alkalmazások pedig felhasználják ezeket a tageket. Az XML tehát megengedi, hogy a felhasználó tetszőleges struktúrákat hozzon létre, s a struktúra jelentéséről semmit sem kell mondania.
Az RDF tartalmazza magát a jelentést, amit hármas csoportosításokban kódolnak, egy alapvető mondatnak lehet alanya, állítmánya és jelzője. Az RDF-ben a dokumentum állításait tartalmazza: bizonyos dolgoknak (emberek, weboldalak) bizonyos tulajdonságaik vannak (testvére ennek, alkotója annak) és bizonyos értékük (más ember, más weboldal). Ezzel a struktúrával a számítógépeknek is érthető módon írható le a feldolgozandó adat. A szemantikus web és az okos kereső ígéretéből nem tudjuk mi valósul meg, egy biztos, az unalmas HTML oldalak kora leáldozóban van.