Az internetes keresés területén tevékenykedő mérnökök előszeretettel hirdetik: a keresés kérdése még csak 5%-ban van megoldva.
Képzeljük el inkább a tökéletes keresés világát. Képzeljük el, hogy bármit kérdezhetünk, és nem csak hogy a pontos, hanem a számunkra legtökéletesebb választ kapjuk, olyan választ, ami beleillik a kérdés kontextusába és szándékába, olyan választ, aminek adója mintha pontosan tudná, kik vagyunk és miért kérdezzük azt, amit. Ez a válasz képes magába foglalni a világ összes, rendelkezésre álló, kereshető tudását, legyen az szöveg, kép vagy hang formátumú. Képes különbséget tenni egyszerűen megválaszolható adatkérdések (Ki volt az Egyesült Államok harmadik elnöke?) és kifinomultabb kérdések között (Milyen körülmények között tagadta meg az Egyesült Államok harmadik elnöke a rabszolgaságról vallott nézeteit?).
A tökéletes keresés
személyre szabott tökéletes választ tud adni és tökéletesen emlékszik. Tudja, milyen oldalakat láttunk, és különbséget tud tenni a kalandozó keresés (discovery, amikor valami újat keresünk) és a felidézés (recovery, a korábban látott információ újra behívása) között.
És ami a legfontosabb, különbséget tud tenni dokumentum és személy között, azaz javaslatot tesz, hogy a tökéletes választ úgy kaphatjuk meg, ha
ezzel és ezzel a személlyel kommunikálunk, ahelyett hogy
egy adott dokumentumot elolvasnánk. Röviden, a jövő keresőprogramja nem olyan, amilyennek most ismerjük. Inkább olyan, mint egy intelligens közvetítő, egy kézikönyvtáros, aki tökéletesen ismeri az emberi tudás teljes korpuszát.
Ugyan hosszú még az út, de egy ilyen szolgáltatást elképzelni már nem a tudományos-fantasztikus irodalom körébe tartozik. Ez lett a keresésben érdekelt szinte minden fontos cég kinyilvánított küldetése, ezt tűzte ki célul az IBM, a Microsoft, a Google, a Yahoo és sokan mások. De hogyan jutunk el idáig, és ha elértük, hogyan fogja ez megváltoztatni a világot?
Mindenütt való keresés (Oldaltörés)
A közeljövőben a keresés áttéteket fog képezni az eredeti, PC-centrikus világhálóról, és mindenféle eszközben megtapad. Ez már megkezdődött a mobiltelefonokkal és PDA-kkal, és folytatódni fog: úgy terjed majd, mint valami vírus, mígnem beépül minden digitális eszközbe. A telefonban, az autóban, a televízióban, a hi-fi toronyban, a legolcsóbb eszközben, amiben mikrocsip van és számítógépes hálózathoz csatlakoztatható, mind benne lesz a hálózati keresés lehetősége. Hogyan találhatná meg azt a 15 évvel ezelőtti képet, amin kedvesével a görög tengerparton vannak? Vagy beszkenneli vagy átengedi az analóg ismeretlenség elemésztő ölelésének. De a gyermekeinek nem lesznek ilyen problémái; az ő fényképeik már teljesen digitális és kereshető formában vannak, a teljes metaadat-sor szerepel rajtuk (dátum, idő, és hamarosan a kontextus is).
Két évtizeden belül szinte minden, ami értéket képvisel, apró számítástechnikai eszközökhöz lesz csatlakoztatva, olyan eszközökhöz, melyek rádióhullám-alapú kérdésre képesek bejelentkezni: "Itt vagyok, pontosan itt, ezt és ezt végeztem el, míg nem voltál itt." A nehézkes vonalkódok felragasztgatása helyett a repülőtéren a csomagfelvételnél egyszerűen ráütnek a poggyászra, és a RFID (rádiófrekvenciás azonosító) csip tárolja az adatokat. Elveszett poggyász? Nem hiszem, hogy lesz ilyen. Nem, ha az utas a drága Louis Vuitton bőröndjének útját a Google megfelelő alkalmazásával valós időben követheti.
Gondoljunk csak bele: a Google-lal követhetjük kutyánk, gyerekünk, pénztárcánk, mobiltelefonunk, autónk mozgását. A lista gyorsan halad a végtelen felé. Ahol csip van, ott működhet, és valószínűleg működni is fog a keresés. De a tökéletes keresés megvalósulásához a keresésnek mindenütt jelen kell lennie, mindenhez kapcsolódnia kell. Ez sok minden más mellett azt jelenti, hogy a keresésnek meg kell oldania egy mindeddig megoldhatatlan problémát: a Láthatatlan Világháló problémáját. A láthatatlan világháló minden, ami a weben megtalálható, de a keresőprogramok még nem találtak rá. A tudás mély adatkútjai, mint a University of California könyvtári rendszere vagy a LexisNexis nevű hír- és idézetszolgáltatás kereskedelmi vagy technológiai okból fallal vannak elkerítve a keresőprogramok elől. Mára az összes jelentős keresőprogram létrehozott úgynevezett desktop search (saját gép kereső) eszközöket, amikkel a felhasználó saját merevlemezét indexelheti, és a webes találati eredményekhez hasonlóan jeleníti meg a tartalmát. A desktop search keresési eszközök előtt PC-nk a Láthatatlan Világhálóhoz tartozott. De ez már nincs így.
A nagyrészt láthatatlan, többnyire még az analóg világban ragadt információ az, amit tartalmi webnek (content Web) nevezhetünk. Jelenleg több mint 100 millió kötetnyi könyv létezik, de csak néhány ezer érhető el online. Vegyük hozzá ehhez azt a rengeteg filmet, televízióműsort és folyóiratokat, amit az emberiség felhalmozott, de amik a keresők számára hozzáférhetetlenek. Hála a Napsternek, a zene kemény diója már részben fel van törve. A Napster megjelenésekor több millió ember töltötte fel kedvenc zenéjét a világhálóra. Több mint valószínű, hogy ebben rejlik az eddig még "kereshetetlen" média feldolgozásának kulcsa is. Mert szinte minden könyvet, filmet, televízióműsort valaki valami okból feltehet a webre, azzal a feltételezéssel, hogy majd csak zöldágra vergődünk valahogy a szerzői jogokkal. Hatalmas archiváló projektek, mint a Google Print vagy az Internet Archive és az Amazon Search Inside the Book (keresés a könyvben) programja sokat tett e probléma megoldásáért, de még hosszú, hosszú utat kell megtenni, és az egyszerű logika azt diktálja, hogy senki sem tudja az emberiség összes keletkezett információját archiválni. Ha a világ kereshetőségéről van szó, a legjobb, ha azt a világra bízzuk.
Gyakorlatilag minden, ami értékkel bír (a poggyászunk is) csatlakoztatva lesz a világhálóra, mert a behálózott világban minden érték alapja a webhez való csatlakozás. Ahogy a Sokaság Ereje beleszövi a világhálóba az emberiség értékes holmiját, a keresőprogramok becsévélik ezt az új tartalmat az indexbe, ezzel a világ a tökéletes keresés megvalósítása felé mozdul.
Digitális tudatosság-folyamunk, a clickstream (Oldaltörés)
Hogyan lehet egy keresőprogram mindenütt jelenvaló és személyre szabott egyben? A probléma megoldása a clickstreamben rejlik. A digitális világban való tevékenykedésünk során nyomokat hagyunk magunk után, és minél több nyomot hagyunk, annál pontosabban fogja tudni a keresőprogram, hogy egy adott kereső-kifejezés begépelésekor valójában mire vagyunk kíváncsiak. Számos szolgáltatás elkezdte nyomainkat lekövetni, és idővel ezek a nyomok a relevancia aranyává válnak.
A clickstream jelenségét legjobban egy kis történet alapján érthetjük meg. 2004 nyarán rákerestem a Google-ban a "sors kísértése" (tempting fate) kifejezésre. Volt egy olyan előérzetem, hogy a kifejezés a Google tőzsdei bevezetésére és mérnökvezérelt kultúrájára utal. Biztos voltam benne, hogy a kifejezés a görög-római mitológiában gyökerezik. Az eredmények túl szétszórtak voltak (bár érdekes volt köztük a Google News egyik sztorija az athéni olimpiáról). Felhívtam anyámat, aki középiskolai tanár, és mitológiai kérdésekben sokkal többet tud nálam. Anyám említette, hogy Shakespeare gyakran szerepelteti a párkákat munkáiban. Ezzel a tudással felvértezve mentem vissza a Google keresőablakhoz, és begépeltem a "párkák mitológia" kifejezést. Végre találtam valamit. Találtam egy oldalt, melyen a sors görög istennőiről írtak, és az innen vett információval a Google segítségével végigmentem a sorsistennők referenciáin. De nem találtam meg a tökéletes választ. Ki volt az első sorskísértő? Talán egy nagy ember mondta először ezt a kifejezést, onnan híres, gondoltam. Vagy a dolognak nem mitológiai alapja van. Hirtelen furcsa déjà vu érzésem támadt. Eszembe jutott, hogy hetekkel korábban láttam egy oldalt, ami hasznos lenne az aktuális keresésben. Korábbi keresésemkor nagyszerű idézetgyűjteményre bukkantam. De sajnos nem mentettem el az URL-t. Ha valahogy hozzá tudnék férni előző clickstreamemhez – keresési "aktámhoz" – hamar megtalálnám. De sajnos elölről kellett kezdenem a keresést. Bár azt az idézetgyűjteményt többé nem találtam meg, azon kaptam magam, hogy nagy utazást teszek a huszadik század eleji filozófiai és vallási szövegektől a párkák tudományos taglalásáig és a görög tragédiában betöltött szerepükig. Közben fel kellett frissítenem a homéroszi epikáról, Shakespeare-ről és Joyce-ról való tudásomat. Remek szórakozás volt. A végén sokkal jobban értettem eredeti kérdésemet: mi a csudának indította a Google éppen péntek tizenharmadikán részvényeinek aukcióját? Miért kísértette a sorsot? Erre a kérdésre megtaláltam a magam igen szubjektív válaszát. Azért, mert a mérnökök a görög filozófusokhoz hasonlóan úgy gondolják, hogy a sorsot nem lehet kihívni, sorskísértések pedig nincsenek; de erre a következtetésre nem úgy jutottam, hogy az első rákeresés első 10 találatát kattintgattam végig, hanem hosszú kerülő úton találtam rá a válaszra.
A tökéletes keresés világában az is lehetővé válhat, hogy ezt az utazást a kattintások szintjén is követni lehet, össze lehet rakni, és el lehet menteni úgy, hogy később hivatkozni tudjak rá; olyan eszközé válik, ami súgóként segít, hogy újra és újra elmondjam, hogyan jutottam erre a válaszra. Nyomok a porban, mondhatni, amin mások elindulhatnak, vagy felfedezhetik, hogyan jutottam következtetéseimre. És ezek a nyomok nem csak potenciális narratívák, amit mások olvashatnak; egyben olyan objektumok is, amiket a keresőprogramok lekövethetnek, és általuk teljesen újfajta tudást kaphatnak az emberi tanulásról. Összességében a kattintás-folyam (clickstream) olyan szintű információt ad az emberek webhasználatáról, ami nagyságrendekkel részletesebb és árnyaltabb, mint az egyszerű hivatkozáskövetés, ami a Google PageRank forradalmának alapját képezte.
A clickstream az a mag, amiből kultúránk memexe (a potenciális tudás új ökológiája) kinőhet, és a keresés lesz az ásó, ami megforgatja az internet talaját. A clickstream alapján működő keresőprogramok mellett az elemzésalapú kereséseket végrehajtók olyanok lesznek, mint a prekambiumból maradt őskövületek.