Wyszukiwarki internetowe należą bez wątpienia do jednych z najczęściej używanych usług w Internecie. Globalny rynek SEM i SEO eksperci wycenili w bieżącym roku 2009 na 15 miliardów dolarów a szacunki na rok 2011 oscylują już wokół 20 miliardów dolarów.

Liderem wyszukiwana jest Google – to właśnie ta firma wcale nie tak dawno temu pierwsza pokazała że zaindeksowanie całego światowego Internetu jest nie tylko możliwe ale również niesie ze sobą możliwość znalezienia przez użytkowników praktycznie każdego aspektu wiedzy i działalności ludzkiej. Dziś Google to nazwa znana każdemu, określenie „wygooglać” na stałe weszło do słownictwa a charakterystyczna biała płachta wyników jest wywoływana praktycznie w każdym zakątku świata paredziesiąt tysięcy razy na sekundę.

Często można spotkać się ze stwierdzeniem iż Google to monopolista wyszukiwania w Internecie – nic bardziej mylnego. Na dzień dzisiejszy głównym konkurentem Google jest Microsoft – firma która o monopolizacji wie bardzo dużo gdyż praktycznie nie ma konkurencji na swoim najważniejszym poletku – systemów operacyjnych dla komputerów klasy PC. Microsoft pozazdrościł Google’owi i wraz z kolejnymi wersjami swojej wyszukiwarki Bing przybliża się do lidera wyszukiwania w sieci. Google oczywiście też zazdrości Microsoftowi – i stąd takie produkty jak ChromeOS – ale to już trochę inny temat.

Nie tylko najwięksi tuzowie branży starają się przybliżyć choć trochę do tego wielomiliardowego zielonego tortu – zdumiewa mnogość obecnych rozwiązań, innowacyjnych prób i przedsięwzięć dostarczenia nowej jakości wyników, nowych sposobów klasyfikacji i zupełnie nietypowych podejść do samej idei wyszukiwania w treściach internetowych. Celem tego artykułu jest przybliżenie i przedstawienie rozwiązań oraz trendów w wyszukiwarkach które być może nie są konkurencją dla uznanych już mechanizmów ale są zarówno innowacyjne jak i interesujące – i istnieje szansa że lada chwila na podwalinach właśnie tych rozwiązań powstanie bliżej nieokreślone ‘coś’ które zdetronizuje aktualnych liderów.

Klasyczne wyszukiwarki

Wspomniany już Bing – konkurent Google – jest podobny w prezentacji, podobny w wynikach, podobny zapewne też w algorytmach – ale powiększa sukcesywnie ilość swoich użytkowników, po części dlatego że jest integrowany z oprogramowaniem Microsoftu, a po części zapewne dlatego że – szuka po prostu dobrze.

Wyszukiwarki metasearch

Są usługą polegającą na integrowaniu wyszukiwań z wielu osobnych źródeł – w formie prezentacji składają się bądź z zintegrowanych wyników bądź osobnych panelów prezentujących rezultaty – nie zdobyły jednak popularności. W pierwszym przypadku prezentacji ciężko jest dobrze połączyć w jedną listę wyniki z wielu często specjalizowanych źródeł, w drugim przypadku osobne panele wcale nie są czytelniejsze dla użytkownika niż pojedyńcza lista.


http://clusty.com
– typowa wyszukiwarka łącząca wyniki z wielu źródeł:


http://surfwax.com
– wyszukiwarka tworząca dla każdego wyniku ‘site snaps’ – krótkie podsumowanie na temat każdego wyniku tworzone w czasie rzeczywistym:

Personal revelance/social search

Za tym określeniem kryją się mechanizmy które pozwalają użytkownikom na „ręczne” rankowanie wyników – de facto polega to na tworzeniu przez użytkowników płacht wyników na dowolne zapytania. Interesującym typem wyszukiwania social search jest tzw. „lazy search” – polega na zadaniu zapytania – a nasi znajomi i znajomi naszych znajomych na portalu społecznościowym dostaną szansę na wykazanie się i udzielenie wyczerpującej odpowiedzi. Rozwiązanie interesujące i ciekawe, lecz najwyraźniej szybko nudzące się użytkownikom – zarówno tym oczekującym aż ktoś raczy odpisać jak i tym którzy udzielają odpowiedzi.

Wyszukiwarki faktów

Właściwe kategoria zarezerwowana dla jednego rozwiązania: WolframAlpha. Jest to wyszukiwarka wiedzy stworzona przez Stephena Wolframa, uznanego światowej klasy naukowca (znanego również jako twórca aplikacji Mathematica) – WolframAlpha to gigantyczne przedsięwzięcie mające na celu skatalogowanie nie tyle Internetu co całej wiedzy ludzkości i okraszenie tych danych systemami samouczącymi się będącymi w stanie automatycznie wnioskować, poruszać się i operować na faktach i pojęciach. Ta wyszukiwarka ma stać się podstawowym szkolnym narzędziem używanym w amerykańskim szkolnictwie. Warte oglądnięcia. Ciekawym podejściem do wyszukiwania charakteryzuje się SiteTruth – wyszukiwarka która stara się uwzględniać w rankingu wyników ‘poważność’ wyszukiwanego wyniku – głównie chodzi tutaj o ‘poważność’ biznesową – mechanizm sprawdza dane firm i osób które są skojarzone z wynikiem, rankuje za obecność w rankingach biznesowych, wpisy w KRS, profesjonalność hostingu etc. Wyniki niestety są tylko częściowe i nie obejmują polski – produkt jest w fazie alpha test.


http://www.wolframalpha.com
– wyszukiwarka faktów – semantyczna, z racji specyfiki ma stać się podstawowym programem do zastosowania w programach nauczania w US:


http://www.sitetruth.com
– wyszukiwarka analizuje wyniki pod kątem ‘poważności biznesowej’:

Thumbshoty

Thumbshoty czyli zrzuty przeglądanych stron internetowych możemy oglądać w wielu wyszukiwarkach internetowych, najczęściej jednak stanowią tylko dodatkową informację obok zwróconego wyniku. W przypadku Google FastFlip thumbshoty stanowią podstawę działania serwisu, wyszukiwarka prezentuje graficzne zrzuty stron pozbawione często pochodzącej z oryginalnej strony nawigacji i podobnych przeszkadzajek. Thumbshot jest duży, pozwala na błyskawiczne zorientowanie się co do informacji, które zostaną znalezione na stronie – a po kliknięciu staje się jeszcze większy i umożliwia bezproblemowe przeczytanie strony. Pomysł bardzo innowacyjny – oglądanie strony bez wchodzenia na nią, maksymalnie szybko, bez reklam i oglądamy tylko interesująca nas treść. Brak emisji reklam i zmniejszenie oglądalności portali raczej nie wróży temu pomysłowi świetlanej przyszłości – ale zobaczymy.


http://redz.com
– prezentacja wizualna – dwustronny stos thumbshotów:


http://fastflip.googlelabs.com
– zamiast wyników i zajawek prezentuje thumbshoty treści ze stron, pozwala na szybkie przeglądanie powiększonych thumbshotów – nie trzeba odwiedzać oryginalnego site’u:

Wyszukiwanie w multimediach

Skoro wyszukiwanie w Internecie które jest głównie przeszukiwaniem w obrębie danych tekstowych przyniosło tak spektakularny sukces, a równolegle łącza internetowe puchną z dnia na dzień przesyłając coraz więcej multimediów kolejnym naturalnym krokiem jest indeksowanie audio i video. I faktycznie – w ramach głównie rządowych projektów typu SAPIR powstają w laboratoriach uczelnianych i ośrodkach research and development gigantów IT systemy indeksujące stream’y audio i video, przekształcające mowę w tekst, indeksujące obrazy, muzykę, pozwalając na wyszukiwanie według podobieństwa w multimedialnych zbiorach danych.


http://mufin.fi.muni.cz/imgsearch/
- wyszukiwarka obrazów podobnych z Flickr, algorytmika stworzona w ramach programu SAPIR (Search In Audio Visual Content Using Peer-to-peer IR):


http://www.midomi.com
– wyszukiwarka audio – wystarczy zaśpiewać albo zanucić a mechanizm wskaże utwór podobny ze swojej bazy, również dla Iphone’a:

Wyszukiwarki semantyczne

Ambicją wyszukiwarek semantycznych jest nie operowanie wyrazem czy napisem – lecz pojęciami. Wykorzystują algorytmy bazujące na grafach pojęć i automatyczne klasyfikowanie treści. Mechanizm wie o czym jest strona, z jakimi innymi stronami w sieci jest związana, algorytm stara się zrozumieć zapytanie użytkownika, nie tylko potraktować je literalnie – ale stara się dobrać do wyników treść jak najbardziej dopasowaną pojęciowo. Tak naprawdę wszystkie znane wyszukiwarki używają takich metod zwiększenia jakości rezultatów wyszukiwania. W stronę wyszukiwania semantycznego kieruje się również cały rynek wyszukiwarek typu enterprise (do kupienia, postawienia i użycia w małych jak i dużych firmach) – ten rynek jest najmniej zainteresowany wyszukiwaniem w multimediach, interesuje go wyszukiwanie w dokumentach tekstowych – ale z najwyższą jakością wyników.


http://www.powerset.com
– wyszukiwarka semantyczna , przeszukiwanie Wikipedii – wynikowe artykuły prezentowane w formie skojarzeniowej z innymi, dużo relacji i powiązań, prezentacja niewizualna:


http://quintura.com
– wyszukiwarka oparta głównie na nawigowaniu poprzez chmurę tagów stanowiącą część większego grafu pojęć, semantyczna i wizualna:

Wyszukiwarki wizualne

Obraz mówi więcej niż tysiąc słów – to jest hasło przewodnie kilkunastu rozwiązań wyszukiwarkowych funkcjonujących w kategorii „visual search”. Dzieje się tutaj wiele, a wspólną ideą jest prezentacja wyników która będzie niosła za sobą coś więcej – najbardziej trafionym według mnie pomysłem jest możliwość tworzenia topologii – przeciągania wyników do obszarów pojęć, przeskakiwanie pomiędzy grupami znaczeń, możliwość oglądania obszarów wiedzy i internetu choćby luźnow związanych z wyszukiwanym hasłem.


http://search.tianamo.com
– wyszukiwarka prezentuje wyniki na wirującym wykresie powierzchniowym – szczyty reprezentują najpopularniejsze pojęcia, lista wyników prezentowana jest po prawej stronie:


http://www.visuwords.com
– wyszukiwarka pojęć i słów kluczowych, prezentuje graficznie graf pojęć z klasyfikacją terminu po której można się poruszać, rozróżnia części mowy, relacje zawierania, przeciwności, określenia:


http://www.pixsta.com/
,
http://www.empora.com
– wyszukiwarka obrazów podobnych, użyta komercyjnie w sklepie Empora (odzież, duży sklep sieciowy) – „znajdź coś podobnego do tych butów co na obrazku” :


http://search-cube.com
– wyszukiwarka wizualna – efektem wyszukiwania jest sześcian którym można nawigować, a pola budujące sześcian po najechaniu myszą dostarczają więcej informacji o wynikach:


http://www.viewzi.com
– wyszukiwarka z wieloma formami prezentacji graficznej: power-grid, photo tag cloud, songs, celebrity gossip – 13 trybów ręcznie wskazywanych dla lepszego przeglądania rezultatów wyszukiwania:


http://www.oskope.com
– przeszukuje wybrane site’y (katalogi Amazon i Ebay) – wynik wyszukiwania to produkt ze zdjęciem:


http://emislej.googlepages.com/cocovas
– interesujący projekt studencki o nazwie Visual Metaphor, ciężko opisać trzeba zobaczyć, klastry pojęć, szczegółowość, drag&drop, wyniki prezentowane w prawym panelu:


http://www.ujiko.com
– prezentacja w formie owalu, możliwość przeciągania i klasyfikacji wyników przez userów:


http://eyeplorer.com
– semantyczna, pozwala klasyfikować wiedzę i poruszać się myszką w różnych jej obszarach, wyszukiwarka pojęć i wiedzy – nie szuka w stronach internetowych:


http://www.liveplasma.com
– wyszukiwarka zespołów muzycznych oraz filmów, prezentacja grafu po którym można się poruszać


http://www.touchgraph.com/TGGoogleBrowser.html
– właściwie to uniwersalny browser do grafów w przeglądarce internetowej, ma możliwość prezentowania wyników Google’a wraz z wizualizacją pagerank’u wyników:


http://www.bing.com/visualsearch
– do oglądania niestety tylko w US, prezentacja typu macierz obrazków, główne zastosowanie to przeszukiwanie katalogu produktów:

Ten krótki przegląd dostępnych rozwiązań oczywiście nie wyczerpuje tematu – na rynku jest ponad 250 komercyjnych, darmowych bądź też będących wersjami beta ogólnie pojętych mechanizmów wyszukiwarkowych. Nikt nie potrafi dzisiaj odpowiedzieć na pytanie jak będzie wyglądała i jakie funkcjonalności znajdą się w u ulubionej wyszukiwarce internautów za parę lat – dlatego warto obserwować trendy rynku.

Łukasz Bojanowski
Starszy Projektant Systemów Informatycznych