Szemantikailag ellenőrzött kulcsszó-összesítések

2Ezek a közösségek létrehozása vagy azonosítása során figyelembe vehető különféle módszerek között úgy döntöttünk, hogy a kulcsszó-aggregátumok létrehozása alapján azokra összpontosítunk. A kulcsszavak csoportosítására szolgáló kifejezés általában a „klaszter” kifejezés. A "klaszter" fogalma mind a hálózat csomópontjaira, mind a hálózat tartószerkezetére utal. Esetünkben az összesítési folyamat, bár a kötéseket használja erőforrásként, egyszerű listát generál. Ezért preferáltuk az aggregátum kifejezést. Az aggregátumot Bayaly és Cunny (1986) definiálja, mint egy grafikonon logikusan összekapcsolt csomópontok halmazát.

3Az érdeklődésen alapuló felhasználói közösségek azonosítása érdekében javasoljuk, hogy az információkeresésből származó kulcsszavakat erős szemantikai következetességgel összesítsék aggregátumokba. A szemantikai konzisztencia alatt azt értjük, hogy a szavak egy csoportja képes a lehető legpontosabban lefedni egy tartomány területét. Ez a szavak felsorolása hasonló lehet ahhoz, amit a lexikológiában lexikális mezőnek neveznek. Mel'Cuk és mtsai. (1995) a lexikai mező következő meghatározását adja meg: "Egy szemantikai mező lexikális mezőjét azoknak a szavaknak nevezzük, amelyek alapvető lexikái ehhez a szemantikai mezőhöz tartoznak".

4Használatkor az új felhasználó által végzett információkeresés során használt kulcsszavakból (1) képesek leszünk (1) azonosítani a releváns közösségeket az így felépített összesítéseknek köszönhetően, hogy (2) közelebb hozzuk ezt a felhasználót a csatolt felhasználókhoz a legközelebbi közösségeket, és így (3) ezeken a közösségeken alapuló új szolgáltatásokat kínálnak.

6A kulcsszavak "csoportosulása" az elmúlt években számos kutatás tárgyát képezte mind az osztályozás (dokumentumok, lekérdezések, weboldalak stb.), Mind az információs kutatás területén. Amint azonban más előttünk álló szerzők rámutattak (Shingo és mtsai, 2006), az internetes felhasználói lekérdezési tevékenységek során használt kulcsszavak tanulmányozása a „kereskedelmi” keresőmotorokon (Google, Yahoo, Exalead…) keresztül nehéz, sőt szinte lehetetlen, egyszerűen azért, mert a szükséges erőforrásokat nem osztják szét, mert üzleti tevékenységük részét képezik (például: kulcsszavak viszonteladása). Valójában kevés olyan publikáció áll rendelkezésre a tanulmányról, vagy akár a kihasználásról, amelyet javasolni lehet az internetes keresőmotorokban használt kulcsszavakra. Mindazonáltal elkészítjük a munka korszerűségét, amely a kulcsszavak összesítését vizsgálta. Először megvitatjuk az internetes keresőmotorok kulcsszócsoportosításával kapcsolatos munkát. Ezt követően a szemantikailag homogén aggregátumok létrehozásával kapcsolatos munkára fogunk koncentrálni, amely inspirálta a munkánkat.

8 Más munkák, például (Cui és mtsai, 2002) és (Fonseca és mtsai, 2004) munkái megkísérlik kulcsszófürtök létrehozását azáltal, hogy a keresésben használt kulcsszavakat korrelálják a visszaküldött URL-ek (URL, cím, a html oldalon idézett kulcsszavak stb.), és az internet felhasználó választotta ki. Ez a módszer ugyanazokkal függ a keresőmotorok indexeitől, mint az előző. Ezenkívül ez a módszer felveti azt a problémát is, hogy a kereskedelmi internetes keresőmotorok relevánsak-e az eredmények sorrendjében, az előadás sorrendje erősen befolyásolja a felhasználó által javasolt webhely kiválasztását.