IPS és... Az információ-visszakereső rendszerek célja és funkciói

Tartalom

Bemeneti adatfolyamok
Forrás Keresési objektumok
Külső források
Nézetek
Kereshető index
Lekérdezési fejlesztési szabályok és formális lekérdezések
A dokumentumokra mutató linkek kibontott készletei
Kimeneti adatfolyamok

Egy modern ember számára nehéz elképzelni élet nélkül Internet és szinte azonnali hozzáférés az információforrásokhoz. A felhasználó ritkán gondolkodik arról, hogyan történik a kívánt tartalom keresése a hálózaton. De nagyon érdekes.

Az információ-visszakereső rendszer (IPS) egy komplex szoftver-és hardverkomplexum, amely a felhasználó kérésére választja ki az információkat. Az információkat a szervereken digitális formában tárolják, mivel a könyvek korábban a könyvtár polcain voltak. A rendszer sok alrendszerből áll. Mindegyik elvégzi a feladatát a felhasználó kérésének feldolgozása során, valamint szöveges vagy audio formában információt szolgáltat neki. A modern IPS architektúrájának összetettsége (az információ-visszakereső rendszer rövidítése) a megoldandó feladatok sokaságának köszönhető. Egy fajta "fekete doboz": a bemenetnél-a kérés szövege, ami benne van, ismeretlen, a kimeneten-átfogó információ.

Bemeneti adatfolyamok

Az információkérések, amelyeket egy személy szöveges formában generál a modul képernyőjén, a keresőmotor által feldolgozott lekérdezések kis részét teszik ki. A keresési lekérdezések fő tömbjeit olyan robotok alkotják, amelyek elfogadják az emberi kérést, és többlépcsős keresést és felhasználói visszajelzéseket végeznek. Az információs keresőmotorok közé tartozik a jól ismert Google, "Yandex" és mások, akik naponta több millió kérést dolgoznak fel.

Forrás Keresési objektumok

A keresés szempontjából érdekes forrásobjektumok a következők: dokumentumok, felvételek, Videók, Képek stb. Az IPS-en kívül jönnek létre. Az információk tárolására és keresésére szolgáló általános rendszernek beépített bibliográfiai rendszerrel kell rendelkeznie - egyfajta katalógussal, amely lehetővé teszi bármilyen objektum keresését.

Az objektumok vagy azok digitális átalakulása "forrás a belépéshez" az IPS. Ezek közül a felhasználó által igényelt információk kerülnek kiválasztásra.

Külső források

Az információválasztás bemutatásához külső tudásforrásokat használnak. Ez az az információ, amelyet a felhasználó keres. A film címe, idézet a könyvből és még sok más. Számítógépes kereséshez ezeket az információkat algoritmikus nyelven lekérdezésre kell lefordítani. Az IP-kben ez a blokk használatával történik a lekérdezések létrehozásához, indexeléséhez és fejlesztéséhez.

Ideális esetben ez a három folyamat – reprezentáció, indexelés és lekérdezés fejlesztés-azonos tudásforrásokra támaszkodhat, de a gyakorlatban ez elérhetetlen.

Folyamatosan felül kell vizsgálni és frissíteni kell a tudásforrásokat, és a frissítésnek azonosnak és szinkronizálottnak kell lennie. A külső tudásforrás pedig mindig időrendben megelőzi annak használatát a keresőmotorokban egy lekérdezéshez, néha több évvel.

Nézetek

A forrásobjektumok ábrázolása bemeneti adatokból áll, valamilyen kombinációban, vagy egy adott információ szabályainak és algoritmusainak megfelelően átalakítva-keresőmotor.

A nézetek az eredeti keresési objektum többé-kevésbé átalakított példányai. A szerkesztetlen teljes szövegek gyűjteményében, minden szöveg saját ábrázolása. A múzeumi tárgyak tárgyainak gyűjteményében a reprezentáció egy objektum átalakított leírása lehet a képével. Bizonyos esetekben az ábrázolás részben a forrásobjektumból, részben a leírásból származhat: a bibliográfiai Keresési rendszerekben az ábrázolások az objektumból származnak – például a cím, a szerző neve kombinálódik a mű kommentárjával.

Kereshető index

Mivel az információs keresőmotorokban szereplő információkat prezentáció formájában tárolják, logikus feltételezni, hogy a keresést a prezentáció szerint, a felhasználó számára történő kiválasztás után hajtják végre. A gyakorlatban ez nem így van. Például a hálózati könyvtárak aktuális könyvtárai általában több mezővel korlátozzák a keresést: szerző, cím és alcímek egy olyan nézetben, amely más, nem keresett mezőket tartalmaz. Ez elegendő ok arra, hogy különbséget tegyünk egy nézet és egy kereshető index között, amely a nézet Keresési része. Mindent meghatároz, ennek kellene legyen elérhető a kereséshez. A kereshető indexek, mint egy reprezentáció és egy forrásobjektum, külön alindexekre oszthatók, hogy pontosabb, célzottabb keresést biztosítsanak

A keresőmotorok általában szintetikus szerkezettel rendelkeznek az érvényes keresési eredmények összehasonlításához. Ez a szerkezet a kereshető index második összetevője.

Eljárási szempontból az indexelési folyamat különböző módon valósítható meg: a keresésre rendelkezésre álló indexet a következők szerezhetik be:

kereshető nézet szó szerinti másolata;
a nézet részleteinek másolásával. Ez lehet azoknak a nézeteknek a része vagy egésze, amelyek fizikailag csak töredékek formájában léteznek, a keresési index létrehozásának szabályai szerint elosztva, amelyet szükség esetén összegyűjtenek.

Lekérdezési fejlesztési szabályok és formális lekérdezések

A lekérdezésfejlesztés egy olyan funkció, amely közvetít a felhasználói kérés és a hivatalos kérés között. Átalakítja a felhasználó lekérdezését úgy, hogy megfelelteti az extrakciós parancsok szótáraival, az index specifikációval és az extrakció előtti indexszel. Az IPS fejlesztésének hajnalán ezt a szerepet hagyományosan képzett informatikai szakemberekhez rendelték.

Gyakran hivatkoznak olyan számítógépes lekérdezések fejlesztésére, amelyek a szótár lekérdezéseit egy kereshető rendszerindexhez illeszthetik "hogy a szótár bejegyzés modul". A funkció automatizálása ígéretes, és lehetőséget kínál szakértői és valószínűségi Keresési módszerekre.

A hivatalos kérés a felhasználó kérésének átalakítása után válik ilyenné. Az ilyen formális transzformációk példái közé tartozik a csonkolás, a szubsztitúció, a normalizálás, a vektorizációés más transzformációk "külső" képviselet "belső" számítógépes IP-k ábrázolása (dekódoló-információ-visszakereső rendszer).

A dokumentumokra mutató linkek kibontott készletei

Az eredményül kapott információforrások logikusan az ábrázolások egy részhalmaza, amelyet a kereshető index által a hivatalos lekérdezésre alkalmazott illesztési szabályok szerint hoztak létre.

Általában, de nem feltétlenül, külön folyamat van a helyreállított információkészlet rendezésére. Az Online könyvtári katalógusok a megjelenítés előtt általában a szerző betűrendben rendezi át a kapott készleteket. A szigorú rangsorolást eredményező információ-visszakereső rendszerekben a rangsor sorrendje megelőzi az újrarendezést.

Kimeneti adatfolyamok

A keresési eredmények kimenete hagyományosan a kijelzőn történik, gyakrabban olyan objektumok formájában, amelyeket máshol vagy más célokra használnak, befejezi a fő keresési ciklust.Az ilyen adatfolyamok irányíthatók vizualizációs eszközökre, tárolhatók későbbi feldolgozásra, vagy bemeneti adatfolyamként használhatók más kiválasztási szolgáltatásokhoz.

Az információ-visszakereső rendszerek lehetővé teszik, hogy visszajelzést adjon bármely kiválasztási folyamat kimenetéről. Bármely folyamat kimenete visszajelzés lehet más folyamatoktól. Visszajelzés nyújthat az alapja szakértői vélemény bármely szakaszban.