IPS je Svrha i funkcije sustava za pronalaženje informacija
IPS je Svrha i funkcije sustava za pronalaženje informacija

Video: IPS je Svrha i funkcije sustava za pronalaženje informacija

Video: IPS je Svrha i funkcije sustava za pronalaženje informacija
Video: Šta je SEO, kako biti prvi na Googleu i zaraditi? | SEO KURS 1/33 2024, Travanj
Anonim

Suvremenoj osobi je teško zamisliti život bez interneta i gotovo trenutnog pristupa izvorima informacija. Korisnik rijetko razmišlja o tome kako se vrši potraga za željenim sadržajem na mreži. Ali ovo je vrlo zanimljivo.

Sustav za pronalaženje informacija (IPS) je složen softverski i hardverski sustav koji odabire informacije na zahtjev korisnika. Informacije se pohranjuju na poslužiteljima u digitalnom obliku, kao što su se knjige nekada nalazile na policama knjižnica. Sustav se sastoji od mnogih podsustava. Svaki obavlja svoju zadaću u procesu obrade zahtjeva korisnika i pružanja informacija u tekstualnom ili zvučnom obliku. Višestrukost zadataka koje treba riješiti određuje složenost arhitekture suvremenih sustava za pronalaženje informacija (kratica od sustava za pronalaženje informacija). Neka vrsta "crne kutije": na ulazu - tekst zahtjeva, što je unutra - nepoznato, na izlazu - sveobuhvatne informacije.

Kartoteka u stvarnom životu
Kartoteka u stvarnom životu

Ulazni tokovi

Zahtjevi za informacijama koje osoba oblikuje u tekstualnom obliku na zaslonu svog gadgeta,čine mali dio zahtjeva koje obrađuje tražilica. Glavne nizove upita za pretraživanje tvore roboti koji prihvaćaju ljudski zahtjev i izvode pretragu u više koraka i povratnu informaciju s korisnikom. Sustavi za pronalaženje informacija uključuju dobro poznati Google, Yandex i druge, koji svakodnevno obrađuju milijune zahtjeva.

Objekti pretraživanja izvora

Skup početnih objekata od interesa za pretraživanje su dokumenti, zapisi, videozapisi, slike i još mnogo toga. Nastaju izvan IPS-a. Opći sustav za pohranu i pronalaženje informacija trebao bi imati ugrađeni bibliografski sustav - svojevrsni katalog koji vam omogućuje pretraživanje bilo koje vrste objekata.

Objekti ili njihove digitalne transformacije postaju "ulazni resurs" u IPS. Među njima se odabiru informacije koje su korisniku potrebne.

Potražite informacije
Potražite informacije

Vanjski izvori

Prikaz odabira informacija koristi vanjske izvore znanja. Ovo su informacije koje korisnik traži. Naslov filma, citat iz knjige i još mnogo toga. Za pretraživanje računala, ove informacije moraju biti prevedene u upit na algoritamskom jeziku. U IPS-u se to radi pomoću bloka za kreiranje, indeksiranje i razvoj upita.

U idealnom slučaju, ova tri procesa – predstavljanje, indeksiranje i razvoj upita – trebala bi se oslanjati na identične izvore znanja, ali u praksi to nije ostvarivo.

Izvore znanja treba stalno pregledavati i ažurirati, a ažuriranje treba biti identično isinkronizirano. A vanjski izvor znanja uvijek kronološki prethodi njegovoj upotrebi u tražilicama za upit, ponekad i za nekoliko godina.

Sustav za pronalaženje informacija
Sustav za pronalaženje informacija

nastupi

Reprezentacije izvornih objekata sastoje se od ulaznih podataka u nekoj kombinaciji ili se transformiraju u skladu s pravilima i algoritmima određenog sustava za pronalaženje informacija.

Pregledi su manje-više transformirane kopije izvornog objekta pretraživanja. U zbirci neuređenih cjelovitih tekstova svaki je tekst svoj vlastiti prikaz. U zbirci predmeta muzejskih eksponata i artefakata prikaz može biti transformirani opis predmeta s njegovom slikom. U nekim slučajevima, prikaz može biti djelomično izveden iz izvornog objekta, a dijelom iz opisa: u bibliografskim tražilicama, prikazi su izvedeni iz objekta - na primjer, naslov, ime autora će se kombinirati s napomenom o djelu.

Pronalaženje onoga što vam treba
Pronalaženje onoga što vam treba

Indeks koji se može pretraživati

Budući da se informacije u sustavima za pronalaženje informacija pohranjuju u obliku prikaza, logično je pretpostaviti da se pretraživanje provodi prema prikazu i da se nakon odabira daje korisniku. U praksi to nije slučaj. Na primjer, trenutni katalozi online knjižnica obično ograničavaju pretraživanja na nekoliko polja: autor, naslov i podnaslovi unutar pogleda koji sadrži druga polja koja se ne pretražuju. To je dovoljan razlog zašto je potrebno razlikovatiprikaz i indeks koji se može pretraživati, koji je dio pogleda za pretraživanje. Definira sve što bi trebalo biti pretraživo. Indeks koji se može pretraživati, poput prikaza i izvornog objekta, može se podijeliti u zasebne podindekse kako bi se pružila preciznija, ciljana pretraživanja

Tražilice obično imaju internu sintetičku strukturu za podudaranje valjanih rezultata pretraživanja. Ova struktura je druga komponenta indeksa koji se može pretraživati.

Proceduralno, proces indeksiranja može se implementirati na različite načine: indeks koji se može pretraživati može se dobiti na:

  • doslovno kopiranje pretraživanog prikaza;
  • kopiranjem pojedinosti prikaza. To može biti dio ili svi pogledi koji fizički postoje samo kao fragmenti, raspoređeni u skladu s pravilima za kreiranje indeksa za pretraživanje, koji će se prikupljati po potrebi.
Upravljanje pretraživanjem
Upravljanje pretraživanjem

Zahtjev za pravila dizajna i formalne zahtjeve

Inženjering upita je funkcija koja posreduje između upita korisnika i formalnog upita. On transformira korisnički upit, uparujući ga s rječnicima naredbi za dohvaćanje, specifikacijom indeksa i indeksom prije dohvaćanja. U zoru razvoja IPS-a, ova je uloga tradicionalno bila dodijeljena kvalificiranim IT stručnjacima.

Razvoj računalnih upita koji se mogu podudarati s rječničkim upitima u sustav indeksa koji se može pretraživati obično se naziva modulom "unosa rječnika". Automatizacija ove funkcije obećava i nudi mogućnosti za stručne i probabilističke metode pretraživanja.

Službeni zahtjev postaje formalni zahtjev nakon što se korisnikov zahtjev pretvori. Primjeri takvih formalnih transformacija uključuju skraćivanje, supstituciju, normalizaciju, vektorizaciju i druge transformacije "vanjske" reprezentacije u "unutarnje" reprezentacije računalnog IPS-a (dešifriranje - sustav za pronalaženje informacija).

Izdvojeni skupovi veza za dokument

Rezultirajući skup izvora informacija logično je podskup pogleda stvorenih podudarnim pravilima primijenjenim na formalni upit pomoću indeksa koji se može pretraživati.

Obično, ali ne nužno, postoji poseban proces razvrstavanja za oporavljeni skup informacija. Online knjižnični katalozi obično mijenjaju redoslijed primljenih skupova abecednim redom po autoru prije prikazivanja. U sustavima za pronalaženje informacija koji proizvode striktno rangiranje, redoslijed poretka prethodi svakom ponovnom redoslijedu.

Analiza podataka
Analiza podataka

Izlazni tokovi

Izlaz rezultata pretraživanja vrši se tradicionalno na zaslonu, češće u obliku niza objekata koji se koriste negdje drugdje ili u neku drugu svrhu, dovršava glavnu petlju pretraživanja. Takvi se tokovi mogu poslati na uređaje za vizualizaciju, pohrana za daljnju obradu ili korištenje kao ulazni tokovi za druge usluge odabira.

Sustavi za pronalaženje informacija omogućuju povratne informacije odrezultat bilo kojeg procesa selekcije. Rezultat bilo kojeg procesa može biti povratna informacija drugim procesima. Povratne informacije mogu pružiti osnovu za stručnu procjenu u bilo kojoj fazi.

Preporučeni: