IPS er Formålet med og funktionerne for informationssøgningssystemer

Indholdsfortegnelse:

IPS er Formålet med og funktionerne for informationssøgningssystemer
IPS er Formålet med og funktionerne for informationssøgningssystemer

Video: IPS er Formålet med og funktionerne for informationssøgningssystemer

Video: IPS er Formålet med og funktionerne for informationssøgningssystemer
Video: РЭРЗ | Ростовский электровозоремонтный завод (ГК «ЛокоТех») 2024, April
Anonim

Det er svært for et moderne menneske at forestille sig livet uden internettet og næsten øjeblikkelig adgang til informationskilder. Brugeren tænker sjældent over, hvordan søgningen efter det ønskede indhold på netværket udføres. Men det er meget interessant.

Et informationshentningssystem (IPS) er et komplekst software- og hardwaresystem, der udvælger information efter brugerens anmodning. Oplysninger gemmes på servere i digital form, som bøger plejede at stå på bibliotekernes hylder. Systemet består af mange delsystemer. Hver udfører sin opgave i processen med at behandle brugerens anmodning og give ham information i tekst eller lydform. Mangfoldigheden af opgaver, der skal løses, bestemmer kompleksiteten af arkitekturen i moderne informationssøgningssystemer (en forkortelse af informationssøgningssystemet). En slags "sort boks": ved input - teksten i anmodningen, hvad der er indeni - er ukendt, ved output - omfattende information.

Kortfil i det virkelige liv
Kortfil i det virkelige liv

Inputstreams

Anmodninger om oplysninger, som en person danner i tekstform på skærmen på sin gadget,udgør en lille del af de anmodninger, der behandles af søgemaskinen. De vigtigste arrays af søgeforespørgsler er dannet af robotter, der accepterer en menneskelig anmodning og udfører en søgning i flere trin og feedback med brugeren. Informationssøgningssystemer omfatter velkendte Google, Yandex og andre, der behandler millioner af anmodninger dagligt.

Kildesøgeobjekter

Sættet af indledende objekter af interesse for søgningen er dokumenter, optegnelser, videoer, billeder og mere. De er oprettet uden for IPS. Det generelle informationslagrings- og genfindingssystem bør have et indbygget bibliografisk system - en slags katalog, der giver dig mulighed for at søge efter enhver form for objekter.

Objekter eller deres digitale transformationer bliver en "indgangsressource" til IPS. Det er blandt dem, at den information, brugeren har brug for, udvælges.

Søg efter information
Søg efter information

Eksterne kilder

Visning af informationsvalg bruger eksterne videnkilder. Dette er den information, brugeren leder efter. Filmens titel, et citat fra bogen og meget mere. For en computersøgning skal denne information oversættes til en forespørgsel i et algoritmisk sprog. I IPS'en gøres dette ved at bruge blokken til at oprette, indeksere og udvikle forespørgsler.

Ideelt set bør disse tre processer – repræsentation, indeksering og forespørgselsudvikling – være afhængig af identiske videnskilder, men i praksis er dette ikke muligt.

Videnkilder bør konstant gennemgås og opdateres, og opdateringen skal være identisk ogsynkroniseret. Og en ekstern videnskilde går altid kronologisk forud for dens brug i søgemaskiner til en forespørgsel, nogle gange flere år.

Informationssøgningssystem
Informationssøgningssystem

Performances

Repræsentationer af de originale objekter består af inputdata i en eller anden kombination eller transformeret i overensstemmelse med reglerne og algoritmerne for et bestemt informationshentningssystem.

Visninger er mere eller mindre transformerede kopier af det originale søgeobjekt. I samlingen af uredigerede fuldtekster er hver tekst sin egen repræsentation. I samlingen af genstande af museumsudstillinger og artefakter kan repræsentationen være en transformeret beskrivelse af genstanden med dens billede. I nogle tilfælde kan repræsentationen være dels afledt af det originale objekt og dels fra beskrivelsen: i bibliografiske søgemaskiner afledes repræsentationer fra objektet - for eksempel vil titel, forfatterens navn blive kombineret med annotationen af værket.

At finde det, du har brug for
At finde det, du har brug for

Søgbart indeks

Da information i informationssøgningssystemer lagres i form af en repræsentation, er det logisk at antage, at søgningen udføres i overensstemmelse med repræsentationen og, efter valg, gives til brugeren. I praksis er dette ikke tilfældet. For eksempel begrænser de nuværende onlinebibliotekskataloger typisk søgninger til nogle få felter: forfatter, titel og undertekster i en visning, der indeholder andre felter, der ikke søges efter. Dette er tilstrækkelig grund til, at det er nødvendigt at skelneen visning og et søgbart indeks, som er søgedelen af visningen. Den definerer alt, der skal være søgbart. Et søgbart indeks, som visningen og kildeobjektet, kan opdeles i separate underindekser for at give mere præcise, målrettede søgninger

Søgemaskiner har norm alt en syntetisk struktur internt til at matche gyldige søgeresultater. Denne struktur er den anden komponent i det søgbare indeks.

Procedurmæssigt kan indekseringsprocessen implementeres på forskellige måder: et søgbart indeks kan fås ved:

  • bogstaveligt kopiering af en søgbar repræsentation;
  • ved at kopiere visningsdetaljerne. Dette kan være en del af eller alle de visninger, der fysisk kun eksisterer som fragmenter, fordelt i henhold til reglerne for oprettelse af et indeks til søgning, som vil blive indsamlet, når det er nødvendigt.
Søgestyring
Søgestyring

Request design-regler og formelle anmodninger

Query engineering er en funktion, der formidler mellem en brugerforespørgsel og en formel forespørgsel. Den transformerer brugerens forespørgsel og matcher den med ordbøgerne for hentning af kommandoer, indeksspecifikation og indeks før hentning. I begyndelsen af udviklingen af IPS blev denne rolle traditionelt tildelt kvalificerede it-specialister.

Udvikling af computerforespørgsler, der kan matche ordbogsforespørgsler til et søgbart indekssystem, omtales almindeligvis som "ordbogsinput"-modulet. Automatisering af denne funktion er lovende og giver muligheder for ekspert- og probabilistiske søgemetoder.

En formel anmodning bliver en formel anmodning, efter at brugerens anmodning er blevet konverteret. Eksempler på sådanne formelle transformationer omfatter trunkering, substitution, normalisering, vektorisering og andre transformationer af den "ydre" repræsentation til de "interne" repræsentationer af computer IPS (dekryptering - informationshentningssystem).

Udpakkede dokumentlinksæt

Det resulterende sæt af informationskilder er logisk set en delmængde af de visninger, der er skabt af de matchende regler, der anvendes på den formelle forespørgsel af et søgbart indeks.

Norm alt, men ikke nødvendigvis, er der en separat sorteringsproces for det gendannede sæt af oplysninger. Online bibliotekskataloger omarrangerer norm alt modtagne sæt alfabetisk efter forfatter, før de vises. I informationssøgningssystemer, der producerer strenge rangeringer, går rangorden forud for enhver genbestilling.

Dataanalyse
Dataanalyse

Outputstreams

Output af søgeresultater udføres traditionelt på displayet, oftere i form af en strøm af objekter, der skal bruges andre steder eller til et andet formål, fuldender hovedsøgningssløjfen. Sådanne strømme kan sendes til visualiseringsenheder, lager til yderligere behandling eller brug som input-streams til andre udvalgstjenester.

Informationshentningssystemer tillader feedback fraresultatet af enhver udvælgelsesproces. Outputtet af enhver proces kan være feedback til andre processer. Feedback kan danne grundlag for ekspertvurderinger på ethvert tidspunkt.

Anbefalede: