Информационни ресурси

© Христо Тужаров, 2012    

ИНФОРМАЦИОННО ТЪРСЕНЕ

 

• Home • Съдържание • Консултации • Асеневци •

 

ХАРАКТЕРИСТИКИ ИНФОРМАЦИОННИ РЕСУРСИ

СЪЗДАВАНЕ ИНФОРМАЦИОННИ РЕСУРСИ

СЪХРАНЯВАНЕ ИНФОРМАЦИОННИ РЕСУРСИ

ИНФОРМАЦИОННО ТЪРСЕНЕ

ТЪРСЕНЕ ИНФОРМАЦИОННИ РЕСУРСИ

ИЗПОЛЗВАНЕ ИНФОРМАЦИОННИ РЕСУРСИ

СЪДЪРЖАНИЕ  ИНФОРМАЦИОНЕН РЕСУРС  

ОЦЕНКА ИНФОРМАЦИОННИ РЕСУРСИ

 

Информационно търсене (Information retrieval)

Голяма интердисциплинарна област  на науката, намираща се между информатиката, компютърната лингвистика, когнитивната психология, библиотечното дело и статистиката.

 

 

Информационно търсене

 

 

Информационното търсене се явява процес на откриване в информационен  масив на записи, удовлетворяващи предварително определени условия на търсенето или запитването.

 

Предмет на информационното търсене

  • Търсене на документи;

  • Търсене на информация в документи;

  • Извличане на метаданни от документи;

  • Търсенe на текст, изображения, звук и видео;

в бази данни и Интернет.

 

Процесът на търсене включва последователност от оперции, насочени към събиране, обработка и предоставяне на информация.

 

Етапи на информационно търсене

В най-общ случай търсенето на информация се състои от четири етапа на информационно търсене:

 

Етапи на информационно търсене

 

       Запитване

Формализиран начин за изразяване на информационни потребности от потребителите на съответната система.

 

Процесът на извличане на информация започва с въвеждането от потребителя на заявка към системата. Заявките са формални описания на информационната потребност, например низ въведен в полето на търсачката.

 

За изразяване на информационните потребности се използва език на  запитване (оператори) , синтаксиса, на който варира за различните търсещи системи.

 

Всички търсещи системи позволяват въвеждането на запитване да се извършва на естествен език.

 

       Намиране на източници

Определяне на обектите  на запитване,  които  с различни степени на релевантност удовлетворяват съответните информационни потребности.

 

                   Обект на запитване – запис, който съхранява определен обем от информация в базата данни, като в зависимост от приложението, обектът може да е текстов, графичен, аудио- или видео документ. Процесът на въвеждане на обекта на запитване се нарича индексация.

 

        Извличане на информация

Извличане на информация от откритите  обекти на запитване. Повечето системи за извличане на информация изчисляват числов коефициент на релевантност на всеки от обектите на запитване. и аранжират (подреждат в намаляващ ред) така оценените обекти според техния коефициент.

 

        Предоставяне и оценка на резултатите

Най-високо аранжираните обекти по време на извличане на информация са тези, които се връщат, като резултат на потребителя.

 

Съществуват различни техники за измерване и оценка на тези резултати.

 

                     Точността на оценяване (Precision) е отношението на броя извлечени документи, които са релевантни на информационната потребност на потребителя, към общия брой извлечени документи.

 

Процесът на предоставяне и оценка може да претърпи и повече от една итерация, ако потребителят не е удовлетворен от резултата и желае да прецизира заявката си.

 

Показатели за оценка на информационното търсене

  • Наличност / Достъпност на данните (Availability)

  • Пълнота на данните (Completeness) — параметър, измерващ съществуването или отсъствието на данни.

  • Съгласуваност на данни (Consistency) — Съгласувани данни са тези, които при възможно наличие на дублиране на данни, те са с еднакво и налично съдържание.

  • Релевантност / Съответност на данни (Relevance) — Този показател изисква стойностите на данни те да попадат в приемлив обсег или да са от определена типизирана съвкупност.

  • Навременност / Свежест на данни (Timeliness/Freshness) — Този параметър използва времето за записване на данните и времето, когато данните   се смятат актуални. Разликата между тези времена би показала дали данните са свежи