Каталог статей
47. Модели индексированного поиска
47. Модели индексированного поиска Существует несколько моделей индексированного поиска: векторная модель информационного потока; нечеткие множества; вероятностная модель. Представление документов и поиск информации в массиве в рамках векторной модели информационного потока разделим на две модели. Векторной будем называть модель описания информационного массива, а линейной - модель поиска информации в массиве. Такое разделение обусловлено тем, что документы представляются в виде двоичных векторов, в то время как поисковые запросы - это линейные преобразования над этими векторами. В векторной модели информационного потока можно выделить несколько основных понятий: словарь, документ, поток, процедуры поиска и коррекции запросов. Под словарем понимают упорядоченное множество терминов, мощность которого обозначают как D. Документ - это двоичный вектор размера D. Если термин входит в документ /, то в соответствующем разряде двоичного вектора проставляется 1, в противном же случае - 0. Обычно все операции в линейной модели выполняются над поисковыми образами документов, которые принято называть просто документами.. Информационный поток или массив L представляют в виде матрицы размерности nxD, где в качестве строк выступают поисковые образы i=l,...,n документов (рис): При таком рассмотрении можно сформулировать процедуру обращения к информационной системе следующим образом: L*q=r (1) где q - вектор запроса, г - вектор-отклик системы на запрос, * - операция умножения.
|
Категория: Интернет-технологии ГА | Добавил: mgtuga (28.12.2010)
|
Просмотров: 959
| Рейтинг: 0.0/0 |