Основные модели поиска текстовой информации. Оценка качества документальных информационно-поисковых систем.

Поиск текстовой информацииМодель поиска характеризуется следующими параметрами:Представление документов и запросов; Критерий смыслового соответствия; Методы ранжирования результатов запросов; Механизм обратной связи для оценки релевантности документов. Для представления документов и запросов применяется сразу несколько моделейМодели представления документов и запросов:БулевамодельВ этом случае документ представляется с помощью набора терминов, присутствующих в индексе. Каждый термин представлен как булева переменнаяПространственно-векторная модель(предложена Солтоном в 1975 г.). Документы в этом случае представляют собой набор векторов в n-мерном пространстве. Пространство содержит nбазисных нормализованных векторов. Значение первого компонента вектора определяет вес термина. Запрос также представляется n-мерным вектором. Показатель соответствия (релевантности) определяется скалярным произведением вектора запроса на вектор документа.Векторные модели. Данная модель требует определения вероятности вхождения термина в документ, что, как правило, связано с дополнительными затратами.Обратная связь с пользователем ДИПСВ отличие от баз данных в ДИПС нет четкого представления документов и запросов пользователей, поэтому пользователь постепенно уточняет запросы методом итераций. Обратная связь позволяет оценивать релевантность документов, найденных по первоначальному запросу. В векторной модели множество документов считается релевантным, если оно образует положительную обратную связь, и нерелевантным — если отрицательнуюОценкакачества ДИПС.В любой ДИПС присутствуют два типа ошибок:Пропуск цели, т.е. невыдача релевантных документов; Шум — выдача нерелевантных документов. Существуют следующие показатели эффективности ДИПС:Коэффициентполноты — доля выданных релевантных документов среди всех релевантных документовКоэффициентточности — доля выданных релевантных документов ко всем выданнымКоэффициент шума — доля выданных нерелевантных документов ко всем выданнымКоэффициентосадки — доля выданных нерелевантных документов ко всем нерелевантнымКоэффициентспецифичности — доля не выданных нерелевантных ко всем нерелевантным

Компьютерные сети. Назначение, классификация, характерные особенности. Основные топологии компьютерных сетей их достоинства и недостатки. Способы коммутации и передачи данных в компьютерных сетях. Сетевое программное обеспечение.

Компьютерная сеть (вычислительная сеть, сеть передачи данных) — система связи компьютеров и/или компьютерного оборудования (серверы, маршрутизаторы и другое оборудование). Для передачи информации могут быть использованы различные физические явления, как правило — различные виды электрических сигналов, световых сигналов или электромагнитного излучения. По назначению компьютерные сети распределяются: вычислительные, информационные, смешанные

Вычислительные сети предназначены главным образом для решения заданий пользователей с обменом данными между их абонентами.
Информационные сети ориентированы в основном на предоставление информационных услуг пользователям.
Смешанные сети совмещают функции первых двух.

Для классификации компьютерных сетей используются разные признаки, выбор которых заключается в том, чтобы выделить из существующего многообразия такие, которые позволили бы обеспечить данной классификационной схеме такие обязательные качества:

  • возможность классификации всех, как существующих, так и перспективных, компьютерных сетей;
  • дифференциацию существенно разных сетей;
  • однозначность классификации любой компьютерной сети;
  • наглядность, простоту и практическую целесообразность классификационной схемы.

Определенное несоответствие этих требований делает задание по выбору рациональной схемы классификации компьютерной сети достаточно сложной, такой, которая не нашла до этого времени однозначного решения. В основном компьютерные сети классифицируют по признакам структурной и функциональной организации.

Основные топологии компьютерных сетей: шина,кольцо, двойное кольцо,звезда,решетка,дерево.

Звезда — базовая топологиякомпьютерной сети, в которой все компьютеры сети присоединены к центральному узлу (обычно сетевой концентратор), образуя физический сегмент сети. Достоинства:выход из строя одной рабочей станции не отражается на работе всей сети в целом; хорошая масштабируемость сети; лёгкий поиск неисправностей и обрывов в сети; высокая производительность сети (при условии правильного проектирования);,гибкие возможности администрирования. Недостатки: выход из строя центрального концентратора обернётся неработоспособностью сети (или сегмента сети) в целом; для прокладки сети зачастую требуется больше кабеля, чем для большинства других топологий; конечное число рабочих станций в сети (или сегменте сети) ограничено количеством портов в центральном концентраторе.

Топология типа общая шина, представляет собой общий кабель (называемый шина или магистраль), к которому подсоединены все рабочие станции. На концах кабеля находятся терминаторы, для предотвращения отражения сигнала. Типичная шинная топология имеет простую структуру кабельной системы с короткими отрезками кабелей. Поэтому по сравнению с другими топологиями стоимость ее реализации невелика. Однако низкая стоимость реализации компенсируется высокой стоимостью управления. Фактически, самым большим недостатком шинной топологии является то, что диагностика ошибок и изолирование сетевых проблем могут быть довольно сложными, поскольку здесь имеются несколько точек концентрации. Так как среда передачи данных не проходит через узлы, подключенные к сети, потеря работоспособности одного из устройств никак не сказывается на других устройствах. Хотя использование всего лишь одного кабеля может рассматриваться как достоинство шинной топологии, однако оно компенсируется тем фактом, что кабель, используемый в этом типе топологии, может стать критической точкой отказа. Другими словами, если шина обрывается, то ни одно из подключенных к ней устройств не сможет передавать сигналы.

Кольцо — это топология, в которой каждый компьютер соединен линиями связи только с двумя другими: от одного он только получает информацию, а другому только передает. На каждой линии связи, как и в случае звезды, работает только один передатчик и один приемник.Достоинства:Простота установки; Практически полное отсутствие дополнительного оборудования; Возможность устойчивой работы без существенного падения скорости передачи данных при интенсивной загрузке сети, поскольку использование маркера исключает возможность возникновения коллизий.

Недостатки: Выход из строя одной рабочей станции, и другие неполадки (обрыв кабеля), отражаются на работоспособности всей сети; Сложность конфигурирования и настройки; Сложность поиска неисправностей

Коммута́ция — процесс соединения абонентов коммуникационной сети через транзитные узлы.Коммуникационные сети должны обеспечивать связь своих абонентов между собой. Абонентами могут выступать ЭВМ, сегменты локальных сетей, факс-аппараты или телефонные собеседники. Как правило, в сетях общего доступа невозможно предоставить каждой паре абонентов собственную физическую линию связи, которой они могли бы монопольно «владеть» и использовать в любое время. Поэтому в сети всегда применяется какой-либо способ коммутации абонентов, который обеспечивает разделение имеющихся физических каналов между несколькими сеансами связи и между абонентами сети. Передача информации между компьютерами существует с самого момента возникновения ЭВМ. Она позволяет организовать совместную работу отдельных компьютеров, решать одну задачу с помощью нескольких компьютеров, совместно использовать ресурсы и решать множество других проблем. По методу передачи информации различают сети с коммутацией каналов, сообщений, пакетов и со смешанной коммутацией. Чаще используются сети с коммутацией пакетов

Сетевое программное обеспечение предназначено для организации совместной работы группы пользователей на разных компьютерах. Позволяет организовать общую файловую структуру, общие базы данных, доступные каждому члену группы. Обеспечивает возможность передачи сообщений и работы над общими проектами, возможность разделения ресурсов.

Наши рекомендации