Наукова електронна бібліотека
періодичних видань НАН України

Матричные критерии качества выявления подобных документов в информационных потоках

Репозиторій DSpace/Manakin

Показати простий запис статті

dc.contributor.author Ландэ, Д.В.
dc.contributor.author Дармохвал, А.Т.
dc.contributor.author Жигало, В.В.
dc.date.accessioned 2011-09-27T15:10:33Z
dc.date.available 2011-09-27T15:10:33Z
dc.date.issued 2009
dc.identifier.citation Матричные критерии качества выявления подобных документов в информационных потоках / Д.В. Ландэ, А.Т. Дармохвал, В.В. Жигало // Збірник наукових праць Інституту проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України. — К.: ІПМЕ ім. Г.Є. Пухова НАН України, 2009. — Вип. 53. — Бібліогр.: 13 назв. — рос. uk_UA
dc.identifier.issn XXXX-0067
dc.identifier.uri http://dspace.nbuv.gov.ua/handle/123456789/27078
dc.description.abstract Новостные потоки информации, публикуемой на веб-сайтах сети Интернет, включают сообщения, важнейшие и интереснейшие из которых многократно дублируются (в виде перепечаток или содержательных пересказов). Системы автоматического контент-мониторинга, сетевые информационно-поисковые системы содержат отдельные компоненты, предназначенные для определения содержательного дублирования. При этом проблема качества выявления подобных документов при использовании различных критериев является открытой научно-практической проблемой. В данной статье описываются критерии качества выявления подобных документов, основанные на анализе таких свойств так называемой матрицы подобия, как симметричность и транзитивность. Ранее близкие по смыслу критерии рассматривались авторами в работе [1], в настоящей статье представлены более точные и универсальные аналитические выражения для расчета этих критериев, а также приведены результаты экспериментов на многоязычных текстовых корпусах, формируемых с помощью системы контент-мониторинга InfoStream. uk_UA
dc.language.iso ru uk_UA
dc.publisher Інститут проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України uk_UA
dc.relation.ispartof Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України
dc.title Матричные критерии качества выявления подобных документов в информационных потоках uk_UA
dc.type Article uk_UA
dc.status published earlier uk_UA
dc.identifier.udc 681.3


Файли у цій статті

Ця стаття з'являється у наступних колекціях

Показати простий запис статті

Пошук


Розширений пошук

Перегляд

Мій обліковий запис