Показати простий запис статті
dc.contributor.author |
Ландэ, Д.В. |
|
dc.contributor.author |
Дармохвал, А.Т. |
|
dc.contributor.author |
Жигало, В.В. |
|
dc.date.accessioned |
2011-09-27T15:10:33Z |
|
dc.date.available |
2011-09-27T15:10:33Z |
|
dc.date.issued |
2009 |
|
dc.identifier.citation |
Матричные критерии качества выявления подобных документов в информационных потоках / Д.В. Ландэ, А.Т. Дармохвал, В.В. Жигало // Збірник наукових праць Інституту проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України. — К.: ІПМЕ ім. Г.Є. Пухова НАН України, 2009. — Вип. 53. — Бібліогр.: 13 назв. — рос. |
uk_UA |
dc.identifier.issn |
XXXX-0067 |
|
dc.identifier.uri |
http://dspace.nbuv.gov.ua/handle/123456789/27078 |
|
dc.description.abstract |
Новостные потоки информации, публикуемой на веб-сайтах сети Интернет, включают сообщения, важнейшие и интереснейшие из которых многократно дублируются (в виде перепечаток или содержательных
пересказов). Системы автоматического контент-мониторинга, сетевые информационно-поисковые системы содержат отдельные компоненты,
предназначенные для определения содержательного дублирования. При этом
проблема качества выявления подобных документов при использовании различных критериев является открытой научно-практической проблемой. В данной статье описываются критерии качества выявления подобных документов, основанные на анализе таких свойств так называемой матрицы
подобия, как симметричность и транзитивность. Ранее близкие по смыслу
критерии рассматривались авторами в работе [1], в настоящей статье представлены более точные и универсальные аналитические выражения для расчета этих критериев, а также приведены результаты экспериментов на
многоязычных текстовых корпусах, формируемых с помощью системы контент-мониторинга InfoStream. |
uk_UA |
dc.language.iso |
ru |
uk_UA |
dc.publisher |
Інститут проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України |
uk_UA |
dc.relation.ispartof |
Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України |
|
dc.title |
Матричные критерии качества выявления подобных документов в информационных потоках |
uk_UA |
dc.type |
Article |
uk_UA |
dc.status |
published earlier |
uk_UA |
dc.identifier.udc |
681.3 |
|
Файли у цій статті
Ця стаття з'являється у наступних колекціях
Показати простий запис статті