Рассмотрены EM-алгоритм для задачи разделения смесей распределений, описанных цепями Маркова, и связанная с ней проблема максимизации взвешенного правдоподобия. Предложены вспомогательные алгоритмы для выбора начального приближения и оптимального числа компонентов смеси, а также метод аппроксимации смеси распределений на основе известных данных с помощью метода опорных векторов. Полученные результаты применены к задаче классификации фрагментов генов.
Розглянуто EM-алгоритм для задачі поділу сумішей ймовірнісних розподілів, які описуються ланцюжками Маркова, та пов’язану з нею проблему максимізації зваженої правдоподібності. Запропоновано допоміжні алгоритми для вибору початкового наближення та оптимального числа компонентів суміші, а також метод апроксимації суміші розподілів на основі відомих даних з використанням методу опорних векторів. Отримані результати застосовано до задачі класифікації фрагментів генів.
The EM algorithm is considered for the problem of separating probability distribution mixtures with components described by Markov chains, together with the related weighted log likelihood maximization problem. Auxiliary algorithms to select initial approximation and optimal mixture size are proposed, as well as a method for approximating the mixture with given data using support vector machines. The results are applied to boost the quality of gene fragment classifiers