Рассмотрена задача выбора оптимального порядка скрытой марковской модели для распознавания функциональных фрагментов генов. Предложены четыре статистических критерия определения оптимального порядка на основе отношения правдоподобия, эргодического свойства, марковского свойства и информационного критерия Акаике. Подтверждена эффективность использования для решения рассматриваемой задачи байесовских смесей марковских моделей с помощью статистических критериев определено оптимальное количество компонент смеси.
Розглянуто задачу вибору оптимального порядку прихованої марковської моделі для розпізнавання функціональних фрагментів генів. Запропоновано чотири статистичних критерії для визначення оптимального порядку: на основі відношення правдоподібності, ергодичної властивості, марковської властивості та інформаційного критерію Акаіке. Підтверджено ефективність застосування для розв’язання розглянутої задачі байесівських сумішей марковських моделей за допомогою статистичних критеріїв визначено оптимальну кількість компонент у суміші.
We analyze the problem of choosing the optimal order of the hidden Markov model for recognizing functional gene fragments. We propose four statistical criteria to determine the optimal order, which are based on likelihood ratio test, ergodicity, Markov property, and Akaike’s information criterion. Additionally, we confirm the efficiency of Bayesian mixtures of Markov models for solving the problem in question and determine the optimal mixture size using statistical criteria.