Предложена схема моделирования цепочки ДНК как последовательности блоков нуклеотидов. Показано, что такая модель более адекватно описывает наблюдаемые частоты встречаемости локальных зеркальных гомопурин-гомопиримидиновых повторов, нежели марковская однородная модель второго порядка. Описывается методика оценки статистической значимости встречаемости в ДНК некоторых сложных сочетаний нуклеотидов.
Запропоновано схему моделювання ланцюжка ДНК як послідовності блоків нуклеотидів. Показано, що така модель адекватніше описує спостережувані частоти зустрічальності локальних дзеркальних гомопурин- гомопіримідинових повторів, ніж марковська однорідна модель другого порядку. Описано методику оцінки статистичної значущості зустрічальності в ДНК деяких складних поєднань нуклеотидів.
A scheme for modeling of the DNA chain as a sequence of the nucleotide runs of different length is presented. The advantages of such a method and range of its application are discussed. A procedure is suggested to estimate statistical significance of occurrence of some complex sequence structures in DNA by the Monte-Carlo method. It uses a bootstrap algorithm and necessitates comparatively small number of calculations. Three different models, used to derive such estimations of the frequencies of homopurine-homopyrimidine mirror repeats in the DNA of phage K and rodentia noncoding regions are compared.