В статье рассматривается алгоритм ранжирования генов, полученных с использованием технологии
микрочипов. Вектор рангов рассчитывается путем проведения классификаций случайных выборок из
анализируемого набора данных. На каждой последующей итерации алгоритма ранг генов, участвующих в
успешной классификации, повышается. В отличие от ранее используемых подходов, алгоритм позволяет
повысить обобщающие свойства классификационных моделей за счет построения сбалансированных
обучающих выборок, а также учесть информативность комбинации генов путем оценки их подмножеств.
У статті розглядається алгоритм ранжирування генів, отриманих з використанням технології мікрочіпів.
Вектор рангів розраховується шляхом проведення класифікацій випадкових вибірок з аналізованого
набору даних. На кожній подальшій ітерації алгоритму ранг генів, що беруть участь в успішній класифікації,
підвищується. На відміну від раніше використовуваних підходів алгоритм дозволяє підвищити уза-
гальнювальні властивості класифікаційних моделей за рахунок побудови збалансованих навчальних
вибірок, а також врахувати інформативність комбінації генів шляхом оцінки їх підмножин.
The article considers the gene ranking algorithm for the microarray data. The rank vector is estimated by
classifications of the random data samples. At each iteration the ranks of genes participating in the successful
classification become higher. Unlike other methods of feature selection the proposed algorithm allows to increase the
generality of the classification models by the construction of the balanced training samples and to take into account
the descriptiveness of the gene combinations by the subsets estimation.