Научный журнал

ISSN 1814-2400

ИНФОРМАТИКА И СИСТЕМЫ УПРАВЛЕНИЯ

Безруков Н. С., Полянская Е. В.

СПОСОБ ПОСТРОЕНИЯ МОДЕЛИ КЛАСТЕРИЗАЦИИ ДАННЫХ НА ПРИМЕРЕ ДЕМОГРАФИЧЕСКИХ ПОКАЗАТЕЛЕЙ РЕГИОНОВ ДФО

Рассматривается задача построения модели классификации регионов ДФО по демографическим данным с помощью алгоритмов машинного обучения – метод стохастических вложений соседей с t-распределением, метод К-средних и самоорганизующиеся сети. Для демографических показателей построены столбчатые диаграммы и тепловые карты коэффициентов корреляции. Предложена замена демографических показателей на ранговые значения и рассмотрено влияние на результат классификации. На основе самоорганизующейся сети построен классификатор, позволяющий отнести регион ДФО к одному из классов: депрессивному, удовлетворительному или хорошему.

Ключевые слова: демографические показатели, метод стохастических вложений соседей с t-распределением, самоорганизующиеся сети, метод К-средних.