СПОСОБ ПОСТРОЕНИЯ МОДЕЛИ КЛАСТЕРИЗАЦИИ ДАННЫХ НА ПРИМЕРЕ ДЕМОГРАФИЧЕСКИХ ПОКАЗАТЕЛЕЙ РЕГИОНОВ ДФО
Рассматривается задача построения модели классификации регионов ДФО по демографическим данным с помощью алгоритмов машинного обучения – метод стохастических вложений соседей с t-распределением, метод К-средних и самоорганизующиеся сети. Для демографических показателей построены столбчатые диаграммы и тепловые карты коэффициентов корреляции. Предложена замена демографических показателей на ранговые значения и рассмотрено влияние на результат классификации. На основе самоорганизующейся сети построен классификатор, позволяющий отнести регион ДФО к одному из классов: депрессивному, удовлетворительному или хорошему.
Ключевые слова: демографические показатели, метод стохастических вложений соседей с t-распределением, самоорганизующиеся сети, метод К-средних.