Соревнование KAGGLE по определению риска дефолта заемщика. Разработка признаков

Джерело:
Хабрахабр:

Дата публікації:
14/01/2021 07:00

Постійна адреса новини:
http://www.vsinovyny.com/7447444

Соревнование KAGGLE по определению риска дефолта заемщика. Разработка признаков

 

14/01/2021 07:00 // Хабрахабр:

Введение: Соревнование от финансовой группы HOME CREDIT по определению риска дефолта заемщика

Соревнования Kaggle с использованием структурированных данных очень часто выигрывают специалисты по разработке признаков: побеждают те, кто может создавать наиболее полезные признаки из данных. Это представляет собой одну из закономерностей в машинном обучении: разработка признаков дает больший возврат инвестиций, чем построение модели и настройка гиперпараметров. Как говорит один из ведущих ученых в области машинного обучения – Эндрю Ын: «Прикладное машинное обучение — это в основном разработка признаков».

Хотя выбор правильной модели и ее оптимальная настройка, несомненно, очень важны, модель может учиться только на основе предоставленных данных. Обеспечение максимального соответствия этих данных задаче – задача специалиста по данным. Конструирование признаков может включать, как создание признаков: добавление новых признаков из существующих данных, так и выбор признаков: выбор только наиболее важных признаков или другие методы уменьшения размерности. Есть много методов, которые мы можем использовать как для создания, так и для выбора признаков.

Читать далее

 

» Читати повністю

 

« Наступна новина з архіву
Байден відреагував на новину про імпічмент Трампу
  Попередня новина з архіву
Рівень інфляції в Донецькій області становить 5,2%
»

 

 
© 2026 www.vsinovyny.com