Джерело:
Хабрахабр:
Дата публікації:
14/01/2021 07:00
Постійна адреса новини:
http://www.vsinovyny.com/7447444
14/01/2021 07:00 // Хабрахабр:
Введение: Соревнование от финансовой группы HOME CREDIT по определению риска дефолта заемщика
Соревнования Kaggle с использованием структурированных данных очень часто выигрывают специалисты по разработке признаков: побеждают те, кто может создавать наиболее полезные признаки из данных. Это представляет собой одну из закономерностей в машинном обучении: разработка признаков дает больший возврат инвестиций, чем построение модели и настройка гиперпараметров. Как говорит один из ведущих ученых в области машинного обучения – Эндрю Ын: «Прикладное машинное обучение — это в основном разработка признаков».
Хотя выбор правильной модели и ее оптимальная настройка, несомненно, очень важны, модель может учиться только на основе предоставленных данных. Обеспечение максимального соответствия этих данных задаче – задача специалиста по данным. Конструирование признаков может включать, как создание признаков: добавление новых признаков из существующих данных, так и выбор признаков: выбор только наиболее важных признаков или другие методы уменьшения размерности. Есть много методов, которые мы можем использовать как для создания, так и для выбора признаков.
Читать далее| « |
Наступна новина з архіву Байден відреагував на новину про імпічмент Трампу |
Попередня новина з архіву Рівень інфляції в Донецькій області становить 5,2% |
» | |
|
|
||||