- Наука о данных (Data Science) — не магия, а ваш бизнес никто не знает лучше вас. Помогайте специалисту инсайтами и информацией о бизнес-процессах, и результат не заставит себя ждать. Знание и понимание предметной области критически важно.
- Для анализа данных нужны данные. Лучше, если их много и они адекватные. Модель никогда не будет лучше данных, которые ей дадут. Не забывайте принцип «Мусор на входе — мусор на выходе».
- Исследователь данных не волшебник, способный спрогнозировать все изъяны нашего мира. Не рассчитывайте на это.
- Всегда перед постановкой ML-задачи (машинное обучение) спрашивайте себя: принесет ли решение значимую выгоду? Если нет, не беритесь за нее.
- Определите, к какому результату должна стремиться модель, какие ошибки критичны, а какими можно пренебречь.
- Если вы знаете конечную цель оптимизации (деньги, время), сосредоточьтесь сразу на ней. Так весь процесс будет проще и прозрачнее.
Чек-лист для Data Science
06.06.2019