Построение аналитического процесса

Наличие возможности сочетать различные аналитические дисциплины дает огромное преимущество. Подобно тому как источники данных набирают мощность при объединении с другими данными, так и сочетание различных аналитических дисциплин придаст дополнительную силу. Платформа для обнаружения данных обеспечивает такую возможность.

Предположения увеличивают риски; оцените риски. При создании аналитического процесса делается много предположений, причем вероятность того, что все они будут абсолютно точными, крайне низка. Полезно оценивать, как изменяются результаты, по мере того как варьируются фактические значения под влиянием предположений в правдоподобном диапазоне. Это позволяет лучше понять сопряженные с анализом риски.

Не становитесь жертвой суждений задним числом. Когда нужно проанализировать столь много данных по самым разным направлениям, следует, применив здравый смысл, воспользоваться возможностями, способными оказать самое сильное воздействие. Задокументируйте принятие решения с указанием, на чем были сосредоточены усилия, чтобы впоследствии защитить свои действия от суждений задним числом. Найти иголку в стоге сена почти невозможно. Но, когда она обнаружена, её почти невозможно упустить.

Исследование данных не является случайным или бесцельным процессом. Иногда к исследовательскому анализу относятся скептически, считая, что специалисты-аналитики просто играют с данными в попытке найти нечто стоящее. Это не так. Просто исследование данных начинается с постановки более широкой цели и специалистам предоставляется больше времени для достижения этой цели.

Оптимизируйте совокупное качество решений. В операционной аналитике цель — максимизировать не качество каждого отдельного решения, а совокупное воздействие процесса на все решения. Это может потребовать отказа от некоторой аналитической мощности, чтобы сделать процесс достаточно устойчивым для внедрения его в промышленном масштабе.

Идея о том, что статистика потеряла свою актуальность, — заблуждение. Тогда как сегодня действительно существует необходимость выходить за рамки только классических статистических методов, сами по себе эти методы остаются крайне важным компонентом операционной аналитики. Использование статистики может повысить точность пат-анализа и расширить его применение. Создав набор вспомогательных метрик, отражающих ключевые особенности каждого пути, можно более глубоко исследовать, какие аспекты путей влияют на интересующие организацию метрики.

При создании аналитических процессов в операционном масштабе упрощенные решения могут оказаться лучше причудливых. Операционная аналитика часто работает с данными низкого качества, которые могут быть разреженными и неполными. Чрезмерная изощренность модели может привести к нарастанию в данных проблем, вместо того чтобы контролировать их.

Обеспечьте решения, а не лекции по теории аналитики. Многие заказчики и пользователи операционной аналитики не понимают аналитики или не испытывают к ней интереса. Их заботит только возможность решения проблемы. Убедите их в том, что аналитика поможет решить их проблему, но не углубляйтесь в технические подробности. Если же людей перегрузить информацией, они могут вообще отказаться от выполнения предложенного им решения.

Постановка правильных вопросов в начале построения аналитического процесса сильнее воздействует на результаты, чем вся последующая работа. Если фактические значения могут отличаться от исходных предположений, примените анализ чувствительности для оценки потенциального воздействия такого расхождения на результаты.

Аналитическое окружение развивается, объединяя много платформ разной мощности, каждая их которых предназначена для решения разных задач.

ИТ-команда и аналитическая команда должны работать в организации совместно, чтобы успешно превратить традиционную аналитику в операционную. В идеале команды должны сотрудничать добровольно. Если же этого не происходит, высшее руководство должно обязать их сотрудничать в приказном порядке. Принудительное сотрудничество лучше, чем отсутствие всякого сотрудничества.

Создание успешного партнерства между ИТ-командой и командой аналитиков:

• Пусть каждый сотрудник расскажет о своих должностных инструкциях и задачах.
• Пусть каждая команда расскажет, что ее не устраивает в работе другой команды.
• Пусть каждая команда объяснит, почему она делает то, что она делает.
• Пусть каждая команда предложит, какие изменения в свою деятельность может внести другая команда.
• Пусть каждая команда предложит, какие изменения в свою деятельность может внести его собственная команда.
• Используйте свои властные полномочия, чтобы разрешить спорные вопросы (где команды не могут договориться).
• Стимулируйте тесное сотрудничество, привязав его к зарплате.

Интернет вещей будет создавать невообразимые объемы данных. Однако бо́льшая их часть лишена смысла за пределами текущего момента.

Вы должны поставить цель оптимизировать эффективность аналитического процесса в целом за счет наилучшего использования компонентов единого аналитического окружения. Попытки оптимизировать процесс в рамках одного компонента могут привести к гораздо менее эффективным решениям, чем многокомпонентный подход.

С точки зрения управления реальную проблему для операционной аналитики представляет наличие двух разных и даже противоречащих друг другу наборов требований, которые должны быть удовлетворены. Первый набор относится к процессу обнаружения данных, когда организация пытается найти новые инсайты и определить аналитические процессы, способные оказать наибольшее влияние. В этом случае требуются максимальная гибкость и минимальные ограничения. Второй набор требований относится к развертыванию процесса на операционном уровне. В этом случае главным приоритетом становится обеспечение высокой скорости, надежности и стабильности.

Точно так же, как с производственных линий иногда сходят дефектные продукты, так и операционно-аналитические процессы иногда генерируют дефектные решения. Порой проблема может быть настолько серьезной, что потребуется остановить процесс и «отремонтировать» его. Если частота ошибок достаточно низкая, это следует рассматривать как приемлемые издержки ведения бизнеса. Принять этот факт может оказаться достаточно затруднительным, зачастую приходится вносить изменения в корпоративную культуру.

Важная часть операционной аналитики — текущий контроль за правильностью и эффективностью миллионов решений, принимаемых в автоматическом режиме. При этом сами данные и метрики, которые хотят видеть люди, остаются фактическими теми же, что и в прошлом. Меняется только способ принятия решений, которые ведут к генерации тех же данных и метрик.

При поиске новых инсайтов самое главное — обнаружить их как можно быстрее, и поэтому долгое время выполнения процесса не имеет значения. Но при превращении нового инсайта в операционный необходимы максимальные скорость и масштабируемость. Упрощение процесса поиска для превращения его в операционный может потребовать дополнительных усилий.

___________

По материалам книги Билла Фрэнкса «Революция в аналитике: Как в эпоху Big Data улучшить ваш бизнес с помощью операционной аналитики».

Data Scientist # 1

Машинное обучение, большие данные, наука о данных, анализ данных, цифровой маркетинг, искусственный интеллект, нейронные сети, глубокое обучение, data science, data scientist, machine learning, artificial intelligence, big data, deep learning

Данные — новый актив!

Эффективно управлять можно только тем, что можно измерить.
Copyright © 2016-2021 Data Scientist. Все права защищены.