Прогноз выручки когорты

Обычно при планировании маркетингового бюджета используют либо среднюю прибыль с покупателя (Average Revenue per User, ARPU), либо итоговую ценность клиента (Customer Lifetime Value, CLV).

ARPU равна прибыли за определенный период, деленной на количество покупателей. Например, если за полгода 1000 покупателей принесли вам 50 тысяч рублей, ARPU за этот период составляет 50 рублей за покупателя.

CLV — это средняя прибыль от одного покупателя от первой до последней (известной нам) покупки. CLV — более чувствительный параметр, он учитывает, какие группы покупателей (когорты) принесли эти деньги.

Главная проблема LTV в том, что на сбор данных требуется время, которого, обычно, нет. Например, вы в течение месяца тестировали новый рекламный канал, и теперь вам нужно решить, продолжать или нет. За месяц покупок было немного, канал еще далек от точки безубыточности, но вы готовы вкладывать, если будете знать, что за год клиенты окупятся.

Рассмотрим, как прогнозировать годовую выручку когорты по первому месяцу её существования. Для прогноза будем использовать линейную регрессию.

Вам понадобятся:

  • Эксель (Гугл-таблицы тоже подойдут, но там немного другой интерфейс);
  • исторические данные о продажах (на них будем обучать модель).
  • Если, вдруг, ваш бизнес молодой, и данных за год пока нет, — ничего страшного. Постройте прогноз на тот период, за который данные есть.

    Шаг 1: достаньте данные

    Для этого упражнения можно использовать специальный файл, на котором вы можете потренироваться. Скачайте его и откройте в Экселе.

    Шаг 2: посчитайте выручку на каждого пользователя

    Когорты, в которых больше людей, скорее всего, принесут больше денег просто потому, что там больше людей. Единственный вывод, который вы сделаете из модели: “нужно больше покупателей”. Не очень полезно. Вместо этого спрогнозируем среднюю выручку с покупателя. Для этого поделим итоговую выручку с когорты на количество людей.

    Шаг 3: постройте график

    Начинается самое интересное. Чтобы построить модель, нужно понять, как взаимосвязаны данные. Для этого построим scatter plot (такие графики мы все в школе строили).

    Каждая точка на графике — одна когорта. По оси X — выручка за месяц. По оси Y — выручка за год.
    На графике видна сильная и весьма логичная линейная зависимость: люди, принесшие больше за первый месяц, скорее всего, принесут больше и за год.

    Вопрос в том, на сколько больше?

    Шаг 4: строим модель

    Мы всего в паре шагов от победы. Добавьте на график линию тренда. И не забудьте вывести на экран формулу графика.

    Получившаяся формула — и есть нужная нам модель. Напомню, что Y — LTV за год, а X — LTV за первый месяц. То есть:

    LTV за год = 4.67 * LTV за месяц – 0.72

    Шаг 5: оцениваем точность модели

    Под формулой есть показатель R^2. Он показывает, на сколько хорошо модель описывает имеющиеся данные. 0.93 означает «чертовски хорошо описывает». Но нам гораздо интересней знать, с какой точностью модель прогнозирует будущее. Чтобы оценить точность модели, разделим имеющиеся данные на 2 группы: обучающую и тестовую.
    Обучающую группу пометим нулем, тестовую — единицей.

    На основе обучающей группы построим модель: добавим график с линей тренда и получим формулу.

    Формула немного изменилась. Это нормально.

    LTV за год = 5 * LTV за месяц — 1.72

    Теперь применим формулу для прогноза на тестовой выборке.

    На графике голубая линия — реальный LTV каждой когорты, а оранжевая — прогноз, результат работы модели. Смотрите, как они близко.

    В статистике используют специальный показатель MSE, сводящий точность модели к одной цифре. Можно почитать про него на Википедии.

    Вернемся к тому, зачем мы все это делали?

    Итак, нам нужно принять решение, продолжать ли рекламную кампанию.

    Допустим, что за месяц вы потратили $10.000 и привлекли 600 новых пользователей. Эти пользователи за месяц принесли $2400 выручки.

    Стоимость одного пользователя = $10.000/600 = $16.7
    LTV за первый месяц = $2400/600 = $4

    Подставим значения в модель:

    LTV за год = 5 * $4 — 1.72 = $18.28
    Прогнозный ROMI = $18.28/$16.17 = 113%.

    Похоже, что рекламная кампания за год не только окупится, но и принесет небольшую прибыль. Если вас устраивает этот результат, смело продолжайте рекламироваться.

    Естественно, периоды 30 и 365 дней можно менять на любые другие.

    Источник

    Data Scientist # 1

    Машинное обучение, большие данные, наука о данных, анализ данных, цифровой маркетинг, искусственный интеллект, нейронные сети, глубокое обучение, data science, data scientist, machine learning, artificial intelligence, big data, deep learning

    Данные — новый актив!

    Эффективно управлять можно только тем, что можно измерить.
    Copyright © 2016-2021 Data Scientist. Все права защищены.