Прогноз на основе одной переменной редко бывает оптимальным. Добавив в модель больше признаков, можно получить более точный результат. Сегодня продолжим прогнозировать ROI, но в этот раз используем больше данных.
Во‑первых, у нас в распоряжении не 10 когорт, а 1450.
Во‑вторых, помимо недельной и годовой выручки данные содержат тип рекламного канала, количество пользователей в когорте и затраты на привлечение пользователей.
Каждая строка — это когорта людей, пришедших из определённого рекламного канала за сутки:
Channel — тип рекламного канала;
Costs — затраты на привлечение;
Regs — количество зарегистрированных пользователей;
Revenue_week — выручка когорты за первую неделю после регистрации;
Revenue_year — выручка когорты за первый год после регистрации.