Анализ факторов, влияющих на продолжительность работы сотрудников до увольнения, и построение прогнозной модели на основе ответов соискателей при собеседовании.
Несоответствие утраты доверия имеет самый длительный средний срок работы — 13 месяцев
| Фактор | Коэффициент корреляции | Интерпретация | Сила влияния |
|---|---|---|---|
| Семейное положение | 0.052 | очень слабая связь | |
| Месяц найма | -0.05 | очень слабая связь | |
| Пол | -0.047 | очень слабая связь | |
| Наличие детей | -0.024 | очень слабая связь | |
| Возраст | 0.008 | очень слабая связь | |
| Образование | -0.003 | очень слабая связь |
Все исследуемые факторы показывают очень слабую корреляцию с продолжительностью работы сотрудников. Это указывает на то, что необходим комплексный подход к прогнозированию с использованием нелинейных моделей.
Специализированные методы для работы с цензурированными данными и прогнозирования времени до наступления события.
Прогнозирование точного времени работы как непрерывной числовой переменной.
Прогнозирование вероятности увольнения в определенные временные интервалы.
Мера способности модели ранжировать сотрудников по времени увольнения. Значения: 0.5 (случайное) - 1.0 (идеальное)
Мера точности вероятностных прогнозов модели. Меньшие значения лучше
Среднеквадратичная ошибка прогноза. Меньшие значения лучше
Средняя абсолютная ошибка. Меньшие значения лучше
Доля объясненной дисперсии. Значения ближе к 1 лучше
Площадь под кривой ROC. Значения ближе к 1 лучше
Точность, полнота и их гармоническое среднее. Значения ближе к 1 лучше
Логарифмическая функция потерь. Меньшие значения лучше
Рекомендуется использовать комбинацию метрик для комплексной оценки качества моделей, при этом уделяя особое внимание бизнес-показателям, таким как снижение затрат на найм за счет сокращения количества "короткоживущих" сотрудников.
Заполнение медианами для числовых признаков, наиболее частыми значениями для категориальных, создание флагов пропусков для признаков с MNAR
Выявление и устранение аномальных значений, например, отрицательного стажа работы или нереалистично длительных периодов работы
One-Hot Encoding для категорий с малым числом значений, Target Encoding для категорий с большим числом значений
Стандартизация (z-score) или Min-Max нормализация в зависимости от распределения, логарифмическая трансформация для признаков с правосторонней асимметрией
Извлечение месяца/сезона найма, дня недели, возраста на момент найма, создание признаков на основе дат (стаж на предыдущем месте работы)
Создание взаимодействий между важными признаками (возраст × наличие детей, пол × семейное положение и т.д.)
Создание признаков на основе статистик по группам (средний срок работы для отдела, должности)
Создание нескольких целевых переменных для различных временных горизонтов (работа < 3 мес, < 6 мес, < 12 мес)
Реализация Cox Proportional Hazards и Random Survival Forest для работы с цензурированными данными
Градиентный бустинг (XGBoost, CatBoost) для прогнозирования длительности работы на разных подвыборках (должности, отделы)
Прогнозирование вероятности увольнения в критические периоды (3, 6, 12 месяцев)
Временная кросс-валидация с учетом смещения данных, оценка на различных метриках (C-index, RMSE, AUC-ROC)
Взвешенное усреднение предсказаний моделей выживаемости и регрессии для повышения точности
Применение SHAP Values для интерпретации влияния каждого фактора на прогноз
Преобразование результатов модели в понятные бизнес-метрики (ожидаемое время работы, ROI на найм)
Выделение паттернов высокого риска раннего увольнения для HR-отдела
Создание простого интерфейса для HR-менеджеров для ввода данных соискателей и получения прогнозов
Связь с существующими системами управления персоналом для автоматического получения данных
Отслеживание точности прогнозов с течением времени и выявление дрейфа данных
Обновление моделей на новых данных каждые 3-6 месяцев для поддержания актуальности
Ожидаемый результат: сокращение затрат на найм до 35% за счет более точного прогнозирования долгосрочности работы сотрудников и снижения текучести кадров.
Создание удобного интерфейса для рекрутеров, куда они могут вносить ответы кандидатов
Генерация прогноза продолжительности работы и рекомендаций
Постоянное отслеживание качества прогнозов
Сокращение расходов на подбор, адаптацию и обучение сотрудников, которые с высокой вероятностью уволятся в первые месяцы
Улучшение производительности команд за счет снижения текучести и более стабильного состава сотрудников
Формирование более стабильной корпоративной культуры и повышение уровня вовлеченности персонала
Наши специалисты помогут вам внедрить предиктивную модель удержания сотрудников, которая сократит затраты на найм и повысит стабильность персонала.
Выявление потенциальных "короткоживущих" сотрудников еще на этапе собеседования
Сокращение затрат на подбор и адаптацию персонала до 35%