Вопрос обнаружения двойников в БД традиционно входит в основную пятерку базовых функционалов, о которых спрашивают при первой оценке возможностей ATS, и в силу этого в целом может рассматриваться как своего рода «гигиенический минимум» системы, однако, мало кто осознает в чем заключается реальная, а не номинально декларируемая важность функциональности по определению и удалению двойников в системе автоматизации подбора.
Модуль обнаружения двойников является тем самым фундаментом, на котором базируются два других ключевых функционала любой ATS – Модуль по обработке персональных данных и Модуль объединения двойников. Неразрывно связанные логически и технически три этих функционала образуют триаду, без слаженной работы которой невозможно нормальное функционирование системы автоматизации рекрутмента.
Основная проблема большинства ATS заключается именно в непонимании того факта, что отсутствие корректных связей между тремя этими функционалами или недостаточная проработанность любого из них автоматически вызывает каскадные сбои в работе двух других и одновременно приводит к серьезным ошибкам в Модуле сбора аналитики.
В качестве простого и наглядного примера можно рассмотреть ситуацию, когда Модуль обнаружения двойников некорректно отработал ситуацию с потенциальным двойником, например, при парсинге профиля с работного сайта. В качестве одной из возможных ошибок можно рассмотреть кейс, когда Модуль ошибочно определил, что профиль данного человека уже есть в БД, а в качестве другого кейса – ситуацию, когда Модуль не нашел двойника, который действительно есть в ATS.
- В первом случае – при некорректном определении Двойника - последует следующий каскад ошибок: Модуль объединения людей ошибочно объединит две карточки разных людей, слив все их данные, статусы, документы и историю движения по проектам. А Модуль ОПД ошибочно отправит или, наоборот, не отправит запрос на обработку ПД, так как будет ориентироваться на статус ОПД, который относился к другой карточке, ошибочно объединенной с новым профилем.
- Во втором случае – при не обнаружении Двойника – тоже последует каскад ошибок: Модуль объединения не отработает объединение двух идентичных профилей в одну карточку, задвоив данные, статусы и документы. А Модуль ОПД отправит запрос на обработку ПД человеку, который, возможно, уже недавно дал свое согласие, так как не обнаружит соответствующего статуса в его карточке.
В итоге, из-за ошибки при обнаружении двойника мы получим испорченную карточку человека, изуродованную статистику, испорченные коммуникации с кандидатом и нарушение правил обработки ПД, влекущее за собой штрафные санкции при проверке.
Как определить, насколько квалифицированно и качественно проработан Модуль определения двойников в ATS, которую вы рассматриваете?
Задайте производителю вопрос – каким образом происходит определение двойников и каковы базовые принципы работы Модуля, отвечающего за поиск Двойников. Если производитель ATS приведет в качестве критериев триаду Имя/Фамилия, Имейл и Телефон и не сможет внятно объяснить вам на какие категории Двойников делится поток возможных вариантов при первичной проверке, Вам стоит насторожиться – совершенно очевидно, что у данной ATS весьма серьезные проблемы как с качеством обработки данных и их чистотой, так и с соответствием требованиям закона в части обработки ПД.
В Experium, который исторически фокусировался на работе с большими и огромными базами данных своих клиентов - крупных компаний с миллионами кандидатов и десятками миллионов документов, процессы обнаружения и объединения двойников автоматизированы академически. Модуль обнаружения производит несколько циклов проверок, сверяя новые профили с БД по 25 группам/ датасетам, в каждом из которых может быть от трех до восьми критериев. Крайне важным является проверка не только на наличие совпадений критериев в этих датасетах, но и проверка на Несовпадение критериев.
В зависимости от полученных результатов найденные двойники ранжируются и делятся на Однозначных (которые обрабатываются системой автоматически) и Потенциальных (в отношении которых даются рекомендации, но выбор действия остается на усмотрение пользователя).
Как следствие, в отношении определенных таким образом Двойников не происходит ошибок ни при их объединении, ни при обработке запросов и согласий на ОПД, ни при сборе статистики.