В Национальном исследовательском ядерном университете «МИФИ» команда студентов и научных сотрудников под руководством Вадима Даньшина, аспиранта кафедры компьютерных систем и технологий, создала дистанционный детектор лжи.
Теперь распознать эмоции и ложь можно без подключения датчиков к человеку. Проект существует с октября 2015 года, сегодня он внедряется и выходит на рынок. Им интересуются организации в финансовых, правоохранительных и социальных сферах. О создании и функционировании изобретения мы поговорили с Вадимом Даньшиным на территории университета.
— Вадим Владимирович, как возник проект?
— Я работал IT-специалистом в компании, занимающейся микрофинансами. Управлял базами данных, искал клиентов, которые брали кредит и затем… исчезали. Проработал в этой отрасли порядка пяти лет. Попутно создал банковскую базу данных, которая автоматизировала процесс выдачи кредитов, а также синхронизировал между собой торговые филиалы компании. Это делалось для того, чтобы избежать ситуаций, когда сходил в одно отделение — там отказали, пошел в другое — а там разрешили. Таким образом, у организации была возможность защищать свои финансовые интересы. Микрофинансы — это займы, где очень высокие риски. То есть пять тысяч рублей на две недели под 732% годовых — это 2% в день. То есть, например, взял человек пять тысяч рублей, а через две недели вернул уже 6,5 тысяч. Но зато никаких документов и справок не нужно, достаточно иметь паспорт или водительские права. В таких потребительских займах надо очень быстро проверять людей на платежеспособность и принимать решение: кому давать деньги, а кому — нет. Существуют две крупные проблемы, которые нам удалось автоматизировать.
Первая проблема — это схожесть человека с его документами, анализ фотографии. Второе — это собеседование. В банке человеку задают неудобные вопросы. Например: «Сколько этажей в вашем доме?», «Какая станция метро рядом с вашим домом?» и т.д. Все это легко узнать по Google Maps, по соответствующим базам данных. Если человек пришел с поддельными документами, то он будет неверно или неуверенно отвечать на эти вопросы, волноваться, выдавать свое волнение характерным поведением, которое можно измерить и пронаблюдать. Есть категория мошенников, которые обращаются за помощью к кредитному брокеру. Кредитный брокер — это организация, которая рада видеть любого потенциального заемщика и за 10% от суммы, например, ипотечного займа и готова «нарисовать» все справки, подготовить команду поддержки (посадить на другой конец телефонного провода вымышленную жену, мужа, брата, работодателя). Человек приходит, отвечает на вопросы вроде как правильные, показывает «правильные» справки. Но обычно такие люди займ не гасят. Распознавать таких людей — большая проблема.
— Получается, что вы нашли способ снижения риска невозврата кредита?
— Мы поняли, за счет чего на этапе собеседования снизить риск невозврата займа на 2–3% от всего объема средств выдаваемых населению за интервал времени. Цепочка принятия решения банков обычно состоит из четырех или более оценочных блоков: обзвонить знакомых, проверить документы и т.д. В пятый блок можно добавить наш детектор лжи. Согласно собранной статистике, он имеет точность порядка 65–75%. Работа оценочных блоков организована таким образом, что каждый последующий улучшает выборку клиентов. Полученных 15% преимущества над равновероятным событием дадут 2–3% статистической выгоды на общем потоке клиентов. Например, у небольшой микрофинансовой организации риск невозврата 13%, и они в месяц выдают населению 100 млн рублей. С нашей системой им можно сэкономить за месяц 2-3 млн рублей, внедрив нашу систему на 50 рабочих мест. Соответственно, срок окупаемости системы для микрофинансовой организации составляет не более месяца в худшем случае. А в случае ипотечных займов речь уже идет о 2–3% от стоимости ипотеки, поэтому срок окупаемости сокращается до нескольких рабочих смен.
— Как работает ваш детектор лжи?
— Это программа, которая устанавливается на компьютеры организации-заказчика. К ней устанавливается обычная веб-камера за три тысячи рублей, которая снимает заинтересованного в получении кредита человека. Ему предлагается отвечать на неудобные вопросы, глядя в камеру. Собеседование с человеком делится на 21 фрагмент. Каждый состоит из вопроса кредитного специалиста и ответа клиента. Фрагменты бывают калибровочные, где мы отслеживаем закономерности в поведении человека при попытке соврать, сказать правду, вести беседу на отвлеченные вопросы. Также шесть вопросов, по которым нужно сделать анализ — например, «Вы собираетесь погашать займ?». И, наконец, проверка документов. Экономический эффект возможен благодаря тому, что организация работает с большим потоком клиентов, где стоимость одной сделки весьма высока. Полученная статистика обрабатывается IT-специалистами компании и сохраняется на серверах заказчика в открытом для изучения формате. Наша система внедрена сейчас в микрофинансовую организацию «Кредит 911».
— Возможно, такая системы была бы полезна для многих организаций: аэропортов, судмедэкспертиз и т.д.?
— Там нет такой задачи, потому что есть строго индивидуальные случаи. В банках все бизнес-процессы жестко стандартизированы. Поэтому здесь принимать решение можно не по паре сотен вопросов, как в МВД, например, а по двадцати. Вам уже известны эти вопросы и всегда одни и те же обстоятельства (не надо давать наводящие вопросы). А дальше вы можете делать прогнозы, анализы, извлекать из этого выгоду.
— Обмануть машину возможно? Существует процент неточных показаний, что-то доступно для клиентов-мошенников? Как детектор реагирует на попытки человека соврать?
— Возможно, но сложно. Когда вы подготовились к вопросам и попытались придумать альтернативную реальность, ваш мозг тратит ресурсы. Этих ресурсов уже недостаточно для того, чтобы рефлексы с глазами, с морганиями, с мимикой вели себя прежним образом. В итоге у вас просто начинают «плавать» временные интервалы. И если задать достаточное количество вопросов, то собранной информации хватит для того, чтобы сделать прогнозы. Человек — очень плохой генератор случайных чисел. Тем более мы смотрим не на поведение относительно какого-то шаблона, а наблюдаем за отклонениями поведения человека от его нормального состояния. В процессе беседы задаются калибровочные вопросы нейтрального содержания. И в итоге наша система собирает больше 25 каналов данных, по каждому из которых дополнительно подсчитывает скорости, ускорения, осуществляет частотный анализ. Безусловно, есть ошибки, но задача абсолютной точности у нас тоже не стоит. Во-первых, это затруднительно с точки зрения качества собранных данных, а во-вторых, нам достаточно экономического эффекта от автоматизации процесса беседы с клиентами и снижения рисков на 2–3%.
— Часто возникают случаи столкновения с мошенниками? Как с ними бороться?
— Помимо всего ещё приходят люди с наркологическими зависимостями. Но их «ломают», раскалывают вопросами, которые называются «стоп-факторами». Нужно различать две категории клиентов. Есть клиенты — мошенники. Они хотят просто попробовать зайти и сегодня получить деньги, чтобы удовлетворить какие-то сиюминутные потребности. А есть клиенты, которые приходят организованными группами. Синхронно заходят в офисы и пытаются как-то перегрузить отдел службы безопасности, чтобы они не справились с проверками.
— Расскажите про выход вашего детектора на рынок. Есть ли сложности в регистрации изобретения при вузе?
— Самый простой способ, насколько мне известно — это ввести режим коммерческой тайны на предприятии, делать нумерацию всей использованной документации со своими подчиненными. Дальше вступают в дело договоры на отчуждение результатов интеллектуальной деятельности сотрудника за полученную зарплату в пользу предприятия. Эти результаты интеллектуальной деятельности ставятся на баланс предприятия, и этим нужно распоряжаться — например, продавать права на использование.
— А существуют ли сегодня аналогии? Расскажите о них.
— Я слышал, что подобные проекты пытаются сейчас запустить в Китае. В России такого нет. И соответственно, нами заинтересовались различные органы, в том числе ФСБ, компании, которые занимаются аутсорсом микрофинансовых организаций.
— Есть ли у вас ещё какие-нибудь проекты?
— В ходе работы над детектором лжи у нас образовался еще один интересный проект. Это система по реконструкции лиц, которая позволяет моментально сконвертировать фотографию в трехмерную модель из трех тысяч треугольников и далее в набор из 600 параметров, по которым можно распознать с высокой точностью лицо человека в больших базах данных. Человек садится перед камерой, и ему поверх лица на компьютере накладывается 3D-сетка. Мы отслеживаем все 40 мышц на лице. Также научились делать алгоритм подавления помех, которые применяем к шумовым процессам в видео, что позволяет выделять такие малозаметные процессы как покраснение капилляров кожи человека в такт ударам сердца почти на самой границе чувствительности видеокамеры. Это позволяет нам измерить пульс, видеть фазовые задержки между артериальной и венозной кровью, выделять частоту дыхания по прогибам рисунка на одежде, измерять тремор головы в такт сердцебиению.
— Расскажите, пожалуйста, как работает эта система?
— У нас есть четыре системы принятия решений. Каждая из них решает отдельно взятую задачу. Сначала мы смотрим на человеческое лицо и расставляем ключевые точки на бровях, губах и др. На втором этапе мы отслеживаем взаиморасположение этих ключевых точек относительно друг друга и пытаемся восстановить углы крена тангажа и рысканья человеческого лица в кадре из этого взаиморасположения. На третьем этапе мы отслеживаем градиент бликов освещенности на человеческом лице и накладываем ограничения на радиусы кривизны поверхностей носа, лба, щек и т.д. И на четвертом этапе — все это собираем в единую модель, где на нее накладываются известные ограничения, а неизвестные берутся как наиболее вероятные соотношения пропорций для людей, которых мы проанализировали на выборке восьми тысяч лиц.
— Для полиграфологов вы будете полезны?
— Они нами тоже интересуются. Для них, как и для любого другого заказчика, мы готовы предоставить исходные данные, которые мы измерили. Также для каждого канала данных мы представляем результаты системы, которая оценивает качество работы. Мы не принимаем решение выдавать или не выдавать займ, не принимаем решение, какие именно вопросы задавать клиенту. Заказчик сам формирует опросную анкету. Она показывается в интерфейсе. Пока специалист беседует с клиентом, ему высвечиваются вопросы. Для повышения удобства пользования мы сделали автоматизацию, чтобы не разбивать допрос клиента на две стадии: съемка беседы и анализ полученной видеозаписи. Так будет тратиться меньше времени, т.е. все будет происходить одновременно, без необходимости привлечения отдельного сотрудника для разметки видео на фрагменты. Мы хотим это ускорить, сделать настолько доступным, чтобы полиграфолог-специалист был не нужен в большинстве прикладных задач.
— Получается, что они не будут так востребованы?
— Полиграфолог не сможет сделать более четырех обследований в сутки, просто потому что он устанет и потеряет бдительность. А точность любого проводного детектора лжи сильно зависит от квалификации полиграфолога. Здесь мы исключаем это звено и делаем процесс беседы значительно проще и объективней. Что касается фотографий, то тут другая история. Здесь ожидается значительное снижение рисков порядка 0,5–1% на этапе проверки документов. Мы хотим в ближайшие два месяца ввести в строй специальный сервер, на котором любой заказчик может оплатить свой личный кабинет, загрузить огромное количество каких-либо фотографий и за 20 миллисекунд получить для каждой фотографии 600 параметров пропорций в 3D. На этих основаниях можно эффективно искать лица в больших фотобазах. Здесь можно будет получить точность распознавания на уровне 90–95% в фотобазах на десять миллионов лиц. Задача абсолютной точности здесь тоже недостижима, как и в предыдущем случае заказчик сможет получать усредненный выигрыш в процессах проверки фотографий на документах, поиска людей похожих на мошенников.
текст: Виктория Тархова, Иван Горбунов, фото: Элина Мальцева