Как научить ИИ «читать» бумажные страховые претензии

Проникновение ИТ позволило частично изменить эту ситуацию и повысить скорость работы страховых компаний. Однако «узким местом» на пути тотальной цифровизации страхования до сих пор остается большой объем неструктурированных данных, которые приходится обрабатывать вручную: фотографий, сканов гарантийных писем, претензий, актов и других документов.

08.09.2024

11:30

CNews.ru

О том, как разработчик российской цифровой платформы сопровождения страхования грузоперевозок Zunami — ИТ-компания «Инносети» — решает эту проблему с помощью инноваций в сфере искусственного интеллекта, рассказал ее генеральный директор Артем Ефимов.

Постановка задачи

На высококонкурентном страховом рынке скорость имеет решающее значение. На это в первую очередь влияет опыт, полученный страхователями в других сферах. Зная, что оформить заявку на кредит в приложении банка можно за пять минут, клиент справедливо ждет, что его страховой случай тоже рассмотрят быстро.

Автоматизация обработки и анализа документов даст существенный скачок в эффективности обслуживания страхователей. Ручная обработка сканов и фотографий не только занимает значительное время операторов, но и подвержена риску человеческой ошибки. Показателен пример из медицинской сферы — по оценкам Американской медицинской ассоциации, уровень ошибок при оформлении страховых случаев по медицинской страховке достигает 20% и приводит к потерям в размере около 20 млрд долларов ежегодно.

В рамках нашей цифровой платформы сопровождения страхования грузоперевозок Zunami уже запущены сервисы по роботизации урегулирования претензий, автоматическому поиску страхового мошенничества и расчету тарифов с использованием ИИ. Поэтому мы видели перспективу и в сервисе автоматического распознавания документов: он ускорит проверку документов, повысит их точность и сократит расходы клиентов.

Подход к решению

Уже более пяти лет мы специализируемся на работе со сложными технологиями, в том числе с блокчейном и искусственным интеллектом. Поэтому решили подойти к проблеме неструктурированных клиентских данных с использованием нашего накопленного опыта в сфере инноваций.

Проект по автоматическому распознаванию документов было решено реализовать в рамках внутренних R&D-процессов компании (Research and Development — «исследование и разработка», или НИОКР). По пути собственной R&D-разработки мы пошли не просто так. Дело в том, что существующие на рынке решения имеют ограниченные возможности кастомизации, что приводит к их низкой эффективности при использовании в узких сегментах. А в нашем случае при обработке претензий как раз приходится работать с нестандартными документами, зачастую не имеющими заранее заданной структуры.

Кроме того, в силу специфики обрабатываемой информации сервис должен работать в закрытом контуре. На платформе Zunami аккумулируется большой объем чувствительных данных, работа с которыми требует соблюдения правил безопасности и конфиденциальности. Поэтому мы не могли использовать готовые облачные решения, которые работают на удаленном сервере разработчика.

Наконец, проведение R&D позволяет команде глубже погрузиться в современные технологии и архитектуры моделей. Это позволит нам в будущем строить новые гипотезы и модели, внедрять инновации, повышая тем самым конкурентоспособность и способствуя дальнейшему развитию и бизнеса, и отрасли в целом.

В компании реализован гейтовый подход к инновациям, который после признания идеи потенциально успешной предполагает разработку MVP (Minimum Viable Product — «минимально жизнеспособный продукт»). Это недорогой и быстрый способ удостовериться в том, что проект может быть реализован и экономически успешен.

Реализация проекта

В рамках MVP было запланировано запустить сервис для распознавания документов одного определенного типа. Также мы сформулировали требования к модели, которые планировалось получить при внедрении:

Ускорение времени на загрузку и проверку документов.
Увеличение точности в классификации и извлечении информации из документов.
Круглосуточная работа системы.
Обработка больших объемов информации.
Снижение рисков человеческого фактора.

Проанализировав базу документов, мы выяснили, что приблизительно 66% файлов, передаваемых вместе с претензией, имеют редактируемый формат. Для извлечения текста достаточно использовать библиотеку для парсинга из PDF, такие как PDFium или PyPDF2. Однако продукт должен уметь не только для загружать текстовую информацию, но и определять все ли пункты заполнены, в решении должна присутствовать модель, извлекающая визуальную информацию. Это задача уже посложнее.

Для выбора подходящего алгоритма мы провели глубокий анализ существующих технологий. Учитывали их доступность для русского языка, возможность дообучения, наличие полного репозитория и поддержки со стороны разработчика. В результате исследования нами были отобраны три решения из группы моделей на архитектуре Transformer и Phi3 на базе MLLM (мультимодальные большие языковые модели).

Чтобы выбрать наиболее эффективное решение, мы провели тесты каждого из них. Результаты показали, что модели на базе Transformer требуют большого количества высококачественных изображений для эффективного обучения. В отличие от них, модель Phi3 эффективно распознает текст без необходимости «скармливания» ей огромного количества данных, что сокращает затраты при сопоставимых результатах. К тому же она изначально поддерживает русский язык и демонстрирует высокую производительность.

Тем не менее Phi3 имеет ограничения: она подходит не для всех задач. В частности, из-за нечетких или слишком мелких полей в документах, таких как паспорт, модель может не справляться с извлечением данных. Это ограничивает ее использование в определенных случаях, несмотря на выдающиеся общие характеристики. Поэтому в финальной версии мы дополнительно использовали комбинацию из двух моделей — то, что Phi3 не может выполнить самостоятельно, берет на себя Transformer.

В ходе экспериментов было выяснено, что такая комбинация имеет высокую способность к распознаванию. Сейчас процесс подачи и обработки претензии занимает в среднем три минуты. После внедрения сервиса мы ожидаем сокращения общего времени на 50%. Так что на следующем этапе планируем полноценно внедрить MVP в пайплайн работы.

Перспективы решения

На данном этапе проект демонстрирует жизнеспособность идеи по внедрению сервиса. Высокие оценки моделей позволяют предположить, что сервис способен повысить оперативность и внести значительный вклад в улучшение качества обслуживания клиентов, поддерживая высокие стандарты и инновационное развитие в компании. В дальнейшем мы планируем:

Обучить модели для распознавания различных типов документов.

Внедрить модель, которая будет подсказывать пользователю, какие документы необходимо догрузить для успешной заявки на урегулирование убытка.

Обеспечить автоматическое заполнение форм на базе обработанных документов для обеспечения дальнейшей автоматизации бизнес-процессов.

Решение может оказать значительное влияние на рынок страхования грузоперевозок и еще больше стимулировать экспедиторов и грузовладельцев цифровизировать страховые процессы. Мы ожидаем, что внедрение такого сервиса поднимет планку качества обслуживания на рынке и клиентского опыта.

Эффективное использование данных и автоматизация процессов могут также способствовать более строгому соблюдению законодательства и регулятивных требований, что укрепит доверие к отрасли страхования в целом. Проект может стать катализатором для дальнейших исследований и разработок в области искусственного интеллекта и его применения в страховой и логистической сферах.