Автоматизация учета

Распознавание корпоративных документов: как не утонуть в море бумаг

Мы подсчитали, что ручной ввод данных из типовых форм занимает у сотрудников 6–7 часов в день. Автономная система Smart Document Engine на смартфоне справляется с подобной задачей буквально за минуты. В этой статье мы расскажем о самых эффективных бизнес-кейсах применения нашей мобильной OCR.
Распознавание корпоративных документов: как не утонуть в море бумаг
Иллюстрация: Вера Ревина/Клерк.ру

Когда в вашей компании появляется новый клиент или запустился очередной проект с давним партнером, неизбежно формируется большой объем корпоративных документов. К ним относится вся «первичка»: счета-фактуры, счета на оплату, платежные поручения; документы бухгалтерской и налоговой отчетности (например, справка о доходах физлица). А кроме того уставные, страховые, нотариальные документы, KYC-анкеты, согласия на обработку персональных данных и т.д.

Зачастую компании обрабатывают миллионы листов корпоративных документов с помощью планшетного сканера. Сотрудники сканируют документы и переводят их в PDF-файлы. Поиск нужной информацию в этих копиях иногда превращается в квест.

Нередко банки, государственные компании и госкорпорации привлекают к обработке документов специальные онлайн-сервисы, которые в свою очередь нанимают операторами распознавания третьих лиц, обычно, самозанятых. В этом случае при несущественных затратах у заказчика возникает серьезный риск утечки данных и угроза мошенничества, за что компания и ее CEO, скорее всего, будут оштрафованы.

Утечки персональных данных могут обернуться для топ-менеджеров банков более серьезными последствиями. Так, при участии Банка России в начале 2024 года был разработан законопроект, который предусматривает отстранение топ-менеджеров банков от работы на десять лет за неоднократную утечку данных.

Более надежно обрабатывать данные в безопасном контуре, не используя внешние сервисы. Распознавание корпоративных документов сейчас можно поручить автономной системе на базе искусственного интеллекта, которая инсталлируется на любое устройство. Последней разработкой в этом классе является программный продукт Smart Document Engine. В июле 2024 г. Smart Engines обновила его до версии 2.4.0. 

Распознавание счета на оплату:

Если говорить коротко, решение позволяет решить две главных задачи:

  • Оцифровка бумажных документов;

  • Оптимизация процессов массового ввода документов.

Как автономная OCR применяется в банках и МФО

Наша система помогает банкам улучшить качество обслуживания и увеличить точность, скорость и безопасность своих операций.

Быстрое распознавание справки о доходах физического лица (ранее – 2-НДФЛ) позволяет банкам полностью автоматизировать процесс так называемого «кредитного конвейера». Это система обработки заявок на кредитование и принятия решений на основе комплексного анализа данных заемщика. Она анализирует риск невозврата и определяет параметры кредита — условия, лимит, срок, обеспечение. Причем не имеет значения, идет ли речь о микрофинансировании, потребительском кредитовании, автокредитах, ипотеке.

Распознавание справки о доходах физических лиц:

Технология распознавания обнаруживает и извлекает из справки о доходах все данные табличной части, в том числе при размещении информации на двух страницах. Система обрабатывает до нескольких сотен атрибутов, содержащихся в справке о доходах.

Таким образом, автономная OCR для смартфона помогает банкам ускорить процесс коммуникации с клиентом и, что не менее важно, сократить число ошибок ввода, которые приводят к необоснованным отказам.

Технологии распознавания Smart Engines используются в банках не только для обработки документов, но и для считывания данных QR-кодов, банковских карт и при сканировании номеров телефонов. 

Где OCR может использоваться еще?

Smart Document Engine©

Система анализа и распознавания документов

Автоматизация бухгалтерской отчетности

Давайте представим себе компанию Х, занимающуюся продажей гидравлического оборудования. В ней работает бухгалтер, который контролирует участок товарно-материальных ценностей (ТМЦ) и отвечает за оформление процессов закупки материалов, товаров и услуг. Ежедневно он обрабатывает по 60–70 первичных документов. На каждый из них у него уходит от 5 до 10 минут. То есть в день бухгалтер-материалист тратит на эти процессы по 6–7 часов.

Теперь предположим, что сотрудник вводит данные из документов не вручную, а с помощью системы распознавания первичных документов для десктопных, серверных и мобильных платформ.

OCR извлекает атрибуты счета-фактуры за 2–3 секунды, платежного требования — за 2 секунды. Иначе говоря, те же самые 60–70 документов решение обрабатывает за считанные минуты. При автоматическом вводе снижается и вероятность ошибки, исключается риск утечки.

Упрощение аудиторских проверок

Выездные аудиторы обычно работают в офисе клиента. Согласитесь, в условиях такой «полевой» работы каждая минута на счету. Вспомним, сколько стоит рабочее время таких выездных сотрудников. Такой режим задает высокую планку для допустимого времени извлечения данных из документа. А какова цена ошибки при вводе данных из важных бухгалтерских документов? Точность считывания данных для аудитора особенно важна.

Автоматизация программ лояльности

Хотя в мире уже сформировался тренд на автоматизацию процессов в работе с программой лояльности, многие компании по-прежнему предпочитают действовать по старинке: взамен заполненной от руки бумажной анкеты дают пластиковую карточку. При ручной обработке результатов анкетирования процент ошибок составляет около 30%, в то время как автоматический ввод данных обеспечивает гораздо более высокий уровень точности.

Smart Document Engine также обеспечивает защиту персональных данных пользователей программ лояльности. Это наиболее надежный вариант обработки персональных данных — в этом случае информация не покидает контур безопасности.

Если оператор персональных данных привлекает к их обработке внешних исполнителей, то это создает риск утечки. Пример тому — «Спортмастер».

31 декабря 2022 г. в одном из телеграмм-каналов был опубликован архив с данными клиентов «Спортмастера». В распоряжении злоумышленников оказались имена, даты рождения, номера телефонов и адреса электронных почт. Этот архив содержал всего 1,655 млн строк информации о пользователях.

«Спортмастер» объявил о начале расследования, которое должно выяснить причины инцидента. По предварительным данным, утечка произошла через одного из подрядчиков компании, который имел доступ к указанной информации. Название компании-подрядчика, попавшего под подозрение, «Спортмастер» не уточнил.

Но вернемся к нашему лонгриду. Где еще можно применять нашу безопасную OCR?

Обработка KYC-анкет

Система KYC — Know Your Customer или Знай своего клиента (ЗСК) — это процедура идентификации контрагентов, обязательная для банков, бирж, криптобирж и букмекерских контор.

С ее помощью организации защищают себя от риска работы с мошенниками, а также от контактов с лицами, внесенными в списки экстремистов и террористов.

В соответствии с этим принципом компании задают своим клиентам вопросы об их финансовой деятельности и т.д. Но сбор данных — это лишь первый этап, после которого следует обработка полученной информации. Система распознавания документов не только в разы увеличивает качество проверки данных из KYC-анкет, но и снижает санкционные риски.

Помимо распознавания паспорта или ID-карт, Smart Engines проверит подлинность удостоверяющих документов, найдет признаки редактирования файлов и установит факты компрометации изображений, которые предъявляются в ходе онбординга клиентов. В апреле в Smart Document Engine была добавлена возможность распознавания нескольких документов, удостоверяющих личность, в одном видеоклипе или изображении, что значительно ускоряет работу с ними.

Распознавание 15 документов за 1 секунду на сервере:

Обработка логистической документации

В качестве примера представим себе логистический склад, где водитель-экспедитор в соответствии с универсальным передаточным документом (УПД) или товарной накладной по форме ТОРГ-12 передает кладовщику под ответственное хранение весь товар. Какое оборудование, помимо шариковой ручки, в такие моменты под рукой? Максимум — терминал сбора данных или какой-то смартфон. Автономная OCR Smart Document Engine для мобильного телефона значительно ускорит работу кладовщика.

Распознавание накладной МХ-18:

На каком этапе развития компании пора внедрять OCR по распознаванию документов

AI-решение по распознаванию документов существенно повышает эффективность бизнеса и потому не может стоить дешево. В ряде случаев руководству компании в моменте удобнее держать в штате несколько человек, которые в течение дня вводят и обрабатывают документы (первичку, KYC анкеты, заявления и т.д.), чем нести затраты на покупку OCR.

Мы подсчитали, что если организация — вне зависимости от того, чем она занимается — обрабатывает более 100 тыс. документов в год или использует хотя бы двух операторов ручного ввода, то ей имеет смысл приобретать решение по распознаванию текста уже сейчас.

Спасибо, что дочитали до конца нашу статью!

Специально для вас мы собрали ее ключевые поинты:

  • Обработка документов с помощью планшетного сканера — это прошлый век;

  • Передача персональных данных на обработку третьим лицам, во внешние сервисы и на краудсорсинг грозит утечками, большими штрафами, дисквалификацией, уголовной ответственностью;

  • Обработку паспортных данных и другой чувствительной информации о клиентах необходимо проводить внутри своей ИТ-инфраструктуры - в контуре безопасности;

  • В июле вышла новая версия ПО по безопасному распознаванию корпоративных документов — Smart Document Engine. Это полностью российская разработка. OCR быстро и точно работает на смартфонах. А на сервере скорость распознавания достигает впечатляющих 15 страниц в секунду.

Smart Document Engine©

Система анализа и распознавания документов

Реклама: ООО «СМАРТ ЭНДЖИНС СЕРВИС», ИНН 7728328449, erid: LjN8KBp2o

Информации об авторе

Начать дискуссию



Похожие материалы

Поставка

Поставщиков защитили от штрафов за невыполненные заказы от торговых сетей

Торговым сетям нужно до 1 марта 2026 года пересмотреть договоры с поставщиками. Больше нельзя их штрафовать за недопоставку товаров, если заказ не был согласован.

Банкротство

Предложено сделать все собрания кредиторов в банкротстве электронными

Для электронных собраний кредиторов можно использовать специальные сервисы, считает Сбер.

Учет в туризме

С 30 июня 2025 иностранные туристы смогут въехать в РФ только после регистрации на Госуслугах

Жители стран, которые могут посещать Россию без виз, будут за 72 часа до въезда регистрироваться на Госуслугах. Для экстренных случаев срок сокращен до 4 часов.

Курсы повышения
квалификации

23
Официальное удостоверение с занесением в госреестр Рособрнадзора

Выгодно ли брать отпуск и как отдыхаем в июне. 🌴👙«Ночной бухгалтер» № 1937

Ура, скоро лето! Вот и сезон отпусков начался, рассказываем, выгодно ли брать в июне отпуск и какие выходные нас ждут в этом месяце.

Иллюстрация: Вера Ревина/Клерк.ру

Путин упростил порядок включения бизнеса в реестр МСП

Юридические лица перестанут считать вновь созданными, если при преобразовании изменилась только организационно-правовая форма.

Мошенничество

Власти запустят приложение для защиты от кибермошенничества

В июне 2025 года Минцифры начнет работу над мобильным приложением, которое будет информировать людей о мошенническом действии. Там будет тревожная кнопка для срочной помощи.

sinykovanat

Отчетный периодв кс2 и кс3

Подскажите, какой ставить отчетный период в КС-2 и КС-3 , если работы начали выполнятся с 1.04.2024 , а закончились 4.04.2025

Эксперт:

Сергей Верещагин

Сергей Верещагин
Эксперт

Получается, что так.

Нарушений нет.

Общество

В гостиницы начали заселять по биометрии

Время регистрации гостей в отелях сократится с 5 минут до 20 секунд, если гости будут использовать биометрию.

Обзоры новостей

⚡️ Итоги дня: «Алису» установят в жилой комплекс, на Wildberries продают плавучие дома, а цены на бытовую технику упали на 10-20%

Подготовили обзор главных событий дня — 23 мая 2025 года. Все самое интересное, что писали и обсуждали в сети, в одной подборке.

Банки

ЦБ разработал новую методику определения системно значимых банков

Концепция определения СЗКО (банков и иных кредитных организаций) будет учитывать число клиентов и наличие экосистем. На новую методику поэтапно перейдут к 2028 году.

НДФЛ

Какие КБК надо указать в уведомлении по НДФЛ за май 2025 г.

До 26 мая бухгалтеры должны сдать уведомление об исчисленном НДФЛ за период с 1 по 22 мая 2025 г. Рассказываем, как заполнить документ, какой указать код периода и КБК для разных ставок НДФЛ.

Иллюстрация: Вера Ревина/Клерк.ру

⚡ Новый онлайн-курс по работе с персональными данными-2025 поможет вам защититься от выросших штрафов Роскомнадзора

С 30 мая в силу вступают изменения по обработке и защите персональных данных. Штрафы за нарушения выросли до 15 млн руб., а уголовные наказания до 8 лет. Защитите себя от проблем с законом — работать безопасно и по актуальным правилам научим на новом онлайн-курсе «Новые правила по защите персданных - 2025».

НДС

🔨 Путин: нужно освободить от НДС услуги по ремонту общего имущества в многоквартирных домах

От НДС освободят все услуги по содержанию и ремонту общедомового имущества, причем даже те, которые оказывают ИП на УСН.

💥 Повышение лимитов для МСП, новый бесплатный сервис «Клерка» от штрафов РКН, новые налоговые льготы в НК РФ, выросла средняя зарплата и др. Топ новостей за неделю

Собрали для вас самые важные бухгалтерские новости недели, которые вы могли пропустить.

Коды ОКВЭД

Блогерам предложили применять ОСНО или УСН

С 2025 года для блогеров ввели новые коды ОКВЭД. Налоговики рекомендуют выбрать подходящий код ОКВЭД для вида деятельности и систему налогообложения.

Ведение бизнеса

🚕 Путин подписал закон о локализации машин в такси

С 1 марта 2026 года автомобили смогут попасть в реестр такси, если наберут нужное число баллов локализации.

❓ Какие трудности возникают при отправке уведомления в Роскомнадзор и как их решить: пользователи делятся опытом

При отправке уведомления в РКН больше всего проблем возникает с подписанием его ЭЦП. В нашем телеграм-канале подсказали несколько вариантов решения.

УСН

Проценты по вкладам ИП должны указывать в декларации. Но Минфин частично опровергает это

В налоговое уведомление налоговики не включают доходы в виде процентов от вкладов на расчетных счетах ИП. За эти проценты ИП должны отчитываться самостоятельно.

С 30 мая 2025 собирать персданные можно только после регистрации в Роскомнадзоре

Если раньше заявление можно было подать после начала работы с данными, то с 30 мая правила изменились — теперь уведомить Роскомнадзор нужно заранее, иначе выпишут штраф. Кстати, для новых правил их поднимут до 15 млн руб.

Цифровой рубль

Цифровой рубль интегрируют в бюджетный процесс – законопроект

С 2025 года цифровой рубль начнут интегрировать в бюджетный процесс. Участники системы казначейских платежей смогут рассчитываться цифровой валютой.

НДС на УСН

Налоговики: новый формат пояснений помимо плюсов требует особого внимания

Формы пояснений для НДС обновили. Теперь их проще заполнить, но нужно уделить внимание разделам о взаимозачетах и экспортных операциях.

Интересные материалы