Цифровая трансформация стала главным приоритетом для компаний, и эта тенденция будет еще больше ускоряться в свете текущей ситуации с COVID-19. В рамках этого развития компании и государственные учреждения прилагают усилия для оцифровки своих документов и, следовательно, ежедневно собирают огромное количество данных.
В связи с чем может возникнуть вопрос: есть ли момент, когда мы больше не будем работать с документами?
Понимание документов: человек против машины
Во-первых, давайте сравним, как машины читают и понимают документы, и как люди понимают документы.
Машины могут обрабатывать только структурированные данные. Для машины структурированные данные представляют собой строки чисел или символов. Информация представлена таким образом, что ее можно просто обработать, так как логика задана, и вся информация является явной. Такие документы, как скан, pdf или электронная почта, как правило, более сложны, в них неявно дается много информации. Большое разнообразие макетов, структур, встроенной логики и знания контекста чрезвычайно затрудняет автоматизированную обработку.
Вот тут-то и появляются люди. Поскольку нас всю жизнь учили читать и понимать информацию в документах, мы можем схватывать и анализировать документы «на лету».
Благодаря этому человек отлично справляется с обработкой неструктурированных данных, которыми является большинство документов. В процессе оцифровки новые технологии, такие как машинное обучение, улучшают доступ к неструктурированным данным и делают их пригодными для обработки машинами в целом.
Человек: бесконечный источник документов
Близок ли конец документам?
Есть один момент, который делает такой сценарий трудным, если не невозможным: это творчество человечества. Пока у нас есть идеи и мы хотим обменяться ими с нашими коллегами и друзьями в письменной форме, мы будем использовать документы как средство коммуникации. Творчество и интерпретация не могут быть разбиты на код, поскольку они требуют человеческого взаимодействия и обмена.
Мы сталкиваемся с проблемой и пытаемся найти решения, используя предыдущий опыт вместе с внешними входными данными, частично в виде структурированных данных, частично в виде обратной связи с людьми. Это всего лишь один пример того, как мы анализируем, делаем выводы и создаем новые вещи таким образом, который слишком сложен, чтобы его можно было разбить на стандартную цепочку чисел.
Полный жесткий диск вместо горы файлов
Поэтому маловероятно, что документы исчезнут в ближайшее время. Чего мы можем ожидать, так это уменьшения количества документов в их физической форме по мере того, как компании и другие учреждения продвигаются в своем цифровом путешествии. С другой стороны, количество цифровых документов резко возросло за последние несколько лет и, как ожидается, будет расти почти экспоненциально в случае неструктурированных данных.
Реальность такова: каждый год создается около 2,5 триллионов PDF-документов, а в 2019 году ежедневно отправляли около 293 миллиардов электронных писем. По оценкам IDC (International Data Corporation), в 2025 году мировое производство данных достигнет 175 зеттабайт, что в десять раз больше, чем в 2017 году, и большая часть из них — неструктурированные данные.
Так как же нам подготовиться к будущему с таким огромным объемом информации? Многие предприятия уже предприняли один из первых шагов: оцифровка своих документов. В качестве следующего шага вы хотите найти интеллектуальную систему, которая позволит вам обрабатывать огромное количество документов и преобразовывать их из неструктурированных в структурированные данные. И хотя машины, возможно, не смогут полностью заменить нас в чтении и понимании документов, они, по крайней мере, могут помочь нам в их организации и немного упростить нашу жизнь.
Чтобы узнать больше об Интеллектуальной обработке документов (IDP), посетите acodis.io