Интерес к пониманию содержания и языковым моделям обычно коренится в искренней любви к историям, стилям повествования и языковым нюансам. Несколько лет назад я оказался вовлеченным в задачу по составлению списка менее обсуждаемых сложных проблем в области понимания контента. Именно тогда я наткнулся на слегка игнорируемую проблему поиска дальних семантических отношений. Игнорируется, потому что часто нет стимула работать над чем-то, над чем вы не можете продемонстрировать значительный прогресс.

Рассмотрим простые синтаксические лингвистические отношения в предложении «Обама родился на Гавайях». Он содержит простое отношение типа «откуда» между «Обамой» и «Гавайями». Современные модели ИИ умело обнаруживают эти краткие отношения ближнего действия.

Однако трудность заключается в том, чтобы уловить более сложные, долгосрочные отношения. Рассмотрим сценарий, в котором человек упоминается с помощью контекстных подсказок несколькими абзацами позже, например, в предложении: «Общая температура во время экономического кризиса 2008 года действительно противоречила погоде, в которой вырос гавайский парень». Эти тонкие связи представляют собой большую проблему обнаружения, чем более запутанной становится связь, тем труднее ее раскрыть существующим моделям.

Именно тогда друг с опытом работы в области лингвистики обнародовал откровение, призвав меня обдумать самые пределы этой загадки. Что, если эти отношения неявны, но безошибочно присутствуют? Подумайте о романах с параллельными направлениями или темами, где связи между разными сюжетными линиями становятся очевидными только со временем.

Смотрели «Форрест Гамп»? Помимо его статуса запоминающегося слезоточивого человека, можно задаться вопросом, вращается ли история в первую очередь вокруг испытаний и приключений главного героя или служит сардоническим комментарием на фоне исторических событий. Я позволю вам решить это для себя.

Еще один убедительный пример — «Дети полуночи» Салмана Рушди. На первый взгляд, он представляет собой рассказ о магическом реализме, в центре которого находится человек с очень чувствительным носом. Однако за этим фасадом скрывается личная критика индийской политики пятидесятилетней давности, вникающая в нюансы национального прошлого и его социально-экономического ландшафта.

Это привело меня к: Братья Карамазовы. По моему предвзятому личному мнению, это величайшее произведение этого жанра. Я настолько обожаю эту книгу, что написал к ней отдельный комментарий, который вы можете посмотреть здесь.

По сути, исследованиям и разработкам в понимании содержания предстоит пройти долгий путь, преодолевая простые корреляции и углубляясь в тонкое понимание, распутывая причинно-следственные связи и культивируя толику размышлений, прежде чем развить способность понять, не говоря уже о том, чтобы написать еще один шедевр, такой как «Братья Карамазовы». Действительно, современные генеративные модели, такие как ChatGPT, превосходят некоторые возможности редактирования текста, завершения текста, помощи в поиске и облегчения категоризации.

Тем не менее считать их смертью всего творчества кажется излишним.