Визуализация прогресса машинного обучения

На фото копия Bonnier. Для большинства людей это просто старая книга. Но для тысяч студентов-биологов из Европы он стал символом пытки, которой был экзамен по ботанике, который включал определение с помощью Бонье определенного количества видов растений, среди которых всегда были травы с особенно запутанной таксономией и основанные на минимальном количестве растений. различимые атрибуты, которые требовали использования бинокулярной лупы. Трудная, скучная задача, для выполнения которой требовался определенный опыт. По общему мнению, идентификация ботанических видов продолжается таким же образом, и Bonnier все еще используется, хотя и в более новой версии, и даже требуется для некоторых экзаменов, чтобы стать учителем (ссылка на испанском).

В мои дни, в середине 1980-х, мы использовали Bonnier именно такой, как на иллюстрации (он всегда выглядел старым, хотя издание было выпущено в 1972 году), издание в мягкой обложке на бумаге плохого качества, на французском языке, и я был одержим идеей Оцифровка его. Я даже подготовил базу данных и простой интерфейс для нее с dBASE и Clipper, все на MS-DOS. Если бы я выполнил, чего не сделал, когда осознал титаническую задачу оцифровки всех этих файлов и атрибутов нескольких тысяч видов сосудистых растений, вместо того, чтобы перелистывать страницы книги, я мог бы использовать экран и в честно говоря, это не было бы большим прорывом.

Теперь, более тридцати лет спустя, статья в журнале Nature, ссылающаяся на Boing Boing, Искусственный интеллект определяет виды растений для науки, объясняет разработку алгоритма машинного обучения: после его обучения примерно 260 000 оцифрованных изображений большего количества более тысячи видов растений в гербариях по всему миру - по оценкам, в мире существует около 3000 гербариев определенного размера, в общей сложности около 350 миллионов образцов, из которых лишь небольшая часть была оцифрована - the алгоритм способен идентифицировать растение с вероятностью успеха 80% (в 90% случаев вид был среди первых пяти вариантов алгоритма). Эти показатели успеха превышают показатели ботаников, которые являются экспертами в области систематики (в мое время для сдачи экзамена нам требовалось правильно определить три растения из пяти, а мы были всего лишь студентами третьего курса).

Когда вы видите алгоритм, способный выполнить задачу, сложность которой вы можете оценить с точки зрения вашего опыта, вы понимаете потенциал машинного обучения. Моя элементарная попытка оцифровки заключалась просто в том, чтобы упростить идентификацию видов растений. Теперь все, что требуется, - это показать алгоритму оцифрованное изображение растения, и он сразу же определит его жанр и вид с вероятностью успеха 80%.

Каковы последствия для развития ботаники? Через несколько лет, учитывая производительность алгоритма и необходимые исправления, ни один исследователь не сможет определить вид растения без помощи соответствующего алгоритма: немногие, кто сможет это сделать, будут пенсионерами с их Боннье на книжной полке. Конечно, только благодаря знаниям этих профессионалов можно было обучить алгоритм, и этим профессионалам будут поручены другие задачи в мире, в котором больше не будет необходимости тратить время или усилия на идентификацию растения. потому что это будет сделано автоматически. Необходимо будет изменить способ преподавания дисциплины, включив в нее другие виды упражнений, другие материалы и другие дисциплины, тем самым расширив границы знаний. Будет ли потеря способности определять растения на глаз большой потерей? Нет. Как и сегодня, вряд ли кто-то может писать клинописи на глиняной табличке.

Имеет ли это какое-то отношение к «умным» роботам? Нет, алгоритм, который классифицирует виды растений, делает то, что до недавнего времени мог делать только человек, но это не интеллект: он просто способен выполнять очень определенную задачу, основанную на ряде атрибутов. Примените алгоритм к чему-нибудь еще, и вам потребуется внести целый ряд корректировок. Интеллект - это другое дело.

Собираются ли роботы заменить ботаников? Нет. Речь идет о применении человеческого интеллекта для решения более важных задач, высвобождении ресурсов, которые не были оптимизированы ... это о прогрессе в дисциплине. И могут ли профессионалы отказаться от совместной работы по обучению алгоритму, опасаясь, что их в конечном итоге заменят? Идея абсурдная, практически оскорбительная. Вопрос, который мы должны задать себе: сколько вещей, которые мы сегодня считаем исключительно человеческими, в конечном итоге будут выполняться алгоритмами, и сколько еще вещей позволит нам делать это?

(En español, вода)