Control + Enter: наука о пищевых продуктах?

Присоединяетесь к науке о продуктах питания и науке о данных?

Несмотря на ажиотаж вокруг больших данных и растущий интерес к искусственному интеллекту (ИИ), а также все большее с каждым днем сближение между анализом данных и индустрией 4.0, между наукой о продуктах питания и наукой о данных все еще существует разрыв, даже если эта взаимосвязь, очевидно, может приносят пользу обеим дисциплинам.

С одной стороны, наука о продуктах питания может использовать преимущества самых передовых алгоритмов, статистических методов и глубокого обучения, чтобы находить и оценивать то, что называется «особенностями» (обобщая объяснительную силу нескольких переменных и тонн данных одновременно) и признавать взаимосвязи, которые могут быть скрыты. .

С другой стороны, наука о данных ищет практические приложения, но, как показывает хорошо проведенное исследование идей (интеллектуальный анализ данных), цель состоит не в том, чтобы найти бессмысленные отношения или применить алгоритмы классификации или регрессии, если данные не являются отражением реальность и понимание не помогают решать проблемы и придавать ценность.

Одна вещь, которую я хотел бы заявить, заключается в том, что наличие междисциплинарного опыта в области пищевой химии является хорошей основой для начала работы с наукой о данных, например, я только начал изучать программирование на Python в этом году. Суть науки о данных подчеркивается в основном в исчислении и статистике или даже связана с физикохимией и сенсорной оценкой, поэтому моя цель также состоит в том, чтобы продемонстрировать, что этот переход не так сложен, как может показаться.

Однако эта интеграция не происходит мгновенно, наука о данных обычно ожидает тысячи (или даже 10¹²) данных, разбивая их на обучающий и тестовый наборы (обучение с учителем), чтобы модель училась на обучающем наборе и применяла полученные знания. в невиданные ранее тестовые данные, чтобы предотвратить переобучение, эта модель слишком хорошо объясняет данные, на которых она была обучена, но она корректируется с преувеличением и рассматривает ошибки как часть модели, а не как шум.

Хотя интерес к воспроизведению модели машинного обучения в пищевых приложениях может варьироваться в зависимости от каждого отдельного случая, иногда может показаться, что модель требуется для определенного продукта или характеристики, поэтому идея разделить данные на обучение/тестирование может показаться странной. для такой задачи, как физико-химический анализ. Это верно только для проблем с помеченными данными, и мы рассмотрим это в следующих сообщениях.

Тем не менее, должен быть баланс, потому что, как я упоминал ранее, приоритетом является извлечение значимых знаний и эффектов для конкретной проблемы, а не уменьшение показателей ошибок, но мы также должны учитывать, что модель машинного обучения нуждается в большая длина данных для хорошей работы.

Во всем мире существует множество подходов и приложений, связанных с FDS; например, я недавно прочитал о компании, которая использует ИИ для разработки веганских продуктов с сенсорным профилем, аналогичным молочным и мясным продуктам (NotCo®). По-видимому, это достигается за счет обширной базы данных характеристик растительной пищи.

Или другая компания, специализирующаяся на искусственном интеллекте, которая использует прогностические модели для измерения потребительских предпочтений непосредственно на дегустационных панелях и способна обнаруживать недостатки пива по сенсорным данным, интегрируя отслеживание метаболических путей с точностью до шести сигм (Analytical Flavor Systems® [AFS ]).

Как вы можете догадаться, потенциал настолько воображаемый, насколько это возможно, когда я начал концептуализировать идеи, я пришел к оценке срока годности с помощью анализа временных рядов, составлению рецептур пищевых продуктов с оптимизацией алгоритмов потерь, анализу обработки с помощью устройств и датчиков и данных в реальном времени. , интеллектуальная упаковка, обнаружение эмоций, потребительские исследования или сенсорное обучение для судей, чтобы упомянуть некоторые из них.

Я хотел бы заявить, что подход «Food Data Science» (FDS) имеет намерение уважительно помочь уже инновационной и научно обоснованной дисциплине; концептуализация и реализация Науки о продуктах питания были разрушительными и изменили жизнь, если что-то может положительно накормить, улучшить и еще больше укрепить восприятие Науки о продуктах питания, возможно, стоит попробовать.

Итак, идея этого блога состоит в том, чтобы создать мост, соединяющий обе стороны одной медали. Поскольку я считаю, что наука должна быть демократичной, мое намерение состоит в том, чтобы показать игровую позицию, а не строгий анализ или теоретический подход между концепциями. Упрощение — это ключевой инструмент, который помогает нам понять и практиковать способ обучения.

Намерение состоит в том, чтобы описать проект quincenal и изучить процесс, соображения, уроки и идеи, которые я обнаружил в процессе. Так что я могу показать тему, чтобы пробудить ваш интерес к поиску, исследованию и изучению этой темы. Кроме того, если ваш бэкграунд ориентирован на DS&ML, а не на Food Science или наоборот, рекомендую обратиться за помощью к специалистам.

Как я закончил тем, что попробовал этот блог?

Я пищевой химик и магистр инженерного дела, хорошо разбираюсь в статистике, расчетах, пищевой науке, реологии и органолептической оценке. У меня была возможность работать в некоторых отраслях и проводить исследования в ICAT UNAM.

Мои сомнения и неопытность в моей первой работе привели меня к мысли, что исследования и анализ пищевых продуктов должны выходить за рамки таких работ, как поверхностный контакт, стерические препятствия и активность воды. В частности, когда мы говорим о такой сложной матрице, с несоизмеримыми взаимодействующими соединениями… это привело к моему интересу к линейному программированию, планированию экспериментов, теории принятия решений и анализу больших данных в качестве фона и введения в науку о данных благодаря моему магистерскому обучению в области инженерии.

В этом 2020 году я начал учиться программировать и погружаться в науку о данных и машинное обучение. Излишне говорить, что я не являюсь экспертом, но я считаю, что мой опыт может показать, что отношения между наукой о продуктах питания и наукой о данных ближе, чем мы думаем, и в конечном итоге может дать нам ответ, о котором мы просили, и стать необходимостью.

Этот блог также является мотивацией продолжать писать и совершенствовать свои навыки. Так что спасибо за чтение, и если у вас есть какие-либо сомнения или предложения, дайте мне знать, чтобы мы могли увидеть, куда они нас приведут, а пока позвольте мне присоединиться к вам в этом путешествии…

Благодарности:

Наконец, я хотел бы поблагодарить следующих профессоров, инструкторов и группы за их сотрудничество и за то, что они вдохновили меня на развитие этой идеи:

Доктор философии Мария Соледад Кордова Агилар Laboratorio de Ingeniería de Proceso ICAT UNAM

Доктор философии Патрисия Севериано Перес Отдел сенсорной оценки FQ UNAM

PhD Хосе Самано Кастильо - Координация производства калидад-гестион UNAM

М.И. Хорхе Родригес Рубио - профессор Facultad de Ingeniería UNAM

Кандидат наук Катя Франк – заместитель директора по написанию научных статей по английскому языку CONACYT

PhD Габриэль Асканио Гаска Laboratorio de Ingeniería de Proceso ICAT UNAM

PhD Айседора Мартинес Арельяно Laboratorio de Ingeniería de Proceso ICAT UNAM

Андрей Негойе — инструктор Python, наука о данных

Дэниел Бурк — инструктор по машинному обучению

365 Карьера

Хосе Портилья — инструктор Python, временные ряды и прогнозирование

Доктор философии Эктор Мануэль Торрес Домингес - профессор Facultad de Química UNAM

Гастрограф ИИ

Control + Enter: наука о пищевых продуктах?