[Неделя 2 - SeeFood]

Тема: Расчет калорийности пищи

Члены команды: Окан Алан Гёкберк Шахин Эмре Языджи

На этой неделе мы углубились в связанные работы, упомянутые на прошлой неделе, чтобы лучше понять, как мы собираемся предсказать калорийность пищи, просто исходя из ее изображения.

Мы, люди, можем довольно точно измерить калорийность, скажем, яблока. Как? Что ж, нам просто нужны точные весы и смартфон, чтобы узнать, сколько калорий в 100 граммах яблока. Поскольку в наших карманах нет точных весов, мы просто смотрим на вес яблока и умножаем его на количество калорий на 100 грамм. Поэтому мы задали вопрос: «Как выглядит у людей глазное яблоко?». После прочтения пары статей в Интернете выяснилось, что мы склонны оценивать вес объекта по его объему, и исследователи, написавшие статью, упомянутую в предыдущем посте, сделали то же самое. Они имитировали алгоритм того, как люди оценивают калории. Как и люди, мы оцениваем объем, затем используем этот объем для оценки массы и, наконец, умножаем массу на количество калорий на грамм.

Сегментация изображений

Авторы статьи выбрали Faster R-CNN вместо использования метода семантической сегментации, такого как полностью сверточные сети (FCN). Здесь, после того как изображения вводятся как каналы RGB, исследователи могут получить серию ограничивающих рамок. В этом процессе используется подход обработки изображений для сегментации каждой ограничивающей рамки. Ограничивающие рамки вокруг объекта, необходимые для алгоритма, могут быть предоставлены Faster R-CNN. После сегментации мы можем получить серию изображений еды, хранящихся в матрице, но со значениями пикселей фона, замененными нулями. Это оставит только пиксели переднего плана.

Оценка объема

Для оценки объема рассчитаем масштабные коэффициенты на основе калибровочных объектов. Исследователи использовали монету в 1 юань, чтобы показать конкретный процесс расчета объема. Диаметр монеты составляет 2,5 см, а масштабный коэффициент вида сбоку был рассчитан по уравнению 1.

В этом уравнении Ws - это ширина ограничивающего прямоугольника, Hs - это высота ограничивающего прямоугольника. Точно так же масштаб вида сверху можно рассчитать с помощью уравнения 2.

После разделения продуктов на три категории по форме: эллипсоид, столбик, неправильная форма. В соответствии с уравнением 3 для разных типов пищевых продуктов будет выбрана другая формула оценки объема. HS - высота бокового обзора PS, а LkS - количество пикселей переднего плана в строке k (k ∈ 1,2,…, HS).

LMAX = max (Lk,…, Lk), он записывает максимальное количество пикселей переднего плана в PS. ß - коэффициент компенсации (значение по умолчанию = 1,0). После этого для каждого типа еды будет уникальное значение.

Оценка калорий

После оценки объема следующим шагом будет оценка массы каждого продукта. Его можно рассчитать по уравнению 4, где v (см³) представляет объем текущей пищи, а ρ (г / см³) представляет собой значение плотности.

Тогда калорийность пищи может быть получена с помощью уравнения 5.

Где m (г) представляет собой массу текущей пищи, а c (Ккал / г) представляет количество калорий на грамм.

В упомянутой предыдущей работе исследователи получили относительно точную оценку, как видно из следующей таблицы:

На следующей неделе мы изучим различные методы и, надеюсь, в конечном итоге найдем подход, который повысит точность этих оценок. В противном случае мы просто попытаемся добиться лучших результатов, расширив набор данных.

Ссылки

Https://syncedreview.com/2017/08/03/deep-learning-based-food-calorie-estimation-method-in-dietary-assessment/

[Неделя 2 - SeeFood]

Вопросы по теме