Публикации по тегам deep-dives

Публикации по теме 'deep-dives'

Линейная регрессия —«Бритва Оккама прогнозного моделирования машинного обучения»

Моделирование машинного обучения с использованием линейной регрессии в Python Вы знакомы с бритвой Оккама? Я помню упоминание об этом в сериале «Теория большого взрыва»! Идея бритвы Оккама заключается в том, что при прочих равных условиях самое простое объяснение явления с большей вероятностью будет верным, чем более сложное (то есть самое простое решение почти всегда является лучшим). Хотелось бы думать, что бритва Оккама прогнозного моделирования в машинном обучении — это линейная..

CNN Фурье с размером ядра 1024x1024 и больше

Многомерные преобразования Фурье в сверточных нейронных сетях В наши дни широко распространены сверточные нейронные сети (CNN). Независимо от их успеха, свертки неэффективны. Скользящее окно требует большого количества вычислений и ограничивает размер ядра. В то же время небольшое ядро, обычно от [3,3] до [7,7], ограничивает поле восприятия, и требуется много слоев для захвата глобального контекста входного тензора (например, 2D-изображений). Чем больше изображение, тем хуже..

EfficientNetV2 — быстрее, компактнее и точнее, чем Vision Transformers

Подробное объяснение моделей EfficientNetV2, а также разработка их архитектуры и методов обучения. В настоящее время EfficientNets являются одной из самых мощных моделей сверточных нейронных сетей (CNN). С появлением Vision Transformers, которые достигли даже более высокой точности, чем EfficientNets, возник вопрос, умирают ли сейчас CNN. EfficientNetV2 доказывает обратное, не только повышая точность, но и сокращая время обучения и задержки. В этой статье я подробно рассказал о том,..

От Graph ML к глубокому реляционному обучению

к Глубокому реляционному обучению От Graph ML к глубокому реляционному обучению Интеграция нейронных сетей с реляционным обучением , чтобы выйти за рамки текущего состояния структурированных моделей глубокого обучения, таких как графовые нейронные сети Графически структурированные данные окружают нас повсюду. С недавним появлением глубокого обучения кажется вполне естественным, что исследователи также начали изучать это представление данных с помощью нейронных сетей. В..

Говори со мной: сколько слов читает модель

| ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ| магистр права| НЛП | Говори со мной: сколько слов читает модель Почему и как преодолеть внутренний предел большой языковой модели LLM продемонстрировали свои навыки в последние месяцы, продемонстрировав, что они хорошо справляются с широким кругом задач. Все это через один способ взаимодействия: подсказка. В последние месяцы наблюдается стремление расширить контекст языковых моделей. Но как это влияет на языковую модель? Эта статья разделена..

Адаптация методологий управления проектами к науке о данных

Записки из промышленности Адаптация методологий управления проектами к науке о данных Как эффективно управлять проектами, основанными на данных, и максимизировать ценность результатов проекта В последние годы специалисты по обработке и анализу данных заняли видное место на различных предприятиях. Специалисты по данным пользуются большим спросом как на технические, так и на нетехнические таланты. В результате специалисты по обработке данных должны продолжать совершенствовать свои..

Решение обратных задач с помощью DeepONet, основанного на физике: практическое руководство с реализацией кода

Два тематических исследования с оценкой параметров и калибровкой входной функции В моем предыдущем блоге мы углубились в концепцию DeepONet, основанного на физике (PI-DeepONet), и выяснили, почему он особенно подходит для обучения операторов, т. е. изучения отображений входной функции в выходную функцию. Мы также превратили теорию в код и внедрили PI-DeepONet, которая может точно решить обыкновенное дифференциальное уравнение (ОДУ) даже с невидимыми входными входными профилями...