НОВОСТИ, БЮЛЛЕТЕНЬ

Практическое распределенное обучение с детерминированным ИИ, революционным алгоритмом, кодированным смещением… и многим другим!

Новости, исследования и обновления искусственного интеллекта, захватывающая встреча по распределенному практическому обучению и наши ежемесячные подборки редакций!

Если у вас возникли проблемы с чтением этого письма, откройте его в веб-браузере.

С возвращением, навстречу семье AI! Прошло немного времени с тех пор, как мы отправили наш последний информационный бюллетень. В этом выпуске мы представляем вам несколько интересных вещей, которые, как мы думаем, вам понравятся. Для начала ознакомьтесь с этой отличной и бесплатной встречей по практическому распределенному обучению, организованной нашими друзьями из Determined AI (бесплатный обед включен 😊):

Решительный ИИ проводит сеанс обеда и обучения о том, как ускорить обучение модели и сэкономить деньги на ресурсах графического процессора. Присоединяйтесь к нам 13 апреля, чтобы получить практическое интерактивное руководство по практическому распределенному обучению и получить обед от нас!

Исследовательская группа Delphi Research Group Карнеги-Меллона в сотрудничестве с Facebook опубликовала результаты последнего исследования COVID-19. Анализ опроса показывает, что нерешительность в отношении вакцинации сохраняется. Профессор науки о данных и статистики Алекс Рейнхарт обсуждает возможные стратегии решения этой проблемы.

У компьютерного зрения есть несколько потенциальных приложений. Однако является ли распознавание лиц этичным и точным? Исследователь из Массачусетского технологического института Джой Буоламвини решает эту парадигму, поскольку она обнаруживает, что распознавание лиц не позволяет точно увидеть темнокожие лица в документальном фильме Coded Bias , Только что запущенный на Netflix.

Вы с нетерпением ждете возможности отправить свой доклад на NeurIPS 2021? Ознакомьтесь с этим аккуратным руководством председателей программы NeurIPS, выделив контрольный список, чтобы убедиться, что ваша статья соответствует ее стандартам, включая прозрачность, усиление интеграции, потенциальное социальное воздействие, этическую экспертизу и т. Д. .

Если вас интересует обучение с подкреплением, посмотрите этот проект от Google AI, где демонстрируется, как новый алгоритм учит агентов решать задачи, предоставляя только примеры успеха. Его новизна заключается в том, что он не требует созданных вручную функций вознаграждения, как в обычных алгоритмах обучения с подкреплением, что превосходит предыдущие подходы к обучению.

Конференция по справедливости, подотчетности и прозрачности (ACM FAccT 2021) становится очень популярной благодаря своим усилиям по увеличению разнообразия, справедливости и вовлеченности в междисциплинарные исследования, особенно в области компьютерных наук, социальных и гуманитарных наук. Этот пост Нил-Яны Акпинар из машинного обучения в CMU демонстрирует некоторые соответствующие исследовательские работы и руководства, принятые на FAccT 2021, чтобы дать вам представление о том, что конференция ищет.

Наборы данных Машинное обучение содержат ошибки маркировки. Исследователи из Массачусетского технологического института и Amazon углубились в эту проблему в своей исследовательской статье, подчеркнув, что 10 широко цитируемых наборов данных, включая ImageNet, содержат процент ошибок в 3,4%. Если вы хотите прочитать более понятную версию, ознакомьтесь с разделом Ошибки меток в наборах тестов ML.

Если вы еще не пробовали, мы недавно выпустили нашу книгу по описательной статистике с Python. Эта статья или этот PDF содержит образцы первых 36 страниц книги. Не забывайте, что вы можете получить доступ к этой работе, многим другим книгам и другим вкусностям, став участником.

Теперь о ежемесячных выборах! Мы выбираем эти статьи на основе читателей, поклонников и просмотров конкретной статьи. Мы надеемся, что вам понравится читать их так же, как и нам. Также мы начали делать что-то новое! Мы выберем наши самые популярные статьи, а наши редакторы выберут пару эссе, которые не показали выдающихся результатов, но из-за их качества - они попали в список за месяц.

Поделиться - это забота. Не стесняйтесь делиться нашей информационной рассылкой или ссылкой для подписки со своими друзьями, коллегами и знакомыми. Одно электронное письмо в месяц; отказаться от подписки в любое время! Если у вас есть отзывы о том, как мы можем улучшить, пожалуйста, дайте нам знать.

📚 Избранные статьи месяца по выбору редакции ↓ 📚

Нам больше не нужно беспокоиться о переобучении, Шон Бенхур Дж.

В глубоком обучении мы используем алгоритмы оптимизации, такие как SGD / Adam, для достижения сходимости в нашей модели, что приводит к нахождению глобальных минимумов, то есть точки, в которой потери обучающего набора данных невелики. Но несколько видов исследований, таких как Zhang и др., показали, что многие сети могут легко запоминать обучающие данные и обладают способностью переобучаться. Чтобы предотвратить эту проблему и добавить больше обобщений, исследователи из Google опубликовали новый документ под названием Минимизация понимания резкости, в котором представлены современные результаты по CIFAR10 и другим наборам данных.

[Подробнее]

Ультрасовременная маркировка данных с помощью настоящей платформы управления данными на базе искусственного интеллекта от Towards AI Team

Маркировка данных является неотъемлемой частью рабочего процесса машинного обучения, особенно предварительной обработки данных, когда как входные, так и выходные данные помечаются для классификации, чтобы представить базу обучения для запланированной обработки данных. Мы используем маркировку данных для идентификации необработанных данных, таких как объекты в изображениях, видео, тексте и т. Д. Он работает путем прикрепления одного или нескольких значимых и информативных ярлыков для создания контекста, чтобы модель могла учиться на нем.

[Подробнее]

Методы ансамбля, объясненные простым языком: упаковка Клаудиа Нг

В этой статье я рассмотрю популярный метод ансамбля однородных моделей - мешковину. Однородные ансамбли объединяют большое количество базовых оценок или слабых учеников одного и того же алгоритма. Принцип, лежащий в основе однородных ансамблей, - это идея «мудрости толпы» - коллективные предсказания множества различных моделей лучше, чем любой набор предсказаний, сделанный единственной моделью. Для этого есть три требования ...

[Подробнее]

GAM и сглаживающие сплайны (Часть-1) от Сай Прадип Пери

В современном мире, где глубокое обучение используется в большинстве приложений машинного обучения, интерпретируемость стала первостепенной задачей в реальных приложениях. Интерпретируемость модели имеет решающее значение для понимания того, как различные переменные взаимодействуют для генерации решений модели. В этом контексте я хочу суммировать мощное семейство интерпретируемых моделей - Обобщенные аддитивные модели (GAM) вместе с их строительными блоками - сглаживающими сплайнами.

[Подробнее]

Пошаговое базовое понимание нейронных сетей с Keras в Python от Амит Чаухан

Нейронные сети находятся на подъеме в отраслях по всему миру. Речь идет о традиционных алгоритмах машинного обучения для регрессии, классификации, кластеризации и т. Д. Когда мы получаем большие сложные данные, возникают проблемы с точностью, чрезмерной подгонкой и увеличением времени на тестирование и обучение. В этой статье мы обсудим простую нейронную сеть и ее определение на примере Кераса. Использование нейронных сетей вместо традиционного машинного обучения для обеспечения точности и обработки больших сложных данных.

[Подробнее]

Анализ поэзии в Python Кертис Томпсон

Насколько легко написать стихотворение? Добавьте несколько слов на страницу, заставьте их рифмовать, и у вас есть стихотворение. Некоторые поэты, вероятно, морщатся сразу после прочтения этого предложения. Может быть, вы решили следовать хорошо известной форме поэзии, такой как хайку, лимерики и сонеты - это, безусловно, сделает ваши слова похожими на стихотворение. Иногда бывает трудно понять, соответствует ли ваше стихотворение форме. Вот где вам пригодятся ваши навыки программирования!

[Подробнее]

Почему Python - идеальный язык для проекта машинного обучения, Бипин Биддаппа П. К.

Python всегда преуспевал благодаря своей стабильной и легко обслуживаемой природе, и, как популярный подросток, проходящий по коридорам средней школы, python в последние годы привлекал внимание многих. Индекс TIOBE четыре раза признавал его языком года с момента его создания.

[Подробнее]

300 ноутбуков НЛП и свобода от Quantum Stat

Если вы впервые слышите о SDNR, то это удобный репозиторий, содержащий более 300 записных книжек Colab (и их количество растет), посвященных обработке естественного языка (NLP). Colab - это, по сути, записная книжка Jupyter, которую можно использовать и делиться через ядро ​​на базе Интернета. Лучшая часть этих ноутбуков заключается в том, что вы можете использовать бесплатный графический процессор, обычно K80 или T4, или даже TPU (если вы чувствуете себя опасно), для точной настройки вашей модели NLP. Если вы хотите познакомиться с Colab, вы можете посмотреть это видео здесь ...

[Подробнее]

Создайте веб-приложение для интерпретации ваших прогнозов машинного обучения за секунды с помощью Shapash, автор Четан Амби

Shapash позволяет создать красивое веб-приложение для интерпретации ваших моделей машинного обучения за считанные секунды, как только модель будет готова. Вам не нужно тратить время на создание собственных веб-приложений. Это сэкономит много времени вам и вашей команде. Разве это не интересно? Если вы дочитали до этого места, то я уверен, что вам это интересно.

[Подробнее]

Полное руководство по доверительному интервалу, t-тесту и z-тесту в R для специалистов по данным от Рашиды Насрин Саки

Доверительный интервал, t-критерий и z-критерий - модные и широко используемые методы в статистических выводах. Они так важны, потому что мы можем использовать только выборку, чтобы сделать вывод о большой совокупности для любого исследования или анализа данных. В этом случае эти статистические методы вывода помогают нам учитывать ошибки и делать более точные оценки для большей совокупности, используя меньшую выборку.

[Подробнее]

Специалисты по анализу данных должны овладеть математикой Бенджамин Оби Тайо, доктор философии

Наука о данных - это междисциплинарная область, в которой используются научные методы, процессы и алгоритмы для извлечения знаний и понимания из данных. Область науки о данных состоит из нескольких подразделов, таких как интеллектуальный анализ данных, преобразование данных, визуализация данных, машинное обучение, глубокое обучение и т. Д. В качестве научной дисциплины задача науки о данных может быть разбита на 3 основных этапа ...

[Подробнее]

Как Microsoft Icebreaker решает проблему холодного старта в моделях машинного обучения, Хесус Родригес

Получение и маркировка обучающих данных остается одной из основных проблем массового внедрения решений машинного обучения. В сообществе исследователей машинного обучения было предпринято несколько попыток, таких как обучение со слабым учителем или однократное обучение, для решения этой проблемы. Microsoft Research недавно создала группу под названием Minimum Data AI для работы над различными решениями для моделей машинного обучения, которые могут работать без необходимости в больших наборах обучающих данных.

[Подробнее]

Чем полезна бизнес-аналитика для специалиста по данным? Автор Евгения Анелло

На самом деле я встречаюсь с Business Intelligence во время стажировки в области Data Science. Но это не в первый раз. Это повторилось во время предыдущей стажировки на другой должности в компании ИКТ. Во время учебы в университете я ни разу не прочитал курс на эту тему, и это непросто понять, когда в Интернете много новых концепций и мало ресурсов. Итак, что такое Business Intelligence? Почему мы обычно встречаемся с ним, когда идем на работу, а не во время учебы?

[Подробнее]

Курс Fastai, глава 1, Linux, автор Дэвид Литтлфилд

его статья представляет собой расширенное руководство, призванное помочь вам узнать, что происходит на протяжении всей главы. Он предоставляет определения терминов, команд и кода, которые используются в статье. Он также содержит подчеркнутый текст со ссылками на дополнительные определения в глоссарии статьи. В первой главе учебника показано, как построить 5 различных моделей примерно с 5 строками кода. Он строит модель для классификации изображений, сегментации изображений, классификации текста…

[Подробнее]

Создание озера данных с помощью AWS, Магдалена Конкевич

Каждый день большие и маленькие компании собирают все больше и больше данных. Предприятия обычно собирают данные о деятельности компаний, клиентах, конкуренции, продуктах и ​​т. Д. Им необходимо хранить, обрабатывать и эффективно анализировать всю эту информацию. Традиционное решение по созданию складов и баз данных просто не соответствует задаче удовлетворения потребностей компаний, поскольку они имеют дело с огромными объемами данных.

[Подробнее]



«Спонсоры | Узнайте, как стать спонсором с помощью ИИ.
Хотите ли вы привлечь внимание читателей к своему продукту, привлечь высокорелевантную нишевую аудиторию или… SPonsors.towardsai .сеть"







🙏 Спасибо, что являетесь подписчиком на Навстречу AI! 🙏

Следуйте за нами ↓

[Facebook] | [Twitter] | [Instagram] | [LinkedIn] | [Github] | [Новости Google]