Доброго времени суток, замечательные люди, и добро пожаловать в 29-й выпуск информационного бюллетеня НЛП! Я Элвис из Белиза, редактор DAIR.ai и доктор наук в области искусственного интеллекта и НЛП. Вот примечательные новости НЛП на этой неделе: новый набор данных тестов машинного перевода; ИИ в здоровье, этике и контекстном мышлении; снижение гендерной предвзятости в наборах данных; несколько попыток улучшить системы субтитров к изображениям; как и почему языковые модели быстро развивают анализ текста, и многое другое.

О людях…

В настоящее время процесс донорства органов в значительной степени автоматизирован с использованием технологий искусственного интеллекта. В недавней статье сообщалось, что с помощью этих алгоритмов уже идентифицируются тысячи живых доноров почек. Процесс, который также требует помощи, - это составление списка ожидания на трансплантацию почки с использованием инструментов принятия решений AI - ссылка

Сообщается, что DARPA инвестирует до 2 миллиардов долларов в инициативу AI Next, цель которой - предоставить машинам возможности контекстного мышления и решения проблем - ссылка

Группа исследователей из Калифорнийского университета разрабатывает новый и новаторский метод, который сохраняет гендерную информацию в словарных векторах, заставляя другие измерения быть свободными от гендерного влияния. Их статья озаглавлена ​​Изучение гендерно-нейтральных встраиваний слов и направлена ​​на снижение гендерной предвзятости, присутствующей в наборах языковых данных - ссылка

BBC недавно провела программу, в которой этика и мораль ИИ обсуждаются с экспертами по ИИ со всего мира. Среди участников программы - Мустафа Сулейман, Ник Бостром и другие студенты - ссылка

В статье NY Times обсуждается потенциал ИИ, чтобы помочь людям общаться и снова общаться - ссылка

Об образовании и исследованиях…

Анализ текста быстро развивается благодаря недавним неконтролируемым методам, используемым для обучения языковых моделей на немаркированных языковых данных. fast.ai, OpenAI и Allen Institute of AI находятся в авангарде технологий этого типа, которые уже способны выполнять сложные задачи НЛП, такие как понимание языка и анализ тональности - ссылка

Луис Серрано выпускает видеолекцию о матричной факторизации и о том, как эту технику можно использовать для рекомендаций фильмов Netflix - ссылка

В новой статье представлен метод НЛП для объединения разрозненных ресурсов и получения точной информации о поставщиках медицинских услуг - ссылка

Команда CSAIL из Массачусетского технологического института разработала систему под названием Dense Object Nets (DON), которая может генерировать 3D-визуализации и описания для объектов, которых она никогда раньше не видела - ссылка

Лекционные материалы доступны для нового курса машинного обучения Себастьяна Рашки », который читается в Вашингтонском университете в Мэдисоне - «ссылка

В документе, принятом на EMNLP 2018, представлен новый эталонный набор данных для машинного перевода зашумленного текста (MTNT), состоящий из комментариев Reddit и переводов, выполненных профессионалами. Он отличается от предыдущих наборов данных, которые в основном генерируются синтетически - ссылка

Узнайте больше об инструментах, таких как iris.ai и Dimensions.ai, которые позволяют искать научный текст с использованием современных методов НЛП и машинного обучения - ссылка

В новом документе предлагается Иерархическая CVAE для детальной классификации языка ненависти - метод понимания языка ненависти в 40 группах ненависти и 13 различных категориях ненависти - ссылка

Вот состав участников семинара по байесовскому глубокому обучению в этом году, организованного в рамках конференции NIPS. Тема этого года - Неопределенность глубокого обучения в реальных приложениях - ссылка

Google AI выпускает инструмент What-If, новую функцию Tensorboard, которая помогает пользователям лучше понимать свои модели машинного обучения без написания кода - ссылка

О коде и данных…

Google выпускает Dataset Search, платформу для быстрого и эффективного поиска открытых наборов данных, которые были загружены на общедоступные сайты, такие как личные веб-сайты и профили университетов - ссылка

Школа анализа данных Яндекса (YSDA) выпускает материал для своего нового курса НЛП (репозиторий GitHub) - ссылка

Jupytext - это плагин Jupyter, который читает и записывает записные книжки в виде простых текстовых файлов. Он поддерживает такие языки, как R, Julia, Python и Markdown, в том числе - ссылка

Google выпускает новый набор данных для подписей к изображениям под названием "Концептуальные подписи". Этот набор данных был выпущен в рамках исследовательской работы, представленной на ACL 2018 - ссылка

Microsoft выпускает набор данных речевого корпуса для индийских языков, чтобы помочь исследователям создавать более совершенные речевые технологии - ссылка

Узнайте все, что вам нужно знать о Google Colaboratory и о том, как начать работу, из этого руководства, написанного dair.ai - ссылка

Стремясь создать более представительные модели машинного обучения и способствовать инклюзивности ИИ, Google AI объявляет конкурс инклюзивных изображений на Kaggle. Задача состоит в том, чтобы создать надежные инструменты создания подписей к изображениям, которые работают даже с изображениями, которые содержат недостаточно представленные группы, на основе набора данных Open Images - ссылка.

GAN Lab - это инструмент визуализации, созданный на основе Tensorflow.js, который учит, как работают и учатся сети GAN - ссылка

Отрасль…

На конференции HR Technology будет представлен ряд технологий человеческих ресурсов (HR) на основе искусственного интеллекта от крупных компаний, таких как Google и IBM. В последнее время большой спрос на технологии, которые можно нанимать автоматически, продолжается, и сейчас идет гонка за созданием самых мощных и интеллектуальных диалоговых ботов для решения кадровых проблем с использованием машинного обучения и НЛП - ссылка

Узнайте о науке о данных, стоящей за системой рекомендаций, используемой Feedly - ссылка

Узнайте, почему машинное обучение как услуга (MLaaS) является следующим этапом машинного обучения и как облачные сервисы стремятся интегрировать сервисы машинного обучения в свою инфраструктуру и упрощают внедрение машинного обучения для других компаний и сервисов в их собственный бизнес - ссылка

В недавней статье обсуждается, почему поиск изображений и видео с помощью искусственного интеллекта - это следующий рубеж. Узнайте, как такие компании, как Panopto и Google, используют НЛП и машинное обучение для создания приложений с мощными возможностями каталогизации и поиска - ссылка

Достойные упоминания…

Радость ИИ - это эпизод, транслируемый BBC, в котором эксперты по ИИ обсуждают, как ИИ меняет наш мир и бросает вызов нашим представлениям об интеллекте и сознании - ссылка

dair.ai выпускает новую статью о том, как вывести вашу науку о данных на новый уровень - ссылка

В этой статье вы можете узнать, чем виртуальные помощники отличаются от чат-ботов - ссылка

Онлайн-справочник TensorFlow, доступный на английском и китайском языках; он основан на стремлении помочь разработчикам как можно быстрее начать работу с TensorFlow - ссылка

Если вы обнаружите какие-либо ошибки или неточности в этом информационном бюллетене, оставьте комментарий ниже.