Доброго времени суток, замечательные люди, и добро пожаловать в 29-й выпуск информационного бюллетеня НЛП! Я Элвис из Белиза, редактор DAIR.ai и доктор наук в области искусственного интеллекта и НЛП. Вот примечательные новости НЛП на этой неделе: новый набор данных тестов машинного перевода; ИИ в здоровье, этике и контекстном мышлении; снижение гендерной предвзятости в наборах данных; несколько попыток улучшить системы субтитров к изображениям; как и почему языковые модели быстро развивают анализ текста, и многое другое.
О людях…
В настоящее время процесс донорства органов в значительной степени автоматизирован с использованием технологий искусственного интеллекта. В недавней статье сообщалось, что с помощью этих алгоритмов уже идентифицируются тысячи живых доноров почек. Процесс, который также требует помощи, - это составление списка ожидания на трансплантацию почки с использованием инструментов принятия решений AI - ссылка
Сообщается, что DARPA инвестирует до 2 миллиардов долларов в инициативу AI Next, цель которой - предоставить машинам возможности контекстного мышления и решения проблем - ссылка
Группа исследователей из Калифорнийского университета разрабатывает новый и новаторский метод, который сохраняет гендерную информацию в словарных векторах, заставляя другие измерения быть свободными от гендерного влияния. Их статья озаглавлена Изучение гендерно-нейтральных встраиваний слов и направлена на снижение гендерной предвзятости, присутствующей в наборах языковых данных - ссылка
BBC недавно провела программу, в которой этика и мораль ИИ обсуждаются с экспертами по ИИ со всего мира. Среди участников программы - Мустафа Сулейман, Ник Бостром и другие студенты - ссылка
В статье NY Times обсуждается потенциал ИИ, чтобы помочь людям общаться и снова общаться - ссылка
Об образовании и исследованиях…
Анализ текста быстро развивается благодаря недавним неконтролируемым методам, используемым для обучения языковых моделей на немаркированных языковых данных. fast.ai, OpenAI и Allen Institute of AI находятся в авангарде технологий этого типа, которые уже способны выполнять сложные задачи НЛП, такие как понимание языка и анализ тональности - ссылка
Луис Серрано выпускает видеолекцию о матричной факторизации и о том, как эту технику можно использовать для рекомендаций фильмов Netflix - ссылка
В новой статье представлен метод НЛП для объединения разрозненных ресурсов и получения точной информации о поставщиках медицинских услуг - ссылка
Команда CSAIL из Массачусетского технологического института разработала систему под названием Dense Object Nets (DON), которая может генерировать 3D-визуализации и описания для объектов, которых она никогда раньше не видела - ссылка
Лекционные материалы доступны для нового курса машинного обучения Себастьяна Рашки », который читается в Вашингтонском университете в Мэдисоне - «ссылка
В документе, принятом на EMNLP 2018, представлен новый эталонный набор данных для машинного перевода зашумленного текста (MTNT), состоящий из комментариев Reddit и переводов, выполненных профессионалами. Он отличается от предыдущих наборов данных, которые в основном генерируются синтетически - ссылка
Узнайте больше об инструментах, таких как iris.ai и Dimensions.ai, которые позволяют искать научный текст с использованием современных методов НЛП и машинного обучения - ссылка
В новом документе предлагается Иерархическая CVAE для детальной классификации языка ненависти - метод понимания языка ненависти в 40 группах ненависти и 13 различных категориях ненависти - ссылка
Вот состав участников семинара по байесовскому глубокому обучению в этом году, организованного в рамках конференции NIPS. Тема этого года - Неопределенность глубокого обучения в реальных приложениях - ссылка
Google AI выпускает инструмент What-If, новую функцию Tensorboard, которая помогает пользователям лучше понимать свои модели машинного обучения без написания кода - ссылка
О коде и данных…
Google выпускает Dataset Search, платформу для быстрого и эффективного поиска открытых наборов данных, которые были загружены на общедоступные сайты, такие как личные веб-сайты и профили университетов - ссылка
Школа анализа данных Яндекса (YSDA) выпускает материал для своего нового курса НЛП (репозиторий GitHub) - ссылка
Jupytext - это плагин Jupyter, который читает и записывает записные книжки в виде простых текстовых файлов. Он поддерживает такие языки, как R, Julia, Python и Markdown, в том числе - ссылка
Google выпускает новый набор данных для подписей к изображениям под названием "Концептуальные подписи". Этот набор данных был выпущен в рамках исследовательской работы, представленной на ACL 2018 - ссылка
Microsoft выпускает набор данных речевого корпуса для индийских языков, чтобы помочь исследователям создавать более совершенные речевые технологии - ссылка
Узнайте все, что вам нужно знать о Google Colaboratory и о том, как начать работу, из этого руководства, написанного dair.ai - ссылка
Стремясь создать более представительные модели машинного обучения и способствовать инклюзивности ИИ, Google AI объявляет конкурс инклюзивных изображений на Kaggle. Задача состоит в том, чтобы создать надежные инструменты создания подписей к изображениям, которые работают даже с изображениями, которые содержат недостаточно представленные группы, на основе набора данных Open Images - ссылка.
GAN Lab - это инструмент визуализации, созданный на основе Tensorflow.js, который учит, как работают и учатся сети GAN - ссылка
Отрасль…
На конференции HR Technology будет представлен ряд технологий человеческих ресурсов (HR) на основе искусственного интеллекта от крупных компаний, таких как Google и IBM. В последнее время большой спрос на технологии, которые можно нанимать автоматически, продолжается, и сейчас идет гонка за созданием самых мощных и интеллектуальных диалоговых ботов для решения кадровых проблем с использованием машинного обучения и НЛП - ссылка
Узнайте о науке о данных, стоящей за системой рекомендаций, используемой Feedly - ссылка
Узнайте, почему машинное обучение как услуга (MLaaS) является следующим этапом машинного обучения и как облачные сервисы стремятся интегрировать сервисы машинного обучения в свою инфраструктуру и упрощают внедрение машинного обучения для других компаний и сервисов в их собственный бизнес - ссылка
В недавней статье обсуждается, почему поиск изображений и видео с помощью искусственного интеллекта - это следующий рубеж. Узнайте, как такие компании, как Panopto и Google, используют НЛП и машинное обучение для создания приложений с мощными возможностями каталогизации и поиска - ссылка
Достойные упоминания…
Радость ИИ - это эпизод, транслируемый BBC, в котором эксперты по ИИ обсуждают, как ИИ меняет наш мир и бросает вызов нашим представлениям об интеллекте и сознании - ссылка
dair.ai выпускает новую статью о том, как вывести вашу науку о данных на новый уровень - ссылка
В этой статье вы можете узнать, чем виртуальные помощники отличаются от чат-ботов - ссылка
Онлайн-справочник TensorFlow, доступный на английском и китайском языках; он основан на стремлении помочь разработчикам как можно быстрее начать работу с TensorFlow - ссылка
Если вы обнаружите какие-либо ошибки или неточности в этом информационном бюллетене, оставьте комментарий ниже.