Еженедельник AI Santosh GSK - Выпуск 2

Subscribe to the newsletter to get weekly updates on AI

В этом информационном бюллетене вы узнаете обо всех последних событиях в области машинного обучения и искусственного интеллекта, произошедших за последнюю неделю. Как мы все знаем, эта область развивается с головокружительной скоростью, и трудно успеть за всеми событиями. Я надеюсь, что этот информационный бюллетень поможет исследователям, отраслевым практикам или любому Любопытному Джорджу быть в курсе событий :)

Я разбил новости на разные разделы в зависимости от типа контента, не стесняйтесь переходить к тем разделам, которые вам будут интересны.

Улучшение разговорных агентов (чат-ботов)

[1905.08743] Генератор переносимых многодоменных состояний для диалоговых систем, ориентированных на задачи

Arxiv.org

В целенаправленных диалоговых системах (читайте о чат-ботах) самой сложной проблемой будет отслеживание состояния диалога (DST). Всякий раз, когда пользователь переключает контекст, часто бывает трудно отследить несколько предыдущих контекстов, чтобы ответить соответствующим образом. В этой статье авторы поделились подходом, который они назвали TRADE, который может решить DST с нулевым обучением.

Достижения в разговорном ИИ - ai.facebook.com
ИИ Facebook добился научного прогресса в улучшении тонких разговорных навыков, включая последовательность, конкретность и сопереживание.

Безопасность, конфиденциальность и социальное влияние

Поскольку охват приложений машинного обучения превышает миллиарды, стало критически важно обсудить социальное воздействие, безопасность таких приложений машинного обучения и то, как можно защитить конфиденциальность пользователей, если (когда) будут использоваться их данные.

GitHub - jphall663 / secure_ML_ideas: Практические идеи по защите моделей машинного обучения - github.com

Можно ли взломать системы машинного обучения? Если да, то каковы возможные пути? Нам лучше позаботиться о защите наших приложений. Узнайте о шести различных способах взлома систем машинного обучения, которые кратко описаны в шпаргалках в этом репозитории.

Снижение злонамеренного использования синтетических медиа-исследований - Авив Овадья - Medium - medium.com

Последние достижения искусственного интеллекта использовались для злонамеренных целей, таких как создание фальшивых видеороликов для преследования журналистов, создание фальшивых голосов за финансовые преступления, видеороликов, которые затрагивают не только знаменитостей, но и широкую публику. Учитывая такие угрозы, продолжаются дискуссии о политике публикации новых исследований, которые хорошо сформулированы в этой статье. Кроме того, авторы представили общие рекомендации по созданию долгосрочного решения.

Технология сопоставления фотографий и видео с открытым исходным кодом, чтобы сделать Интернет более безопасным | Facebook Newsroom - newsroom.fb.com

Социальные сети использовались для распространения вредоносного контента, такого как эксплуатация детей, террористическая пропаганда и т. Д. Выявление таких СМИ и удаление их из сети имеет решающее значение, поскольку социальные сети влияют на миллиарды людей по всей планете. Facebook предоставил открытый исходный код для своего программного обеспечения, которое обнаруживает идентичные и почти идентичные фотографии / видео с помощью методов хеширования. Его можно в дальнейшем использовать в медиа-компаниях для предотвращения распространения такого вредоносного контента.

[1902.01046] На пути к федеративному обучению в масштабе: проектирование системы

Arxiv.org

Федеративное обучение, структура для сохранения конфиденциальности пользователей за счет перемещения модели обучения в расположение данных, а не наоборот, было масштабно развернуто Google на мобильных устройствах. В этом документе они описывают свою производственную архитектуру и то, как они решили некоторые проблемы, такие как доступность устройств, ненадежное подключение, ограниченное хранилище устройств и вычислительные ресурсы.

Оптимизация гиперпараметров

GitHub - pfnet / optuna: фреймворк для оптимизации гиперпараметров - github.com

В существующих структурах оптимизации гиперпараметров используется установка статических параметров, и не выполняется обрезка для исключения определенных значений параметров. Для решения этих проблем создана Optuna, которая очень гибкая в построении различных моделей вместе со значениями динамических параметров. Они утверждали, что превзошли существующие инструменты оптимизации гиперпараметров, такие как HyperOpt, Spearmint и т. Д.

[1902.01894] Обобщенная система обучения населения

Arxiv.org

В обучающих нейронных сетях гиперпараметры устанавливаются вручную, а веса изучаются. Настройка гиперпараметров - это двухэтапный подход к исправлению диапазона гиперпараметров и обучающих моделей, который неэффективен при обучении больших моделей. В Population Based Training предлагается совместная оптимизация гиперпараметров и силовых тренировок, которая доказала свою эффективность при обучении синтезу человеческой речи с использованием Wavenet.

Новое состояние искусств

FixResNext 101 в настоящее время занимает верхнюю позицию в таблице лидеров ImageNet - paperwithcode.com

🏆 SOTA для классификации изображений в ImageNet (первая метрика точности). Они добились прироста производительности с помощью методов увеличения данных, в частности, сделав разрешение набора поездов ниже, чем в тесте.

[1907.11692] RoBERTa: надежно оптимизированный подход к предварительному обучению BERT

Arxiv.org

Новая языковая модель от Facebook возглавила тест GLUE, который представляет собой набор из 9 наборов данных для оценки систем NLU.

Ресурсы и инструменты

spaCy встречает PyTorch-Transformers: точная настройка BERT, XLNet и GPT-2 · Блог · Explosion - Explosion.ai

Предпочтительная библиотека для разработчиков NLP, spaCy теперь интегрировала библиотеку pytorch-transformers, которая предоставляет современные языковые модели, такие как BERT, GPT-2 и XLNet. Это предоставит разработчикам НЛП доступ к этим языковым моделям, которые могут быть включены в задачи НЛП на производстве, улучшая их производительность.

Набор инструментов для клонирования голоса в реальном времени - www.youtube.com

Речь может быть синтезирована любым голосом. Все, что ему нужно, - это 5-секундный аудиоклип в их голосе. Демо-версия рада.

Джеффри Хинтон и Ян Лекун, 2018 ACM A.M. Лекция премии Тьюринга «Революция глубокого обучения - www.youtube.com

Лауреаты премии Тьюринга рассказывают широкой аудитории о революции глубокого обучения и ее будущих возможностях. Итак, если кто-то хочет понять историю глубокого обучения и его будущее из первых уст, это единственный разговор, который вам нужно выслушать.

В частности, Джефф Хинтон проводит демонстрацию человеческого понимания симметрии, которую я настоятельно рекомендую, поскольку вы можете быть удивлены тем, что вы обнаружите.

Стэнфордский центр профессионального развития AI Resource Hub - onlinehub.stanford.edu
Изучите искусственный интеллект у профессоров Стэнфорда Кристофера Мэннинга, Эндрю Нг и Эммы Брунскилл. Бесплатные видеоролики онлайн-курсов по глубокому обучению, обучению с подкреплением и обработке естественного языка.

Блоги

Модели интеграции групп по анализу данных в организации - medium.com

Чтобы найти синергию с специалистами по анализу данных, важно понимать организационную структуру групп специалистов по анализу данных. Пардис Нурзад, менеджер по обработке и анализу данных в Twitter, рассказывает об организации групп по анализу данных таким образом, чтобы они работали синхронно с целями организации. Она объясняет несколько существующих структур, принятых компаниями, а также предлагает рекомендуемую структуру.

Как я стал практиком машинного обучения • Грег Брокман - blog.gregbrockman.com

Грег Брокман - председатель и технический директор блогов OpenAI рассказывает о своем пути к овладению навыками машинного обучения на работе. Это вдохновляющая история для всех, кто хочет стать инженером машинного обучения. Даже несмотря на то, что понимание ландшафта алгоритмов ИИ может показаться непосильным, именно постепенные шаги могут создать импульс для решения невозможного.

Статьи

Клинически применимый подход к непрерывному прогнозированию будущего острого повреждения почек | Nature - www.nature.com
Подход глубокого обучения, который позволяет прогнозировать риск острого повреждения почек, может помочь выявить пациентов с риском ухудшения здоровья в пределах временного окна, что позволит начать лечение на раннем этапе.

[1905.06241] Представление структуры схемы с помощью графических нейронных сетей для синтаксического анализа текста в SQL

Arxiv.org

Понимание текстового запроса и его преобразование в SQL имеет большой потенциал для расширения бизнес-аналитики. Было много стартапов, пытающихся решить эту проблему, чтобы создать инструменты бизнес-аналитики следующего поколения. В этой статье авторы предполагают, что добавление схемы БД повысит точность синтаксического анализа SQL с использованием архитектуры кодировщика-декодера.

Дайте мне знать, если у вас есть предложения по улучшению информационного бюллетеня. Вы можете написать мне на [email protected]. Пожалуйста, подпишитесь, чтобы быть в курсе последних тенденций в области искусственного интеллекта.

Еженедельник AI Santosh GSK - Выпуск 2 - 6 августа 2019 г.

Улучшение разговорных агентов (чат-ботов)

[1905.08743] Генератор переносимых многодоменных состояний для диалоговых систем, ориентированных на задачи

Безопасность, конфиденциальность и социальное влияние

[1902.01046] На пути к федеративному обучению в масштабе: проектирование системы

Оптимизация гиперпараметров

[1902.01894] Обобщенная система обучения населения

Новое состояние искусств

[1907.11692] RoBERTa: надежно оптимизированный подход к предварительному обучению BERT

Ресурсы и инструменты

Блоги

Статьи

[1905.06241] Представление структуры схемы с помощью графических нейронных сетей для синтаксического анализа текста в SQL

Вопросы по теме