Наш опыт приема нью-йоркских специалистов по данным и исследователей из академических кругов и промышленности

2018 год стал отличным годом для достижений в области машинного обучения и большого сообщества специалистов по науке о данных!

Наша команда в Comet.ml начала проводить встречи через Искусственный интеллект и машинное обучение в Нью-Йорке с миссией собрать вместе специалистов по данным для обсуждения последних достижений в области машинного обучения в академических кругах и в отрасли.

Наши встречи охватывали отрасли и темы исследований - в июле мы пригласили Клэр Голлник, технического директора Terbium Labs, чтобы поделиться своими мыслями о кризисе воспроизводимости в науке о данных. В октябре мы пригласили команду Precision Health AI, чтобы представить их конвейер машинного обучения для управления онкологическими данными и развертывания моделей прогнозирования.

Продолжайте читать, чтобы узнать об итогах года и о том, что освещали разные докладчики -

⭐️ Наша следующая встреча с главным научным сотрудником Enigma Джарродом Паркером состоится 29 января 2019 г.! ⭐️ RSVP откроется в начале месяца - присоединяйтесь к группе встречи, чтобы оставаться в курсе!

Сетевой анализ, воспроизводимость машинного обучения, данные онкологии и многое другое

Технический директор Terbium Labs, Клэр Голлник - Воспроизводимость машинного обучения и философия данных

Как специалист по данным, ученый и технический директор, нет никого ближе к кризису воспроизводимости в науке о данных, чем Клэр Голлник.

Во время своей презентации Клэр рассказала о неправильном применении статистики, философии науки о данных и поделилась концепцией, которая объясняет (и даже предсказывает) вероятность успеха проекта данных.

См. Стороны Клэр для встречи здесь.

Columbia PhD + FAIR Intern, Melanie Weber - Анализ сложных сетей на основе кривизны

Сложные сети являются популярным средством изучения широкого спектра систем в социальных и естественных науках, а в последнее время - для представления больших данных. Поскольку сложность сетей экспоненциально возрастает, эффективная оценка остается проблемой анализа данных с последствиями для машинного обучения.

Мелани Вебер и ее команда разработали геометрические инструменты с использованием дискретной кривизны Риччи для эффективного анализа структуры и эволюции сложных сетей. Во время своей презентации Мелани описывает повышение производительности, когда широко используемые подходы на основе узлов были расширены, чтобы включить информацию на основе ребер, такую ​​как веса ребер и направленность, для более полной характеристики сети. Их результаты определяют важные структурные особенности, в том числе соединения большой кривизны на большие расстояния, действующие как мосты между основными компонентами сети.

Поистине увлекательная презентация о том, как инструменты на основе кривизны позволяют эффективно вычислять эту основную структуру и, основываясь на этой основной структуре, проводить более затратный анализ, проверку гипотез и изучение сложных моделей.

Смотрите больше работ Мелани на ее сайте.

Precision Health AI, Виктор Ван, Карл Рудин и Вито Колано - конвейеры машинного обучения для обнаружения рака с помощью Precision Health AI

Технология Precision Health AI (PHAI) позволила членам бизнес-команды и технических специалистов PHAI рассказать о проблемах компании с данными, о важности экспертных знаний в области онкологической аналитики и управления результатами анализа данных для фармацевтических клиентов.

Было интересно увидеть, как Карл Рудин, специалист по данным PHAI, объяснил модель данных компании, а Вито Колано, главный инженер-программист PHAI, проверил и развернул их модель прогнозирования OncoStage Last Stage.

Компания Precision Health AI принимает на работу сотрудников. См. Их открытую позицию инженера по машинному обучению

Колумбийский доктор, Исинь Ван - Причинно-следственный вывод в машинном обучении в Колумбийском университете

Исинь Ван в совместной работе с Дэвидом Блей предложил деконфундер, алгоритм, который сочетает в себе неконтролируемое машинное обучение и прогнозную проверку моделей для выполнения причинно-следственного вывода в условиях множественных причин. По сути, деконфундер делает вывод о скрытой переменной в качестве замены ненаблюдаемых искажающих факторов, а затем использует эту замену для выполнения причинно-следственного вывода.

Yixin показал, как деконфундер обеспечивает проверяемый подход к оценке причинно-следственных эффектов, близких к истине, для реального набора данных об актерах и доходах от фильмов.

См. Статью по адресу: https://arxiv.org/abs/1805.06826.

Попробуйте учебник Github по адресу: https://github.com/blei-lab/deconfounder_tutorial

Хотите выступить? Напишите мне на [email protected]

Comet.ml помогает специалистам по обработке данных и инженерам по машинному обучению автоматически отслеживать свои наборы данных, код, эксперименты и результаты, обеспечивая эффективность, наглядность и воспроизводимость.

Узнайте больше и посмотрите демонстрацию на https://www.comet.ml/