Часто говорят, что если 20 век был связан с кремнием, то 21 век будет с биологией. В последние годы новые открытия происходят в области геномики и молекулярной биологиис беспрецедентной скоростью благодаря более глубоким данным, которые мы можем получить из клеток. Каждый день мы получаем новые знания об раке, генетических заболеваниях и новых областях. Благодаря системам секвенирования нового поколения, которые доступны для предприятий любого размера.

Геном человека содержит примерно 20 000 генов, и каждый ген содержит миллионы пар оснований. Секвенирование всего генома человека может дать петабайты данных. Анализ больших наборов данных требует вывода данных в масштабе, например предсказания структуры белка, классификации рака на основе данных микрочипа, кластеризации данных об экспрессии генов. На реализацию первого проекта по геному человека ушло десять лет, а его стоимость составила 3 ​​миллиарда долларов. Теперь с помощью Big Data Sciences весь процесс может быть выполнен за несколько дней и стоит всего несколько тысяч долларов.

Tech Vedika обратилась к ведущей многонациональной медицинской компании с просьбой оказать помощь их глобальной группе поддержки клиентов в анализе телеметрических данных запускать данные о Next Generationсеквенсорах. Процесс включает комплексный анализ зарегистрированных данных прибора. Каждый запуск анализа может генерировать сотни ГБ данных.

Лаборатория аналитики данных Tech Vedika создала новую систему на основе масштабируемых вычислений и храненияHadoop фреймворк. Система принимает большие наборы данных из анализа экспрессии расшифровки вместе с метаданными и строит модель данных для эффективного и быстрого анализа.

Ниже приведены несколько характерных особенностей:

  • Предоставляйте веб-сервисы/очереди для интеграции с другими нижестоящими системами.
  • Механизм SQL в верхней распределенной системе для специального анализа.
  • Автоматическое управление сложными рабочими процессами

Наше решение принимает сотни запусков секвенирования и обрабатывает сотни ГБ ежедневно, чтобы глобальная служба поддержки могла своевременно расследовать неудачные запуски. Наша модель данных обрабатывает большие наборы данных, чтобы предоставить полезную информацию с помощью машинного обучения. Панели визуализации позволяют легко перемещаться по полезной информации, чтобы понять основные причины сбоев.

Чем мы можем вам помочь?

Чтобы запланировать демонстрацию или получить предложение, свяжитесь с нами.