Машинное обучение может стать новым оружием в борьбе с мошенничеством Medicare.

Машинное обучение может быть полезным инструментом в обнаружении мошенничества с Medicare, согласно новому исследованию, которое может ежегодно возвращать от 19 до 65 миллиардов долларов, потерянных в результате мошенничества.

Исследователи из Колледжа инженерии и компьютерных наук Атлантического университета Флориды недавно опубликовали первое в мире исследование с использованием Medicare Big data, машинного обучения и расширенной аналитики для автоматизации обнаружения мошенничества. Они протестировали шесть разных машинных обучающихся на сбалансированных и несбалансированных наборах данных и в конечном итоге обнаружили, что алгоритм случайного леса RF100 будет наиболее эффективным для обнаружения потенциальных случаев мошенничества. Они обнаружили, что несбалансированные наборы данных представляют собой нечто большее, чем сбалансированные наборы данных при сканировании на предмет мошенничества.

Есть много последствий для определения того, что является мошенничеством, а что нет, например, канцелярская ошибка», — говорит Ричард А. Боудер, старший автор и доктор философии.

«Наша цель — позволить машинному обучению знать все эти данные и помечать все подозрительное. Тогда мы сможем предупредить исследователей и аудиторов, которым следует сосредоточиться на 50 случаях вместо 500 и более».

В ходе исследования Боудер и его коллеги изучили данные Medicare, охватывающие 37 миллионов случаев с 2012 по 2015 год, на предмет таких инцидентов, как жестокое обращение с пациентами, отсутствие заботы и выставление счетов за медицинские услуги. Команда сократила набор данных до 3,7 миллиона случаев, что по-прежнему является проблемой для исследователей-людей, которым поручено точное выявление мошенничества с Medicare.

Авторы использовали национальный идентификатор поставщика — выданный правительством идентификационный номер для поставщиков медицинских услуг, чтобы сравнить ярлыки мошенничества с данными части Medicare, которые включают сведения о поставщике, информацию о платежах и сборах, коды полисов, все полисы и медицинские характеристики.

Когда исследователи сравнили данные NPI с данными Medicare, они пометили поставщиков мошеннических услуг в отдельной базе данных.

«Если мы сможем точно оценить уникальность врача на основе нашего статистического анализа, то мы сможем обнаружить исключительное поведение врачей и пометить как можно больше случаев мошенничества для дальнейшего расследования», — сказал Таги М. Хошгофтар, доктор философии, соавтор и профессор в школе.

Итак, если кардиолог ошибочно назван неврологом, это признак обмана.

Тем не менее, набор данных остается проблемой. Небольшое количество мошеннических провайдеров и большое количество бортовых провайдеров создали дисбаланс данных, который может обмануть практикующих машин. Итак, используя случайную недостаточную выборку, исследователи сократили выборку до 12 000 случаев с семью классами распределения от тяжелых до несбалансированных.

Оттуда они выпустили своих учеников и достигли своих результатов в отношении случайного леса и распределения классов.

Удивительно, но исследователи обнаружили, что сохранение данных на 90 процентов простыми и на 10 процентов мошенническими является «золотым пятном» для алгоритмов машинного обучения, которые работают для обнаружения мошенничества с Medicare. Они считали, что эта пропорция должна включать больше мошеннических поставщиков, чтобы учащиеся были эффективными.

Хотите узнать больше об услугах искусственного интеллекта, тогда посетите USM systems бесплатно