Хакатон завершился, и мы хотим поблагодарить всех, кто пришел и отлично провел время с нами! Более 20 человек приняли участие в нетворкинге, и мы надеемся, что им понравилось, и они, как и мы, нашли новых друзей.

Семь отважных мужчин и одна женщина приняли вызов «Сосредоточенное ползание» и сформировали две команды (для простоты названные «Команда А» и «Команда А-Звезда» :-)). Цель состояла в том, чтобы создать алгоритм целенаправленного сканирования, который может находить общедоступные счета-фактуры в Интернете. Команды должны были передавать в наш API найденные URL-адреса, и наши алгоритмы автоматически классифицировали, представляет ли URL-адрес счет или нет.

Большинство участников решили использовать предоставленный Bing Search API и настроили свои алгоритмы «генерации запросов». Результаты представлены на рисунке ниже. Команда-победитель отправила 8996 URL-адресов, из которых 1826 были идентифицированы как счета-фактуры (то есть точность 20,3%). Вторая команда, A-Star, загрузила 5320 URL-адресов, в результате чего было создано 376 уникальных счетов (точность 7,1%). Интересное примечание: обе команды загружают только 48 дубликатов счетов.

Также стоит упомянуть, что один из участников Карел Ха не хотел утруждать себя сканированием Интернета и выбрал стратегию «выстрела на луну» — создание искусственных счетов с помощью генеративно-состязательных сетей (GAN). Тем не менее, нескольких часов работы графического процессора и 10 000 итераций кажется недостаточно, чтобы обмануть наши классификаторы счетов, но результат выглядит довольно круто (см. изображение ниже).

Мы хотим поблагодарить всех участников, особенно тех, кто принял вызов:

Команда-А (победители): Эльназ Бабаева, Юрий Касимов, Мирослав Спуста, Петр Зика
Команда-Звезда: Карел Ха, Петр Марек, Роман Лонг, Степан Прохазка