Размышления об определении и его использовании для систем ИИ.

После моих статей Искусственный интеллект и миграции людей и Что означает грамотность в области ИИ для мигрантов я получил несколько запросов с просьбой уточнить термин Мигрант.

Некоторые читатели были сбиты с толку этим термином, и я подумал, что было бы полезно развеять большинство неправильных толкований.

Определение «мигранта» до сих пор не имеет общепризнанного консенсуса, и оно часто используется и интерпретируется с разных точек зрения.

Страны и организации используют и толкуют этот термин субъективно и в соответствии со своей политикой.

Хотя машины не могут интерпретировать определения, им нужна точная аннотация. Если мы хотим правильно обучать наши модели, мы должны снабжать их правильными аннотированными данными. В этом суть нашего допроса.

Следующие несколько примеров прольют свет на сложность согласования общего определения.

Должны ли мы называть «мигрантами» людей, которые пересекли границу страны и поселились в другом штате на шесть месяцев?

У одних возникнет соблазн ответить утвердительно, у других нет, но оба ответа будут правильными.

Если я добавлю, что срок пребывания этого человека больше года, у нас было бы больше согласных, чем несогласных.

Должны ли мы называть "мигрантами" людей, которые переехали в страну и поселились в другом регионе той же страны?

Многие не согласились бы, но если указать, что эти люди являются вынужденными переселенцами в результате вооруженного конфликта или покидают этот район и переселяются в другой из-за тяжелых экологических, санитарно-климатических и экономических условий, большинство опрошенных согласится.

Итак, есть ли общий знаменатель определения "мигрант"?

По моему предвзятому мнению, единственным атрибутом этого термина является внутренний смысл, происходящий от глагола «мигрировать».

Это может вызвать возмущение, но другие атрибуты, такие как «пересечение границы», «продолжительность пребывания», «легальный статус» или «добровольное, недобровольное перемещение», не будут самостоятельными квалифицирующими.

То же самое касается определения «мигранта» на основе «страны рождения» или «родителей-иностранцев»; в некоторых странах даже «происхождение». Они могут иметь важное значение для демографических или других исследований и отчетов, но не являются определяющим фактором для наших вопросов.

Излишне говорить, что в наше время, в нашем космополитическом и неоднородном мире, многие люди имеют более одного гражданства, национальности и происхождения.

Как мы уже упоминали, использование систем ИИ в сфере миграции не запрещено, но разрешено с обязательными требованиями.

Чтобы лучше управлять миграционными потоками, выделять достаточные ресурсы и удовлетворять растущие потребности мигрантов, многие страны разрабатывают миграционную политику, основанную на прогнозировании миграции посредством прогнозов.

Различная маркировка одних и тех же наборов данных приведет к различным прогнозам для одной и той же группы мигрантов и создаст асимметрию в оценке и повлечет за собой действия для государств.

Следует признать, что классифицировать беженцев, лиц, ищущих убежища, или внутренне перемещенных лиц относительно легко, поскольку их правовой статус определяется и признается государственными органами в соответствии с национальным или международным законодательством.

В то же время мы прекрасно понимаем, что если беженцы, лица, ищущие убежища, или внутренне перемещенные лица все"мигранты", то обратное не обязательно верно. сильный>

Чтобы было ясно, все "мигранты"не являются беженцами, лицами, ищущими убежища, или внутренне перемещенными лицами.

В результате у нас были бы «мигранты», не подпадающие под категорию, а среди этих оставшихся «мигрантов» были бы даже те, кто оказался бы «немигранты».

Смущенный?

В следующих наглядных примерах давайте посмотрим, как «мигрант» может быть классифицирован как «немигрант».

Если для некоторых государств для квалификации в качестве «мигранта» достаточно поселиться в стране не менее шести месяцев, то для ООН и ЕС продолжительность пребывания должна быть двенадцать месяцев, за исключением некоторых государств-членов ЕС. Кроме того, эта продолжительность иногда также сокращается для некоторых программ помощи, связанных с миграцией под руководством ЕС.

Согласно другому признаку определения, «переезда с обычного места жительства на другое» достаточно, чтобы считать человека «мигрантом».

Тем не менее, единственный факт переезда с привычного места жительства на другое место учитывается, но не является уникальнымпризнакомдляопределение «мигрант».

Например, если граждане США или Франции переезжают соответственно из одного штата/региона в другой на временное или постоянное место жительства, вы соглашаетесь с тем, что они не будут считаться "мигрантами".

Однако предположим, что это произошло бы в стране, где штаты/регионы одной и той же страны отличаются этнически, культурно и религиозно. В этом случае вы должны признать, что социальная и культурная интеграция может быть сложной проблемой, и эти люди могут быть квалифицированы как «мигранты» организацией или государством, отвечающим за их интеграцию.

Если нас попросят аннотировать данные для ситуаций, упомянутых выше, эти люди могут быть помечены как «немигранты» в зависимости от интерпретации. Следовательно, они не обязательно будут классифицироваться в категории набора данных «Правда/Ложь» как «Мигранты» или «Немигранты». Таким образом, можно сделать вывод, что нам не хватает точности, что приводит к искаженным прогнозам.

Как следствие, наша возможная неточность прогноза будет иметь процент дисперсии, равный доле «мигрантов», классифицированных или не классифицированных в зависимости от продолжительности пребывания или других квалифицирующих признаков, в зависимости от интерпретации.

Другой вопрос, нужно ли нам найти уникальное определение для этого термина? Хотя очевидно, что попытки добиться всеобщего согласия по этому термину обречены на провал, тем не менее, можно выбрать методологию для достижения наилучших параметров производительности.

При этом и поскольку у нас есть необходимые переменные, такие как «продолжительность пребывания», «национальность», «правовой статус», «добровольное или вынужденное перемещение», «категория визы» и информация о пересечении границы, мы можем ожидать большего. точные и точные прогнозы для миграций.

Заключительные мысли

Прежде чем воспользоваться преимуществами прогнозов миграции, следует с осторожностью обращаться с разрекламированными прогнозами для "мигрантов". Мы должны помнить, что все квалифицирующие признаки, упомянутые выше, могут потребовать ограничительной или расширенной интерпретации. Последнее следует делать в их контексте, чтобы получить правильную аннотацию и маркировку данных, что лежит в основе моделей машинного обучения.

Если мы хотим улучшить нашу производительность, нам нужно свести к минимуму ошибки, а для этого нам нужно иметь достойную информацию, которую можно ввести в систему для оптимизации.

Отсутствие строгой методологии маркировки оставляет значительный простор для непоследовательности и неточных прогнозов, что может повлиять на использование систем ИИ и иметь волновой эффект в периоды особой нагрузки на системы приема в связи с массовым прибытием «мигрантов».