(Обновление: посетите наш веб-сайт таксономии текущих юридических вопросов по адресу https://taxonomy.legal/ )

В этом коротком отчете идет речь о том, с чего начиналась предыдущая статья о таксономии правовой помощи, ориентированной на человека. Каждую неделю я читаю тысячи сообщений на Reddit и на юридических форумах, чтобы узнать, о чем люди просят юридической помощи. В то же время я читал тысячи записей в списках юристов о помощи, которую они могут оказать, - о проблемах, вокруг которых они структурируют свою практику, руководства и веб-сайты.

Зачем я это делаю? Большое видение состоит в том, чтобы разработать лучший способ обозначить все ресурсы этих юристов - особенно те, которые они делятся в Интернете, - чтобы люди на Reddit и юридических форумах могли найти те, которые им подходят. Также может случиться так, что с более стандартизированными, структурированными кодами проблем мы сможем направить автоматизированные инструменты для направления людей на правильный юридический диагноз, варианты и знания. Это будет особенно полезно для поисковых систем, а также для ботов социальных сетей, порталов юридической помощи и других технологий, представляющих общественный интерес.

На прошлой неделе Дэвид Коларуссо из лаборатории Саффолк Лит и я рассказали о нашей работе по машинному обучению и доступу к правосудию для технологической группы юридических услуг, LSNTAP. Большая часть презентации была посвящена новой обновленной версии Национального предметного указателя, над которой я работаю в рамках более крупного проекта машинного обучения. NSMI - это систематика проблем, с которыми группы юридической помощи в США сталкиваются как со своими клиентами, так и с управлением своими организациями. Ему более десяти лет, и он все еще используется, хотя и с проблемами.

Наша цель при обновлении NSMI - сделать коды проблем более организованными и понятными, чтобы их можно было постоянно использовать в качестве ярлыков для проектов машинного обучения. Это в первую очередь для нашего проекта по маркировке сообщений Reddit, данных ABA Free Legal Answers, а также содержания онлайн-суда и самопомощи. Благотворительный фонд Pew Charitable Trusts поддерживает Stanford Legal Design Lab и Suffolk Lit Lab в разработке таксономии, маркировке этих данных и обучении на них моделей машинного обучения.

По мере того, как я просматривал таксономию, объединяя ее с таксономиями других групп юридической помощи, а затем также пытался обозначить сообщения многих людей об их проблемах, я работал над определением руководящих принципов того, какой должна быть новая таксономия.

Здесь я резюмирую моменты, которые мы высказали во время презентации, а также приглашаю всех заинтересованных юристов присоединиться ко мне в этих усилиях, подписавшись в качестве эксперта-рецензента проекта версии 2 НСМИ.

Что нужно для хорошей таксономии юридической помощи?

Вот основные принципы хорошей таксономии. Я разрабатывал их, основываясь на других передовых методах работы в области таксономий, а также на конкретной цели машинного обучения маркировки.

  1. Ясность определенного термина. Когда мы представляем студенту-юристу или юристу термин таксономии, могут ли они точно знать, что он подразумевает?
  2. Включение всех ресурсов / запросов в одно из семейств терминов: есть ли «место» в таксономии для каждой проблемы юридической помощи, которая рассматривается в справочниках юридических служб и судов? Есть ли у каждой проблемы с юридической помощью, которая появляется в сообщениях людей, свое «место»?
  3. Обеспечьте четкость и четкость родителя терминов, чтобы термины не были чрезмерно объединены, но и не разделялись слишком сильно: убедитесь, что существует доступное количество родительских категорий, но которые удерживают родителей в разумная семья - не слишком много непонятного мэшапа

Прямо сейчас текущая таксономия NSMI имеет проблемы со всеми тремя из них, поэтому мы дорабатываем ее.

Для ясности проблема заключается в том, что многие термины NSMI «дети» лишены контекста - они слишком упрощены и их трудно применять, если вы не видите всех их родителей. Например, если бы мы спросили вас, присутствовала ли проблема «семейного положения» в данном сообщении Reddit, было бы сложно точно знать, что означает этот ярлык. Это непонятно, если вы не увидите его происхождение: Работа ›› Дискриминация на работе ›› Семейное положение. Нам нужны ярлыки, которые несут всю эту родословную в своей формулировке.

Что касается включения, то в настоящее время NSMI недостаточно широк, чтобы охватить вопросы, не связанные с бедностью. Это связано с тем, что NSMI был создан для поставщиков юридической помощи по гражданским делам, у которых есть определенные области обслуживания, которые они охватывают и не охватывают. Эти поставщики часто не покрывают деликты, несчастные случаи, травмы и домогательства, поэтому у них нет домов в существующем NSMI. Многие проблемы не имеют четкой основы, которая появляется на Reddit - например, в отношении онлайн-издевательств, озабоченности секстингом и других проблем нового 21-го века. Нам нужны дома для решения вопросов, не связанных с юридической помощью, таких как соседи, правонарушения, несчастные случаи, споры.

Что касается родительского баланса, в настоящее время NSMI имеет большое количество родителей - и ни одного со-родителя детей. Это означает, что таксономия крупнее и расплывчата, чем должна быть. Например, все категории вопросов банкротства, налогообложения и защиты прав потребителей являются родительскими. Так же обстоят дела с TANF, социальным страхованием и социальными пособиями по инвалидности. Таксономия могла бы быть более доступной, если бы эти близкие категории были отнесены к одиноким родителям. Разрешение дочерним терминам иметь несколько родителей также предотвращает появление множества повторяющихся записей одного и того же термина.

Как сделать лучшую таксономию?

Мы находимся в середине нескольких раундов слияния, определения приоритетов, сокращения и проверки новой версии NSMI, которая будет лучше подходить для машинного обучения для доступа к jsutice.

Это включало первый этап изменений:

  1. Сочетание с другими таксономиями веб-навигации от поставщиков юридической помощи и владельцев веб-сайтов
  2. Устранение проблем, не связанных с оказанием помощи, которые больше касались администрирования организаций, а не людей.
  3. Объединение связанных тем вместе с родителями-одиночками
  4. Расстановка приоритетов по уровням родителей, чтобы определить, с чего начать нашу работу

Теперь мы находимся на втором этапе более детальной доработки:

  1. Удаление повторяющихся терминов, чтобы объединить их в единые сопутствующие вопросы
  2. Увеличение количества терминов проблемы, помимо отдельных фраз, для большей ясности / контекста
  3. Оптимизация категорий внутри родителей, чтобы иметь согласованные подкатегории

Наши текущие родительские категории (высшего уровня) следующие. Этот список родителей предназначен для того, чтобы служить высшим руководством для решения большинства юридических вопросов, которые могут возникнуть у человека или по которым организация может предложить помощь.

Несчастные случаи, травмы и проблемы с другими людьми: эта категория охватывает проблемы, которые возникают у одного человека с другим человеком (или животным), например, когда произошла автомобильная авария, укус собаки, издевательства или возможные домогательства или соседи плохо относятся друг к другу.

Преступление и тюрьмы: эта категория охватывает проблемы в уголовной системе, в том числе случаи, когда люди обвиняются в совершении преступлений, предстают перед уголовным судом, попадают в тюрьму или становятся жертвой преступления.

Семья. В эту категорию входят вопросы, возникающие в семье, такие как развод, усыновление, смена имени, опекунство, насилие в семье, опека над ребенком и другие вопросы.

Здоровье. В эту категорию входят проблемы, возникающие при лечении, оплате медицинских счетов, пребывании в больнице или доме престарелых или по другим причинам.

Жилье. В эту категорию входят вопросы, связанные с оплатой квартплаты или ипотеки, арендодателем и арендатором, жилищными субсидиями и государственным жильем, выселением и другими проблемами, связанными с вашей квартирой, передвижным домом или домом.

Работа. Эта категория охватывает вопросы, связанные с работой на рабочем месте, включая дискриминацию и домогательства, компенсацию работнику, права работников, профсоюзы, получение заработной платы, пенсии, увольнение и многое другое.

Пробки. В эту категорию входят проблемы с трафиком и штрафами за парковку, сборы и другие проблемы, связанные с системой дорожного движения.

Льготы. В эту категорию входят льготы, которые люди могут получить от государства, такие как питание, инвалидность, старость, медицинская помощь, безработица, уход за детьми или другие социальные нужды.

Имущество и завещания: эта категория охватывает планирование на случай смерти и особых обстоятельств, включая завещания, доверенности, предварительные распоряжения, трасты и другие имущественные вопросы, с которыми сталкиваются люди и семьи.

Иммиграция: эта категория охватывает визы, убежище, грин-карты, гражданство, работу и льготы для мигрантов, а также другие вопросы, с которыми сталкиваются люди, не являющиеся полноправными гражданами страны.

Деньги, долги и потребительские вопросы: Эта категория охватывает проблемы, с которыми люди сталкиваются в отношении денег, страхования, потребительских товаров и контрактов, налогов и мелких претензий по поводу качества обслуживания.

Гражданские права и права человека: эта категория охватывает основные права людей, которые государство должно защищать, а другие должны уважать. Он применяется к ситуациям дискриминации, злоупотреблений, надлежащей правовой процедуры, первой поправки, прав коренных народов и других ключевых прав.

Суд и юристы: эта категория охватывает логистику взаимодействия человека с юристом или судебной системой. Это относится к обсуждению процедур, правил и других практических вопросов, касающихся работы с этими системами.

Помощь при стихийных бедствиях. Эта категория охватывает вопросы, связанные со стихийными бедствиями, включая права людей, получение пособий и помощи, освобождение от прав собственности и вопросы страхования.

Образование. В эту категорию входят вопросы, связанные со школой, в том числе приспособления для лиц с особыми потребностями, дискриминация, задолженность учащихся, дисциплина и другие вопросы в сфере образования.

Экологическая справедливость. В эту категорию входят вопросы, связанные с загрязнением, опасными отходами, ядами и другими проблемами, связанными с окружающей средой.

Государственные услуги: эта категория охватывает услуги, которые люди запрашивают у правительства, включая лицензии на огнестрельное оружие, ведение бизнеса и охоту, а также запросы информации и другие привилегии от государства.

Проблемы коренных американцев. В эту категорию входят вопросы и законы, относящиеся к коренным американцам и коренным народам.

Малый бизнес: эта категория охватывает проблемы, с которыми сталкиваются люди, ведущие малый бизнес или некоммерческие организации, в том числе связанные с регистрацией, лицензиями, налогами, нормативными актами и другими проблемами.

Ветераны и военные. В эту категорию входят вопросы, законы и услуги, относящиеся к людям, прошедшим военную службу.

Теперь в каждой из этих родительских категорий мы определяем категории проблем «Дочерний уровень-1», которые касаются более конкретных областей проблем и помощи. Большинство очень специфических проблем находятся на уровне ребенка-3 или -4.

Где мы сейчас находимся + ваша помощь

Наша команда в Стэнфорде медленно и неуклонно продвигается в разработке версии 2 с более упорядоченной категоризацией и увеличением количества терминов.

Наша большая потребность - в юридических экспертах для рассмотрения проектов вопросов семейного права, вопросов трудового права, вопросов жилищного права (и не только). По мере того, как мы углубляемся в дочерние категории и конкретные термины, нам потребуется вклад экспертов и редактирование таксономии, прежде чем мы начнем маркировать и обучать модели на основе терминов и категорий. Вам интересно? Обращайтесь к нам! mdhagan [at] stanford [dot] edu

И заходите на наш сайт таксономии: https://taxonomy.legal/

Будьте на связи!