По мере того, как ИИ становится все более распространенным в целом, и в частности, использование ChatGPT для любого сумасшедшего использования быстро растет, возможно ли обучить его так, чтобы предубеждения, всегда присутствующие в средствах массовой информации и в Интернете, сами данные, используемые в обучении, сведены к минимуму? Можно ли свести к минимуму эту предвзятость, не привнося в обучение наши собственные предубеждения, даже если информация, в которой преобладают западные СМИ, сильно предвзято относится к западной культуре?

Одним словом, да. Возможно.

Предвзятость можно понять с чисто математической точки зрения. Таким образом, существует чисто математическое решение предвзятости, которое позволяет избежать проблемы внесения личной предвзятости в процесс исправления наблюдаемой предвзятости в средствах массовой информации.

Чтобы понять это, рассмотрим, что веса в искусственной нейронной сети — это просто ряд матриц, которые применяются последовательно с некоторой нелинейной активацией между каждым применением матрицы.

Но смещение содержится в матрицах. Количество невырожденных главных компонентов этих матриц представляет реальный объем полезной информации, на которой обучается матрица, а собственные значения что-то говорят о качестве этой информации. Когда собственные значения этих матриц преобладают над несколькими собственными значениями, мы говорим, что информационное содержание сильно смещено. Когда собственные значения невырожденных собственных векторов сравнимы по значению, мы можем сказать, что модель менее предвзята. В рамках программы обучения машинному обучению мы можем обеспечить почти эквивалентность собственных значений, тем самым применяя анти-предвзятость даже при обучении на сильно смещенных наборах данных.

Интернет-присутствие Родена Порраты можно найти здесь.