На языке музыкальной мысли

(Эта серия блогов, состоящая из двух частей, будет иметь легкий философский фон, углубляясь в различные области теории музыки. Я постараюсь связать ее с недавними работами в области компьютерной музыки и музыки с искусственным интеллектом.)

В наше время вы могли встретить фразу, что «музыка говорит с душой». Несмотря на проблемный характер этой фразы (оставим дискуссию о душе на другой раз), есть доля правды в том, что музыка говорит или является языком. Под языком я имею в виду не просто средство общения, а своего рода внутреннюю коммуникацию мысли. Важным вопросом не только для теории музыки, но и для любого аспекта музыкальных исследований, таких как поиск музыкальной информации (MIR) и музыкальный искусственный интеллект, является то, как (и если) музыка представлена  в мозгу. Этот вопрос касается того, как мы думаем о музыке, или, более конкретно, как мы думаем в музыке.

Музыка в наших головах

Каким бы способом мы ни воспринимали музыку, похоже, что она одинакова для всех. Это должно быть так, потому что, вообще говоря, музыка открыта для всех во всем мире, независимо от их культурного происхождения. Это означает, что музыку не нужно переводить или, по сути, нельзя переводить, потому что музыкальные тона «говорят» со всеми. Подобно тому, как у каждого есть глаза, чтобы видеть, у них есть универсальное внутреннее музыкальное ухо, чтобы слышать. Но только люди могут слышать и шептать этот волшебный язык - это одна из немногих умственных способностей, которая отличает нас от остального животного царства.

Также возможно, что для музыки вообще нет организованной внутренней репрезентативной системы, а музыкальная мысль воплощена, нецентрализована или построена с нуля, как предполагают некоторые теоретики музыки (Gjerdingen and Bourne, 2015). . Я подозреваю, что подобные теории снизу вверх маловероятны, потому что то, как мы думаем в музыке, очень похоже на внутренний язык, то, что я называю языком музыкальной мысли (LMT). Основная идея LMT состоит в том, что мы не просто слышим музыку и не общаемся с ней, но можем внутренне разговаривать с собой, используя этот язык. Ключевым преимуществом LMT является то, что он представляет музыкальные элементы во внешнем мире, но, что важно, также манипулирует этими представлениями так же, как компьютер манипулирует информацией. Я думаю, что это необходимо нам для познания музыки, поскольку основные строительные блоки музыки (ее основные концепции) объединяются, чтобы сформировать сложные структуры таким образом, который работает (более или менее) логически и систематически. Но я думаю, что для того, чтобы LMT была разумной гипотезой, строительные блоки должны работать на низких уровнях и объединяться менее жестко и систематически, чем в естественном языке.

Основная репрезентативная система

Эта тема не так проста, как может показаться, особенно если вы ожидаете обычной широкой аналогии с тем, что музыка, как и язык, - это просто еще одна форма общения. Простая аналогия между языком и музыкой - это не совсем то, что я имею в виду под LMT. Представленная здесь гипотеза LMT является довольно специфическим и особым заявлением. Идея состоит в том, что существует основная внутренняя вычислительная и репрезентативная система, с помощью которой опосредуется музыка. Кажется очевидным, что мы на самом деле не мыслим, например, ритмами, высотой звука или аккордами. Если мы вообще представляем музыку внутренне, мы должны представлять ее по-другому, но как мы это делаем , остается загадкой. Что ясно, так это то, что LMT, вероятно, представляет музыку внешнего мира без икон. Похоже, это также вычислительная система, в которой представлениями управляют в соответствии с генеративным синтаксисом. Это необходимо для музыкального мышления, чтобы справиться с комбинаторной структурой музыки. Эта структура соответствует многим теориям грамматики в языке и музыке, например, выдвинутым теоретиком музыки Фредом Лердалом с помощью лингвиста Рэя Джекендоффа в статье Генеративная теория тональной музыки (1983) (ГТТМ).

Итак, основной аргумент состоит в том, что LMT - это репрезентативный и вычислительный язык, поскольку музыкальное мышление комбинаторно и порождает. Причина в том, что множество различных музыкальных строительных блоков, таких как аккорды, высота звука и ритмы, собраны таким образом, чтобы они были чувствительны к контексту, а также были продуктивными и систематическими. Это намекает на гораздо более сложную систему, чем ассоциативные, поведенческие или статистические модели познания, выдвинутые в прошлые годы эмпириками, такими как Джон Локк, Дэвид Хьюм и Беррхус Ф. Скиннер, которые совершенно не подходили для музыки и многих других. мощности. В музыке нет прямых условных отношений или серии ассоциативных отношений между идеями. Ассоциативные или статистические объяснения мысли просто недостаточно описательны.

Позиция эмпириков состоит в том, что музыкальный мозг - это просто машина, производящая обычно ассоциированные или статистически вероятные высказывания. Но такое мышление не могло бы смоделировать музыкальное мышление, которое манипулирует музыкальными представлениями так, как это делает классическая вычислительная система. Я думаю, что нейронные сети или модели глубокого обучения современных компьютерных музыковедов автоматически поддерживают эмпирическую метафизику, потому что их машины инкапсулируют информацию непосредственно из окружающей среды, достигая результатов, более или менее полностью основанных на данных, без генеративного или рационального посредничества. Хотя у этих методов есть свои преимущества, такие как информационная насыщенность, «управляемый данными» процесс не отражает основной порождающий принцип языка.

Рекурсивные операции

Одна из наиболее важных характеристик LMT - это рекурсивность. Рекурсия - это особая характеристика, встречающаяся в разных языках; это процесс, при котором повторение функциональной процедуры приводит к самовложению. Используя рекурсивные процессы, представлениями, которые являются строительными блоками языков, можно управлять в соответствии с логическими операциями, создавая сложные конструкции. Рекурсивные операции важны для последовательного и параллельного внедрения музыкальных идей, подтверждая идею о том, что музыкальная мысль подобна языку.

Рекурсия на естественных языках происходит следующим образом. Могу сказать: мужчина пошел в магазин. Еще могу сказать: мужчина пошел в магазин с сыном. И снова, с большим количеством вложений: человек, который никогда не любит выходить на улицу, который был немного навеселе, пошел в магазин со своим сыном. И так далее, до бесконечности. Нет теоретических ограничений на количество рекурсий, допустимых в естественном языке. Однако из-за ограничений производительности он никогда не бывает бесконечным. (Хотя бесконечные рассуждения некоторых людей могут заставить вас относиться к этому немного более скептически.) Естественный язык рекурсивен в определенных отношениях, поскольку встраивание происходит в соответствии с правилами грамматики. Генеративная и рационалистическая картина естественного языка в значительной степени является продуктом Ноама Хомского, первосвященника лингвистики и философии ХХ века. Он рассматривает язык как специализированную универсальную внутреннюю порождающую систему, которая может генерировать бесконечное количество предложений с использованием конечных средств, основанных на принципе рекурсии. Музыка может быть похожей на эту, но могут быть и некоторые важные отличия.

Как музыкальная мысль подобна языку

Обычно грамматика - это средство структурирования мыслей. Например, правила и структуры естественного языка объединяют слова в предложения. Но если мысль сама по себе подобна языку, то разумно предположить, что мысль должна иметь свою собственную порождающую, логическую и конституирующую структуру, подобную логическим и рекурсивным операциям в естественном языке и вычислительных языках. Этот аргумент был наиболее заметно развит Джерри Фодором в Язык мысли (1975) и ЛОТ 2: Возвращение к языку мысли (2008) и другими авторами. Фодор рассматривает ЛОТ как близкую метафору со способностью к естественному языку; Я считаю LMT аналогом LOT. Следуя Фодору, музыкальное мышление может повлечь за собой внутреннюю систему представления, посредством которой сложные молекулярные концепции конструируются из базовых атомарных концепций. , используя комбинаторный синтаксис.

Правдоподобный LMT может выглядеть следующим образом. Строительные блоки LMT конечны, поскольку фактически существует конечное количество высот, ритмов, тембров и т. Д., Которые мы выводим из непрерывной музыкальной среды в мире. То, как мы их делаем, - это просто факт о людях. Наш физический, химический, биологический и психологический состав ограничивает тип основных концепций, которые мы можем индивидуализировать. Эти конечные элементы можно соединять бесконечно многими новыми способами, чтобы создавать сложные (и очень сложные) концепции, вплоть до новых оригинальных композиций. Это самое главное, для чего нужна рекурсия в музыке.

Интуитивно композиционный

Таким образом, рекурсия кажется центральной для внутреннего LMT. Это подтверждает утверждение о том, что музыкальное мышление композиционно. Это соответствует интуитивному осознанию того, что музыка состоит из простых строительных блоков, которые используются для создания сложных зданий. У композиционности есть два важных взаимосвязанных принципа, которые присутствуют в естественном языке: систематичность и продуктивность. Когда система продуктивна, она создает бесконечно много строк, используя конечные средства. Когда он систематичен, он жестко манипулирует своими лексическими символами, используя набор синтаксических операций.

А теперь давайте сосредоточимся на производительности. Как уже отмечалось, продуктивный LMT может превратить конечный набор базовых концепций в бесконечный набор сложных концепций. Это означает, что ограниченный мозг может понимать потенциально бесконечное количество музыкальных выражений. Но для аргументации музыкальной продуктивности нам нужно сначала установить, как можно выделить основные концепции. Ясно, что основные музыкальные концепции должны иметь какое-то отношение к ключевым атрибутам музыки: высоте звука и времени. И для того, чтобы LMT был внутренним языком, они должны быть врожденными и достаточно низкоуровневыми, чтобы быть жесткими на всех музыкальных языках, чтобы позволить музыке иметь конкретные психологические корни. Одной из групп основных концепций может быть тип музыкального алфавита, такой как музыкальная гамма - например, A, B, C, D, E, F, G, - которые можно рекурсивно использовать в качестве блоков для строительства больших зданий, а именно: аккорды, клавиши и музыкальные произведения.

Проблема заключается в том, что музыкальная мысль не может с рождения наделить такие представления, потому что тысячи гамм в мире различаются в зависимости от культуры. (Например, музыкальные гаммы незападных культур, такие как slédro или pélog в музыке гамелана, делят октаву иначе, чем ирландские народные гаммы). Внутренний, врожденный музыкальный алфавит звуков должен быть фундаментальным и межкультурным, например, очень низкоуровневыми представлениями и отношениями частот основного тона. Действительно, должны быть низкоуровневые представления всех параметров музыки, включая, конечно, ритм и метр. В области метра врожденное представление, вероятно, будет на уровне ударов, из которых ограничиваются и детализируются метр и гиперметр. Что касается ритма, мы бы концептуализировали врожденные ритмические отношения низкого уровня, с помощью которых генерируются фразы и более крупные части. Если все это правда, это наводит на мысль, что музыка может быть продуктивной, что подтверждает идею о существовании LMT.

Как уже упоминалось, музыкальное мышление, объединяющее низкоуровневые представления посредством каких-то грамматических операций, можно назвать систематическим. Фодор (1975, 2008) утверждает, что мышление систематично, потому что оно имеет обобщаемый синтаксис. Следовательно, он эффективен с точки зрения вычислений, потому что набор логических операций используется снова и снова для построения сложных предложений. Хотя естественный язык более систематизирован (хотя это также оспаривается), гораздо более сомнительно, что у музыки есть грамматические правила, которые определяют ее структурный состав; музыка кажется более гибкой, что проблематично для гипотезы LMT. Увы, я подробнее расскажу о систематичности во второй публикации этой серии блогов, потому что это сложное понятие; Обсуждению будет способствовать изучение последних музыкальных исследований. А пока я продолжу исследовать продуктивный аспект композиционности.

Как уже отмечалось, отчасти естественный язык композиционен благодаря тому, что он продуктивен в уже определенном особом смысле этого слова. Он может строить любые предложения или конструкции из множества других базовых и сложных концепций бесконечно творческим способом - теоретически. В мыслях и на естественном языке кажется, что это происходит постоянно. Например, тот факт, что мы можем думать о концепции КОРИЧНЕВОЙ КОРОВЫ, обусловлен тем, что у нас уже есть более базовые понятия КОРИЧНЕВЫЙ и КОРОВА. Это означает, что мы можем понять сложное исходное предложение, потому что мы можем разделить концепции на основные вещи, которые мы уже знаем. Обратите внимание, однако, КОРИЧНЕВЫЙ КОРОВ - всего лишь пример, на самом деле концепции КОРИЧНЕВЫЙ или КОРОВЫ могут быть разбиты на более мелкие концепции - хотя сомнительно, что концепция КОРИЧНЕВОГО цвета может быть разбита дальше; вероятно, нет, поскольку цвета кажутся основополагающими.

Вероятно, есть аналогичный процесс внутреннего разложения, который происходит с музыкой. Мы поймем сложные концепции музыки, когда сможем выделить ее основные концепции. Но как мы можем разделить его основные концепции? Как упоминалось выше, я думаю, что мы можем это сделать, потому что наша внутренняя система представления имеет прямую связь с низкоуровневыми внешними элементами музыки. Это подтверждает два утверждения о LMT. Во-первых, мы можем понимать музыку, потому что она состоит из основных строительных блоков, которые мы понимаем от природы. Во-вторых, мы можем создавать и думать о бесконечно сложных музыкальных сооружениях, потому что они собираются вместе с использованием конечных строительных блоков относительно систематическим образом.

Аккорды и контекст

Этот тип концепции дает нам представление о музыкальном мышлении, например, о том, почему мы можем понять, что аккорд есть аккорд. Давайте рассмотрим обычный аккорд, например аккорд до мажор. Для тех, кто не знаком с теорией музыки, он состоит из высот C, E и G. Я бы сказал, что этот аккорд сложен, потому что он состоит из основных понятий высоты звука, C, E и G. что сложные концепции часто расплывчаты. Это звучит правдоподобно, поскольку, когда у нас есть единственный устойчивый аккорд, он также может содержать (некоторые) неаккордовую высоту звука, но мы часто все же заключаем этот комплекс в скобки как дискретную категорию или концепцию аккордов. То есть люди внутренне 'маркируют' его как C-CHORD, даже несмотря на то, что в нем есть некоторые неаккордовые высоты звука, в зависимости, конечно, от степени включения неаккордовых высот (а также учета другие контекстные параметры). Однако допуск неаккордовых тонов проблематичен для языка мысли, потому что вся суть LMT состоит в том, что репрезентации стабильны. Однако я не думаю, что все потеряно, потому что ясно, что должна быть некоторая гибкость в системе представления на более высоких уровнях абстракции. Внутренний язык, или «грамматика», должен быть закреплен на более низких уровнях, чтобы язык мог работать с жесткими строительными блоками. Тогда на более высоких уровнях допускается гибкость для построения новых сложных концепций.

Контекстная проблема, о которой я говорил, заключается в том, что для обозначения аккорда как аккорда требуется взаимодействие других параметров, таких как базовые и сложные ритмические концепции. И эта проблема усугубляется, когда концепции становятся еще более абстрактными - например, как насчет key? Что значит быть в ключе? Концепция тональности, пожалуй, одна из величайших музыкальных абстракций, когда-либо задуманных. Это относится не только к, например, высоте C или аккорду C, но и к очень большому набору аккордов, соотношений высоты тона и ритмических отношений, которые дают ощущение принадлежности тональности C , что бы это ни значило. Я рассмотрю сложность описания таких аспектов для тезиса о внутреннем LMT в следующем посте, когда буду работать над каноном музыкальных теорий - я думаю, что у нас есть хорошее основание для вопросов, которые нас удовлетворяют на данный момент . Несмотря на эти тернистые неудачи, я не верю, что такая сложность и абстракция умаляют основную идею LMT, потому что, как уже говорилось, репрезентативная система языка, похоже, работает на низком уровне, и поэтому конструкции более высокого уровня должны естественно иметь выразительную свободу.

Заключительные мысли на данный момент

На этом мы завершаем этот пост из серии Мысли о языке музыкальной мысли. Надеюсь, я немного поверил идее, что LMT - по крайней мере возможная гипотеза музыкального познания. LMT кажется рекурсивным и имеет продуктивную композиционную структуру, допускающую бесконечное использование конечными средствами; это также кажется относительно систематическим на низких уровнях. В следующем посте я углублюсь в некоторые из поднятых здесь вопросов, рассмотрю различные генеративные и непроизводящие теории музыки и свяжу их с моделями, выдвинутыми в компьютерном музыковедении.