В науке (данных) и математике в целом часто необходимо (или, по крайней мере, очень полезно) иметь ментальную картину того, как вещи расположены в некотором пространстве. Мы живем в трехмерном мире, поэтому наши ментальные картины также трехмерны. Влево/вправо, вверх/вниз, внутрь/вне — то, что нам знакомо.

Вам может казаться, что вы также можете визуализировать двухмерный объект, но есть вероятность, что когда вы это делаете, вы представляете себе этот двухмерный объект, встроенный в трехмерное пространство. Когда я думаю о двухмерном квадрате, я вижу его сверху (т. е. фактически использую третье измерение). Очень сложно правильно представить себе жизнь в 2D (книга Flatland: A Romance of Many Dimensions пытается описать, какой была бы 2D жизнь). Точно так же люди не могут правильно визуализировать объекты более высокого измерения, такие как объекты 4-D, 10-D или 10 000-D.

Тем не менее, мы можем получить некоторое представление о том, на что похожи эти многомерные пространства, с помощью некоторых основных математических анализов. Некоторые свойства многомерных пространств совершенно нелогичны!

Рассмотрим n-мерный куб с длиной стороны 1. Любая точка в этом кубе (он же гиперкуб) может быть представлена ​​списком из n действительных чисел от 0 до 1. Например, (0,6, 0,8, 0,4) будет быть точкой внутри трехмерного куба, показанного ниже.

В высших измерениях нам приходится довольствоваться абстрактным списком чисел. (0,43, 0,38, 0,76, 0,79, 0,18, 0,48, 0,44, 0,64, 0,70, 0,75) является примером точки в 10-мерном гиперкубе.

Факт: большая часть объема многомерного гиперкуба находится на его оболочке (около поверхности). Другим способом сказать это является то, что если вы случайным образом выберете точку из куба, скорее всего, она будет очень близко к поверхности. Вот один из способов получить случайную точку из куба. Выберите случайное число от 0 до 1 n раз и поместите эти числа в список. Затем этот список представляет собой случайную точку. Что означает, что точка находится близко к поверхности? Ну, это означает, что одно или несколько чисел в списке близки к 0 или 1 (потому что вы могли бы легко покинуть куб, немного двигаясь в одном направлении). Если у вас есть длинный список случайных чисел, очень вероятно, что хотя бы одно из них будет близко к 0 или 1! Давайте оценим это количественно.

Будем говорить, что точка гиперкуба близка к поверхности, если хотя бы одно из чисел в ее списке меньше 0,01 или больше 0,99. Тогда вероятность того, что случайная точка не находится вблизи поверхности, равна (0,98)^n. Для n=100 это всего около 13%. Следовательно, вероятность того, что случайная точка находится вблизи поверхности, составляет 87%, если n=100. Так что несколько удивительно, но 87% точек в 100-мерном кубе находятся в пределах 0,01 единицы его поверхности! Чем выше размерность, тем выше эта доля.

Вот еще один способ взглянуть на это. Предположим, у вас есть меньший гиперкуб (с длиной стороны s ‹ 1) внутри гиперкуба со стороной 1. Теперь мы можем спросить, насколько большим должно быть s, чтобы объем меньшего куба занимал половину объема большего куба. . Если n=100, объем меньшего куба равен s¹⁰⁰. Объем большего куба равен 1¹⁰⁰ = 1. Итак, у нас есть s¹⁰⁰ = 0,5, и нам нужно найти s. Это дает нам около 0,9931. Это означает, что если мы сожмем наш куб со стороной 1 совсем чуть-чуть (чтобы длина стороны стала равной 0,9931), мы уже потеряем половину объема! Очевидно, что большая часть объема находится близко к поверхности…

Основное изображение: https://commons.wikimedia.org/wiki/File:Dimension_levels.svg