Я ищу кодировку, которая может кодировать каждую строку в уникальный номер, такой что ->
- Каждые две похожие строки должны иметь значения, близкие друг к другу.
- Каждые два значения, которые близки друг к другу, должны представлять похожие строки.
Сходство строк будет означать, что несколько замен в одной строке могут образовать другую строку. Добавления и удаления не учитываются.
Строка может содержать только символы A, C, T и G (всего четыре варианта)
Вещи, которые я пробовал ->
Код Грея -> Удовлетворяет второму, но не удовлетворяет первому критерию. Две похожие строки не обязательно означают, что они имеют более близкие значения в коде Грея.
Расстояние Хэмминга от эталонной строки -> Очевидно, что если расстояние Хэмминга одинаково, это вовсе не означает, что строки похожи, просто они одинаково далеки от эталона. Таким образом, он не удовлетворяет второму критерию.
Пожалуйста, предложите метод, если вы знаете какой-либо для этой конкретной проблемы.