Быстрая контрольная сумма с открытым исходным кодом для небольших строк

Мне нужна быстрая контрольная сумма (как можно быстрее) для небольших строк (20-500 символов).

Мне нужен исходный код, и он должен быть небольшим! (около 100 LOC макс.)

Если бы он мог генерировать строки в Base32 / 64. (или что-то подобное) было бы идеально. В основном контрольные суммы не могут использовать какие-либо "плохие" символы .. вы знаете .. обычный () {} [].,;: / + - \ | и т.д

Разъяснения

Он может быть сильным / слабым, что на самом деле не имеет значения, так как оно предназначено только для закулисных целей.

Он не обязательно должен содержать все данные исходной строки, поскольку я буду проводить только сравнение с сгенерированными контрольными суммами, я не ожидаю какой-либо «расшифровки».


person Robin Rodricks    schedule 01.05.2009    source источник
comment
Будьте очень благодарны, даже если местный гений сможет вставить фрагмент кода прямо здесь в ответ !!   -  person Robin Rodricks    schedule 01.05.2009
comment
На каком языке вы хотели бы получить этот исходный код?   -  person Ronald Wildenberg    schedule 01.05.2009
comment
Английский :) Или почти что-нибудь C-совместимое.   -  person Robin Rodricks    schedule 01.05.2009
comment
Я имел в виду что-то вроде Adler32 .. они говорят, что он быстрее CRC32.   -  person Robin Rodricks    schedule 01.05.2009
comment
Цитата из вашего ответа: Мне нужно что-то, где даже один уникальный символ генерирует другую контрольную сумму .. - Обычно это невозможно, так как это нарушает принцип голубятни. Конечно, я мог бы дополнить строку до 200 символов (267 в Base 64) и назвать это контрольной суммой, но в целом длинных строк больше, чем маленьких чисел.   -  person MSalters    schedule 01.05.2009
comment
Классный вопрос, просто использовал ответ в проекте, спасибо, что задали его первым.   -  person Matthew Graves    schedule 12.11.2014


Ответы (10)


Быстрая реализация на C, авторских прав с моей стороны нет, так что используйте как хотите. Но учтите, что это очень слабая «контрольная сумма», поэтому не используйте ее для серьезных вещей :) - но это то, что вы хотели, не так ли?

Это возвращает 32-битную целочисленную контрольную сумму, закодированную как строку, содержащую ее шестнадцатеричное значение. Если функция контрольной суммы не удовлетворяет ваши потребности, вы можете изменить строку chk += ((int)(str[i]) * (i + 1)); на что-то лучшее (например, умножение, сложение и побитовое вращение было бы намного лучше).

РЕДАКТИРОВАТЬ: Следуя совету hughdbrown и один из ответов, которые он связал, я изменил цикл for, чтобы он не вызывает strlen на каждой итерации.

#include <stdio.h>
#include <stdlib.h>
#include <string>

char* hextab = "0123456789ABCDEF";

char* encode_int(int i) {
  char* c = (char*)malloc(sizeof(char) * 9);

  for (int j = 0; j < 4; j++) {
    c[(j << 1)] = hextab[((i % 256) >> 4)];
    c[(j << 1) + 1] = hextab[((i % 256) % 16)];

    i = (i >> 8);
  }
  c[8] = 0;

  return c;
}

int checksum(char* str) {
  int i;
  int chk = 0x12345678;

  for (i = 0; str[i] != '\0'; i++) {
    chk += ((int)(str[i]) * (i + 1));
  }

  return chk;
}

int main() {
  char* str1 = "Teststring";
  char* str2 = "Teststring2";

  printf("string: %s, checksum string: %s\n", str1, encode_int(checksum(str1)));
  printf("string: %s, checksum string: %s\n", str2, encode_int(checksum(str2)));

  return 0;
}
person schnaader    schedule 01.05.2009
comment
Удвоить скорость лучшего CRC32, который я мог достать :) - person Robin Rodricks; 01.05.2009
comment
Большое спасибо! Думаю, ответы на мой вопрос. Кроме того, я могу изменить его сам, не нарушая ни одного тонкого алгоритма. - person Robin Rodricks; 01.05.2009
comment
Итак, если вы умножите значение первого символа на 0, то две строки, которые отличаются только первым символом, будут иметь одинаковый хэш. И все строки длиной 0 и 1 имеют одинаковый хэш. - person hughdbrown; 12.08.2011
comment
@hughdbrown: Отличный улов. Измените это на умножение на i + 1. - person schnaader; 12.08.2011
comment
Нет необходимости вычислять strlen () каждый раз в цикле. Почему бы не написать свой цикл вот так? for (int c, j = 0; 0 != (c = *cp++); ) chk += c * ++j; - person hughdbrown; 13.08.2011
comment
В этом случае я доверяю компилятору оптимизировать это для меня, он может быть достаточно умен, чтобы увидеть, что str и поэтому strlen(str) не меняется. Кроме того, это более читабельно. - person schnaader; 13.08.2011
comment
Сказать компилятору, что вы хотите, надежнее, чем надеяться, что компилятор поступит правильно. stackoverflow.com/questions/2049480/ stackoverflow.com/questions/3388029/strlen-function - person hughdbrown; 15.08.2011
comment
Хорошо, спасибо за связанные вопросы / ответы SO, я отредактировал код. Хотя рекомендуемый вами код все же может быть немного быстрее, я решил использовать эту версию, чтобы сделать его максимально читаемым. - person schnaader; 15.08.2011
comment
Тег: Javascript. Принятый ответ: C ... :( - person Stijn de Witt; 03.09.2017

Реализация schnaader действительно очень быстрая. Вот это в Javascript:

function checksum(s)
{
  var chk = 0x12345678;
  var len = s.length;
  for (var i = 0; i < len; i++) {
      chk += (s.charCodeAt(i) * (i + 1));
  }

  return (chk & 0xffffffff).toString(16);
}

При использовании Google Chrome для выполнения этой функции для строк размером 1 мегабайт требуется всего 5 мс, по сравнению с 330 мс при использовании функции crc32.

person joelpt    schedule 18.07.2010
comment
@oelpt: это быстрее, потому что вы забыли реализовать другую часть функции, предоставляемой schnaader. Тот, который называется encode_int. Без этой части ваша контрольная сумма неограниченно увеличивалась бы вместе с длиной строки, поэтому она была бы совершенно бесполезной в качестве контрольной суммы. - person Marco Demaio; 05.04.2011
comment
@ Марко: Я вижу, ты прав. В исходном вопросе упоминались строки из 20-500 символов, и я тестировал только строки размером до 1 МБ. Считаете ли вы, что добавление операции по модулю после каждого добавления будет достаточно для очень больших строк? ТБХ Я не понимаю, что делает encode_int шнаадера. - person joelpt; 07.06.2011
comment
encode_int schnaader Я думаю, что просто преобразует int в строку в шестнадцатеричном формате. - person Marco Demaio; 13.06.2011
comment
зачем убирать i + 1 из реализации шнаадера? здесь вы получите тот же результат, что и первый символ. - person Alexis; 26.10.2013
comment
@Alexis Хороший улов. Фиксированный. - person joelpt; 02.02.2014
comment
Я решил не реализовывать encode_int (), как заметил Марко, потому что он просто преобразует контрольную сумму из int в шестнадцатеричную строку, что для многих случаев использования фактически не требуется. Если это так, вы можете просто вернуть chk.toString (16); чтобы вместо этого получить шестнадцатеричную контрольную сумму. Как заметил Марко, моя функция действительно возвращает значение, которое растет по мере увеличения длины строки, и для очень длинных строк она может в конечном итоге переполнить числовой тип JS. Если это проблема, вы можете использовать chk = (chk + (s.charCodeAt (i) * (i + 1)))% 0xFFFFFFFF; во внутреннем цикле, чтобы предотвратить переполнение / рост. Это делает функцию примерно в 10 раз медленнее. - person joelpt; 02.02.2014
comment
Ваш код допускает небольшую оптимизацию. Вы читаете длину строки в каждом цикле, в то время как вы можете просто сравнить ее с переменной, если вы минимально измените свой оператор for на это: for(var i = 0, l = s.length; i < l; i++). - person Robert Koritnik; 24.02.2015
comment
И вам не нужно выполнять модуль на каждой итерации. Шнаадер преобразовал все это в шестнадцатеричную строку после вычисленной контрольной суммы. Вы можете просто изменить оператор return на return (chk & 0xffffffff).toString(16);, и вы практически получите тот же результат, что и его код. И это не повлияет на производительность ни на один порядок. - person Robert Koritnik; 24.02.2015
comment
@RobertKoritnik отличные наблюдения. Фиксированный. - person joelpt; 13.08.2016
comment
Совершенно очевидно: эта контрольная сумма не будет уникальной. контрольная сумма (231) == контрольная сумма (203) == 123457a3 - person iamio; 19.07.2017
comment
Ситуация переполнения не обрабатывается должным образом. Ведущий бит маски 0xffffffff ничего не делает, кроме захвата бита, который не должен быть захвачен, генерируя отрицательное шестнадцатеричное значение (с инвертированной величиной). Поскольку здесь нет стремления к совершенству, возможно, удовлетворительно просто замаскировать с помощью 0x7fffffff. Это сохранит уникальность так же хорошо, как и раньше, до предела переполнения, и снова начнет циклическое переключение доступных перестановок. В противном случае функция не должна возвращать недопустимый результат и должна выдавать, если установлен бит 0x10000000. - person Blaine; 19.11.2020

Вот реализация CRC32 в Javascript:

function crc32 ( str ) {
    // http://kevin.vanzonneveld.net
    // +   original by: Webtoolkit.info (http://www.webtoolkit.info/)
    // +   improved by: T0bsn
    // -    depends on: utf8_encode
    // *     example 1: crc32('Kevin van Zonneveld');
    // *     returns 1: 1249991249

    str = utf8_encode(str);
    var table = "00000000 77073096 EE0E612C 990951BA 076DC419 706AF48F E963A535 9E6495A3 0EDB8832 79DCB8A4 E0D5E91E 97D2D988 09B64C2B 7EB17CBD E7B82D07 90BF1D91 1DB71064 6AB020F2 F3B97148 84BE41DE 1ADAD47D 6DDDE4EB F4D4B551 83D385C7 136C9856 646BA8C0 FD62F97A 8A65C9EC 14015C4F 63066CD9 FA0F3D63 8D080DF5 3B6E20C8 4C69105E D56041E4 A2677172 3C03E4D1 4B04D447 D20D85FD A50AB56B 35B5A8FA 42B2986C DBBBC9D6 ACBCF940 32D86CE3 45DF5C75 DCD60DCF ABD13D59 26D930AC 51DE003A C8D75180 BFD06116 21B4F4B5 56B3C423 CFBA9599 B8BDA50F 2802B89E 5F058808 C60CD9B2 B10BE924 2F6F7C87 58684C11 C1611DAB B6662D3D 76DC4190 01DB7106 98D220BC EFD5102A 71B18589 06B6B51F 9FBFE4A5 E8B8D433 7807C9A2 0F00F934 9609A88E E10E9818 7F6A0DBB 086D3D2D 91646C97 E6635C01 6B6B51F4 1C6C6162 856530D8 F262004E 6C0695ED 1B01A57B 8208F4C1 F50FC457 65B0D9C6 12B7E950 8BBEB8EA FCB9887C 62DD1DDF 15DA2D49 8CD37CF3 FBD44C65 4DB26158 3AB551CE A3BC0074 D4BB30E2 4ADFA541 3DD895D7 A4D1C46D D3D6F4FB 4369E96A 346ED9FC AD678846 DA60B8D0 44042D73 33031DE5 AA0A4C5F DD0D7CC9 5005713C 270241AA BE0B1010 C90C2086 5768B525 206F85B3 B966D409 CE61E49F 5EDEF90E 29D9C998 B0D09822 C7D7A8B4 59B33D17 2EB40D81 B7BD5C3B C0BA6CAD EDB88320 9ABFB3B6 03B6E20C 74B1D29A EAD54739 9DD277AF 04DB2615 73DC1683 E3630B12 94643B84 0D6D6A3E 7A6A5AA8 E40ECF0B 9309FF9D 0A00AE27 7D079EB1 F00F9344 8708A3D2 1E01F268 6906C2FE F762575D 806567CB 196C3671 6E6B06E7 FED41B76 89D32BE0 10DA7A5A 67DD4ACC F9B9DF6F 8EBEEFF9 17B7BE43 60B08ED5 D6D6A3E8 A1D1937E 38D8C2C4 4FDFF252 D1BB67F1 A6BC5767 3FB506DD 48B2364B D80D2BDA AF0A1B4C 36034AF6 41047A60 DF60EFC3 A867DF55 316E8EEF 4669BE79 CB61B38C BC66831A 256FD2A0 5268E236 CC0C7795 BB0B4703 220216B9 5505262F C5BA3BBE B2BD0B28 2BB45A92 5CB36A04 C2D7FFA7 B5D0CF31 2CD99E8B 5BDEAE1D 9B64C2B0 EC63F226 756AA39C 026D930A 9C0906A9 EB0E363F 72076785 05005713 95BF4A82 E2B87A14 7BB12BAE 0CB61B38 92D28E9B E5D5BE0D 7CDCEFB7 0BDBDF21 86D3D2D4 F1D4E242 68DDB3F8 1FDA836E 81BE16CD F6B9265B 6FB077E1 18B74777 88085AE6 FF0F6A70 66063BCA 11010B5C 8F659EFF F862AE69 616BFFD3 166CCF45 A00AE278 D70DD2EE 4E048354 3903B3C2 A7672661 D06016F7 4969474D 3E6E77DB AED16A4A D9D65ADC 40DF0B66 37D83BF0 A9BCAE53 DEBB9EC5 47B2CF7F 30B5FFE9 BDBDF21C CABAC28A 53B39330 24B4A3A6 BAD03605 CDD70693 54DE5729 23D967BF B3667A2E C4614AB8 5D681B02 2A6F2B94 B40BBE37 C30C8EA1 5A05DF1B 2D02EF8D";

    var crc = 0;
    var x = 0;
    var y = 0;

    crc = crc ^ (-1);
    for( var i = 0, iTop = str.length; i < iTop; i++ ) {
        y = ( crc ^ str.charCodeAt( i ) ) & 0xFF;
        x = "0x" + table.substr( y * 9, 8 );
        crc = ( crc >>> 8 ) ^ x;
    }

    return crc ^ (-1);
}

Найдено на kevin.vanzonneveld.net

person Michael Cramer    schedule 01.05.2009
comment
Спасибо за беспокойство, но небольшой фрагмент Шнаадера работает как шарм, и это быстро. Очень быстро. - person Robin Rodricks; 01.05.2009
comment
да, и мне это нравится, как веб-разработчик, не имеет значения, быстро ли это ... я просто не могу выполнить C в браузере: P - person jebbie; 20.08.2013
comment
Ну, этот не особо оптимизирован, поскольку он выполняет манипуляции со строками. По крайней мере, для этой части может быть полезно иметь массив значений вместо того, чтобы помещать их все в строку. Таким образом, вместо синтаксического анализа строки мы просто будем ссылаться на конкретный индекс таблицы, получая непосредственно нужное нам число. Это сделало бы его быстрее. Намного быстрее. Например, в 25 раз быстрее ... - person Robert Koritnik; 24.02.2015

Практически любой алгоритм, который вы могли бы придумать, удовлетворял бы вашим критериям. Например.

CHECKSUM = SUM( i=0 .. input.length, input[i] )

чтобы сделать его "безопасным для плохих углей"

CHECKSUM = 'A' + SUM( i=0 .. input.length, input[i] ) MODULO 26

Попытка уменьшить количество коллизий за счет увеличения выходной области

# Assume BASE64[ ] is the safe output alphabet array.
TMP = SUM( i=0 .. input.length, input[i] ) MODULO 2^24
FOR I = 0..3
    CHECKSUM[I] = BASE64[TMP MODULO 64]
    TMP = TMP / 64

Решение, которое дополнительно снижает количество столкновений за счет вычисления разных значений для разных пермутаций.

# Assume BASE64[ ] is the safe output alphabet array.
TMP = SUM( i=0 .. input.length, i*input[i] ) MODULO 2^24
FOR I = 0..3
    CHECKSUM[I] = BASE64[TMP MODULO 64]
    TMP = TMP / 64

В общем, все эти варианты работают очень хорошо, если ввод достаточно случайный и достаточно разреженный (конечно, «достаточно» различается в каждом случае).

person MSalters    schedule 01.05.2009
comment
Хорошая идея, но мне нужно что-то, где даже один уникальный символ генерирует другую контрольную сумму. - person Robin Rodricks; 01.05.2009
comment
В качестве сноски, это алгоритм, а не исходный код, и, следовательно, он не может быть открытым. Если вы превратите это в исходный код, вы сможете решить, является ли он открытым. - person MSalters; 01.05.2009
comment
+1 отличное объяснение, спасибо. К вашему сведению, первое решение, которое не использует MOD, создаст контрольную сумму, которая бесконечно увеличивается с длиной строки, но я полагаю, вы ввели ее для более простого объяснения. - person Marco Demaio; 05.04.2011
comment
Я понял, что ваша функция создает контрольную сумму, но знаете ли вы, почему Luhn mod N alg (en.wikipedia.org/wiki / Luhn_mod_N_algorithm в некотором роде аналогично вашей реализации) во время суммирования удваивает значение каждого четного позиционированного символа / цифры? Я имею в виду, у вас есть идея, почему он просто не суммирует символы / цифры from i to input.length, как в ваших примерах? - person Marco Demaio; 05.04.2011

Это 207 строк, но это javascript-реализация md5:

http://www.webtoolkit.info/javascript-md5.html

Соедините это с javascript base64:

http://www.webtoolkit.info/javascript-base64.html

Эти скрипты полностью самодостаточны, поэтому у них есть некоторая избыточность (например, кодирование / декодирование UTF-8), которые можно легко сделать общими для них.

РЕДАКТИРОВАТЬ: На том же сайте вы можете найти javascript crc32:

http://www.webtoolkit.info/javascript-crc32.html

person Mike Boers    schedule 01.05.2009
comment
Или в недавних выпусках вы могли просто загрузить crypto js. cdnjs.cloudflare.com/ajax/libs/ crypto-js / 3.1.2 / components / cdnjs.cloudflare.com/ajax/libs/crypto-js/3.1.2/rollups/md5.js и запустите их с помощью md5 = CryptoJS.MD5 (строка); слова = CryptoJS.lib.WordArray.create (md5.words); и у вас будет весь шестнадцатеричный вывод буквально в 4 строках кода. - person JasonXA; 21.05.2017

чтобы использовать только javascript, вы могли бы использовать эту функцию crc: http://www.webtoolkit.info/javascript-crc32.html

/**
*
*  Javascript crc32
*  http://www.webtoolkit.info/
*
**/

function crc32 (str) {

    function Utf8Encode(string) {
        string = string.replace(/\r\n/g,"\n");
        var utftext = "";

        for (var n = 0; n < string.length; n++) {

            var c = string.charCodeAt(n);

            if (c < 128) {
                utftext += String.fromCharCode(c);
            }
            else if((c > 127) && (c < 2048)) {
                utftext += String.fromCharCode((c >> 6) | 192);
                utftext += String.fromCharCode((c & 63) | 128);
            }
            else {
                utftext += String.fromCharCode((c >> 12) | 224);
                utftext += String.fromCharCode(((c >> 6) & 63) | 128);
                utftext += String.fromCharCode((c & 63) | 128);
            }

        }

        return utftext;
    };

    str = Utf8Encode(str);

    var table = "00000000 77073096 EE0E612C 990951BA 076DC419 706AF48F E963A535 9E6495A3 0EDB8832 79DCB8A4 E0D5E91E 97D2D988 09B64C2B 7EB17CBD E7B82D07 90BF1D91 1DB71064 6AB020F2 F3B97148 84BE41DE 1ADAD47D 6DDDE4EB F4D4B551 83D385C7 136C9856 646BA8C0 FD62F97A 8A65C9EC 14015C4F 63066CD9 FA0F3D63 8D080DF5 3B6E20C8 4C69105E D56041E4 A2677172 3C03E4D1 4B04D447 D20D85FD A50AB56B 35B5A8FA 42B2986C DBBBC9D6 ACBCF940 32D86CE3 45DF5C75 DCD60DCF ABD13D59 26D930AC 51DE003A C8D75180 BFD06116 21B4F4B5 56B3C423 CFBA9599 B8BDA50F 2802B89E 5F058808 C60CD9B2 B10BE924 2F6F7C87 58684C11 C1611DAB B6662D3D 76DC4190 01DB7106 98D220BC EFD5102A 71B18589 06B6B51F 9FBFE4A5 E8B8D433 7807C9A2 0F00F934 9609A88E E10E9818 7F6A0DBB 086D3D2D 91646C97 E6635C01 6B6B51F4 1C6C6162 856530D8 F262004E 6C0695ED 1B01A57B 8208F4C1 F50FC457 65B0D9C6 12B7E950 8BBEB8EA FCB9887C 62DD1DDF 15DA2D49 8CD37CF3 FBD44C65 4DB26158 3AB551CE A3BC0074 D4BB30E2 4ADFA541 3DD895D7 A4D1C46D D3D6F4FB 4369E96A 346ED9FC AD678846 DA60B8D0 44042D73 33031DE5 AA0A4C5F DD0D7CC9 5005713C 270241AA BE0B1010 C90C2086 5768B525 206F85B3 B966D409 CE61E49F 5EDEF90E 29D9C998 B0D09822 C7D7A8B4 59B33D17 2EB40D81 B7BD5C3B C0BA6CAD EDB88320 9ABFB3B6 03B6E20C 74B1D29A EAD54739 9DD277AF 04DB2615 73DC1683 E3630B12 94643B84 0D6D6A3E 7A6A5AA8 E40ECF0B 9309FF9D 0A00AE27 7D079EB1 F00F9344 8708A3D2 1E01F268 6906C2FE F762575D 806567CB 196C3671 6E6B06E7 FED41B76 89D32BE0 10DA7A5A 67DD4ACC F9B9DF6F 8EBEEFF9 17B7BE43 60B08ED5 D6D6A3E8 A1D1937E 38D8C2C4 4FDFF252 D1BB67F1 A6BC5767 3FB506DD 48B2364B D80D2BDA AF0A1B4C 36034AF6 41047A60 DF60EFC3 A867DF55 316E8EEF 4669BE79 CB61B38C BC66831A 256FD2A0 5268E236 CC0C7795 BB0B4703 220216B9 5505262F C5BA3BBE B2BD0B28 2BB45A92 5CB36A04 C2D7FFA7 B5D0CF31 2CD99E8B 5BDEAE1D 9B64C2B0 EC63F226 756AA39C 026D930A 9C0906A9 EB0E363F 72076785 05005713 95BF4A82 E2B87A14 7BB12BAE 0CB61B38 92D28E9B E5D5BE0D 7CDCEFB7 0BDBDF21 86D3D2D4 F1D4E242 68DDB3F8 1FDA836E 81BE16CD F6B9265B 6FB077E1 18B74777 88085AE6 FF0F6A70 66063BCA 11010B5C 8F659EFF F862AE69 616BFFD3 166CCF45 A00AE278 D70DD2EE 4E048354 3903B3C2 A7672661 D06016F7 4969474D 3E6E77DB AED16A4A D9D65ADC 40DF0B66 37D83BF0 A9BCAE53 DEBB9EC5 47B2CF7F 30B5FFE9 BDBDF21C CABAC28A 53B39330 24B4A3A6 BAD03605 CDD70693 54DE5729 23D967BF B3667A2E C4614AB8 5D681B02 2A6F2B94 B40BBE37 C30C8EA1 5A05DF1B 2D02EF8D";

    if (typeof(crc) == "undefined") { crc = 0; }
    var x = 0;
    var y = 0;

    crc = crc ^ (-1);
    for( var i = 0, iTop = str.length; i < iTop; i++ ) {
        y = ( crc ^ str.charCodeAt( i ) ) & 0xFF;
        x = "0x" + table.substr( y * 9, 8 );
        crc = ( crc >>> 8 ) ^ x;
    }

    return crc ^ (-1);

};

в php вы можете сделать это с помощью одной строки с хешем md5, на строке длиной 20-500 это должно быть довольно быстро

$hash_code = md5($string_to_hash);

вот дополнительная информация: http://us.php.net/md5

кроме того, если вы хотите выбрать свой алгоритм хеширования, вы можете использовать функцию hash php: http://us.php.net/manual/en/function.hash.php

person John Boker    schedule 01.05.2009

То, что вы ищете, - это алгоритм для создания хэш-кода для строки. В C #:

byte[] bytesToHash = Encoding.UTF8.GetBytes(stringToHash);
HashAlgorithm sha = new SHA1CryptoServiceProvider();
byte[] hash = sha.ComputeHash(dataArray);
string result = Convert.ToBase64String(hash);
person Ronald Wildenberg    schedule 01.05.2009
comment
Мне нужно что-то с открытым исходным кодом! И определенно никакой зависимости от внешних библиотек или фреймворков. - person Robin Rodricks; 01.05.2009
comment
Ах, открытый исходный код. Пропустил эту часть. - person Ronald Wildenberg; 01.05.2009

md5sum, sha1sum, sha224sum, sha256sum, sha384sum, sha512sum доступны для большинства дистрибутивов * nix.

person Andrew Sledge    schedule 01.05.2009
comment
Кроме тегов отображается javascript. Я получаю помощь в других условиях ... это хорошо для других. - person JasonXA; 21.05.2017

Это может показаться немного поздно и частично не по теме ... Я использовал JS-реализацию joelpt для решение schnaader в приложении на основе JS и PHP. И я предполагаю, что реализация PHP может быть полезна и для других.

function checksum($s) {
    $chk = 0x12345678;
    $len = mb_strlen($s);
    for ($i = 0; $i < $len; $i++) {
        $chk += (mb_ord(mb_substr($s, $i, 1)) * ($i + 1));
    }
    return dechex($chk & 0xffffffff);
}

if (!function_exists('mb_ord')) {
    // Shim from https://stackoverflow.com/a/1365610/336311
    function mb_ord($string) {
        mb_internal_encoding('UTF-8');
        // mb_language('Neutral');
        // mb_detect_order(['UTF-8', 'ISO-8859-15', 'ISO-8859-1', 'ASCII']);

        $result = unpack('N', mb_convert_encoding($string, 'UCS-4BE', 'UTF-8'));

        if (is_array($result)) {
            return $result[1];
        }
        return ord($string);
    }
}
person BurninLeo    schedule 16.09.2018

Работает в современных (не IE) браузерах, должен быть на HTTPS:

https://developer.mozilla.org/en-US/docs/Web/API/SubtleCrypto/digest

const text = `Lorem ipsum dolor sit amet, consectetur adipiscing elit. In nec elit a justo rhoncus blandit. Aenean commodo sem in mattis fermentum. Phasellus pellentesque tortor lectus, a sodales quam cursus in. Aliquam lorem velit, faucibus id nisi sed, tristique tempor odio. Donec sit amet neque non nunc dictum gravida. Vestibulum in suscipit urna, ac porttitor enim. Integer ultrices feugiat justo vel gravida. Cras viverra laoreet lobortis. Mauris non pharetra purus. Aenean sed elementum justo. Vivamus libero enim, consequat eu convallis in, lacinia ut mi. Curabitur eget diam id augue tincidunt tempus ac eu nisi. Sed dui leo, rhoncus vel egestas non, tempor a magna.

Donec congue vehicula nunc sed vestibulum. Interdum et malesuada fames ac ante ipsum primis in faucibus. Donec sodales scelerisque ullamcorper. Sed iaculis aliquet consectetur. Donec vel purus sodales, interdum velit eget, ultricies arcu. Nullam eu lorem vel sem aliquam congue eu ut felis. Praesent auctor vitae massa venenatis bibendum. Morbi a aliquet enim. Mauris ac nisi lacus. Etiam nec sollicitudin nibh. Sed maximus tortor eget lectus maximus, quis ultrices justo faucibus. Suspendisse potenti. Fusce id consequat mi.

Donec cursus, orci vel malesuada porttitor, nisi orci volutpat ipsum, eget pretium nisl est a lorem. Curabitur et egestas tortor, vel mattis tellus. Suspendisse eget nunc varius, pharetra velit sit amet, viverra est. Pellentesque a vehicula risus, eu tincidunt justo. Sed nec ligula a eros sagittis rhoncus. Vestibulum a nulla erat. Nulla facilisi. Aenean elit diam, scelerisque quis sollicitudin non, feugiat a lorem.

Aliquam lacinia mi diam, ut aliquet libero placerat at. Pellentesque sit amet neque varius, pharetra nunc ac, egestas justo. Fusce at dapibus felis, et imperdiet felis. Nullam fringilla mi ut lorem imperdiet cursus. Morbi venenatis, justo vel efficitur euismod, dui lacus tincidunt neque, vel vestibulum velit lectus et velit. Sed non dolor libero. Vivamus nec ligula a nisl eleifend sollicitudin at id nisl. Sed in vestibulum nisi, sed vestibulum nunc. Donec volutpat eu nisi nec venenatis.

Sed rhoncus ut nisl a tristique. Integer lacus massa, congue fringilla mollis in, pretium vitae lorem. Vivamus porttitor quam nisl, vitae suscipit ante egestas at. Ut sed enim vel ante congue euismod sit amet a elit. Phasellus sed placerat nunc. Aenean turpis tortor, convallis eget leo a, fringilla fringilla nisi. Maecenas euismod sapien ut massa ultricies interdum. Donec suscipit dolor dolor.`;

async function digestMessage(message) {
  // encode as (utf-8) Uint8Array
  const msgUint8 = new TextEncoder().encode(message);
  // hash the message
  const hashBuffer = await crypto.subtle.digest('SHA-256', msgUint8);
  // convert buffer to byte array
  const hashArray = Array.from(new Uint8Array(hashBuffer));
  // convert bytes to hex string
  const hashHex = hashArray.map(b => b.toString(16).padStart(2, '0')).join('');
  return hashHex;
}

const digestBuffer = digestMessage(text)
  .then(digestBuffer => console.log(digestBuffer));

Вышеупомянутое занимает около 4,5 мс, короткое предложение, а это длинное не имело значения. Не пробовал для очень длинной струны.

person Dominic    schedule 26.08.2020