разбор объекта formdata с помощью javascript

Моя компания использует умиротворяющий сервер приложений, в котором программы на стороне сервера написаны на javascript (не node.js). Это очень начальная вещь, и поддержка не так уж хороша.

Теперь вот моя проблема:

Мне нужно обработать загруженный csv на стороне сервера. Я использую супер ответ на Как я могу загружать файлы асинхронно? (передавая объект formdata с помощью jquery), и я могу получить доступ к отправленному файлу на стороне сервера. Но как мне его разобрать?

Это выглядит так

------WebKitFormBoundaryU5rJUDxGnj15hIGW
Content-Disposition: form-data; name="fileToUpload"; filename="test.csv"
Content-Type: application/vnd.ms-excel

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

------WebKitFormBoundaryU5rJUDxGnj15hIGW--

Я действительно не понимаю, как обрабатывать этот файл с помощью простого javascript на стороне сервера.

Пожалуйста помоги.


person Shrayas    schedule 22.08.2012    source источник


Ответы (2)


Лучше всего использовать node-formidable, браузерировать и заполнять его. Вот автономный парсер, работает как со строковыми, так и с необработанными ответами. Убедитесь, что вы используете современный браузер для сырых материалов.

/* 
 * MultiPart_parse decodes a multipart/form-data encoded response into a named-part-map.
 * The response can be a string or raw bytes.
 *
 * Usage for string response:
 *      var map = MultiPart_parse(xhr.responseText, xhr.getResponseHeader('Content-Type'));
 *
 * Usage for raw bytes:
 *      xhr.open(..);     
 *      xhr.responseType = "arraybuffer";
 *      ...
 *      var map = MultiPart_parse(xhr.response, xhr.getResponseHeader('Content-Type'));
 *
 * TODO: Can we use https://github.com/felixge/node-formidable
 * See http://stackoverflow.com/questions/6965107/converting-between-strings-and-arraybuffers
 * See http://www.w3.org/Protocols/rfc1341/7_2_Multipart.html
 *
 * Copyright@ 2013-2014 Wolfgang Kuehn, released under the MIT license.
*/
function MultiPart_parse(body, contentType) {
    // Examples for content types:
    //      multipart/form-data; boundary="----7dd322351017c"; ...
    //      multipart/form-data; boundary=----7dd322351017c; ...
    var m = contentType.match(/boundary=(?:"([^"]+)"|([^;]+))/i);

    if ( !m ) {
        throw new Error('Bad content-type header, no multipart boundary');
    }

    var boundary = m[1] || m[2];

    function Header_parse(header) {
        var headerFields = {};
        var matchResult = header.match(/^.*name="([^"]*)"$/);
        if ( matchResult ) headerFields.name = matchResult[1];
        return headerFields;
    }

    function rawStringToBuffer( str ) {
        var idx, len = str.length, arr = new Array( len );
        for ( idx = 0 ; idx < len ; ++idx ) {
            arr[ idx ] = str.charCodeAt(idx) & 0xFF;
        }
        return new Uint8Array( arr ).buffer;
    }

    // \r\n is part of the boundary.
    var boundary = '\r\n--' + boundary;

    var isRaw = typeof(body) !== 'string';

    if ( isRaw ) {
        var view = new Uint8Array( body );
        s = String.fromCharCode.apply(null, view);
    } else {
        s = body;
    }

    // Prepend what has been stripped by the body parsing mechanism.
    s = '\r\n' + s;

    var parts = s.split(new RegExp(boundary)),
        partsByName = {};

    // First part is a preamble, last part is closing '--'
    for (var i=1; i<parts.length-1; i++) {
      var subparts = parts[i].split('\r\n\r\n');
      var headers = subparts[0].split('\r\n');
      for (var j=1; j<headers.length; j++) {
        var headerFields = Header_parse(headers[j]);
        if ( headerFields.name ) {
            fieldName = headerFields.name;
        }
      }

      partsByName[fieldName] = isRaw?rawStringToBuffer(subparts[1]):subparts[1];
    }

    return partsByName;
}
person Wolfgang Kuehn    schedule 07.02.2014
comment
очень полезно. но есть ошибка. если содержимое части содержит \r\n\r\n, то оно также будет разделено, и содержимое будет не исходным значением, а только первой частью содержимого, пока \r\n\r\n var contentStartPos = parts[i].indexOf("\r\n\r\n") + 4; var partHeaders = parts[i].substr(0, contentStartPos - 4).split("\r\n"); var partContent = parts[i].substr(contentStartPos); - person Reza Bayat; 22.04.2021

Итак, мне удалось сделать это самому. Я протестировал его в нескольких браузерах и заметил, что заголовок состоит из 3 строк, а нижний колонтитул — из 1 строки.

Я только что написал один простой синтаксический анализатор, который разбивает файл по символу новой строки и построчно помещает его в массив.

Это помогает мне в обработке до сих пор.

function doProcess()
{

var i=0;
var str = '';
var arrayList = [];

for (i=0;i<fileContent.length;i++)
{
    if (fileContent[i] !== '\n')
    {
        str += fileContent[i];
    }
    else
    {
        str = str.replace("\r","");
        if (trim(str) !== "")
        {
            arrayList.push(str);
        }
        str = '';
    }
}

    // Remove header
    arrayList.splice(0,3);

    // Remove footer
    arrayList.splice(arrayList.length-1,1);

    // arrayList is an array of all the lines in the file
    console.log(arrayList); 
}
person Shrayas    schedule 22.08.2012