cx_Oracle executemany с CLOB

Я пытаюсь проанализировать несколько CSV и вставить их данные в таблицы с помощью cx_Oracle. У меня нет проблем со вставкой в ​​таблицы с помощью execute, но когда я пробую ту же процедуру с executemany, я получаю сообщение об ошибке. Мой код, использующий выполнение, которое работает,

with open(key,'r') as file:
    for line in file:
        data = data.split(",")
        query = "INSERT INTO " + tables[key] + " VALUES ("
        for col in range(len(data)):
            query += ":" + str(col) + ","
        query = query[:-1] + ")"            
        cursor.execute(query, data)

но когда я заменяю его на

with open(key,'r') as file:
    list = []
    for line in file:
        data = data.split(",")
        list.append(data)
    if len(list) > 0:
        query = "INSERT INTO " + tables[key] + " VALUES ("
        for col in range(len(data)):
            query += ":" + str(col) + ","
        query = query[:-1] + ")"            
        cursor.prepare(query)
        cursor.executemany(None,list)

Я получаю «ValueError: слишком большие строковые данные» при попытке вставить в таблицу, в которой есть столбцы CLOB, а размер данных превышает 4000 байт. Executemany отлично работает, когда в таблице нет столбца CLOB. Есть ли способ указать cx_Oracle обрабатывать соответствующие столбцы как объекты CLOB при выполнении?


person Danny    schedule 08.07.2011    source источник


Ответы (1)


Попробуйте установить размер ввода для больших столбцов равным cx_Oracle.CLOB. Может не работать, если у вас есть двоичные данные, но должен работать с любым текстом, который есть в CSV. Значение 2K, вероятно, ниже, чем должно быть.

Обратите внимание, что executemany кажется намного медленнее, когда задействованы CLOB столбцы, но все же лучше, чем повторное выполнение:

def _executemany(cursor, sql, data):
    '''
    run the parameterized sql with the given dataset using cursor.executemany 
    if any column contains string values longer than 2k, use CLOBS to avoid "string
    too large" errors.

    @param sql parameterized sql, with parameters named according to the field names in data
    @param data array of dicts, one per row to execute.  each dict must have fields corresponding
                to the parameter names in sql
    '''
    input_sizes = {}
    for row in data:
        for k, v in row.items():
            if isinstance(v, basestring) and len(v) > 2000:
                input_sizes[k] = cx_Oracle.CLOB
    cursor.setinputsizes(**input_sizes)
    cursor.executemany(sql, data)
person anomolos    schedule 28.08.2012