Вопросы по теме 'duplicate-data'

Как найти повторяющиеся значения в таблице в Oracle?
Какой самый простой оператор SQL вернет повторяющиеся значения для данного столбца и количество их вхождений в таблицу базы данных Oracle? Например: у меня есть JOBS таблица со столбцом JOB_NUMBER . Как я могу узнать, есть ли у меня дубликаты...
748510 просмотров
schedule 13.04.2022

Как обнаружить дублированный текст с некоторой нечеткостью
Некоторое время назад я написал небольшой скрипт используя Text::DeDupe , чтобы удалить дубликаты сообщений в блоге до того, положить на них глаз. После прочтения документа Синтаксическая кластеризация Интернета , в котором реализация...
1991 просмотров

Как найти повторяющиеся данные в XML-документе с помощью XQuery?
У меня есть куча документов в базе данных MarkLogic xml. В одном документе есть: <colors> <color>red</color> <color>red</color> </colors> Наличие нескольких цветов не является проблемой. Наличие...
10594 просмотров
schedule 05.08.2022

Удалить дубликаты/сортировать из массива ассоциативных массивов в PHP
У меня есть массив ассоциативных массивов aa[] = ('Tires'=>100, 'Oil'=>10, 'Spark Plugs'=>4 ); aa[] = ('Tires'=>454, 'Oil'=>43, 'Spark Plugs'=>3 ); aa[] = ('Tires'=>34, 'Oil'=>55, 'Spark Plugs'=>44 ); aa[] = ('Tires'=>454, 'Oil'=>43, 'Spark...
1669 просмотров

каковы быстрые алгоритмы для поиска повторяющихся элементов в коллекции и их группировки?
Скажем, у вас есть коллекция элементов, как вы можете выбрать те, у которых есть дубликаты, и поместить их в каждую группу с наименьшим количеством сравнений? желательно на C++, но алгоритм важнее языка. Например, учитывая...
27082 просмотров
schedule 13.06.2023

Как подсчитать дубликаты в массивах Ruby
Как вы считаете дубликаты в массиве ruby? Например, если бы в моем массиве было три а, как я мог бы посчитать это
29368 просмотров
schedule 21.12.2022

Удаление повторяющихся записей в таблице DB2
Как удалить повторяющиеся записи в таблице DB2? Я хочу, чтобы у меня осталась одна запись для каждой группы дубликатов.
1765 просмотров
schedule 21.12.2022

Поиск повторяющихся строк, которые отличаются в одном столбце
У меня есть следующая таблица в MySQL 5.1: +--------------+----------------+------+-----+---------+----------------+ | Field | Type | Null | Key | Default | Extra |...
8126 просмотров
schedule 14.06.2023

Избегайте дубликатов при разработке отношений «один ко многим»
Перерыл много тем, так и не понял. Извините, если это дублирующийся вопрос. Рассмотрим следующую установку. 1) Сотрудник => (ID, Имя) 2) Отдел => (ID,Имя,местонахождение,Клерк,Бухгалтер,Средний менеджер,Групповой менеджер,Региональный...
2116 просмотров

Удаление кадра данных строк в R при условии, если какая-либо из (конкретная переменная) равна
Я уже некоторое время борюсь с этим кодом... У меня есть этот вектор уникального идентификатора "EID" длиной 821, извлеченный из одного из моих фреймов данных (скейт). Это выглядит так: > head(skate$EID) [1] "896-19" "895-8" "899-1" "899-5"...
4305 просмотров
schedule 08.05.2023

Обнаружение повторяющихся английских имен
Я пытаюсь найти пример, демонстрирующий Lucene или какой-либо другой индекс, который может проверять английскую комбинацию имени и фамилии на наличие возможных дубликатов. Проверка дубликатов должна учитывать распространенные прозвища, например, Боб...
176 просмотров
schedule 05.08.2022

Повторяющийся шаблон внутри URL
Может ли кто-нибудь помочь нам с регулярным выражением для обнаружения повторяющихся шаблонов внутри строки URL? Цель, очевидно, состоит в том, чтобы обнаружить неверно сформированные странные URL-адреса. Например, допустимы следующие URL:...
362 просмотров
schedule 29.09.2022

Ничего не вставляйте в повторяющееся обновление ключа, используя MySQL
Моя проблема в том, что у меня есть несколько уникальных ключей в таблице. Вставить игнорирование не вариант, потому что он подавляет ошибки. MySQL не поддерживает какие-либо условные операторы вне оператора (например, если (условие), затем...
20417 просмотров
schedule 18.06.2023

Получите повторяющиеся записи перед массовым копированием в базу данных
Сейчас я копирую данные из одной клиентской базы данных DB2 в основную базу данных DB1 с помощью SqlBulkCopy . DataTable dtTable = new DataTable(); sqlDB2DataAdapter.Fill(dtTable); //select * from tblOrdersDB2 SqlBulkCopy bulkcopy = new...
1788 просмотров

SQL для дублирования родительских и дочерних записей
Я пытаюсь найти лучший способ создать оператор SQL (в SQL Server), чтобы дублировать родительскую запись и все дочерние записи. У меня есть пример ниже; -- duplicate the order insert into Orders (CustomerID, EmployeeID, OrderDate, RequiredDate,...
379 просмотров

Сравнение массивов с одинаковыми значениями
$array1 = array(1,1,1); $array2= array(1,5,9,2,2,1); Мне нужно сравнить $array2 с $array1 , и если $array2 имеет одинаковые идентичные значения, должно возвращаться true , иначе должно возвращаться false. В этом случае он должен вернуть...
134 просмотров
schedule 16.01.2023

R, найти повторяющиеся строки, независимо от порядка
Я всю ночь думал над этой проблемой: вот моя матрица: 'a' '#' 3 '#' 'a' 3 0 'I am' 2 'I am' 0 2 ..... Я хочу обрабатывать строки так, как будто первые две строки одинаковы, потому что это просто другой порядок «a» и «#». В моем случае я...
3059 просмотров
schedule 02.02.2023

Как иметь не более n дубликатов в поле
Я предполагаю, что мой вопрос несколько уникален. Все хотят избавиться от дубликатов, но я, с другой стороны, хочу разрешить появление определенного количества дубликатов. Я создаю базу данных для резервирования дат для кампаний по сдаче крови....
57 просмотров

Обновление или вставка на основе ключевых столбцов в Redshift
Я ежедневно загружаю CSV-файлы в Redshift. Чтобы обрабатывать дубликаты, я загружаю файлы в промежуточную таблицу, а затем использую сценарии обновления или вставки на основе ключевых столбцов для загрузки в целевую таблицу. Недавно я неожиданно...
1195 просмотров

Запрос доступа дублирует уникальные записи/проблемы со связанной таблицей
Я надеюсь, что кто-то может помочь мне с этим: У меня есть простой запрос, объединяющий список имен и основных сведений с другой таблицей, содержащей более конкретную информацию. Некоторые имена обязательно будут появляться более одного раза, и...
4868 просмотров