Я читаю лист Excel с помощью Kettle, и этот лист имеет три поля: код, описание и дату.
Пример:
1 - description A - 01/JAN/2013
2 - description A - 15/JAN/2013
3 - description A - 04/JAN/2013
4 - description B - 02/JAN/2013
5 - description B - 16/JAN/2013
6 - description B - 11/JAN/2013
Я хочу добавить дополнительное поле Максимальная дата для каждой строки, где максимальная дата — это самая поздняя дата в группе на основе описания, например:
Пример 2
1 - description A - 01/JAN/2013 - 15/JAN/2013
2 - description A - 15/JAN/2013 - 15/JAN/2013
3 - description A - 04/JAN/2013 - 15/JAN/2013
4 - description B - 02/JAN/2013 - 16/JAN/2013
5 - description B - 16/JAN/2013 - 16/JAN/2013
6 - description B - 11/JAN/2013 - 16/JAN/2013
Группа строк с описанием A имеет самую позднюю дату 15 января 2013 г. (из-за строки 2). Группа строк с описанием B имеет самую позднюю дату 16 января 2013 г. (из-за строки 5).