Публикации по теме 'avro'


Де-де-дедупликация событий с помощью Kafka Streams
Не волнуйтесь, это не очередной пост о единовременной обработке. Хочу описать интересное требование, которое возникло в одном из наших проектов. Вот ситуация Источник события отправляет сообщения в тему Kafka. Сообщение содержит единственную строку, являющуюся идентификатором сообщения. В нашем приложении это объект с несколькими полями, одно из которых - id . Он сериализуется с помощью Avro, и мы используем Serdes для Avro, но давайте будем простыми. Все, что мы хотим добиться,..

Вопросы по теме 'avro'

Вопрос о заполнении вложенных записей в Avro с использованием GenericRecord
Предположим, у меня есть следующая схема: { "name" : "Profile", "type" : "record", "fields" : [ { "name" : "firstName", "type" : "string" }, { "name" : "address" , "type" : { "type" : "record", "name" : "AddressUSRecord", "fields"...
8094 просмотров
schedule 29.07.2022

необязательный массив в схеме avro
Мне интересно, возможно ли иметь дополнительный массив. Предположим такую ​​схему: { "type": "record", "name": "test_avro", "fields" : [ {"name": "test_field_1", "type": "long"}, {"name": "subrecord", "type": [{...
26383 просмотров
schedule 17.05.2022

Задание mapreduce с вводом простого текста и выводом avro
Я очень запутался в использовании Avro с уменьшением карты и не могу найти хороших руководств для подражания. Похоже, что такие классы, как AvroJob и AvroMapper, предназначены для решения проблем, когда и ввод, и вывод являются файлами данных Avro....
2205 просмотров
schedule 08.07.2022

Чем отличается карта от записи в авро?
Я использую Apache Avro для проекта, но не могу разобраться в том, что он называет картами . Мне не удалось найти какие-либо примеры используемых карт, а пример в спецификации довольно голый: Карты Карты используют имя типа "map"...
2305 просмотров
schedule 31.03.2023

Использование Apache Avro Reflect
Сериализация Avro популярна среди пользователей Hadoop, но найти примеры очень сложно. Может ли кто-нибудь помочь мне с этим примером кода? Меня больше всего интересует использование Reflect API для чтения/записи в файлы и использование аннотаций...
22984 просмотров
schedule 07.04.2023

Объекты Apache Avro ThreadLocal задерживаются при отмене развертывания Tomcat
Мы используем Apache Avro в качестве интерфейса JSON между нашим приложением Python и некоторыми сторонними библиотеками Java, которые мы запускаем в службе Tomcat. Мы решили просто расширить класс org.apache.avro.ipc.ResponderServlet для реализации...
518 просмотров
schedule 13.10.2022

HBase разные клиенты
Я работаю над проектом, в котором я хотел бы прочитать данные из системы HBase. Я читал, что доступны различные клиенты HBase, Java-клиент по умолчанию, Thrift, Avro и т. д. Теперь я в замешательстве, если я выберу Java-клиент по умолчанию, смогу...
1335 просмотров
schedule 18.10.2022

Используйте дженерики в отражении для Avro
В приведенном ниже коде: public class AvroReader<T> { public AvroReader(Class type, File packetFile) throws IOException{ reader = new DataFileReader<>(packetFile, new...
1198 просмотров
schedule 27.04.2022

Avro и java: десериализованная карта строки не равна исходной карте
Я тестирую Avro для java с простой записью, состоящей из строки и карты. Вот моя схема: { "type":"record", "name":"TableRecord", "fields":[ {"name":"ActionCode","type":"string"}, { "name":"Fields",...
8307 просмотров
schedule 14.05.2023

Примеры схемы Apache Avro и документация
Я пытаюсь определить менее чем тривиальную схему Avro без особого успеха; когда он не будет выдавать синтаксические ошибки схемы, он не будет создавать все типы, которые я пытаюсь определить в схеме. Есть ли полная спецификация возможного...
1860 просмотров
schedule 25.01.2023

Управляйте размером разделения с помощью Avro Input Format в Hadoop
Я должен прочитать запись Avro, сериализованную в файлах avro в HDFS. Для этого я использую AvroKeyInputFormat, поэтому мой преобразователь может работать с прочитанными записями как с ключами. Мой вопрос: как я могу контролировать размер...
1633 просмотров
schedule 16.10.2022

Как Cloudera CDH4 работает с Avro?
Я работаю над некоторыми программами MapR. Обычно они кодируются и тестируются на Apache Hadoop на моем локальном компьютере, а упакованный jar (с зависимостями) загружается в наш кластер под управлением Cloudera CDH4 (v4.4.1). Для обеих ситуаций у...
2978 просмотров
schedule 31.08.2022

отправка закодированных данных avro(avro c) через сокет
отправка закодированных данных avro (avro c) через сокет. Я пытаюсь отправить закодированные данные avro через сокет после преобразования его в массив байтов (с использованием memcpy). Что я сделал, как указано ниже / клиентская сторона: client.c /...
632 просмотров
schedule 10.06.2022

В чем преимущество хранения схемы в avro?
Нам нужно сериализовать некоторые данные для помещения в solr, а также в hadoop. Я оцениваю инструменты сериализации для того же самого. Первые два в моем списке — Gson и Avro. Насколько я понимаю, Avro = Gson + Schema-In-JSON Если это...
21730 просмотров
schedule 25.05.2022

Spark: запись в файл Avro
Я в Spark, у меня есть RDD из файла Avro. Теперь я хочу сделать некоторые преобразования в этом RDD и сохранить его обратно в виде файла Avro: val job = new Job(new Configuration()) AvroJob.setOutputKeySchema(job, getOutputSchema(inputSchema))...
11798 просмотров
schedule 07.02.2023

Сопоставление Accumulo Gora для Array/HashMap
Я могу интегрировать Apache Gora как ORM с Accumulo, используя спецификацию Avro JSON (которая входит в состав Gora). Он отлично работает, когда я использую примитивные типы данных, такие как String , Integer и т. д., но я сталкиваюсь с ошибками,...
382 просмотров
schedule 16.04.2023

Определение схемы для ключа Avro в Oozie
Я новичок в уменьшении карт и Avro. Мой проект в основном имеет только функцию картографа, которая принимает текстовые данные и выводит данные Avro, и для этого я объявил свой картограф примерно так: public class AvroMapper extends...
919 просмотров
schedule 20.04.2023

Как записать вывод avro в карту Hadoop?
Я написал одну программу подсчета слов Hadoop, которая принимает TextInputFormat ввод и должна выводить количество слов в формате avro. Задание Map-Reduce выполняется нормально, но вывод этого задания можно прочитать с помощью команд unix, таких...
7636 просмотров
schedule 24.02.2023

Как Avro Binary кодировать строку JSON с помощью Apache Avro?
Я пытаюсь бинарно закодировать мою строку JSON. Ниже моя строка JSON, и я создал простой метод, который будет выполнять преобразование, но я не уверен, правильно ли я делаю или нет? public static void main(String args[]) throws Exception{ try{...
33619 просмотров
schedule 06.10.2022

Как преобразовать строку JSON в Avro в Python?
Есть ли способ преобразовать строку JSON в Avro без определения схемы в Python? Или это то, с чем может справиться только Java?
12809 просмотров
schedule 28.09.2022