Avro — это система сериализации данных, разработанная в рамках проекта Apache Hadoop. Она предоставляет развитую структуру данных, компактный, быстрый бинарный формат, контейнерный файл для хранения постоянных данных, удаленный вызов процедур (RPC) и простую интеграцию с динамическими языками программирования. Avro использует JSON для определения типов данных и протоколов, а сериализацию данных выполняет в компактном бинарном формате. Основная область применения — Hadoop, где Avro используется для сериализации и обмена данными. Этот формат особенно хорошо подходит для приложений, требующих эволюции схемы, поскольку он сохраняет схему вместе с данными. Это позволяет считывающим программам обрабатывать данные, даже если схема изменилась с момента записи. Возможности эволюции схемы в сочетании с эффективным бинарным форматом делают Avro популярным выбором для хранения и обмена данными в средах больших данных (Big Data). Формат поддерживает сложные типы данных и спроектирован для обеспечения высокой производительности при чтении и записи. Файлы Avro часто используются для хранения больших наборов данных в распределенных системах.