Формат Apache Arrow IPC Stream (.arrow) представляет собой бинарный формат файлов, разработанный для эффективной передачи и хранения данных, в частности, в экосистеме Apache Arrow. Это колоночный формат памяти, что означает, что данные организованы по столбцам, а не по строкам, что крайне выгодно для аналитических рабочих нагрузок. Данный формат обеспечивает обмен данными между процессами и системами с использованием механизма zero-copy (без копирования), что значительно снижает накладные расходы и повышает производительность. Потоки Arrow IPC обычно используются для передачи больших наборов данных между приложениями, поддерживающими формат Arrow, такими как движки обработки данных, базы данных и фреймворки машинного обучения. Формат включает метаданные, описывающие схему данных, что позволяет осуществлять самоописываемый обмен информацией. Он оптимизирован для быстрой сериализации и десериализации, что делает его идеальным для обработки данных в реальном времени и высокопроизводительных вычислений. Формат является независимым от языка программирования, с реализациями, доступными для различных языков, включая Python, Java, C++ и R. Расширение файла .arrow обычно представляет собой поток данных Arrow, который может быть как отдельным пакетом, так и последовательностью пакетов, составляющих более крупный набор данных. Формат спроектирован как расширяемый и поддерживает различные типы данных и кодировки.