.orc

Optimized Row Columnar

Детали файлового расширения

202

Поиски

Данные

Что такое файл .orc?

ORC (Optimized Row Columnar) — это самоописываемый, типизированный колоночный формат файлов, разработанный специально для рабочих нагрузок Hadoop. Он оптимизирован для крупномасштабной обработки и хранения данных, обеспечивая значительные улучшения производительности и эффективности хранения по сравнению с традиционными построчными форматами, такими как CSV или текстовые файлы. Файлы ORC хранят данные в колоночном формате, что позволяет эффективно извлекать конкретные столбцы без необходимости считывания всей строки целиком. Это особенно полезно для аналитических запросов, требующих лишь подмножества данных. Формат также поддерживает различные методы сжатия (например, Zlib, Snappy, LZO) для уменьшения занимаемого места и снижения нагрузки на операции ввода-вывода (I/O). Кроме того, файлы ORC включают метаданные, такие как статистические показатели по каждому столбцу, что позволяет оптимизаторам запросов пропускать нерелевантные блоки данных и дополнительно повышать скорость выполнения запросов. ORC широко используется в экосистемах больших данных, таких как Apache Hive, Apache Spark и Presto, для хранения и обработки огромных массивов информации.

.orc File

Optimized Row Columnar

Совместимое программное обеспечение Alternatives

202

Поиски

Данные

Категория

Совместимость программного обеспечения

Programs that can open and work with .orc files

Windows

Совместимые приложения

Apache Hive

Compatible

Apache Spark

Compatible

Presto

Compatible

Dremio

Compatible

Trino

Compatible

macOS

Совместимые приложения

Apache Hive

Compatible

Apache Spark

Compatible

Presto

Compatible

Dremio

Compatible

Trino

Compatible

Linux

Совместимые приложения

Apache Hive

Compatible

Apache Spark

Compatible

Presto

Compatible

Dremio

Compatible

Trino

Compatible

Мобильные

Мобильные приложения

No mobile app information available

Check back later for updates