Das ARFF (Attribute-Relation File Format) ist ein Textdateiformat, das von der Machine Learning Group der University of Waikato zur Beschreibung von Datensätzen entwickelt wurde, die im maschinellen Lernen verwendet werden. Es wird primär mit der WEKA (Waikato Environment for Knowledge Analysis) Software genutzt, wird aber auch von anderen Tools für maschinelles Lernen unterstützt. Eine ARFF-Datei besteht aus einem Header-Abschnitt und einem Datenabschnitt. Der Header-Abschnitt definiert den Relationsnamen (Datensatzname) und die Attribute (Merkmale oder Spalten) der Daten. Jedes Attribut wird mit seinem Namen und seinem Datentyp deklariert (z.B. numerisch, nominal, String, Datum). Der Datenabschnitt enthält die tatsächlichen Dateninstanzen, wobei jede Instanz als eine durch Kommas getrennte Liste von Attributwerten dargestellt wird. Fehlende Werte werden typischerweise durch ein Fragezeichen (?) dargestellt. ARFF-Dateien sind so konzipiert, dass sie für Menschen lesbar und für Algorithmen des maschinellen Lernens leicht zu parsen sind, was sie zu einer beliebten Wahl für die Speicherung und den Austausch von Datensätzen in der Community des maschinellen Lernens macht. Das Format unterstützt verschiedene Datentypen und ermöglicht die Darstellung von sowohl numerischen als auch kategorialen Daten, was es vielseitig für eine breite Palette von Aufgaben im maschinellen Lernen macht.