Knowledge base

Сохранение преобразованного датасета Spark

На платформе ALLY Tech AI реализовано применение Apache Spark для решения задачи обработки больших данных. При необходимости использования в качестве источника данных датасета, преобразованного в результате использования функции Spark, применяется блок Сохранение датасета Spark в CSV (подробнее см. в этом разделе). Тогда преобразованный датасет будет сохранен в папку, выбранную на этапе настройки блока. В последствии его можно будет использовать в качестве источника данных при построении новых пайплайнов, формат файла в таком датасете – *.csv.