На платформе ALLY Tech AI реализовано применение Apache Spark для решения задачи обработки больших данных. При необходимости использования в качестве источника данных датасета, преобразованного в результате использования функции Spark, применяется блок Сохранение датасета Spark в CSV (подробнее см. в этом разделе). Тогда преобразованный датасет будет сохранен в папку, выбранную на этапе настройки блока. В последствии его можно будет использовать в качестве источника данных при построении новых пайплайнов, формат файла в таком датасете – *.csv.
База знаний
База знаний
Закрыть
- Работа с приложениями
- Kubernetes оркестрация
- Kubernetes
- Работа с отчетами
- Визуализация табличных данных на дашборде
- Загрузка данных
- Анализ данных
- О системе
- Сетевое хранилище (NFS)
- Визуализация графиков на дашборде
- Обучение без учителя
- Визуализация изображений и видео
- Глубокое обучение
- Визуализация в режиме реального времени
- Машинное обучение
- Визуализация из внешней базы данных
- Анализ данных
- Логирование
- Работа с данными
- Spark
- Безопасность
- Типы и форматы данных
- Установка кластера
- Установка платформы
- Сообщить об ошибке
- История изменений
- Словарь терминов
- Контроль версионности системы
- FAQ