На платформе ALLY Tech AI реализовано применение Apache Spark для решения задачи обработки больших данных. При необходимости использования в качестве источника данных датасета, преобразованного в результате использования функции Spark, применяется блок Сохранение датасета Spark в CSV (подробнее см. в этом разделе). Тогда преобразованный датасет будет сохранен в папку, выбранную на этапе настройки блока. В последствии его можно будет использовать в качестве источника данных при построении новых пайплайнов, формат файла в таком датасете – *.csv.
Knowledge base
Knowledge base
Close
- Установка платформы
- Установка кластера
- Типы и форматы данных
- Сообщить об ошибке
- Словарь терминов
- Сетевое хранилище (NFS)
- Работа с приложениями
- Работа с отчетами
- Работа с данными
- Обучение без учителя
- О системе
- Машинное обучение
- Логирование
- Контроль версионности системы
- История изменений
- Загрузка данных
- Глубокое обучение
- Визуализация табличных данных на дашборде
- Визуализация изображений и видео
- Визуализация из внешней базы данных
- Визуализация графиков на дашборде
- Визуализация в режиме реального времени
- Безопасность
- Анализ данных
- Анализ данных
- Spark
- Kubernetes
- Kubernetes оркестрация
- FAQ