Knowledge base

Knowledge base

Close

Spark

Spark DBSCAN

Данный график появляется в результате применения блока Кластеризация Spark DBSCAN (подробнее см. в этом разделе). Это график в виде пузырьковой диаграммы. Пузырьковая диаграмма — это разновидность точечной диаграммы, в которой точки данных заменены пузырьками, причем их размер служит дополнительным измерением данных: чем больше размер точек или пузырей на диаграмме – тем больше взаимосвязь между признаками (пузыри одинакового размера тесно связаны между собой, а самые большие пузыри часто представляют наибольший результат переменной). Цвет пузырька соответствует номеру кластера, то есть каждому кластеру в соответствие ставится свой цвет.

И горизонтальная и вертикальная оси диаграммы являются осями значений. 

Если признаков 4 и больше, для визуализации применяется метод главных компонентов (PCA) уменьшения размерности пространства.

Spark DBSCAN

Spark DBSCAN Объем кластеров

Данный график появляется в результате применения блока Кластеризация Spark DBSCAN (подробнее см. в этом разделе). Круговая диаграмма показывает объем кластеров – т.е. сколько % объектов входит в каждый отдельный кластер. Имена кластеров сортируются в зависимости от их веса в общем проценте.

Spark DBSCAN Объем кластеров 

Матрица ошибок для бинарной классификации

Данный график появляется в результате применения блока Модель градиентного бустинга Spark для бинарной классификации (подробнее см. в этом разделе). Матрица ошибок работает по принципу тепловой диаграммы, на графике представлены холодные и теплые цвета. Чем холоднее цвет – тем ниже его значение.

Spark Матрица ошибок бинарной классификации

Прогноз. Количество объектов по классам

Данный график появляется в результате применения блока Прогноз модели (подробнее см. в этом разделе).

Spark Прогноз. Объекты по классам.

Визуализация Real-time

При построении блок-схем, где в качестве источника данных выступает интеграция с внешней БД, предоставляющая обновленные значения в режиме реального время, для визуализации значений в виде графиков используется специальный блок Визуализация Real-time (подробнее см. в этом разделе). Платформа позволяет выбрать необходимые графики для отображения на рабочей области.

Линейный график real time

Данный график визуально выглядит так же как Линейный график временного ряда (подробнее см. в этом разделе). Главное отличие заключается в том, что на графике можно увидеть не только фактические, но и прогнозные значение выбранных признаков. При этом в параметрах при построении графика необходимо указать число периодов в окне и период окна. Лаг прогноза задаётся как шаг ресемплирования на моменте обучения модели, которая применяется, как источник данных в блок схеме real time. Можно посмотреть на примере Работа с данными в режиме реального времени.

  • Число периодов в окне – значение, которое определяет сколько периодов будет одновременно отображаться на графике. 
  • Период окна – значение, которое определяет отсечки на оси x и соответственно временные интервалы отображения значений данных. Это могут быть (месяцы, недели, дни, часы, минуты, секунды). 

Линейный график real time с прогнозными значениями за каждую минуту в течение последних 10 минут

Свечной график real time

Данный график визуально выглядит так же как Свечной график временного ряда (подробнее см. в этом разделе). В параметрах при построении графика необходимо указать:

  • Число периодов – количество периодов, группируемых вместе.
  • Период – обуславливает временной интервал, значения внутри которого будут сгруппированы вместе для отображения на графике (это могут быть года, месяцы, недели, дни, часы, минуты, секунды)
  • Число периодов в окне – значение, которое определяет сколько периодов будет одновременно отображаться на графике. 
  • Период окна – значение, которое определяет отсечки на оси x и соответственно временные интервалы отображения значений данных.  (это могут быть месяцы, недели, дни, часы, минуты, секунды)

Свечной график real time

Time profile real time

Данный график визуально выглядит так же как Time profile временного ряда (подробнее см. в этом разделе). В параметрах при построении графика необходимо указать:

  • Число периодов – количество периодов, группируемых вместе.
  • Период – обуславливает временной интервал, значения внутри которого будут сгруппированы вместе для отображения на графике (это могут быть года, месяцы, недели, дни, часы, минуты, секунды)
  • Число профилей  в окне  – значение, которое определяет сколько периодов будет одновременно отображаться на графике.  

График Time profile real time

Extended real time

Данный график визуально выглядит так же как Extended временного ряда (подробнее см. в этом разделе). В параметрах при построении графика необходимо указать:

  • Число периодов – количество периодов, группируемых вместе.
  • Период – обуславливает временной интервал, значения внутри которого будут сгруппированы вместе для отображения на графике (это могут быть года, месяцы, недели, дни, часы, минуты, секунды)
  • Число периодов в окне – значение, которое определяет сколько периодов будет одновременно отображаться на графике. 

График Extended real time

Bollinger Bands real time

Данный график визуально выглядит так же как Bollinger Bands (подробнее см. в этом разделе) временного ряда. В параметрах при построении графика необходимо указать:

  • Размер окна Moving average – период времени, на основании которого будет рассчитана скользящая средняя.
  • Число периодов – количество периодов, группируемых вместе.
  • Период – обуславливает временной интервал, значения внутри которого будут сгруппированы вместе для отображения на графике (это могут быть года, месяцы, недели, дни, часы, минуты, секунды)

График Bollinger Bands real time

Stochastic real time

Данный график визуально выглядит так же как Stochastic временного ряда (подробнее см. в этом разделе). В параметрах при построении графика необходимо указать:

  • Число периодов – количество периодов, группируемых вместе.
  • Период – обуславливает временной интервал, значения внутри которого будут сгруппированы вместе для отображения на графике (это могут быть года, месяцы, недели, дни, часы, минуты, секунды)
  • Размер окна Moving average – период времени, на основании которого будет рассчитана скользящая средняя.
  • Число периодов в окне – значение, которое определяет сколько периодов будет одновременно отображаться на графике. 
  • Период окна – значение, которое определяет отсечки на оси x и соответственно временные интервалы отображения значений данных.  (это могут быть месяцы, недели, дни, часы, минуты, секунды)
In this article: