После того, как модель обучена – она может быть применена для обработки данных, которые в примере будут получены при помощи коннектора из базы данных PostgreSQL. Т.о. второй этап работы с данными в режиме реального времени заключается в настройке коннектора и построении второго пайплайна, который будет получать информацию из соединения и обрабатывать её с помощью ранее созданной и обученной модели.
- Создание коннектора.
- Перейдите в пункт меню «Соединения». Перейти в пункт меню «Соединения».
Откроется страница «Соединения» на первой вкладке «Источники данных», на которой отображаются все ранее созданные источники:
- Для создания нового источника, нажимается кнопка «Создать источник данных» в верхнем правом углу. Откроется окно «Создание нового ресурса данных»:
- Заполнить следующей информацией:
- Название. Пользователь задает название источника «postgres dataset 116».
- Хост. Указывается хост протокола TCP/IP, т.е IP-адрес подключаемой БД, например: «172.16.11.116».
- Порт. Номер порта, по которому устанавливается соединение с сервером, на котором установлена БД posgresql. Указать «9999».
- Имя хранилища. Название базы данных, которое указано на подключаемом сервере. Указать «dataset».
- Тип хранилища. Из выпадающего списка выбирается тип «postgresql»:
- Имя пользователя, пароль. Параметры учетной записи администратора внешнего сервера для разрешения доступа к данным. Указать пользователя «postgres», и пароль «example».
- Описание. Вводится дополнительная информация по источнику, необязательное поле.
- Для регистрации в Системе источника нажимается кнопка «Создать».
- Созданный коннектор отобразится в общем списке. При необходимости изменить настройки используется кнопка «Редактировать»:
- Создание ETL. Создание нового ETL осуществляется на вкладке «ETL» в разделе Соединения:
- Нажимается кнопка «Создать ETL». Открывается окно «Создать новый ETL»:
- Заполнить поля:
- Название. Пользователь вручную задает название ETL «mei1d_duplicate_2» – запроса на извлечение данных.
- Содержание запроса. Прописывается sql запрос для извлечения данных из внешнего сервера: select “Tq”, “Tw” from mei1d_duplicate_2
- Тип хранилища. Выбирается тип «postgresql».
- Нажать на кнопку «Создать».
- Созданный ETL можно менять и редактировать по аналогии с источником данных.
- Создание Коннектора. Пользователь переходит на вкладку «Коннекторы»:
- Нажать на кнопку «Создать коннектор». Откроется окно «Создать новый коннектор»:
- Заполнить поля:
- Название. Пользователь вручную задает название создаваемого коннектора, например «mei1d_duplicate_2».
- Ресурсы данных. Из списка выбирается источник «postgres dataset 116», созданный в шаге 1
- ETL. Из списка выбирается ETL «mei1d_duplicate_2», созданный в шаге 2.
- Описание.
- Нажать кнопка «Создать».
- Сразу после создания коннектору присваивается статус «Stopped»:
- Запуск коннектора. Чтобы данные из источника начали поступать в Систему необходимо запустить коннектор. Для этого пользователь нажимает на кнопку «» в строке с коннектором. В результате статус меняется на значение «Started». Пользователь имеет возможность использовать данные из БД PostreSQL в режиме реального времени, подключая его в качестве источника в пайплайн.
- Создание блок схемы.
Теперь пользователь переходит к созданию второго пайплайна, где будет использована ранее обученная модель и созданный коннектор. Т.о. будет происходить обработка данных, получаемых в режиме реального время, для получения прогноза температуры воды и котла.
- Создание новой рабочей области.
- Перейти в пункт меню системы Моделирование –> Рабочая область. На панели инструментов блок-схемы нажать кнопку «Создание рабочей области» (кнопка ):
- В открывшейся форме ввести название новой рабочей области «МЭИ realtime» и нажать кнопку «Создать»:
- На панели инструментов отобразится название созданной рабочей области.
- Добавление первого элемента «Источник данных». В данном примере мы будем использовать два источника данных: коннектор и модель. Для загрузки в пайплайн данных из коннектора нужно добавить элемент «Источник данных» на рабочую область (кнопка ) и настроить элемент:
- На элементе нажать на кнопку. Откроется панель настроек элемента.
- На панели настроек элемента выбрать из списка функцию: раздел «Загрузка данных» -> функция «Загрузка табличных данных из коннектора».
- В поле «Выберите файл» из списка всех созданных коннекторов выбрать «mei1d_duplicate_2».
- Установить галочку в поле «Онлайн данные»:
- Нажмите на кнопку «Сохранить».
- Переименуйте блок в «Данные МЭИ»
- Соедините элементы:
- Добавление второго элемента «Источник данных». Для того чтобы включить в пайплайн ранее созданную обученную модель, нужно добавить еще один элемент «Источник данных» на рабочую область (кнопка ). Чтобы настроить элемент:
- На элементе нажмите на кнопку. Откроется панель настроек элемента.
- На панели настроек элемента выберите из списка функцию: раздел «Машинное обучение» -> функция «Загрузка модели».
- В списке моделей выберите «mei»
- Переименуйте блок в «Модель»
- Запись в датасет логирования. В данном блоке будет осуществляться логирование новой поступающей новой информации в датасет, для этого:
- Добавьте на рабочую область элемент «Процесс»:
- В карточке элемента выберите из списка функцию: раздел «Анализ данных» -> функция «Запись в датасет логирования».
- Переименуйте блок в «Логирование»
- Соедините элементы:
- Прогноз. Добавьте на рабочую область и настроить еще один элемент «Процесс»:
- В карточке элемента выберите из списка функцию: раздел «Машинное обучение» -> функция «Прогноз модели».
- Переименуйте блок в «Прогноз»
- Соедините элементы:
- Визуализация. Добавьте на рабочую область и настройте элемент «Процесс»:
- В карточке элемента выберите из списка функцию: раздел «Анализ данных» -> функция «Визуализация Real-Time».
- В параметрах блока выберите все графики и установите для них следующие параметры:
- Линейный график: Число периодов в окне: 10; Период окна: 5.Минуты
- Свечной график: Число периодов: 1; Период: 5.Минуты; Число периодов в окне: 10; Период окна: 5.Минуты
- Переименуйте блок в «Визуализация»
- Соедините элементы:
- Запуск блок-схемы. Для запуска блок-схемы нужно нажать на кнопку на первом элементе «Запуск». Все элементы блок-схемы должны отработать с зелеными индикаторами.
При запуске real time блок схем элементы будут отрабатывать снова и снова и индикаторы на пайплайне будут постоянно менять цвета. Если необходимо остановить обработку данных – нажмите кнопку запуск повторно.
- Визуализация результатов прогнозирования температуры на графиках.
После того как все элементы схемы будут успешно обработаны, на панели инструментов активизируется кнопка «Графики»:
Графики будут доступны в зависимости от выбранных в рамках блока «Визуализация». В текущем примере это Линейный и Свечной графики:
Список доступных графиков для отображения на рабочей области
Для отображения графиков на рабочей области нужно выбрать необходимые, кликнув на их названия.
Обратите внимание, что блок схема работает в режиме реального времени и данные на графиках будут постоянно обновляться в зависимости от заданного лага в графиках.
- Линейный график:
Линейный график временного ряда в режиме реального времени
График показывает изменения значений целевых признаков (Tq и Tw) в течение заданного периода времени, который устанавливается в параметрах блока «Визуализация». В нашем примере мы выбрали период равный 10 минутам:
Параметры настройки линейного графика
Соответственно на графике отображаются все значения признаков за последние 10 минут. Каждый раз, когда блок схема будет отрабатывать – временной отрезок ниже будет сдвигаться вперед, но значения всегда будут в пределах 10 минут. Т.к. на пайплайне присутствует блок прогнозирования, на линейном графике мы также видим прогноз значений параметров. Горизонт планирования равен шагу ресемплирования из пайплайна обучения, это значение записывается моделью.
- Свечной график:
Свечной график в режиме реального времени
График также показывает изменения значений параметров в течение заданного периода времени. При этом задается период, в рамках которого будет сформирована т.н. свеча (столбик на графике); и число периодов в окне. В нашем примере – это одна минута, и мы можем видеть 10 свечей на графике, т.к. задали число периодов в окне равное 10 минутам:
На горизонтальной оси отображается время, для которого было зафиксировано значение. На вертикальной – само значение признака. Прямоугольники (свечи) на графике отображают разницу между значением параметра на начало периода и на конец. Линии, исходящие из свечей, показывают максимальное и минимальное значение параметра за период времени. Если значение параметра на конец периода выше, чем на начало – то свеча окрасится в оранжевый цвет; если значение на конец периода ниже, чем на начало – в серый.
Созданные графики можно использовать для создания индивидуальных дашбордов.