Блок "Профиль датасета"
Блок доступен начиная с версии 1.0
Назначение блока
Блок предназначен для создания описательного отчета для датасета.
Чтобы начать работать с блоком, необходимо выбрать его в библиотеке и переместить в область графа.
Настройки блока
Работа с настройками блока осуществляется через локальное меню (пункт Настройки):
Модальное окно выглядит следующим образом:
Общие настройки блоков описаны в отдельном разделе.
Раздел "Специфические настройки блока"
| Наименование | Тип | Обязательное | Описание | Пример |
|---|---|---|---|---|
| Тип отчета | Выпадающий список | Да | По умолчанию "Общая информация о датасете". Варианты выбора: - Детальный обзор датасета; - Описание рядов датасета; - Общая информация о датасете; - Сводная информация о рядах в датасете |
Входы блока
| Наименование выхода | Тип | Описание |
|---|---|---|
| Датасет | DataFrame | Обязательный вход. Набор данных в виде временного ряда или многомерной таблицы |
Выходы блока
| Наименование выхода | Тип | Описание |
|---|---|---|
| Описательный отчет | html | Тип отчета выбирается пользователем |
События блока
В блоке нет событий.
Описание работы блока
Блок предназначен для сбора и предоставления статистического описания входного набора данных. Входные данные могут представлять собой как отдельный временной ряд, так и многомерную таблицу. Блок поддерживает работу как с временными рядами, так и с обычными табличными данными.
Для вывода доступны 4 типа отчетов:
- Блок строит отдельный статистический отчет для каждого типа данных во входном датасете. Отчет включает характеристики, соответствующие конкретному типу.
Блок может обработать:
-
Числовые ряды - стандартные статистики (среднее, медиана, дисперсия и т.д.);
-
Текстовые ряды - статистика по текстовым полям;
-
Категориальный ряд - частоты категорий, мода;
-
Бинарные ряды - статистика для двоичных (0/1) значений;
-
Ряды дат - Примечание: определяются частота и диапазон. При наличии пропусков статистика может быть неточной;
-
Строковые ряды - аналогично текстовым (обработка строк).
- Общая информация о датасете:
Отчет содержит общие метаданные датасета:
- количество строк и столбцов;
- количество пропусков в данных;
- сводка о количестве рядов каждого типа, присутствующих в датасете.
- Детальный обзор датасета:
Данный отчет объединяет информацию из двух предыдущих разделов («Описание рядов» и «Общая информация»), предоставляя комплексное представление о данных.
- Сводная информация о рядах в датасете:
Отчет представляет собой таблицу, описывающую все ряды датасета. Для каждого ряда приводится общая метаинформация и фрагмент его данных.



