Перейти к содержанию

Блок "Профиль датасета"

Блок доступен начиная с версии 1.0

Назначение блока

Блок предназначен для создания описательного отчета для датасета.

Чтобы начать работать с блоком, необходимо выбрать его в библиотеке и переместить в область графа.

Настройки блока

Работа с настройками блока осуществляется через локальное меню (пункт Настройки):

Модальное окно выглядит следующим образом:

Общие настройки блоков описаны в отдельном разделе.

Раздел "Специфические настройки блока"

Наименование Тип Обязательное Описание Пример
Тип отчета Выпадающий список Да По умолчанию "Общая информация о датасете". Варианты выбора:
- Детальный обзор датасета;
- Описание рядов датасета;
- Общая информация о датасете;
- Сводная информация о рядах в датасете

Входы блока

Наименование выхода Тип Описание
Датасет DataFrame Обязательный вход. Набор данных в виде временного ряда или многомерной таблицы

Выходы блока

Наименование выхода Тип Описание
Описательный отчет html Тип отчета выбирается пользователем

События блока

В блоке нет событий.

Описание работы блока

Блок предназначен для сбора и предоставления статистического описания входного набора данных. Входные данные могут представлять собой как отдельный временной ряд, так и многомерную таблицу. Блок поддерживает работу как с временными рядами, так и с обычными табличными данными.

Для вывода доступны 4 типа отчетов:

  1. Блок строит отдельный статистический отчет для каждого типа данных во входном датасете. Отчет включает характеристики, соответствующие конкретному типу.

Блок может обработать:

  • Числовые ряды - стандартные статистики (среднее, медиана, дисперсия и т.д.);

  • Текстовые ряды - статистика по текстовым полям;

  • Категориальный ряд - частоты категорий, мода;

  • Бинарные ряды - статистика для двоичных (0/1) значений;

  • Ряды дат - Примечание: определяются частота и диапазон. При наличии пропусков статистика может быть неточной;

  • Строковые ряды - аналогично текстовым (обработка строк).

  1. Общая информация о датасете:

Отчет содержит общие метаданные датасета:

  • количество строк и столбцов;
  • количество пропусков в данных;
  • сводка о количестве рядов каждого типа, присутствующих в датасете.
  1. Детальный обзор датасета:

Данный отчет объединяет информацию из двух предыдущих разделов («Описание рядов» и «Общая информация»), предоставляя комплексное представление о данных.

  1. Сводная информация о рядах в датасете:

Отчет представляет собой таблицу, описывающую все ряды датасета. Для каждого ряда приводится общая метаинформация и фрагмент его данных.