Перейти к содержанию

Блок "Удаление пропусков"

Блок доступен начиная с версии 1.0

Назначение блока

Блок предназначен для удаления пропущенных значений из датасета (DataFrame). Обработка пропусков другими способами (например, заполнение) выполняется другими блоками.

Удаление может выполняться:

  • глобально — из всего датасета целиком;
  • выборочно — по отдельным факторам (колонкам/признакам).

Чтобы начать работу с блоком, его необходимо выбрать в библиотеке блоков и переместить в область графа.

Настройки блока

Работа с настройками блока осуществляется через локальное меню (пункт Настройки):

Модальное окно представлено ниже:

Общие настройки блоков описаны в отдельном разделе.

Раздел "Специфические настройки блока"

Наименование Тип Обязательное Описание Пример
Список факторов Ввод выражения Нет По умолчанию пусто. Факторы должны быть разделены между собой точкой с запятой(;) без пробелов. Например: A;B;C

Входы блока

Наименование выхода Тип Описание
Датасет DataFrame Обязательный вход. Набор рядов, в котором нужно удалить пропуски
Список факторов list(str) Массив имён факторов входящего датасета, в которых необходимо удалить пропуски

Выходы блока

Наименование выхода Тип Описание
Обработанный датасет DataFrame Датасет, очищенный от пропусков
Отчет о работе метода html Summary метода (отчет о качестве модели)

События блока

В блоке нет событий.

Описание работы блока

Блок удаляет пропуски из датасета (DataFrame). Удаление можно выполнять по определенным факторам (колонкам).

Способы задания списка факторов:

  1. Через вход «Список факторов» — передается массив имен факторов (например, factor_list = ['A', 'C', 'D']). Если массив передан, внутренняя настройка блока игнорируется. При передаче пустого массива блок возвращает ошибку: «Список факторов из входных данных пуст».
  2. Через настройку «Список факторов» — имена факторов задаются в виде строки, разделенной символом ";" (без пробелов до и после). Например: A;B;D.

Проверка и обработка:

Для обоих способов выполняется проверка наличия указанных факторов во входящем датасете. Если какой-либо фактор отсутствует, он игнорируется. В случае, когда ни один из переданных факторов не найден в датасете, блок возвращает ошибку: «Ни одно имя фактора из указанных в списке не найдено во входящем датасете».