Блок "Удаление пропусков"
Блок доступен начиная с версии 1.0
Назначение блока
Блок предназначен для удаления пропущенных значений из датасета (DataFrame). Обработка пропусков другими способами (например, заполнение) выполняется другими блоками.
Удаление может выполняться:
- глобально — из всего датасета целиком;
- выборочно — по отдельным факторам (колонкам/признакам).
Чтобы начать работу с блоком, его необходимо выбрать в библиотеке блоков и переместить в область графа.
Настройки блока
Работа с настройками блока осуществляется через локальное меню (пункт Настройки):
Модальное окно представлено ниже:
Общие настройки блоков описаны в отдельном разделе.
Раздел "Специфические настройки блока"
| Наименование | Тип | Обязательное | Описание | Пример |
|---|---|---|---|---|
| Список факторов | Ввод выражения | Нет | По умолчанию пусто. Факторы должны быть разделены между собой точкой с запятой(;) без пробелов. Например: A;B;C |
Входы блока
| Наименование выхода | Тип | Описание |
|---|---|---|
| Датасет | DataFrame | Обязательный вход. Набор рядов, в котором нужно удалить пропуски |
| Список факторов | list(str) | Массив имён факторов входящего датасета, в которых необходимо удалить пропуски |
Выходы блока
| Наименование выхода | Тип | Описание |
|---|---|---|
| Обработанный датасет | DataFrame | Датасет, очищенный от пропусков |
| Отчет о работе метода | html | Summary метода (отчет о качестве модели) |
События блока
В блоке нет событий.
Описание работы блока
Блок удаляет пропуски из датасета (DataFrame). Удаление можно выполнять по определенным факторам (колонкам).
Способы задания списка факторов:
- Через вход «Список факторов» — передается массив имен факторов (например, factor_list = ['A', 'C', 'D']). Если массив передан, внутренняя настройка блока игнорируется. При передаче пустого массива блок возвращает ошибку: «Список факторов из входных данных пуст».
- Через настройку «Список факторов» — имена факторов задаются в виде строки, разделенной символом ";" (без пробелов до и после). Например: A;B;D.
Проверка и обработка:
Для обоих способов выполняется проверка наличия указанных факторов во входящем датасете. Если какой-либо фактор отсутствует, он игнорируется. В случае, когда ни один из переданных факторов не найден в датасете, блок возвращает ошибку: «Ни одно имя фактора из указанных в списке не найдено во входящем датасете».


