Блок "Автоподбор линейной регрессии"
Назначение блока
Блок позволяет подобрать лучшую модель линейной регрессии на заданных независимых переменных.
Настройки блока
Основные свойства
| Наименование | Тип данных | Обязательное | Примечание |
|---|---|---|---|
| Наименование блока | Строка | Нет | Наименование, которое будет иметь блок в графе. По умолчанию Автоподбор линейной регрессии |
Специфические настройки блока
| Наименование | Тип данных | Обязательное | Примечание |
|---|---|---|---|
| Критерий отбора | Выпадающий список | Да | Поле поддерживает единичную отметку. По умолчанию выбран "Информационный критерий Акаика". Содержит следующие элементы: - Информационный критерий Акаика. - Информационный критерий Байеса. |
| Включать ли в подбираемые модели константу | Флаг | Да | По уломчанию True. |
| Отображать константу в списке уравнений модели | Флаг | Да | По уломчанию True. |
| Ограничения на положительность/отрицательность коэффициентов | Строка | Нет | По умолчанию пуст. Ограничения можно задавать входным рядом или строкой. Приоритет у входного ряда |
| Количество знаков после запятой | Целое число | Да | По умолчанию 6. |
Настройки генетического алгоритма
| Наименование | Тип данных | Обязательное | Примечание |
|---|---|---|---|
| Размер популяции | Целое число | Да | По умолчанию 100 |
| Количество испытаний | Целое число | Да | По умолчанию 1 |
Общие настройки блока
Общие настройки блоков описаны в отдельном разделе.
Входы
| Наименование | Тип данных | Обязательное | Примечание |
|---|---|---|---|
| Зависимая переменная Y | Ряд данных | Да | Ряд для которого необходимо подобрать лучшую модель |
| Независимые переменные X. Факт | Ряд данных | Да | |
| Независимые переменные X. Прогноз | Ряд данных | Нет | |
| Ограничения коэффициентов | Ряд данных | Нет |
Выходы
| Наименование | Тип данных | Примечание |
|---|---|---|
| Зависимая переменная Y | Ряд данных | Временной ряд для которого была рассчитана модель тренда. Если в ряде были пропуски - то пропуски восстановлены или заполнены в зависимости от выбранного метода обработки пропусков. |
| Уравнение модели | Строка | Содержит уравнение лучшей модели |
| Модель регрессии | Строка | Содержит уравнение лучшей модели с рассчитанными коэффициентами |
| Массив временных рядов | Ряд данных | |
| Список уравнений модели | JSON | все уравнения (а так же их коэффициент, и отдельный список X) которые посчитала модель |
| Массив прогнозных рядов | Ряд данных | Период прогнозирования для выбранных факторов |
| Коэффициенты значимости факторов | Ряд данных | Процент значимости каждой переменной |
| Предупреждение | Строка | Сообщения метода в случае каких-то проблем с расчетом |
События блока
В блоке нет событий
Описание работы блока
Ограничения метода
Описание особенностей
- Ограничения на положительность и отрицательность коэффициентов в строке задаются через запятую, знаками "+" или "-". Если ограничения на коэффициент нет, то между запятыми должно быть пусто. Например, если задано 5 независимых переменных и третья из них должна быть отрицательной, а первая положительной - то ограничения будут выглядеть следующим образом: +,,-,,
- Метод может выбирать модель только из 30 независимых переменных.
В R базовый расчет логарифма функции максимального правдоподобия производится с ошибкой (степени свободы содержат лишнюю единицу), следовательно, все информационный критерии рассчитаны не корректно. В Питоне и во всех остальных методах критерии рассчитаны верно.
Описание ограничений
- Набор независимых переменных может содержать не более 30 рядов.
- Если ограничения заданы - то они должны быть заданы для каждой независимой переменной.
