Решение проблемы несбалансированности данных




Скачать 1.02 Mb.
Название Решение проблемы несбалансированности данных
страница 5/6
Тип Решение
rykovodstvo.ru > Руководство эксплуатация > Решение
1   2   3   4   5   6

2.3 Поиск оптимального горизонта прогнозирования

Выбрав приемлемую для построения модели структуру подвыборки, перейдем к подбору оптимального горизонта прогнозирования.

Целью построения модели, позволяющей прогнозировать вероятность банкротства, является выявление потенциально ненадежных банков. Чем раньше будут обнаружены проблемы с финансовой устойчивостью банка, тем больше шансов для его сохранения.

Проверим применимость отобранных факторов для прогнозирования банкротства на более длительный период времени. С этой целью проанализируем период, на 8 месяцев предшествующий отзыву лицензии, с шагом в 1 месяц. В Таблице 7 представлены результаты построения моделей в каждый из периодов.

На всех временных промежутках знаки коэффициентов сохраняются, нарушения сделанных ранее предположений не происходит, что не накладывает ограничений на использование более длительных горизонтов прогнозирования. С ростом периода прогнозирования значимость коэффициентов постепенно снижается. Так размер банка влияет на вероятность его банкротства только на коротких периодах времени (1-2 месяца). Невысокая значимость коэффициента перед размером банка связана с тем, что используемая выборка составлялась по принципу подобия, в основе которого лежало равенство величин валют балансов на ближайшую отзыву лицензии дату. Наибольшая значимость на всех периодах присуща доле ликвидных активов в валюте баланса, хотя и ее средний уровень несколько снижается (минимальная значимость проявляется при прогнозировании за 7 месяцев до наступления банкротства — 6,7%). Ликвидность средств наиболее важна в те периоды, когда банк непосредственно сталкивается с проблемами. Обратная тенденция наблюдается для доли инвестиций в государственные обязательства, значимость которой повышается по мере удаления от даты потенциального банкротства. Все показатели (за исключением размера банка) остаются значимыми в течение первых 5 периодов, чего не наблюдается в последующие периоды.
Таблица 7

Оценки коэффициентов моделей на основе сбалансированной выборки




1 мес.

2 мес.

3 мес.

4 мес.

5 мес.

6 мес.

7 мес.

8 мес.

Доля собственного капитала

-0,9**

-0,82**

-0,58*

-0,74**

-0,64*

-0,54

-0,56*

-0,5

Доля инвестиций в ГКО

3,41

2,41

4,14***

3,91*

3,18**

2,52**

1,87*

4,04**

Доля ликвидных активов

-1,2***

-1,15***

-1,1***

-1***

-1,1***

-0,95**

-0,8*

-0,85**

Размер банка

-0,09*

-0,08*

-0,02

-0,06

-0,05

-0,04

-0,03

-0,02

Доля кредитов нефинансовым организациям

-0,1***

-0,82**

-0,9***

-0,73**

-0,57*

-0,55*

-0,35

-0,46

Константа

2,35***

2,07**

1,26*

1,74**

1,63**

1,44*

1,17

1,02


Количество звездочек отражает средний уровень значимости следующим образом: (*) 15%, (**) 5%, (***) 1%

Для выбора оптимального горизонта прогнозирования необходимо проследить динамику изменения классификационной точности модели, которая представлена в Таблицах 8, 9.

При увеличении горизонта прогнозирования резко снижается способность модели классифицировать банки-банкроты, поэтому требуется вносить более сильные корректировки для поддержания чувствительности модели на приемлемом уровне. С учетом специфики исследуемого вопроса при увеличении горизонта прогнозирования имеет смысл ориентироваться на критический уровень вероятности, основанный на максимизации взвешенного показателя. Данный подход позволяет сохранять чувствительность модели на постоянном уровне для нескольких временных периодов.

С ростом горизонта прогнозирования происходят незначительные изменения в оптимальном уровне пороговой вероятности. В целом наблюдается тенденция к его снижению при удалении от даты потенциального банкротства, хотя максимальное значение достигается при горизонте прогнозирования в 5 месяцев. Более сильным изменениям подвержен уровень вероятности, рассчитанный на основе взвешенного показателя эффективности. За 8 месяцев он снижается с 46% до 31%.
Таблица 8

Классификационная таблица для сбалансированной выборки (за 1- 4 месяца)




1 месяц

2 месяца

3 месяца

4 месяца




Факт

Факт

Факт

Факт

Модель

Небакрот

Банкрот

Небакрот

Банкрот

Небакрот

Банкрот

Небакрот

Банкрот

Небакрот

55

9

52

10

53

11

52

11

Банкрот

5

21

8

20

7

19

8

19

% Верно

91,7

70

86,7

66,6

88,3

63,3

86,7

63,3

% Всего верно

84,4

80

80

78,8

WE

47,7

38

37

35,2

Пороговая вероятность

0,48

0,48

0,46

0,43


Таблица 9

Классификационная таблица для сбалансированной выборки (за 5- 8 месяцев)




5 месяцев

6 месяцев

7 месяцев

8 месяцев




Факт

Факт

Факт

Факт

Модель

Небакрот

Банкрот

Небакрот

Банкрот

Небакрот

Банкрот

Небакрот

Банкрот

Небакрот

51

11

50

11

44

11

40

10

Банкрот

9

19

10

19

16

19

20

20

% Верно

85

63,3

83,3

63,3

73,3

63,3

66,7

66,7

% Всего верно

77,7

76,7

70

66,7

WE

33,4

31,8

24,1

22,23

Пороговая вероятность

0,48

0,45

0,45

0,44


При росте временного периода, предшествующего банкротству, происходит падение общей точности модели, чему также способствует необходимость снижения числа ошибок II-рода. Классификационная точность модели снижается с 84,4% до 66,7%. Улучшение классификации банков-банкротов достигается за счет снижения точности определения состояния банков-небанкротов. Специфичность модели за 8 периодов постепенно опускается с 91,7% до 66,7%. На всех анализируемых периодах модель более качественно классифицирует банки-небанкроты, нежели определяет финансовое состояние банков-банкротов. При более длительных горизонтах прогнозирования (с 3 мес. по 8 мес.) дальнейшее увеличение периода не приводит к снижению чувствительности модели.

Б
олее наглядно сравнить качество моделей позволяет проведение ROC-анализа для каждого временного промежутка. На рисунке 4 представлены ROC-кривые, соотвествующие только горизонтам прогнозирования в 2, 5 и 8 месяцев. Однако, их расположение отражает общую тенденцию снижения точности модели при удалении от даты потенциального банкротства.

Рис. 4. ROC-кривые для горизонтов прогнозирования в 2, 5 и 8 месяцев


Для более точного сравнения результатов моделей были рассчитаны площади под каждой из кривых (Таблица 10). При увеличении горизонта прогнозирования значение площади под кривой постепенно снижается от 75% до 60%. На коротких временных промежутках точность модели сокращается незначительно, оставаясь постоянной в период от 3 до 5 месяцев, дальнейшее снижение происходит более резко.
Таблица 10

Значения площадей под ROC-кривыми

1 мес.

0,75

2 мес.

0,73

3 мес.

0,72

4 мес.

0,72

5 мес.

0,72

6 мес.

0,69

7 мес.

0,66

8 мес.

0,6


Оптимальный горизонт прогнозирования следует выбирать в зависимости от целей использования моделей. При необходимости выявления всех банков, выживание которых в последующих периодах находится под угрозой, возможно применение модели даже на горизонте прогнозирования в 8 месяцев, что создает максимальные возможности для проведения мер, направленных на оздоровление банка. При ориентации на общую классификационную точность модели следует выбирать более короткие периоды прогнозирования.

С учетом классификационной точности модели и значимости коэффициентов в качестве оптимального горизонта прогнозирования было выбрано 5 месяцев.


2.4 Интерпретация результатов логистической регрессии

Описанный ранее анализ позволил сформировать итоговую модель, интерпретации результатов которой посвящен данный раздел.

Итоговая модель строится на основе подвыборок, состоящих из 30 банкротов и 60 небанкротов, и позволяет оценивать вероятность банкротства за 5 месяцев до его наступления. В Приложении 5 представлен график плотности распределения коэффициента общей точности модели.

Результатом построения модели стало нахождение медианных значений и 95% доверительных интервалов для коэффициентов перед каждым объясняющим фактором (Таблица 11). Использование медианных оценок коэффициентов снижает их зависимость от конкретной выборки, что защищает модель от тенденции к переобучаемости. Медианные оценки предпочтительней средних, так как они менее чувствительны к выбросам и представляют собой конкретную точку на графике распределения. Для более наглядной оценки устойчивости коэффициентов были построены графики распределения их оценок (Приложение 6).
Таблица 11

Характеристика коэффициентов модели (за 5 месяцев)




95% доверительный интервал

Медианное значение

Доля собственного капитала

[-0,67; -0,61]

-0,64*

Доля инвестиций в ГКО

[3,08; 3,28]

3,17**

Доля ликвидных активов

[-1,16; -1,1]

-1,13***

Размер банка

[-0,06; -0,05]

-0,057

Доля кредитов нефинансовым организациям

[-0,59; -0,53]

-0,56*

Константа

[1,62; 1,74]

1,68**

Количество звездочек отражает средний уровень значимости следующим образом: (*) 15%, (**) 5%, (***) 1%

Полученные результаты говорят о том, что увеличение в валюте баланса долей собственного капитала, ликвидных активов, кредитов нефинансовым организациям и рост величины активов банка приводит к повышению финансовой устойчивости банка и снижению вероятности его банкротства (отрицательные значения коэффициентов перед всеми переменными говорят об обратной зависимости). Изменение доли вложений в государственные ценные бумаги оказывает противоположное влияние на оценку вероятности банкротства, то есть ее рост приводит к ухудшению финансового состояния банка. Кроме того, наибольшее влияние на изменение вероятности банкротства оказывает изменение доли вложений в государственные ценные бумаги (наибольшее по модулю значение коэффициента). Стоит отметить, что в моделях, построенных на основе разных горизонтов прогнозирования, знаки коэффициентов перед переменными сохраняются, то есть направление влияния не изменяется с течением времени. Данное обстоятельство указывает на устойчивость обнаруженных взаимосвязей.

Была проверена частота, с которой каждая из переменных проявляет статистическую значимость на 15% уровне. Наибольшую объясняющую способность продемонстрировали наличие у банка достаточной величины ликвидных активов и его вовлеченность в операции с государственными ценными бумагами (на 15% уровне факторы оказались значимы для каждой из подвыборок, на 1% уровне — в 99% и 90% случаев соответственно). В 113 из 150 случаев высокую значимость проявили доля кредитов нефинансовым организациям и показатель, характеризующий достаточность собственного капитала. Несколько худшие результаты продемонстрировал показатель, отвечающий за размер банка (значим в 40% случаев). Далее представлен средний уровень значимости каждого показателя:

  • доля ликвидных активов 0,4%

  • доля вложений в государственные ценные бумаги 4,4%

  • доля собственного капитала 11,3%

  • доля кредитов нефинансовым организациям 12,2%

  • валюта баланса 24,6%.

Для большой доли подвыборок показатель, характеризующий размер банка, оказывает значимое влияние на вероятность банкротства. В связи с этим, несмотря на относительно невысокий средний уровень значимости, данный фактор включается в число объясняющих переменных. Кроме того, полученный уровень значимости несколько занижен относительно складывающегося в реальности из-за специфики составления выборки.

Значимость модели в целом подтвердилась тестом Вальда.

Для определения количественного влияния каждого фактора на вероятность банкротства рассчитаем соответствующие предельные эффекты. Значения показателей для среднего и медианного банков и их предельные эффекты представлены в Таблице 12.
Таблица 12

Значения показателей в разных точках




Среднее

Медиана

Эффект (среднее)

Эффект (медиана)

Доля собственных средств

0,24

0,18

-0,1

-0,16

Доля инвестиций в ГКО

0

0

0,49

0,77

Доля ликвидных активов

0,25

0,2

-0,18

-0,27

Размер банка

13,87

13,8

-0,01

-0,01

Доля кредитов нефинансовым организациям

0,36

0,36

-0,09

-0,14


Полученные значения для медианного банка позволяют говорить о том, что при росте соответствующего показателя на 10% вероятность банкротства изменяется следующим образом:

  • при росте доли собственных средств в валюте баланса вероятность банкротства банка снижается на 1,6% ;

  • при увеличении доли ликвидных активов в общей сумме активов вероятность банкротства уменьшается на 2,7% ;

  • результатом увеличения доли вложений в государственные ценные бумаги является рост вероятности банкротства на 7,7%, что подтверждает наибольшую степень влияния данного фактора среди других переменных;

  • при росте доли кредитов нефинансовым организациям происходит сокращение вероятности банкротства на 1,4% ;

  • при росте величины активов вероятность банкротства снижается на 0,1%.

Степень влияния для банков с высокими и низкими значениями финансовых показателей может различаться. Для анализа зависимости между финансовым состоянием банка и величиной влияния значимых показателей предельные эффекты были рассчитаны в каждой точке распределения. На рисунке 5 представлено на сколько процентов изменится вероятность банкротства при росте значения показателя на 1%.
Р
ис. 5. Значения предельных эффектов, %

По оси абсцисс отложены уровни квантилей, в которых находятся значения переменных. Исключение составляет переменная, отражающая долю вложений в государственные ценные бумаги, для которой ось абсцисс представляет собой (1 - рассчитываемый уровень квантили). Так, например, для показателя доли вложений в государственные ценные бумаги точке 0,2 на оси абсцисс соответствует значение квантили уровня 0,8. Данное расположение оси было принято в виду того, что рассматриваемый показатель оказывает на вероятность банкротства влияние по направлению противоположное влиянию других факторов. Таким образом, при движении по оси абсцисс с лева на право финансовое положение банков улучшается, а вероятность банкротства снижается.

Наибольшие значения предельных эффектов соответствуют банкам со средним уровнем финансового состояния. Степень влияния остается постоянной для достаточно большого диапазона банков. Банку, находящемуся на грани перехода из категории финансово устойчивых в категорию банкротов и наоборот, достаточно небольшого изменения значений объясняющих факторов для значительного изменения характеристики его финансового положения. Обратная ситуация складывается для банков, определенно являющихся банкротами или небанкротами. Банку с неудовлетворительным финансовым состоянием требуется значительно улучшить свои показатели, чтобы хоть немного снизить вероятность банкротства. Банк с запасом финансовой устойчивости, напротив, может позволить себе значительное ухудшение рассматриваемых показателей без существенного роста вероятности стать банкротом. Резкое снижение величины предельных эффектов наблюдается для 7% наихудших и 10% наилучших банков.

Рассмотрим изменение степени влияния объясняющих факторов в зависимости от длины горизонта прогнозирования. В Приложении 7 представлены графики, на которых отражаются предельные эффекты от изменения того или иного показателя в каждой точке за различные периоды времени до банкротства. На графиках отображены результаты, полученные для периодов, предшествующих банкротству на 2, 5 и 8 месяцев. Результаты за остальные периоды по всем показателям соответствуют наблюдаемым тенденциям, поэтому не отображаются на графиках, чтобы излишне не перегружать их. Порядок факторов по степени влияния остается постоянным для разных временных горизонтов, то есть наибольший эффект присущ изменению доли вложений в государственные ценные бумаги, а наименьший — изменению размера банка. Высокое значение предельных эффектов от изменения доли вложения возникает из-за того, что она относительно низка для всех банков выборки.

Для каждого периода времени сохраняется наблюдаемая ранее зависимость: предельные эффекты значительно ниже для банков, определенно являющихся банкротами или небанкротами. При этом максимальная величина предельных эффектов сохраняется постоянной, меняется лишь уровень финансовой устойчивости, при котором она достигается. Наблюдается снижение уровня процентили, в которой достигается максимальное значение предельных эффектов. При увеличении горизонта прогнозирования изменение финансовых показателей оказывает все большее влияние на наиболее устойчивые банки. В случае высокого уровня финансовой устойчивости эффект от изменения выявленных факторов носит более долгосрочный характер и отражается в основном на вероятности банкротства через длительный промежуток времени. Для банков, уже испытывающих трудности, улучшение показателей приводит к снижению риска банкротства только в коротком периоде и не гарантирует стабилизации положения впоследствии. Поддерживать хорошее состояние в долгосрочной перспективе проще, чем восстанавливать его. Использование модели, которая позволяет оценивать вероятность банкроства и следить за уровнем финансового состояния в любой момент времени, может быть крайне полезно.

Оценим качество модели по точности классификации банков, не входящих в исходную выборку. Как было отмечено ранее, в качестве тестирующей выборки используется 70 банков (10 банкротов и 60 небанкротов), не входивших в первоначальную выборку. Результаты, полученные с использованием модели, представлены в Таблице 13.
Таблица 13

Классификационная таблица для тестирующей выборки (за 5 месяцев)




Факт

Модель

Небакрот

Банкрот

Небакрот

50

3

Банкрот

10

7

% Верно

83,33

70

% Всего верно

81,43

WE

46,03


Классификационная способность модели составила 81,43%, то есть она верно определила категорию 57 из 70 банков. При этом было допущено 13 ошибок: 10 ошибки первого рода и 3 ошибки второго рода, то есть модель неверно отнесла к банкротам 16,7% здоровых банков и признала финансово устойчивыми 30% обанкротившихся банков. Построенная модель демонстрирует несколько более высокий уровень специфичности (83,33%), чем чувствительности (70%). Полученные результаты говорят о том, что данная модель в большей степени предназначена для обнаружения здоровых банков, чем для выявления банкротств при их наличии. Признание большей значимости ошибок II-рода и построение модели на основе сбалансированной выборки позволило добиться достаточно высокой точности классификации банков-банкротов. Для анализируемой модели взвешенный показатель эффективности составил 46,03%.
Сохранение классификационных возможностей на высоком уровне и даже некоторое их увеличение говорят о высоком качестве полученной модели. Оценить вероятность банкротства российского банка в течение следующих пяти месяцев можно с использованием всего 5 бухгалтерских показателей: величины активов, долей в активах собственного капитала, ликвидных активов, кредитов нефинансовым организациям и вложений в ГКО.
1   2   3   4   5   6

Похожие:

Решение проблемы несбалансированности данных icon 1. Политика как общественное явление Политика это такая область деятельности...
Решение этих проблем осуществляется при помощи политических институтов, в совокупности представляющих собой определенное государственное...
Решение проблемы несбалансированности данных icon Решение проблемы возврата торговыми организациями хлеба и хлебобулочных...
Решение проблемы возврата торговыми организациями хлеба и хлебобулочных изделий поставщикам имеет важнейшее государственное и народнохозяйственное...
Решение проблемы несбалансированности данных icon Диссертация На тему «Формы визуализации данных на сайтах российских...
На тему «Формы визуализации данных на сайтах российских информационных агентств: проблемы и перспективы»
Решение проблемы несбалансированности данных icon 3. решение проблемы
Комплект переходников и шлангов для жидкостного способа очистки
Решение проблемы несбалансированности данных icon 3. решение проблемы
Комплект переходников и шлангов для жидкостного способа очистки
Решение проблемы несбалансированности данных icon Рекомендации по действиям заказчиков, направленным на решение проблемы,...
Рекомендации по действиям заказчиков, направленным на решение проблемы, связанной с неправильной публикацией в планах-графиках сведений...
Решение проблемы несбалансированности данных icon Решение проблемы альтернативного школьного питания для детей-аллергиков...

Решение проблемы несбалансированности данных icon Решение проблемы Калининградской области 12
Государственная поддержка регионов в предупреждении и ликвидации чрезвычайных ситуаций 44
Решение проблемы несбалансированности данных icon Рекомендации по действиям заказчиков, направленным на решение проблемы,...

Решение проблемы несбалансированности данных icon Решение задачи поиска данных
Обозначения и сокращения
Решение проблемы несбалансированности данных icon Решение проблемы
Из всех систем современных автомобилей наиболее чувствительной к разного рода загрязнениям является топливная система автомобиля
Решение проблемы несбалансированности данных icon 2 декабря 2015 05: 31 риа новости Москва
Тасс интервью: Сергей Аксенов: за эффективное решение энергетической проблемы готов уступить свое кресло
Решение проблемы несбалансированности данных icon Инструкция к программному обеспечению NewlyDraw Компания «юсто» +7 (812)
Если в устройстве найдены неисправности, пожалуйста, свяжитесь с уполномоченным представителем за оперативным решение проблемы
Решение проблемы несбалансированности данных icon I. Научно-методическое и практическое решение задач проблемы школы 2016/17 учебного года
Публичный отчет директора мбоу «Школа коррекции и развития VIII вида №37» г. Брянска
Решение проблемы несбалансированности данных icon 2. Решение Судебной Палаты по информационным спорам РФ о равноправии женщин. 209
Консорциум женских неправительственных объединений. Проблемы правовой защиты женщин от дискриминации в сфере труда и занятости
Решение проблемы несбалансированности данных icon Решение продовольственной проблемы в Российской Федерации, в частности...
«Надзор в области обеспечения качества и безопасности зерна и продуктов его переработки»

Руководство, инструкция по применению






При копировании материала укажите ссылку © 2024
контакты
rykovodstvo.ru
Поиск