Елена Синельникова-Мурылева,
кандидат экономических наук, старший научный сотрудник
центра изучения проблем центральных банков ИПЭИ.
Таисия Горшкова,
научный сотрудник лаборатории
макроэкономического прогнозирования ИПЭИ.
Наталья Макеева
младший научный сотрудник
центра изучения проблем центральных банков ИПЭИ.
Институт прикладных экономических исследований (ИПЭИ) РАНХиГС
119571, Россия, Москва, просп. Вернадского, д. 82, стр. 1.
Экономическая политика
№2 2018
Аннотация
В работе рассматриваются различные методы прогнозирования банковских дефолтов с целью выявления модели, обладающей наибольшей прогнозной силой на фактических российских данных в период 2015-2016 годов. Помимо панельных логит-моделей — стандартного аппарата для определения вероятности обвала банка, используется алгоритм «случайного леса», строящий прогноз на основе процесса машинного обучения, который ранее не применялся для анализа российского банковского сектора. Показано, что новые инструменты прогнозирования обладают наибольшей прогнозной силой, верно идентифицируя состояние 99,62% банков в выборке и тем самым выдавая наименьшее значение средней абсолютной ошибки прогноза. Помимо этого, при помощи панельных логит-моделей в работе выявляются факторы, позволяющие оценить вероятность банкротства банка на основе динамики показателей его финансовой отчетности. Показано, что увеличение показателей, характеризующих доходность чистого дохода, нормированного на сумму активов-нетто, рентабельности активов, уровня обеспечения кредитного портфеля залогом имущества, норматива достаточности капитала Н1, уменьшает вероятность дефолта. В свою очередь факторы, связанные с кредитными операциями: отношение кредитного портфеля к активам-нетто и отношение промышленных кредитов к активам-нетто, — имеют положительное влияние на вероятность обвала банка. Отрицательное влияние уровня просроченной задолженности по кредитному портфелю на вероятность обвала указывает на специфику действий Банка России при отзыве лицензии. Таким образом, результаты работы позволяют усовершенствовать систему раннего оповещения банковских дефолтов для ее использования как коммерческими банками, так и монетарными властями.
Банковский сектор — один из основных секторов финансового рынка, выполняющий трансформацию активов. Определение и прогнозирование банковской стабильности оказывает огромное влияние на принятие решений всеми участниками рынка. В отечественном банковском секторе существуют проблемы с достаточностью капитала и качеством активов, препятствующие стабильному развитию и росту экономики [Белоусова, 2009; Воловник и др., 2011]. Большое количество банковских дефолтов усугубляет эти трудности и увеличивает общий уровень задолженности в экономике. В данной статье для прогнозирования дефолтов в банковском секторе, помимо стандартных подходов, впервые на российских данных применяется алгоритм машинного обучения «случайного леса», результаты которого сравниваются с другими моделями для выявления наилучшей на основе показателя средней абсолютной ошибки прогноза.
Работа имеет следующую структуру. В первой части рассмотрены теоретические предпосылки индивидуальных банковских кризисов (набега на банк) и выявлены эмпирические факторы — предвестники дефолтов, имеющие влияние на вероятность обвалов в российском и зарубежных банковских секторах. Во втором разделе проведены расчеты на фактических данных и проанализированы результаты. В заключении описаны основные итоги исследования.
Банковские депозитные договоры, как правило, позволяют вкладчикам снять номинальную стоимость своих вкладов по требованию. До тех пор пока часть таких вкладов используется для финансирования неликвидных и рискованных ссуд или инвестирования, существует вероятность кризиса ликвидности, который может привести к дефолту банка. Большинство теоретических моделей рассматривают этот вопрос в агрегированной структуре, представляющей всю банковскую отрасль как единую сущность. Тем не менее важно различать набеги на банк, которые влияют на отдельно взятый банк, то есть индивидуальные банковские кризисы, и банковские паники (системный риск), которые касаются всего банковского сектора, платежной системы и межбанковского рынка.
Подробным изучением и моделированием набегов на банк занимались в своей работе Дуглас Даймонд и Филип Дибвиг [Diamond, Dybvig, 1983]. Они рассматривали однотоварную трехпериодную экономику, в которой присутствует континуум агентов (вкладчиков, потребителей), наделенных единицей блага в нулевой период и желающих потреблять в периоды 1 (нетерпеливые агенты) или 2 (терпеливые агенты). Также в экономике существует долгосрочная производственная технология — такая, что инвестирование одной единицы в нулевой момент времени приносит доход, превышающий первоначальное вложение во втором периоде, а при прерывании технологии в первом периоде ликвидационная стоимость в точности равна первоначальным затратам. Авторы показали, что система страхования вкладов может обеспечить реализацию Парето-доминирующего равновесия за счет гарантирования выплаты обещанного дохода всем агентам, желающим снять вклад. В работе предлагается использовать государственное страхование, поскольку частные компании ограничены имеющимися у них ресурсами, в то время как государство обладает правом взимать налоги. Для вкладчиков имеет значение посленалоговая ценность их дохода от снятия ввиду того, что это является конечной суммой их потребления. Таким образом, налогообложение сдерживает вкладчиков второго типа от досрочного снятия денежных средств.
Дальнейшее изучение этой темы заключалось в попытках модифицировать классическую модель Даймонда — Дибвига. Например, Варадараджан Кари и Рави Джаганатан [Chari, Jagannathan, 1988] рассматривали модель, в которую была введена случайным образом формирующаяся доходность от инвестиций во втором периоде. Основным выводом работы этих авторов является то, что при добавлении стохастической модификации инвестиционной технологии без ввода специальных механизмов всегда будет реализовываться равновесие с набегом. Еще одной модификацией является увеличение временного горизонта. Одна из таких моделей, расширенная до четырех периодов, была предложена Мерваном Инжиниром [Engineer, 1989]. Автор показал, что при такой постановке задачи (поскольку предпочтения агентов выявляются в течение долгого времени) стандартный механизм предотвращения кризиса путем приостановки конвертируемости не работает, приводя к реализации с некоторой вероятностью равновесия с набегом на банк. Джеймс Пек и Карл Шелл [Peck, Shell, 2003] добавили в игру спецификацию до внесения депозита. Если в классической модели рассматривались ситуации, когда деньги уже вложены, то здесь авторы предлагали проанализировать случай, когда депозит может быть не открыт. Было показано, что в таком случае оптимальный механизм также может включать в себя равновесие с набегом на банк. Чао Гу [Gu, 2011] в свою очередь рассматривал модификацию классической модели, где период 1 разделен на N+1 подпериодов, что позволяет уловить «стадные» эффекты, опускаемые в классической работе. В этом случае в экономике с неопределенностью в отношении возвратности инвестиций очередь в банк содержит информацию о состоянии инвестиционного портфеля банка. Сводные данные по каждой модели, полученные на основании проведенного анализа, приведены в табл. 1.
Таблица 1. Классификация теоретических моделей
Подход | Модель | Спецификация | Вывод |
Классический | [Diamond, Dybvig, 1983] | Государственная система страхования депозитов | Страхование депозитов предотвращает набег на банк |
Стохастическая модификация | [Chari, Jagannathan, 1988] | Стохастический доход | Набег на банк происходит в любом случае |
Увеличение временного горизонта | [Engineer, 1989] | Приостановка конвертируемости | Приостановка выдачи наличных не устраняет набеги на банк |
Изменение предпосылок относительно вкладчиков | [Peck, Shell, 2003] | Различные функции полезности | Оптимальный банковский механизм допускает вероятность набега на банк |
Модификация структуры периодов | [Gu, 2011] | Разбиение второго периода на N + 1 подпериодов | Очередь содержит информацию о состоянии инвестиционного портфеля банка |
Эмпирические исследования дефолтов банков в отличие от теоретических направлены не только на изучение различных факторов и ситуаций, которые могут спровоцировать кризис, но и на прогнозирование возможных «падений». Иными словами, эмпирические модели прогнозирования предоставляют регулирующим органам банка и другим заинтересованным агентам систему раннего оповещения, которая, используя текущую финансовую информацию, выявляет «тревожные» учреждения. Наиболее часто используемыми в таких исследованиях являются пробит- и логит-модели, поскольку они могут, основываясь на динамике известных финансовых показателей, оценивать вероятность обвала банка в ближайшем будущем, однако всё больше исследований в последние годы посвящается изучению моделирования вероятности дефолтов с помощью алгоритмов машинного обучения.
Одной из работ, базирующихся на основе логит-моделей, является исследование Дар-Йеха Хванга, Ченга Ли и Томаса Льава [Hwang et al., 1997], которые занимались анализом обвалов банков в США в период с 1985-го по 1988 год. Результаты этого исследования свидетельствуют в пользу строгого нормативного контроля и установления минимального размера собственного капитала. Другим примером использования логит-модели является работа Даниэля Мартина [Martin, 1977]. Он оценивал вероятность банкротства банка в 1970-е годы на основе исторических данных обо всех банках — членах Федеральной резервной системы. Его работа интересна тем, что в ней было введено формальное деление используемых переменных по описываемой ими информации на четыре обобщенные группы, отвечающие за: (1) рисковые активы, (2) ликвидность, (3) достаточность основного капитала и (4) прибыль.
Поскольку системные банковские кризисы для развивающихся стран относительно более дорогостоящие с точки зрения расходов бюджета, чем для промышленно развитых стран, их прогнозирование на более ранних этапах — актуальная задача [Caprio, Klingebiel, 1996]. Подобный вопрос поднимал в своей работе Марко Арена [Arena, 2008], рассматривая эпизоды системных кризисов в Латинской Америке и Восточной Азии и тестируя, возможно ли, что во время кризиса обваливаются в основном изначально слабые банки, то есть банки с плохими показателями индивидуальной отчетности. Результаты демонстрируют, что системные потрясения (макроэкономические или шоки ликвидности), которые спровоцировали банковские кризисы, главным образом, дестабилизировали банки, ослабленные еще до этих потрясений.
Другой работой, посвященной проблеме банкротства банков, является исследование Ахлема Сельмы Мессаи и Мохамеда Имен Галлали [Messai, Gallali, 2015]. Эта работа продемонстрировала эффективность новых искусственных нейронных методов по сравнению с другими классическими подходами. Эти новые методы уже используются в нескольких областях, но лишь недавно стали применяться для прогнозирования кризиса финансовых систем.
Эмпирические работы, посвященные прогнозированию дефолтов в российском банковском секторе, также сосредоточены на выявлении факторов индивидуальной банковской деятельности, которые влияют на вероятность обвала. Тем не менее в отличие от работ Анатолия Пересецкого с соавторами [Peresetsky et al., 2011] и Андрея Зубарева [Зубарев, 2013], сосредоточенных на анализе факторов — предвестников дефолтов, некоторые зарубежные авторы, такие как Софи Клаис и Коен Шурс [Claeys, Schoors, 2007] и Жарко Фидрмук и Филипп Сюсс [Fidrmuc, Suss, 2011], рассматривали российскую банковскую систему на более глубоком уровне. Так, в работе Клаис и Шурса было показано, что в своей лицензионной политике Банк России руководствуется не только микро-, но и макропруденци-альными характеристиками. Результаты исследования Фидрмука и Сюсса свидетельствуют о том, что если расширить определение дефолта банка, добавив, помимо условия отзыва лицензии, получение прямой государственной поддержки и принудительное слияние или поглощение, то факторы-предвестники не изменятся и будут совпадать с выявленными ранее.
Основные сведения по факторам, влияющим на вероятность банкротства в зарубежных и российском банковских секторах, представлены в табл. 2.
Таблица 2. Факторы и их влияние на вероятность банкротства зарубежных и российских банков
Фактор | Влияние | Страна | Исследование |
Доля ликвидных активов в общей сумме активов | - | США | [Hwang et al., 1997] |
Доля недвижимости, находящейся в собственности, в общей сумме активов | + | США | [Hwang et al., 1997] |
Отношение просроченных кредитов к общей сумме активов | + | США | [Hwang et al., 1997] |
Доля собственного капитала в общей сумме активов | - | США | [Hwang et al., 1997] |
Россия | [Fidrmuc, Suss, 2011] | ||
Отношение оборотного капитала к рисковым активам | - | США | [Martin, 1977] |
Чистый доход, нормированный на сумму совокупных активов | - | США | [Martin, 1977] |
Доля коммерческих кредитов в общем объеме выданных ссуд | + | США | [Martin, 1977] |
Отношение расходов к операционному доходу | + | США | [Martin, 1977] |
Россия | [Fidrmuc, Suss, 2011] | ||
Отношение ликвидных активов к общей сумме обязательств (пассивов) | - | Страны Азии и Латинской Америки | [Arena, 2008] |
Отношение сумм выданных кредитов к совокупным активам | + | Страны Азии и Латинской Америки | [Arena, 2008] |
Россия | [Fidrmuc, Suss, 2011] | ||
Рентабельность активов | - | Страны Азии и Латинской Америки | [Arena, 2008] |
Россия | [Claeys, Schoors, 2007] | ||
Отношение резервов по возможным потерям по кредитам к общей сумме выданных ссуд | + | Страны Азии и Латинской Америки | [Arena, 2008] |
Страны Европы | [Messai, Gallali, 2015] | ||
Коэффициент средней отдачи собственного капитала | + | Страны Европы | [Messai, Gallali, 2015] |
Россия | [Fidrmuc, Suss, 2011] | ||
Отношение резервов по возможным потерям к совокупным активам | - | Россия | [Peresetsky et al., 2011] |
Доля кредитов нефинансовых организаций в совокупных активах | + | Россия | [Peresetsky et al., 2011] |
Резервы по возможным потерям по кредитам | + | Россия | [Зубарев, 2013] |
Объем просроченной задолженности | - | Россия | [Зубарев, 2013] |
Источник: составлено авторами.
Большинство моделей прогнозирования обвалов банков используют переменные, которые могут быть классифицированы по четырем из пяти факторов CAMEL1.
1 C — capital adequacy, или достаточность капитала; A — asset quality, или качество активов; M — management, или качество управления; E — earnings, или доходность; L — liquidity, или ликвидность.
Переменная, которая, как правило, отсутствует, характеризует качество управления. В некотором смысле это удивительно, поскольку многие исследования прогнозирования банкротства банка пришли к выводу, что качество и эффективность управления банком являются значимыми причинами обвала. В целом значимые факторы и тенденции их влияния в разных странах схожи. Например, отношения, характеризующие доходность, уменьшают вероятность обвала банка. Отношения, связанные с кредитными операциями (выданными, просроченными кредитами или резервами по возможным потерям по кредитам), имеют положительное влияние на вероятность обвала банка. Стоит отметить, что ряд факторов, выявленных для российского банковского сектора, и направления их влияния полностью совпадают с показателями, используемыми для прогнозирования обвала зарубежных банков. Причем эти факторы значимы для прогнозирования банковских кризисов не только в странах с развивающейся экономикой, но и в США, и в странах Европы.
Как уже было сказано, набег на банк влияет на отдельно взятый банк и происходит, когда вкладчики получают плохие новости о его работе и, опасаясь банкротства, реагируют изъятием своих средств. В данном исследовании основной упор делается на прогнозирование фундаментальных набегов на банки (из рассмотрения исключены системные кризисы), то есть когда банки действительно имеют плохие финансовые показатели. Иными словами, для прогнозирования дефолтов выбран микропруденциальный подход: рассматриваются индивидуальные обвалы, для исследования используются финансовые (микроэкономические) переменные, рассчитанные на основе бухгалтерской отчетности.
Для проведения корректного исследования необходимо четкое определение обвала, чтобы исключить из выборки банки, чьи лицензии были отозваны из-за махинаций или просто ликвидированные по собственной инициативе. В данной статье это определение сформулировано следующим образом: считается, что дефолт банка произошел тогда и только тогда, когда среди перечня причин отзыва лицензии фигурировали хотя бы две из нижеперечисленных2:
2 Перечень причин, включенных в определение дефолта, был сформирован на основе ст. 20 Федерального закона «О банках и банковской деятельности» от 02.12.1990 № 395—1. Данные о причинах отзыва лицензии отдельно взятого банка были собраны на основании приказа об отзыве лицензии или ее ликвидации, изданного Банком России.
После определения критериев дефолта была сформирована выборка из двадцати восьми финансовых показателей, включающих в себя как чистые показатели из отчетности, так и производные от них (см. Приложение А). Всего в выборке использовались квартальные данные о 661 банке за период с I квартала 2015 года вплоть до I квартала 2017 года. Для обучающей выборки был выбран промежуток с начала 2015-го по конец 2016 года, вероятность обвала прогнозировалась для I квартала 2017 года. Двухгодичный период был выбран по двум причинам: во-первых, такой период охватывает среднее время между отзывом лицензии и ликвидацией банка, а во-вторых, этот период, согласно проведенным эмпирическим исследованиям, обладает самой высокой прогнозирующей способностью [Peresetsky et al., 2011]. Сам прогноз в предлагаемом исследовании осуществлялся с помощью бинарных панельных логит-моделей и модели «случайного леса». Зависимая переменная в обоих случаях являлась бинарной и характеризовала вероятность обвала, принимая значение 0, если банк продолжал свою деятельность, и 1, если произошел дефолт.
После формирования и сбора данных и разбиения их на обучающую и контрольную выборки была проведена очистка собранных данных: удалены явные ошибки ввода и измерения, а также статистические выбросы. Стоит отметить, что выбросы удалялись только для продолжающих работу банков, так как в случае дефолтов они могут на самом деле являться теми самыми «плохими новостями» о работе банка, которые мы стараемся выявить при прогнозировании. Тем не менее для построения наиболее эффективной модели бинарного выбора рекомендуется также проводить предварительный анализ переменных, а не только избавляться от статистических ошибок сбора данных. Авторы решили провести ANOVA-тест на разделительную способность переменных. Данная процедура является разновидностью дисперсионного анализа и заключается в том, что проверяется наличие статистических различий между средними исследуемых групп. В данном случае деление по группам происходит на основании оцениваемой бинарной переменной, то есть в зависимости от того, произошел дефолт или нет. Были протестированы все двадцать восемь показателей, а также три из них в логарифмическом виде (такая зависимость была выбрана на основе анализа взаимосвязи с объясняемой переменной), в результате чего выявлено четырнадцать показателей (см. Приложение В). Они являются потоковыми, поэтому их можно принять за стационарные, опустив проверку на единичный корень. Из-за того что в выбранный временной промежуток (I квартал 2015-го — I квартал 2017 года) не было сильных потрясений банковского сектора, также можно утверждать, что существенных сдвигов в рядах нет. Проведение тестирования с помощью разновидности критерия Хаусмана необходимо для обоснования использования модели со случайными эффектами (re) и модели пула (pa). Нулевая гипотеза не была отвергнута ни на одном из разумных уровней значимости, что говорит о состоятельности оценок в построенных ниже моделях.
Построение обеих моделей: и модели пула, и модели со случайными эффектами — начиналось с одинаковой базовой спецификации, включающей все переменные, отобранные при предварительном анализе показателей на основе ANOVA-теста. Далее спецификации сужались на основе тестов об индивидуальной значимости и теста Вальда для проверки одновременного равенства нулю коэффициентов при незначимых по отдельности переменных. Алгоритм отбора проводился до получения модели со всеми значимыми переменными.
Анализ начался с построения модели пула. После проведения описанного выше процесса отбора переменных была специфицирована модель с девятью регрессорами (см. Приложение С, табл. С1). Почти все полученные знаки коэффициентов при этих переменных, или, иными словами, влияние на вероятность дефолта банка, совпадают с ожидаемыми знаками, которые охарактеризованы на основании анализа, проведенного в первой части работы (табл. 3). Например, увеличивает вероятность обвала такой показатель, как отношение кредитного портфеля к активам-нетто. Это объясняется тем, что кредиты являются активами банка, и если они составляют большую часть активов, это говорит о плохой организации деятельности и неправильных вложениях и распределении средств. Остальные переменные имеют отрицательное влияние на вероятность дефолта банка, что также согласуется с экономическими обоснованиями и работами других авторов.
Таблица 3. Ожидаемое и полученное влияние факторов на вероятность дефолта
Показатель | Ожидаемый знак | Полученный знак (pa) | Полученный знак (re) |
Чистый доход, нормированный на сумму активов-нетто | - | - | |
Отношение кредитного портфеля к активам-нетто | +/- | + | |
Доля промышленных кредитов в общем объеме кредитного портфеля | - | - | - |
Отношение промышленных кредитов к активам-нетто | + | + | |
Отношение коммерческих кредитов к активам-нетто | - | - | - |
Рентабельность активов-нетто | - | - | - |
Уровень просроченной задолженности по кредитному портфелю | + | - | - |
Уровень обеспечения кредитного портфеля залогом имущества | - | - | |
Норматив достаточности капитала Н1 | - | - | - |
Логарифм средств предприятий и организаций | - | - | - |
Источник: расчеты авторов.
Из общего ряда показателей выбивается уровень просроченной задолженности по кредитному портфелю, которая, согласно полученной модели, имеет отрицательное влияние на вероятность дефолта (при ожидаемом положительном). Это объясняется спецификой работы Банка России: банки заранее получают уведомления о вероятном отзыве лицензии и стараются привести к норме показатели своей деятельности. Как следствие, согласно исследованиям Банка России у обвалившихся банков практически нет просроченной задолженности. Также можно сказать, что такой результат частично согласуется с выводом Зубарева [Зубарев, 2013], который рассматривал общий объем просроченной задолженности в кредитном портфеле для российских банков и продемонстрировал отрицательное влияние этого показателя на вероятность дефолта.
Результаты прогноза по данной модели представлены в табл. 4. Полученная pa-модель правильно классифицирует три банка из четырех обвалившихся, предсказывая 75% дефолтов. При этом из 528 продолжающих работу банков модель пула классифицирует четыре банка как обанкротившиеся. Это говорит о том, что общая прогнозная сила модели составляет 99,06%.
Таблица 4. Результаты прогноза модели пула
Вероятность обвала | Прогнозируемая классификация | Всего | ||
0 | 1 | |||
Абсолютный | 0 | 524 | 4 | 528 |
показатель | 1 | 1 | 3 | 4 |
Относительный! | 0 | 99,24 | 0,76 | 100 |
показатель (%) | 1 | 25 | 75 | 100 |
Источник: расчеты авторов.
Далее по тому же алгоритму была специфицирована модель со случайными эффектами. Полученная модель включала в себя уже семь регрессоров (см. Приложение C, табл. C1). В этом случае в отличие от модели пула незначимыми оказались чистый доход, нормированный на сумму активов-нетто, отношение кредитного портфеля к активам-нетто и уровень обеспечения кредитного портфеля залогом имущества. В то же время в модель добавился показатель, характеризующий отношение промышленных кредитов к активам-нетто, который положительно влияет на вероятность дефолта. В данном случае это объясняется спецификой российских данных: большинство взятых кредитов относятся к займам малого и среднего бизнеса, то есть с учетом нестабильной экономической ситуации они не являются самым надежным активом банка. Знаки коэффициентов при других показателях совпадают со знаками, полученными при спецификации модели пула. То, что при построении модели со случайными эффектами снова было получено значимое отрицательное влияние уровня просроченной задолженности по кредитному портфелю, говорит об устойчивости этого результата на фактических российских данных.
Таблица 5. Результаты прогноза модели со случайными эффектами
Вероятность обвала | Прогнозируемая классификация | Всего | ||
0 | 1 | |||
Абсолютный | 0 | 519 | 9 | 528 |
показатель | 1 | 1 | 3 | 4 |
Относительный | 0 | 98,30 | 1,70 | 100 |
показатель (%) | 1 | 50 | 50 | 100 |
Результаты осуществленной на основе построенной ге-модели классификации на обвалившиеся и продолжающие работать банки представлены в табл. 5. Модель также правильно классифицирует три банка из четырех обвалившихся, давая корректный прогноз 75% дефолтов. Однако в этом случае уже девять банков из продолжающих работу классифицируются как обанкротившиеся, то есть правильно предсказывается 98,30% продолжающих свою деятельность банков. За счет увеличения ошибки II рода, когда классификация 1 присваивается в действительности работающим банкам, общая прогнозная сила модели составляет 98,12%.
Полученные результаты говорят, что, хотя согласно теории re-модель должна лучше соответствовать данным [Носко, 2016], прогноз, сделанный на основе pa-модели, больше соответствует действительности.
В отличие от панельных логит-моделей бинарного выбора построение алгоритма «случайного леса» не требует предварительной очистки переменных. Корректному построению модели прогнозирования с помощью «случайного леса» не мешают ни единичные корни, ни сдвиги, ни другие аномалии панельных данных. По этой причине единственное, что необходимо было сделать перед началом построения, — очистить данные от ошибок ввода и выбросов (для продолжающих работать банков).
Модель «случайного леса» не дает интерпретируемых коэффициентов. Результатом процесса обучения является агрегированный по всем деревьям процесс построения прогноза — классификации банков по 0 и 1. Построенный алгоритм «случайного леса» на обучающей выборке верно прогнозирует 53 обвалившихся банка из 100 и неверно приписывает дефолт шести продолжающим работать банкам (см. Приложение C, табл. C2). С учетом полученных характеристик модель признана пригодной для прогнозирования на контрольной выборке. Результаты полученного прогноза представлены в табл. 6.
Таблица 6. Результаты прогноза модели «случайного леса»
Вероятность обвала | Прогнозируемая классификация | Всего | ||
0 | 1 | |||
Абсолютный | 0 | 528 | 0 | 528 |
показатель | 1 | 2 | 2 | 4 |
Относительный! | 0 | 100 | 0 | 100 |
показатель (%) | 1 | 50 | 50 | 100 |
Источник: расчеты авторов.
В рамках контрольной выборки алгоритм «случайного леса» верно классифицирует все банки, продолжающие свою деятельность, то есть полученная модель верно определяет 100% необанкротившихся банков. При этом из четырех действительно потерпевших дефолт банков алгоритм правильно находит только два. Таким образом, общая доля правильно классифицированных банков составляет 99,62%.
Как уже было отмечено в предыдущем разделе, основное отличие между прогнозированием с помощью алгоритма «случайного леса» и прогнозированием с помощью логит-моделей заключается в том, что в панельных моделях бинарного выбора получаются интерпретируемые коэффициенты. Построенные pa- и re-модели дают не только классификацию банков как продолжающих свою деятельность и прекративших ее, но и выявляют своего рода индикаторы — предвестники дефолта. Иными словами, пользуясь результатами построенных моделей при изучении банковской отчетности и других показателей, посчитанных на ее основе, можно дать характеристику банку и проанализировать, близок ли он к дефолту или же его работа стабильна. Отсутствие интерпретируемости модели прогнозирования, основанной на алгоритме «случайного леса», представляет собой явный недостаток с экономической точки зрения. Однако чтобы корректно сравнить полученные модели, необходима еще и эконометрическая интерпретация, и критерий сравнения. Авторы решили сравнивать среднюю абсолютную ошибку (MAE). Также в качестве характеристики сравнения была использована доля правильно классифицированных банков, которая определялась как (1— MAE). Для удобства интерпретации оба показателя взяты в процентах (табл. 7).
Таблица 7. Сравнение прогнозной силы моделей
Модель | MAE х 100% | (1 - MAE) х % |
pa-модель | 0,94 | 99,06 |
re-модель | 1,88 | 98,12 |
«случайный лес» | 0,38 | 99,62 |
Средняя ошибка прогноза для модели со случайными эффектами составляет 1,88%, что является наибольшим значением этого показателя среди всех построенных моделей. У модели пула показатель средней ошибки меньше и составляет уже только 0,94%. Это подтверждает вывод о том, что pa-модель работает лучше, верно классифицируя 99,06%, в то время как re-модель верно классифицирует 98,12%. Значение показателя MAE в процентах для «случайного леса» еще меньше и составляет всего 0,38%, что дает общую долю верно классифицированных банков, равную 99,62%. Такой высокий показатель получен за счет того, что ни один из продолжающих свою деятельность банков не был отнесен к обанкротившимся.
Полученный результат согласуется с более ранними исследованиями, свидетельствующими о том, что логит-модели больше не являются наиболее эффективными моделями для прогнозирования. Модели, основанные на алгоритмах машинного обучения, хоть и дают неинтерпретируемый результат, но обладают большей прогнозной силой, позволяющей добиться более верного определения продолжающих свою работу и прекративших ее банков.
В данной статье была поставлена цель прогнозирования дефолтов в российском банковском секторе и сравнения прогнозной силы использованных моделей для выявления наилучшей.
Для реализации данной цели в первой части работы рассмотрены теоретические предпосылки индивидуальных обвалов банков, а также проведен анализ эмпирических исследований банковских дефолтов в зарубежных странах и в Российской Федерации. Было продемонстрировано, что показатели бухгалтерской и финансовой отчетности оказывают прямое воздействие на вероятность обвала банка.
На основе выводов, сделанных в первой части работы, во втором разделе проведены расчеты, необходимые для построения моделей, прогнозирующих вероятность дефолта в российском банковском секторе. Построенные панельные логит-модели дают корректную характеристику факторов — предвестников дефолтов, совпадающую с результатами предыдущих исследований и отражающую особенности российских банков. В частности, если отношение кредитного портфеля к активам-нетто или отношение промышленных кредитов к активам-нетто увеличивается, то это может служить для вкладчиков сигналом к тому, чтобы не вкладывать средства в этот банк или же изъять их из него. В свою очередь возрастающая динамика таких показателей, как отношение коммерческих кредитов к активам-нетто и уровень обеспечения кредитного портфеля залогом имущества, свидетельствует о снижении вероятности дефолта. Если же увеличиваются (в разумных пределах, то есть не выше установленной верхней границы для этих показателей) норматив достаточности капитала Н1, рентабельность активов-нетто, а также чистый доход, нормированный на сумму активов-нетто, то это уже будет свидетельством уменьшения вероятности дефолта данного банка, и поэтому его можно считать более надежным для вложения денежных средств. Отдельно стоит отметить влияние динамики такого показателя, как уровень задолженности по кредитному портфелю, поскольку его отрицательное влияние на обвал банка отражает особенности работы Банка России при отзыве лицензий. Если говорить о более формальных результатах, то re-модель, согласно теории больше подходящая для описания данных, верно классифицирует 98,12% банков и обладает меньшей прогнозной силой, чем модель пула, корректно определяющая состояние 99,06% банков. Наибольшей прогнозной силой обладает модель, основанная на алгоритме машинного обучения «случайного леса», впервые примененная к анализу российских банковских данных и верно определяющая вероятность дефолта 99,62% банков.
Полученные результаты можно использовать для создания системы раннего оповещения банковских дефолтов; в частности, на основе логит-моделей рекомендуется проведение анализа финансовой отчетности с целью выявления сигналов «плохой» работы банка, а с помощью модели «случайного леса» — осуществление прогнозирования вероятности дефолтов в российском банковском секторе. Таким образом, результаты, предложенные в данной работе, могут быть использованы как частным сектором, так и монетарными властями.
Таблица. Обозначение и характеристики используемых переменных
Показатель | Обозначение / расчет | Показатель | Обозначение / расчет |
Активы-нетто | na | Рентабельность активов-нетто | ROA |
Чистая прибыль | ni | Рентабельность капитала | ROE |
Капитал (по форме 123) | c. 123 | Кредитный! портфель | cp |
Кредиты предприятиям и организациям | c.b | Уровень резервирования по кредитному портфелю | IR |
Просроченная задолженность в кредитном портфеле | LLPGL | Уровень обеспечения кредитного портфеля залогом имущества | LCP |
Вклады физических лиц | dep.f | Норматив ликвидности Н2 | H2 |
Кредиты физическим лицам | c.f | Норматив ликвидности Н3 | H3 |
Просроченная задолженность по кредитам физических лиц | LLP.c.f | Норматив достаточности капитала Н1 | H1 |
Уровень просроченной задолженности по кредитному портфелю | LLP | Доля коммерческих кредитов в общем объеме кредитного портфеля | cf=c.f/cp |
Просроченная задолженность по кредитам предприятий и организаций | LLP.c.b | Доля промышленных кредитов в общем объеме кредитного портфеля | cb=c.b/cp |
Выданные МБК | ibl | Отношение коммерческих кредитов к активам-нетто | naf=c.f/na |
Средства предприятий и организаций | dep.b | Отношение промышленных кредитов к активам-нетто | nab=c.b/na |
Валютный оборот к активам-нетто | fr.na | Отношение кредитного портфеля к активам-нетто | cpn=cp/na |
Оборот по валютным операциям (тыс. руб.) | fr | Чистый доход, нормированный на сумму активов-нетто | nn=ni/na |
Таблица. Результаты ANOVA-теста
Показатель | Обозначение | F value | Pr (> |F|) |
Рентабельность активов-нетто | ROA | 416,6 | <2e-16*** |
Рентабельность капитала | ROE | 18,13 | 2,1e-05*** |
Уровень просроченной задолженности по кредитному портфелю | LLP | 3,53 | 0,0603. |
Уровень обеспечения кредитного портфеля залогом имущества | LCP | 30,52 | 3,48e-08*** |
Чистый доход, нормированный на сумму активов-нетто | nn | 268 | <2e-16*** |
Норматив достаточности капитала Н1 | H1 | 52,36 | 5,35e-13*** |
Логарифм активов-нетто ln(na) | ln(na) | 28,08 | 1,22e-07*** |
Логарифм чистой прибыли | ln(ni) | 7,855 | 0,0051** |
Логарифм средств предприятий и организаций | ln(dep.b) | 55,56 | 1,07e-13*** |
Доля коммерческих кредитов в общем объеме кредитного портфеля | cf | 23,06 | 1,62e-06*** |
Доля промышленных кредитов в общем объеме кредитного портфеля |
cb | 81,25 | <2e-16*** |
Отношение коммерческих кредитов к активам-нетто | naf | 17,07 | 3,66e-05*** |
Отношение промышленных кредитов к активам-нетто | nab | 11,93 | 0,000556*** |
Отношение кредитного портфеля к активам-нетто | cpn | 43,75 | 4,13e-11*** |
Примечание. Уровень значимости: *** — 0,001, ** — 0,01, * — 0,05, «.» — 0,1.
Таблица С1. Результаты оценивания логит-моделей
Показатель | Коэффициент (pa) | P > |z| | Коэффициент (re) | P > |z| |
nn | -3,577 | 0,001 | - | - |
cpn | 0,877 | 0,011 | - | - |
cb | -1,981 | 0,000 | -6,764 | 0,000 |
nab | - | - | 3,184 | 0,000 |
naf | -4,564 | 0,000 | -10,7 | 0,000 |
ROA | -0,00015 | 0,002 | -0,0006 | 0,000 |
LLP | -0,029 | 0,000 | -0,05 | 0,000 |
LCP | -0,003 | 0,002 | - | - |
H1 | -0,0330 | 0,000 | -0,066 | 0,000 |
ln(dep.b) | -0,629 | 0,000 | -1,516 | 0,000 |
Таблица С2. Результаты построения алгоритма «случайного леса»
as.factor(Prob) na + ni + c.123 + cp + LLPGL + dep.f + dep.b + ROA + nab + naf + cf + ROE + LLP + IR + LCP + fr.na + fr + H1 + H2 + H3 + c.f + LLP.c.f + c.b + LLP.c.b + ibl + cb + nn + cpn | |||
Тип алгоритма «случайного леса»: Количество «деревьев»: Количество переменных для каждого разбиения: |
классификация 5000 5 |
||
OOB оценка коэффициента ошибок: | 1,1% | ||
Матрица несоответствий: | |||
0 | 1 | ошибка класса | |
0 | 4714 | 6 | 0,001271186 |
1 | 47 | 53 | 0,470000000 |
Литература
1. Белоусова В.Ю. Эффективность издержек однородных российских коммерческих банков: обзор проблемы и новые результаты // Экономический журнал ВШЭ. 2009. Т 13. № 4.С. 489-519.
2. Воловник А.Д., Кибардина Ю.С., Зиядуллаев Н.С. Базель-III: испытание надежности банковской системы России в условиях глобальной конкуренции // Экономика мегаполисов и регионов. 2011. № 3.С. 40—49.
3. Зубарев А.В. Финансовый кризис 2008—2009: факторы банкротств на примерах крупных российских банков // Российское предпринимательство. 2013. Т. 14. № 22. С. 87—94.
4. Носко В.П. Эконометрика. Книга вторая. М.: Дело, 2011.
5. Arena M. Bank Failures and Bank Fundamentals: A Comparative Analysis of Latin America and East Asia During the Nineties Using Bank-Level Data // Journal of Banking & Finance. 2008. Vol. 32. No 2.P. 299—310.
6. Azariadis C. Self-Fulfilling Prophecies // Journal of Economic Theory. 1981. Vol. 25. No 3.P. 380—396.
7. BanerjeeA. V. A Simple Model of Herd Behavior // The Quarterly Journal of Economics. 1992. Vol. 107. No 3.P. 797—817.
8. Bryant J. A Model of Reserves, Bank Runs, and Deposit Insurance // Journal of Banking & Finance. 1980. Vol. 4. No 4.P. 335—344.
9. Calomiris C.W., Kahn C.M. The Role of Demandable Debt in Structuring Optimal Banking Arrangements // American Economic Review. 1991. Vol. 81. No 3.P. 497—513.
10. Caprio G., Klingebiel D. Bank Insolvencies: Cross-Country Experience. World Bank Publications, 1996.
11. Cass D., Shell K. Do Sunspots Matter? // Journal of Political Economy. 1983. Vol. 91. No 2.P. 193—227.
12. Chari V.V., Jagannathan R. Banking Panics, Information, and Rational Expectations Equilibrium // The Journal of Finance. 1988. Vol. 43. No 3.P. 749—761.
13. Chari V.V., Kehoe P.J. Financial Crises as Herds: Overturning the Critiques // Journal of Economic Theory. 2004. Vol. 119. No 1.P. 128—150.
14. Claeys S., Schoors K. Bank Supervision Russian Style: Evidence of Conflicts Between Micro- and Macro-Prudential Concerns // Journal of Comparative Economics. 2007. Vol. 35. No 3.P. 630—657.
15. Crockett A. Marrying the Micro- and Macro-Prudential Dimensions of Financial Stability // BIS Speeches. 2000. Vol. 21.
16. DiamondD. W, Dybvig P.H. Bank Runs, Deposit Insurance, and Liquidity // Journal of Political Economy. 1983. Vol. 91. No 3.P. 401—419.
17. Dreger C., Fidrmuc J. Drivers of Exchange Rate Dynamics in Selected CIS Countries: Evidence from a Factor-Augmented Vector Autoregressive (FAVAR) Analysis // Emerging Markets Finance and Trade. 2011. Vol. 47. No 4.P. 49—58.
18. Dybvig P.H., Spatt C.S. Adoption Externalities as Public Goods // Journal of Public Economics. 1983. Vol. 20. No 2.P. 231—247.
19. Engineer M. Bank Runs and the Suspension of Deposit Convertibility // Journal of Monetary Economics. 1989. Vol. 24. No 3.P. 443—454.
20. Fidrmuc J., Suss P. The Outbreak of the Russian Banking Crisis // Czech Economic Review. 2011. No 1.P. 46—63.
21. Gorton G. Bank Suspension of Convertibility // Journal of Monetary Economics. 1985. Vol. 15. No 2.P. 177—193.
22. Gu C. Herding and Bank Runs // Journal of Economic Theory. 2011. Vol. 146. No 1.P. 163—188.
23. Hwang D.-Y., Lee C.F., Liaw K.T. Forecasting Bank Failures and Deposit Insurance Premium // International Review of Economics & Finance. 1997. Vol. 6. No 3.P. 317—334.
24. Jacklin C.J., Bhattacharya S. Distinguishing Panics and Information-Based Bank Runs: Welfare and Policy Implications // Journal of Political Economy. 1988. Vol. 96. No 3.P. 568—592.
25. Martin D. Early Warning of Bank Failure: A Logit Regression Approach // Journal of Banking & Finance. 1977. Vol. 1. No 3.P. 249—276.
26. Messai A.S., Gallali M.I. Financial Leading Indicators of Banking Distress: A Micro Prudential Approach — Evidence from Europe // Asian Social Science. 2015. Vol. 11. No 21. P. 78—90.
27. Morttinen L.M., Poloni P., Sandars P. Analysing Banking Sector Conditions: How to Use Macro-Prudential Indicators. ECB Occasional Paper. No 26. 2005.
28. Peck J., ShellK. Equilibrium Bank Runs // Journal of Political Economy. 2003. Vol. 111. No 1.P. 103—123.
29. PeresetskyA. A., Karminsky A.M., Golovan S.V. Probability of Default Models of Russian Banks // Economic Change and Restructuring. 2011. Vol. 44. No 4.P. 297—334.