В конце 1980-х годов все поменялось. С одной стороны, стал разваливаться военно-промышленный комплекс, исчезла та внутренняя мотивированность (я сейчас ни в коем случае не говорю о деньгах — с ними все было еще в порядке), в силу которой я с интересом занимался прикладными задачами. И поэтому из НИИ АА ушли Кулешов, Кабатянский, я и другие мои коллеги и друзья, причем в разные стороны; стал директором Института проблем информатики Академии наук И. А. Мизин. С другой стороны, прекратились научные математические семинары: их просто перестали посещать. Многие уехали, а у оставшихся людей просто пропал стимул встречаться и что-то обсуждать. А так как мои занятия математикой «подогревались» именно моей вовлеченностью в статистическое комьюнити, в котором я ощущал себя его частью, и именно это было морально очень значимо для меня, то и я, по сути, прекратил заниматься теоретической математикой, перестал доказывать теоремы.
Не знаю, как бы развивалась моя дальнейшая жизнь. Я работал в довольно бессмысленном месте, где не было ни математических, ни мотивированных прикладных задач, но произошла очередная случайность, хотя и имеющая, наверное, совершенно неслучайное происхождение, и я оказался вовлеченным в некоторую прикладную деятельность, связанную с обработкой и статистическим анализом изображений, в которой были и задачи по multiple target tracking и оказались востребованными мои старые результаты из кандидатской диссертации. Я вернулся к своей старой задаче, но уже с другими знаниями и умениями, существенно продвинулся в ней и увидел, что в ней есть более глубокое математическое, алгебро-геометрическое содержание. К сожалению, я переключился на другие задачи, даже полученные новые, еще математические результаты я почти не опубликовал и тем более не углубился в задачу, хотя ясно увидел ее более глубокий внутренний смысл. В это время мне приходилось решать и другие мотивированные прикладные статистические задачи, и некоторые решения были связаны только с тем, что мое математическое образование и опыт позволяли по-иному, чем даже очень квалифицированным инженерам, смотреть на задачу и формулировать ее в математических терминах, и даже стандартные математические решения так сформулированных задач давали тогда значимый прикладной эффект.
Но потребность в этой деятельности по внешним обстоятельствам пропала, и снова реального дела нет. Я решил написать статьи по своим новым неопубликованным результатам, успел опубликовать статью в американском статистическом журнале, но — очередной поворот судьбы. Академики Фортов, тогда вице-президент Академии, и Станислав Васильевич Емельянов пригласили Александра Петровича Кулешова в Академию наук, чтобы использовать его богатый научный, инженерный и управленческий опыт для развития инновационных проектов в области информационно-телекоммуникационных технологий. А он пригласил меня. И очередная случайность, что в Airbus презентация Кулешова о возможностях российской науки и, главное, личные разговоры с ним привели к тому, что в компании Airbus Кулешову поверили, решили попробовать и заказали некоторую поисковую прикладную работу, в существенной степени основанную на анализе данных. Начинали мы эту работу фактически вдвоем, потом по мере развития проекта к нам приходили молодые талантливые ребята. Одним из первых пришел Женя Бурнаев, с которым мы до сих пор вместе работаем, а в чисто прикладной авиационной части нас консультировал и внес большой вклад талантливый аэродинамик из ЦАГИ Юрий Николаевич Свириденко, и в результате проект успешно состоялся. Но главным результатом проекта стало становление в стране нового прикладного и очень наукоемкого направления предсказательного моделирования по данным, что определило мою жизнь до сегодняшнего дня.
Когда я сейчас читаю книжки, которые написали такие гении, как Владимир Игоревич Арнольд или Сергей Петрович Новиков, слушаю рассказы Синая, то нахожу в них утверждение, что именно задачи, которые возникают в физике и других реальных областях, развивают математику, а математика благодарно возвращает новые методы, которые продвигают, обогащают эти области. Совсем недавно прочитал, что один из величайших математиков всех времен, «король математиков» Гаусс, значительную часть своей жизни занимался самыми различными приложениями, используя свои действительно великие разносторонние математические результаты, часть из которых и была мотивирована этими приложениями. Жизнь великого Колмогорова свидетельствует о том же.
И мой прошлый опыт в математике (или около математики), особенно последнего десятилетия, убедил меня в том, что в реальном мире постоянно возникают новые математические задачи, очень часто прямое использование известных методов невозможно и настоящий успех в прикладных задачах достигается тогда, когда на эти задачи начинают смотреть немного «математически по-другому», нетрадиционно. Те вещи, в которых при мне и иногда с моим участием произошел прорыв, стали возможны именно потому, что кто-то сумел посмотреть на них математически по-новому.
Например, модная сейчас тема — нейронные сети, Большие данные. Обработкой и анализом данных занимались всегда, метод наименьших квадратов Гаусс придумал более 200 лет назад. А сейчас появилась возможность сохранять большое количество данных, быстро их обрабатывать, передавать их быстро и на большие расстояния. И стало возможно ставить и решать совершенно новые задачи, например: задачи обработки и понимания изображений, медицинской диагностики, распознавания и др. Это привело к созданию новой университетской и академической дисциплины, получившей название «науки о данных», в которой стали развиваться совершенно новые математические подходы и методы. Математическая статистика к этому моменту имела дело в основном с задачами, в которых носители данных являются линейными подпространствами. Но в реальном мире эта модель не работает, и для таких данных стали развиваться различные эвристические методы, например нейронные сети, которые иногда прекрасно работали, а иногда давали полную ерунду.
Но когда математики задумались и поняли, чем вызваны частные успехи нейронных сетей, то были предложены совсем другие методы или в нейронные сети было внесено новое содержание, в результате были получены новые, существенно более интересные решения. Например, в задаче снижения размерностей в 2000 году была предложена нелинейная модель многомерных данных (для линейной модели ее решение — метод главных компонент — предложил еще Пирсон в начале прошлого века), в соответствии с которой реальные многомерные данные лежат на многообразии меньшей размерности, вложенном в высокоразмерное пространство наблюдений. И этот появившийся геометрический взгляд на данные сразу породил массу новых алгоритмов, и репликативные нейронные сети для этой задачи были забыты. И сейчас этот подход, называемый моделированием многообразий (Manifold learning), успешно развивается как в математическом направлении (появился, например, топологический анализ данных), став предметом моих научных интересов в последние годы, так и в многочисленных приложениях, например в нейроимиджинге.
Но 10 лет назад появился новый класс нейронных сетей — так называемые глубинные сети, и они творят чудеса. Но почему и как работает этот чисто эвристический подход, до сих пор не понимает никто. На самых престижных конференциях по анализу данных организуются круглые столы для обсуждения того, какие fundamentals лежат в их основе, но ответа пока нет. Может быть, этим не заинтересовались действительно великие математики, может быть, чего-то не хватает в самой математике, требуются новый язык, новые постановки и результаты, но я верю, что это обязательно произойдет, а то, что это вызовет, какие новые прикладные задачи будут решены, даже трудно себе представить.