Новости

15.12.2019

Интересное интервью. В чем проблема с индексом Хирша......?

Источник

https://academia.interfax.ru

Председатель совета директоров Digital Science Россия и СНГ, вице-президент Digital Science Global Игорь Осипов в интервью "Интерфаксу" рассказал, как научно-исследовательский контекст и "большие данные" помогают принимать правильные решения, когда информации о научных публикациях недостаточно или ее просто нет. В чем проблема с индексом Хирша и почему научная публикация часто напоминает мертвого лося?

– Игорь Александрович, в этом году компания Digital Sсience в третий раз провела в Москве форум, посвященный "большим данным" в науке. Что самое важное было сказано в этот раз? Какие изменения в аудитории Вы видите как основатель форума?

– На форуме было очень много практической информации. Например, говорили о международном опыте представителей Большой двадцатки в создании инфраструктурных проектов. Участников также познакомили с международными и российскими кейсами, в том числе наработками университетов-участников программы 5-100, крупных российских фондов и представителей бизнеса.

Для меня важнее всего, что мы перешли от общих больших тем к конкретике. По каждому из важных направлений развития – и "больших данных", и вообще цифровых технологий, – мы слышали информацию из первых уст. Говорили люди, которые либо сами разрабатывают цифровые платформы, либо уже разработали, внедряют их и смотрят, как ими пользоваться. Это, наверное, основное изменение.

 – Во время своего выступления на форуме заведующий лабораторией физики высоких энергий МФТИ, профессор РАН Тагир Аушев высказал мысль, что для развития науки и инноваций необходима гибкая цифровая платформа, состоящая из многих отдельных платформ, которая будет обеспечивать универсальный доступ к продуктам интеллектуальной деятельности. Ключи от нее должны быть у государства. Что Вы об этом думаете? Когда такая платформа может появиться?

 Я был очень рад, что Тагир выступил с этой презентацией, потому что коллеги под его руководством и с его участием разрабатывают такую мегаплатформу достаточно давно. Они рассказывали об этом в разных аудиториях, в нашей – впервые. То, как видят развитие этой мегаплатформы Тагир и его коллеги, на мой взгляд, очень разумно. Она очень гибкая, позволяет сосуществовать совершенно разным системам, которые через шлюзы и API могут друг с другом обмениваться информацией.

Должны ли находиться ключи у государства или еще у кого-то? Это вопрос объемный. Как руководителю Digital Science в России и СНГ мне важно, что платформа, о которой говорил Тагир, включает в себя всех основных участников. Появляется экосистема, которая будет развиваться, на ее основе будут создаваться еще сотни, тысячи приложений, цифровых бизнесов.

Здесь ключевое слово – гибкость. Чем гибче система, тем больше у нее шансов стать востребованной, и тем больше шансов, что она выживет. Мы знаем, что государство начинает много проектов. Некоторые из них живут, а некоторые умирают, потому что они не гибкие.

– А как сегодня правильно распоряжаться нарастающим объемом научной информации? Что самое главное?

– Наверное, самое главное – не ставить жесткие рамки и не говорить, что науку нужно измерять только по индексу Хирша. Я считаю, что это неправильно. Это не только моя позиция, но и мнение очень многих коллег, которые работают и руководят российскими и зарубежными научными фондами, университетами.

Именно поэтому появилась Dimensions. Собралось больше 120 участников со всего мира, включая 15 российских, которые сказали свое веское слово и создали Dimensions вместе с нами, – это означает, что старая парадигма себя изживает. Понятно, что она закреплена в законодательстве, внедрена уже довольно долгое время и живет как система.

Тридцать лет назад, или даже десять лет назад все строилось на публикациях. В значительной степени публикации, цитирование и все, что с этим связано, будут актуальны и дальше. Но неужели за последние пять лет не появилось ничего нового? Появилась масса новых вещей, масса новой информации, новых типов информации. На это нельзя закрыть глаза и сказать, что нам очень удобно пользоваться индексом Хирша, мы и дальше будем всех мерить по нему. Это было бы проявлением той самой негибкости, заскорузлости, которые необходимо преодолевать. Нужно дать людям возможность создавать и новые индикаторы, и новые метрики, и пользоваться новыми видами данных.

В свое время я жил, учился и работал на Крайнем Севере, в Арктике. Там у нас была такая шуточная история, что публикация похожа на мертвого лося. Он прожил жизнь, на него поохотились, его разделали, и вот он лежит перед нами. То есть, публикация – это то, что уже произошло, случилось, год пролежало у редакторов и сейчас вышло. Да, это ценная информация, но она с точки зрения понимания быстро меняющегося будущего или даже настоящего, уже немножко опоздала. Если мы будем фокусироваться только на публикации, мы очень сильно потеряем в той самой гибкости и быстроте принятия решений.

 – Что Вы думаете об угрозах нарастающей роли искусственного интеллекта, машинного обучения в анализе научных данных. Очень много всякого рода страшилок, публикаций о том, что искусственный интеллект нас поработит и т.д. Действительно ли искусственный интеллект несет нам угрозу в будущем?

 – Мне сложно выступать пророком, потому что я сам работаю в этой сфере и вижу, как это все развивается. Для себя лично я разделяю две вещи: то, что касается самих данных, научного знания или просто знания, инноваций. И то, что касается человека. Для меня это две разные истории. Некая граница проходит именно там, где заканчивается просто знание информации и начинается человек и все, что касается человека.

Если говорить о первом, то здесь, мне кажется, искусственный интеллект очень полезен. Объем данных возрастает просто невероятно, и справиться с ним вручную уже невозможно. Безусловно, нужны алгоритмы и какие-то инструменты, чтобы делать релевантный анализ, основанный на умном машинном обучении, на тех самых "больших данных".

Если говорить об искусственном интеллекте и человеке, я призываю всех быть крайне аккуратными. Нужно смотреть, где стоит разрешить действовать или дать какую-то задачку искусственному интеллекту, а где нам надо просто его остановить, выключить и сказать: "Нет, дорогой друг. Здесь начинается человек, и пусть это так и останется". Это решение будет определять будущее всей истории, связанной с искусственным интеллектом. Давайте все-таки разделять информацию, знания и все, что с этим связано и живого, думающего, чувствующего человека. Это моя личная позиция.

 – Форум Digital Science 2019 проходил в контексте Российско-Германского года научно-образовательных партнерств 2018-2020. Вы как цифровая компания пытались измерить, насколько тесны научные взаимоотношения между нашими странами? Что интересного есть в совместной науке?

 – Мы просто привели несколько примеров из тех областей, которыми занимались в Digital Science. В частности, мы вместе со старейшей научно-технологической компанией "Merck" измерили достаточно узкую область – точную медицину. Мы анализировали, что есть в России, что есть в Германии, и как это отражается на крупном игроке фармрынка. Как академические, предметные области и подобласти в точной медицине ложатся на практическое применение.

Мы постарались создать дополнительную площадку для взаимодействия коллег из России и Германии. Возможно, она будет полезна для научных фондов двух стран.

На форуме побывали представители всех основных научных фондов или научных ассоциаций. Приветствие нам сказал независимый директор управляющего комитета Max Planck Society Штефан фон Хольцбринк. Заместитель генерального директора Российского научного фонда Сергей Лебедев и заместитель директора по науке Российского фонда фундаментальных исследований, член-корреспондент РАН Игорь Шеремет рассказали о проектах фондов, также о своих проектах рассказали представители двух крупнейших финансирующих научных организаций Германии –

Ассоциации Гельмгольца и DFG. У всех перечисленных мной организаций есть какие-то совместные грантовые конкурсы, причем долгоиграющие. Для нас и вообще для науки такое сотрудничество – всегда плюс.

 – Расскажите об институте RoRi (Research on Research Institute). Почему его основали при участии Digital Science? В чем его задача?

– Наверное, первый такой институт исследования научной информации был основан в 1960 году Юджином Гарфилдом. Там составляли библиографические базы данных научных публикаций, индексировали их и определяли индекс цитируемости, импакт-фактор и другие статистические показатели научных работ.

Раньше подобные инициативы финансировались крупными компаниями. Например, компания, производящая или агрегирующая информацию, создавала некую лабораторию или институт, в котором изучается влияние этой научной информации на общество и на саму науку.

В RoRi другой подход, так же, как и в Dimensions. Важно, что институт основали не Digital Science, или Хольцбринк, а целая группа интересующихся этим вопросом фондов, университетов. Мы просто один из партнеров этого мероприятия. Вопросы научной информации будут изучаться RoRi не с точки зрения индустрии, а с точки зрения запросов от научных фондов или университетов.

– В 2019 году Digital Science по согласованию с Минобром открыла национальный тестовый доступ к платформе Dimensions для российских научно-образовательных и исследовательских организаций. Какие итоги, на Ваш взгляд? Какие ожидания есть?

 Доступ к платформе был открыт для 370 университетов, научных организаций РАН на 4,5 месяца. Это продолжительный срок. Нам было интересно посмотреть, как работают новые инструменты глубокого анализа, который отличается от традиционного подхода – от публикаций и цитирования. Важно было посмотреть, насколько будет востребована контекстная картинка исследований: где начинается финансирование; где происходит техтрансфер, то есть трансфер технологий, где происходят связи между патентной информацией, публикационной информацией, грантовой информацией; каким-то общественным резонансом тех или иных исследований. То есть поставить исследование в широкий контекст вокруг него – то, чего раньше никогда не было.

Все, кто участвовал в этом тестовом доступе, использовали систему достаточно активно. Мы увидели серьезную группу лидеров, как в РАН, так и университетском сообществе России, которые восприимчивы к новым инструментам, и находят в них существенную пользу.

Я знаю, что и министерство, и целый ряд институтов для принятия решений пользовались нашей платформой, дополнительно анализируя контекст, использовали ее в своих внутренних информационных замерах. Обратная связь была очень хорошая. Национальный доступ оказался полезен.

И еще один важный момент. В этом году продолжила свою работу Ведомственная комиссия по оценке научно-образовательных организаций Министерства образования и науки. По квоте бизнеса мы также участвовали в заседаниях этой Комиссии и видели, насколько Dimensions полезен при спорных вопросах по оценке той или иной организации, когда не хватает данных за пределами публикаций.

Например, когда есть публикации, а больше ничего нет, мы начинаем смотреть патенты, гранты – российские, зарубежные. И что касается зарубежных финансовых или патентных данных, это было просто крайне полезно. Мы смогли увидеть очень много такой информации, которую даже сами университеты или институты РАН в своих анкетах не заявляли, или заявляли частично. Таким образом, наша система действительно помогла принять определенные решения.

Именно недостаток информации ведет к неадекватности принятого решения. Если информации больше, и контекст виден лучше, гораздо проще понять, какие лаборатории, организации, ученых надо поддержать. А иначе как? Ну да, вот, допустим, ученые не опубликовались в журналах Scopus или Web of Science, зато у них огромное количество патентов, или они получили финансирование на создание каких-то проектов или прототипов. В публикационной сфере вы этого не сможете еще увидеть, работа только началась, а мы уже можем это посмотреть, оценить и сказать, что они на правильном пути. Комиссия это рассматривает и говорит: "Да, действительно, это так. Факты соответствуют". Это был практический, очень полезный, на мой взгляд, наш вклад в работу ведомственной комиссии.