Доцент кафедры информатики исторического факультета МГУ им. Ломоносова, кандидат исторических наук Андрей Володин читает в БФУ им. И. Канта «цифровым гуманитариям» курс по интеллектуальному поиску в Сети. В интервью kantiana.ru Андрей Юрьевич рассказал о том, как эффективно работать с поисковыми системами, в чём Яндекс превосходит Google, в каких специализированных базах данных лучше искать научную информацию и почему «цифровому гуманитарию» важно уметь работать руками.

— Андрей Юрьевич, что представляет собой интеллектуальный поиск в Сети?

 — Сейчас существует два способа поиска в интернете. Первый из них — горизонтальный. Это поиск в Яндексе, Google и других менее известных универсальных поисковых системах, которые стремятся охватить всё. С бытовой точки зрения этот поиск часто дает хороший результат. Особенно в стандартных ситуациях. Все ведь примерно одинаково заказывают пиццу.

Если мы говорим о профессиональном поиске, то он называется — вертикальный. Сегодня стало ясно, что надо ограничить количество ресурсов для поиска, но отбирать эти ресурсы следует по большому количеству критериев, чтобы добиться максимального качества. Поэтому известные специализированные базы, вроде Web of Science или Scopus, герметичны. То есть, никак не связаны с остальной Сетью. Они ищут из того, что было отобрано заранее. И такой поиск дает качественные результаты по связанным с научной деятельностью запросам. На занятиях мы со студентами сначала учимся добывать информацию в специализированных базах, а потом — общим поиском.

6R1A0775.jpg

— Почему именно такая последовательность?

 — Потому что, если вы уже умеете находить нужную информацию в ограниченных ресурсах, вам легче формулировать информационные потребности в огромном море данных.

— Можно ли найти специфическую, научную, информацию в общедоступных поисковых системах?

 — И да, и нет. Справочную информацию найти несложно, а вот, например, данные, которые собраны в рамках разных исследований или источники, вы, скорее всего, не найдете. Но там можно обнаружить то, что называется точкой входа. То есть, собственно специализированные базы. А дальше нужно уже искать внутри этих баз.

— Можете ли вы дать какие-то, пусть и самые общие рекомендации по поиску в обычных поисковых системах?

 — Первая рекомендация заключается в том, что перед тем, как приступить к поиску, нужно максимально четко сформулировать то, что по-научному называется информационной потребностью.

Ну вот, например, вам надо найти информацию по войне 1812 года. И вы должны четко определиться, какого рода эта информация должна быть. Может, вы хотите найти оригинальные исторические документы или исторические исследования, рецензии на книги и так далее.
Как правило, ищем просто справочную информацию. И чаще всего нам неинтересно, откуда она берётся. Но в действительности все факты имеют источник, есть исследователи, которые эти факты установили. И все это надо найти.

И после того, как мы максимально точно сформулировали нашу информационную потребность, можно приступать к поиску.
Но тут важно еще знать, как работают инструменты поисковика. Статистика говорит, что разного рода фильтрами пользуются всего около пяти процентов пользователей. А ведь поиск можно ограничить по времени, по языку, по конкретному ресурсу. Есть еще одна простая рекомендация. Чем больше слов в запросе, тем выше шанс найти то, что вам нужно.

6R1A0764.jpg

— Ну вот меня, допустим, интересует конкретный аспект войны 1812 года — расстановка сил перед ее началом. Где и как мне лучше всего искать информацию?

 — В этом случае я бы посоветовал пойти в научную электронную библиотеку elibrary.ru. Её кто-то хвалит, кто-то критикует, но спорить с тем, что это фантастический по количеству оцифрованного научного материала ресурс, сложно. Те, кто владеет иностранными языками, подойдет база jstor.org. Если вам нужно добыть информацию быстро, то в некоторых случаях вполне может подойти и Википедия, но я все-таки посоветовал бы обратить внимание на качественные энциклопедии. В сети есть оцифрованные версии Большой советской энциклопедии 30-70 годов. А теперь еще можно пользоваться и электронной Большой российской энциклопедией.

— В чем состоит специфика поиска в Яндексе, Гугле и других поисковых системах ?

 — Яндекс имеет существенные преимущества в использовании особенностей русского языка. В целом Яндекс — это удивительный пример в международной практике, потому что он до сих пор сохраняет половину национального рынка. В большинстве других стран Google давно съел местные поисковики. Но в целом базы у Google, конечно, больше, чем у Яндекса. Особенно, конечно, в англоязычном сегменте.
Проблема для местных пользователей заключается в том, что когда они набирают google.com, система перекидывает их на google.ru — то есть, ближе к той локации, в которой они находятся.

Для того, чтобы система вас не перекидывала, нужно применить один трюк — набить google.com /ncr. То есть, no country relocation. И тогда вы останетесь в google.com и будете пользоваться полноценной англоязычной базой, а не сокращенной, как на google.ru.
Еще бы рекомендовал обратить внимание на майкрософтовский поисковик Bing. Он у нас не очень популярен, потому что плохо работает с кириллицей. Но по объему данных, он второй в мире.

Ну, а в целом, для того, чтобы получить максимально полный результат, разумнее всего комбинировать поисковые системы. Базы у них пересекаются только примерно на 30 процентов, поэтому то, что не найдет один, вполне сможет отыскать другой.

6R1A0755.jpg

— Смогут ли историки и вообще гуманитарии обойтись без цифровизации?

 — Есть все основания полагать, что программирование станет второй грамотностью для гуманитариев. Программный язык будет таким же важным, как и иностранный. Потому что надо уметь формулировать задачи, уметь обращаться с большими корпусами данных. И в России на уровне магистратур гуманитарии уже начинают изучать программирование. Но информатика часто рассматривается просто как предмет. В итоге студент получает теоретические знания, может, например, перевести биты в байты, но совершенно не способен обработать сто тысяч разнородных записей. Надо научиться решить такие типовые задачи.

И это, уверяю вас, несложно. Речь не идет о том, что надо писать программу с нуля. Речь идет о том, чтобы уметь пользоваться разными элементами программирования. И бояться здесь, повторюсь, нечего. Мы же учим иностранные языки, умеем обращаться с мобильными интерфейсами. И никого это не удивляет.

— Насколько успешно в БФУ им. И. Канта идет подготовка гуманитариев нового типа?

 — БФУ им. И. Канта сейчас один из лидеров. Разумеется, и в ряде других российских не столичных вузах есть структуры подобные вашему Научно-исследовательскому центру социально-гуманитарной информатики, но главное преимущество программы БФУ в том, что здесь студенты работают руками. Они берут документы по первым переселенцам в архиве и переносят их в цифровую среду. И такой опыт, мне кажется, принципиален для современных людей, которые обучаются профессии.

Бытует мнение, что компьютер делает всё быстро. Это действительно так, но только в том случае, когда все базы подготовлены. Но создать их — это большой, сложный, кропотливый труд. Главным образом, как я уже сказал, ручной. Если говорить о планах, то речь может идти о внедрении в программе для «цифровых гуманитариев» элементов программирования. Это определенно повысит цену выпускников на рынке труда.