
Это действительно происходит неравномерно, рывками. Есть какие-то события, которые все меняют довольно сильно. Они, скорее, происходят в науке. А вот то, что происходит на рынке, то что видно людям, обычно происходит по времени несколько позже.
Вообще мне кажется, что резкий подъем нейронных сетей начался с 2012 года, когда они продемонстрировали свои преимущества перед другими методами машинного обучения в распознавания изображений. Обычные люди, конечно, в 2012 году понятия об этом не имели. А пару лет спустя появилось много прикладных приложений. В Яндексе, например, это распознавание изображений — поиск по картинке, когда можно все, что угодно сфотографировать и найти. И это стало заметно!
Чуть позже очень много ажиотажа было вокруг технологий распознавания лиц. А дальше случился ряд довольно значимых событий.
В начале – в игровой индустрии, когда в 2015 году программа AlphaGo выиграла у человека в го [китайская стратегическая настольная игра, по вариативности в разы превосходящая шахматы — МР]. Термин ИИ в нашу жизнь активно вошел именно тогда.
А в 2017ом году случилось очень важное событие: вышла статья с красивым названием “Attention Is All You Need”, где впервые был применен термин “трансформеры” [общее название нейросетевой архитектуры, которая лежит в основе современных подходов к анализу текстовой информации — МР]. Там описывалась архитектура обработки последовательностей, которая привела к существенному успеху именно в анализе текста. И снова фокус внимания сместился с компьютерного зрения на работу с текстом. Но в начале это было заметно лишь в технологии перевода: когда в 2017 году в Яндексе впервые применили для перевода “трансформеры”, перевод стал таким красивым и литературным, словно его сделал человек.
Чуть позже стали появляться многочисленные генеративные модели. В начале они были смешными, не очень полезными, но с ними было интересно разговаривать. И это ознаменовало эпоху расцвета персональных ассистентов. Вот наша Алиса [AI-ассистентвиртуальный голосовой помощник Яндекса — MP] как раз тоже взлетела на том, что с ней можно было просто болтать. Понимаете, не только решить какую-то конкретную задачу (а это она тоже умела очень хорошо), но и просто поговорить.
И мне кажется, что после этого было еще несколько волн таких успехов. Но тут важно понимать, что прорывы с точки зрения обычных людей начинается тогда, когда технологии преодолевают некий порог пригодности для прикладного применения. Казалось бы, и раньше модель говорила, стало лишь чуть-чуть лучше. Но этого “чуть-чуть” оказалось достаточно, чтобы люди решили, что вот теперь наконец “изобрели умный ИИ”. ну и стоит добавить, что темп развития технологий и продуктов на их основе, сейчас не снижается, а скорее наоборот, только нарастает. И благодаря этому ИИ остается на волне хайпа.

Загадывать очень тяжело. Уже не раз бывало, думаешь, ну, теперь уже все придумано, дальше ничего не произойдет. А на самом деле происходит бурный рост. Или наоборот: есть какие-то ожидания невероятного роста, а потом прогресс во что-то упирается и останавливается.
Мне кажется, из того, что я наблюдаю, что все только начинается. Сейчас мы в стадии, когда активное развитие будет продолжаться еще довольно долго. Но повторю, это не очень надежный прогноз, потому что уже через год все может оказаться совсем по-другому.
Был такой эпизод в истории Яндекса. Когда Google пришел в Россию, он начал довольно сильно отъедать у Яндекса долю рынка. Было страшновато! Были даже упаднические настроения. Нужно было как-то отыгрываться, нужно было улучшать качество поиска. И была применена собственная реализация технологии градиентного бустинга на решающих деревьях, которая называлась Матрикснет [метод машинного обучения, с помощью которого строится формула ранжирования Яндекса — MP]. Это позволило очень сильно улучшить качество поиска, и тренд поменялся: мы перестали проигрывать Google и начали отыгрывать долю рынка.
В конечном счете люди выбирают продукт, который качественно удовлетворяет их потребности. Мы хорошо понимаем, что доля скоррелирована с качеством продукта.
И да, тогда, 15 лет назад, технологии машинного обучения, или как мы сейчас называем технологии искусственного интеллекта, нас спасли.
К моему личному глубокому сожалению, предыдущий запрос Алиса пока не запоминает, а очень хотелось бы. Алиса помнит сессию. Пока идет сессия, диалог, пока она находится в контексте, она придерживается этого контекста. И это позволяет ей быть “умнее”, лучше отвечать на вопросы.
Конечно, любой поиск, и обращение к Алисе, были бы бесполезным, если бы не учитывались дополнительные параметры, разрешенные в настройках, например, геолокация. Ну, например, когда заказываешь пиццу, или спрашиваешь в какой кинотеатр пойти. Зачем показывать пиццерию или кинотеатр, которые находятся в другом районе или даже городе, это абсолютно бессмысленно.
Есть еще какие-то вещи, которые обычный нормальный поиск про пользователя учитывает. Ну, например, знание языка: если пользователь читает на другом языке, значит, можно показывать страницу на нем. Алиса будет все более и более персональной. То есть для каждого пользователя она будет немножко своей. Это было бы легко сделать в виде демо или прототипа. Но когда это сервис на десятки миллионов людей, это превращается в очень непростую инфраструктурную задачу.
Алиса их поймет, но тут важно, что если мы говорим о разных возрастных категориях, есть разница. Алиса по-разному общается с детьми и со взрослым. Просто хотя бы потому, что есть темы, которые неприемлемы для детей и приемлемы для взрослых. Такого, чтобы разделять пожилых и взрослых людей, нет, просто из контекста Алиса понимает, с кем она беседует в данный момент. На запросы пожилых людей она отвечает довольно удачно, и они с удовольствием с ней взаимодействуют.
Плюс к этому Алиса хорошо понимает людей, у которых есть некие затруднения с речью. Мы специально дообучали Алису на таких датасетах, чтобы люди с ограниченными возможностями тоже могли эффективно общаться с Алисой.
Конечно.
Мне почему-то кажется, что мы все прекрасно знаем, что умеет Алиса. Но вот например не все знают, что если обратиться к Алисе шепотом, она шепотом и ответит.

Могу сказать лишь то, что загадывать на 10 лет вперед — это дело крайне неблагодарное. Все меняется очень быстро и стремительно, и прогнозы, которые звучат сейчас, через 10 лет будут выглядеть очень наивными. Да что там через 10 лет… Через пару лет будут выглядеть наивными.
Но есть один устойчивый тренд, про который я могу сказать. Он у нас давно и весьма стабилен. Вообще наш Поиск — это не столько поиск информации интернете, сколько решение задачи. А задачи бывают разные. Есть навигационные, когда тебе нужно найти какой-то конкретный сайт. И для таких запросов, в целом, ничего не меняется.
А бывает, что человеку нужна информация. И вот здесь инновации внедряются постоянно. Они по чуть-чуть, понемножку, но меняют поиск. Появляются все более и более информативные и разнообразные ответы. Собирается информация из разных источников. Пишешь запрос, и видишь, что не надо никуда ходить, ответ — прямо перед тобой. Или когда нужно что-то купить, и интересует цена, наличие. Тебе уже не нужно переходить просто так по ссылке вхолостую, чтобы понимать, что там есть действительно то, что ты ищешь. В Поиске с Алисой появляются ответы, которые агрегируют информацию из различных маркетплейсов.
То есть Поиск – уже давно не просто поиск информации, а решение задачи пользователя.
Гораздо легче сказать, где она не используется. Хотя и тут я наверняка ошибусь. Буквально каждый день появляются новые применения. Думаю не ошибусь, если скажу что собственные генеративные нейросети работают в более чем 20 сервисах Яндекса. Помимо очевидного Поиска, она улучшает и составление объявлений в Яндекс.Маркете, в Картах, делает суммаризацию отзывов о местах, в машинном переводе, в поддержке, разумеется в Алисе – ее наверное стоило назвать в первую очередь.
Плюс к этому генеративные модели сейчас — хоть об этом мало говорят — невероятно улучшают качество рекомендаций, которые используются во множестве сервисов.
Отдельно стоит сказать про применение в рекламе идет давно. И это не только выбор релевантного рекламного объявления для показа, но и его создание.
Собственные модели мы используем везде, где видим возможность для роста качества сервисов.
Ну, вообще надо сказать, что в интернете всегда было много разных злоумышленников, спамеров, мошенников. Каждый день создается множество количество фишинговых сайтов. Есть много автосгенерированных сайтов-инфопомоек, которые создаются, чтобы притягивать трафик. И любая поисковая система тратит существенные усилия на то, чтобы оградить пользователя от всего этого.
И, конечно, когда появляются новые технологии, они одновременно приходят в руки и тем, кто защищается от нежелательного контента, и тем, кто нежелательный контент создает.
Что касается автосгенерированного текста, то эта проблема, довольно актуальна потому, что тексты сейчас генерируются очень хорошо. Тут надо, правда, подчеркнуть, что если текст автосгенерирован, это не означает автоматически что он плохой. Он может быть и хорошим и полезным, а может быть и бесполезный, как и текст, написанный человеком.
Если говорить о проблеме дипфейков, которая очень беспокоит людей, можно ли сказать, что мы часто с ними сталкиваемся в жизни? Вот я ни разу не видел дипфейк, который ввел бы меня в заблуждение. Это не значит, что этого нет, наверняка, кто-то видел. Просто мне кажется, что у нас пока больше опасений, чем реальных столкновений с проблемой, что, наверное, неплохо, потому что мы, в принципе, уже подготовлены: если вдруг незнакомый нам человек будет говорить по видеосвязи что-то странное, многие заподозрят, а не дипфейк ли это?
Ну и плюс, есть же еще такие методы борьбы, как определение источника информации. И у Яндекса тоже есть сервис, который подсказывает, чей это звонок,не спам ли это, стоит ли брать трубку? И это самая простая вещь, чтобы просто оградить от контакта с чем-то нежелательным. И, разумеется, в нашем браузере нейросети надежно защищают пользователя от вредоносных сайтов.
Все-таки важно не то, как она была сделана, а какая она. Даже в генерации всегда существует авторский вклад человека. Если у человека была мысль, которую ему было тяжело выразить, и он за несколько подходов, за несколько модификаций промпта получил результат, который его устраивает, он прочитал, сказал, да, вот это то, что я хотел сказать, это отличная мысль. Или если человек сгенерировал несколько изображений, выбрал то, которое подходит, разве это плохо, разве в этом нет авторского вклада? Ведь сгенерированное отражает человеческую мысль!
Да, есть совсем бессмысленные генераторы, которые без участия человека просто создают бесполезные тексты в попытках обмануть поисковую систему, и сделать так, чтобы эти тексты ранжировались интернет-поисковиками выше. Такое детектируется. У Яндекса есть детекторы, которые позволяют определить, сгенерированные это тексты или нет. Но решение по ранжированию принимается не по какому-то одному отдельному детектору, а по совокупности факторов.
Об этом сейчас очень много споров, очень много копий ломается, и сложно сказать, до чего мы все, люди, в этом месте договоримся.
Но мне кажется, что это вопрос решается на уровне каждого конкретного сервиса. Если сервис говорит, что все, что вы сгенерировали — ваше, значит так и есть. Если же сервис говорит: можете пользоваться, но при условии, что все что сгенерировано, не ваше — оно не ваше.
Но, правда, есть тоже одна очень важная оговорка: так как нейронная сеть при генерации чему-то подражает, чему-то что видела раньше, существует вероятность, что права контент, который она сгенерирует, уже кому-то принадлежат. Не на конкретный сгенерированный текст или изображение, а художественный образ, например. То есть говоришь, сгенерируй мне зверька с большими ушами. Генерирует Чебурашку. Думаешь, что можешь распечатать и использовать, а выясняется, что права на Чебурашку кому-то принадлежат уже.
Я рекомендую читателям перед коммерческим использованием сгенерированного нейросетью, во-первых, проверить, не нарушает ли этот контент чьи-то другие авторские права. А во-вторых, по возможности подписывать, обозначать, что это создано при использовании нейронных сетей. При написании авторского текста мы же ставим ссылки на источники, которые мы использовали при работе над материалом. Так и в случае с нейросетью — можно указать ее в качестве источника информации. Но повторюсь, это нужно не всегда, нужно читать условия конкретного сервиса. Если пользователь сгенерировал нейронной сетью обычное поздравление знакомому с днем рождения или если собирается печатать картинку на футболках для продажи — это разные истории.

Это и будущее, и настоящее. Что такое агент? Агент – это программа, которая способна совершать какие-то действия во внешней среде. Если подумать, то экосистемы умного дома — это тоже в некотором виде набор агентов. Например, такой маленький и примитивный агент, который умеет включать свет.
Наш Поиск с Алисой, который, как я уже сказал, развивается в ту сторону решения пользовательских задач — тоже своего рода агент. Конечно, доля “агентности” будет расти, потому что есть огромное количество рутинных операций, которые мы уже готовы доверить системам.
И, согласитесь, иногда выглядит глупо, когда ты говоришь текстовой модели: мне нужно решить такую-то задачу, а нейросеть по шагам описывает, что нужно сделать. И кажется, ну раз такая умная, сделай уже сама, буквально один шажок остался.
Мне кажется, агентные системы абсолютно точно войдут в нашу жизнь, мы будем ими пользоваться. Не уверен, что это будет происходить очень быстро, потому что всегда есть недоверие, опасения по поводу ошибок. Особенно если речь идет о выполнении важных задач. Но в каких-то более-менее простых, однотипных действиях, где все можно сделать настолько надежно, что ошибки не будет, либо там, где у нас довольно высокая толерантность к ошибкам, агенты будут входить в нашу жизнь. Я думаю, возможно, агентность — это один из самых больших трендов следующего года.
Я говорю “возможно”, несмотря на текущую очевидность того, что ИИ-агенты точно будут в тренде, а я не исключаю возможности появления чего-то более совершенного, что отодвинет ИИ-агентов на второй план.
Я не сомневаюсь, что эксперимента ради появятся какие-то большие проекты, про которые будут говорить: “Это целиком и полностью сделал ИИ, без вмешательства человека”. Но это будут, скорее, рекламные истории. Потому что на практике, если мы говорим о серьезных больших проектах, где большая ответственность, гораздо лучше, если их создает компетентный специалист, использующий при этом в полной мере технологии искусственного интеллекта. Пусть даже 99% кода будет сгенерировано искусственным интеллектом, все-таки пусть человек правит, направляет в особо критических местах, смотрит, контролирует. Так получится лучше, надежнее и эффективнее.
Вот как раз “искры и озарения” он уже, мне кажется, вполне себе демонстрирует и делает это не хуже человека. Я многократно выдвигал гипотезы, что искусственный интеллект не сможет сделать и каждый раз они не оправдывались. Прямо сейчас у искусственного интеллекта, мне кажется, не очень здорово получается шутить и иронизировать. Но, давайте честно, это и не у всех людей хорошо получается. Скажем так, просто есть люди, которые умеют делать это лучше искусственного интеллекта.
А еще у нас, людей, довольно серьезные преимущества, что мы плотно взаимодействуем с реальным физическим миром, и поэтому нам лучше дается решение любых задач, где требуется знание о нем. Знание, которое нельзя настолько подробно и полно описать текстом. Тут у человека есть преимущество, и оно сохранится надолго. По крайней мере, пока не появятся роботы и устройства, которые что-то щупают, нюхают и собирают информацию об окружающем мире подобным образом.

Мне кажется, если переместиться в прошлое, чтобы показать людям современные генеративные нейронные сети и сервисы на их базе, и спросить: “А это AGI?”, ответ будет утвердительным. А сейчас это уже не кажется чем-то запредельным, нам нужно что-то более совершенное.
Полность, конечно, человек не заменим. Да и нет такой цели. Я бы сказал так: меньше всего искусственный интеллект способен заменить самых лучших специалистов в своей области. Тех, кто способен через, собственно, искусственный интеллект масштабировать свои знания и умения. Тех же, кто умеет выполнять лишь рутинные операции в своей области — их искусственный интеллект в этой области сможет заменить.
Для того, чтобы быть эффективным в жизни, мне кажется, нужно договориться с собой и понять, что мы живем в настолько быстро изменяющемся мире, что нужно быть готовым меняться всю жизнь, учиться всю жизнь. Не считать, что ты, в молодые годы получивший некоторый багаж знаний, проживешь с ним всю оставшуюся жизнь. Кажется, что современный мир не такой. Он гораздо интереснее, можно усваивать новые знания, осваивать новые профессии. Наверняка искусственный интеллект для многих профессий сильно понизит спрос. Но при этом он же создаст много новых профессий.
Например – интернет, который активно развивается 30 с небольшим лет. Какие профессии исчезли в связи с развитиеминтернета? Вспомнить будет не так просто. А какие профессии появились? И тут нам будет гораздо уже легче ответить.
Мне кажется, что с искусственным интеллектом произойдет примерно то же самое. Со временем спрос на некоторые профессии будет угасать, мне бы сейчас не хотелось угадывать, что именно это будет. Но появится много новых специальностей.
Ну, а в чем преимущество вайб-кодеров перед обычным разработчиком? Разве что в том, что их больше? Но все равно выбирать будут квалифицированных специалистов.
Просто, возвращаясь к предыдущей теме, хочется еще раз подчеркнут: сегодня недостаточно просто окончить учебное заведение, чтобы работать программистом, или переводчиком, или маркетологом, в общем — кем угодно. Нужно обладать знаниями, которые делают тебя востребованным, нужным и, если не уникальным, то по крайней мере редким специалистом. Таких мало. Такие всем нужны. Такие всегда будут очень-очень важны.
Для серьезных инвестиционных решений точно нет. Но даже эта рекомендация не является инвестиционной рекомендацией.
Все только начинается.
Россия – часть мира.
Особенно это верно, если мы говорим про науку, про развитие высоких технологий, здесь все в мире очень-очень связано.
Еще один выходной день в неделю.
Мы станем еще более зависимыми от компьютеров.
Я так не думаю.
Да, хотя не должен был бы, потому что для диверсификации рисков стоит инвестировать во что-нибудь другое.
DeepSeek.
DeepSeek.
DeepSeek.
Я пользуюсь чатом с Алисой на YandexGPT. Жалко, про Claude или про Perplexety не спросили. Для меня они интереснее, чем DeepSeek. И вообще мой выбор не только по “умности” систем (она приравнивается), но и по удобству использования.
Биография респондента
Александр Крайнов – директор по развитию технологий искусственного интеллекта компанииЯндекс.
Окончил Московский институт радиотехники, электроники и автоматики (МИРЭА). Первым местом работы был временный научный коллектив «Сверхматрица», где занимался машинным проектированием топологии сверхпроводниковых матриц.
До Яндекса трудился в компании «SeeStorm» - дочернем подразделении компании SPIRIT DSP в должности директора по продуктам. Занимался алгоритмами сжатия и передачи звука и видео, распознаванием речи, технологиями видеоконференций, компьютерным зрением и 3D-моделированием.
В Яндексе на протяжении 9 лет возглавлял разработку компьютерного зрения.
Член экспертного совета научной премии Яндекса. Член попечительского совета и руководитель магистратуры ИТМО. Председатель научного совета Альянса по развитию ИИ. Председатель научного совета национальной премии Лидеры ИИ.
в удобном формате
