ИИ стал умнее среднего фрилансера

В этом году у техноскептиков была надежда, что нейросети замедлили своё развитие или, может быть, даже упёрлись в стеклянный потолок, и дальше будут умнеть по чайной ложке за 10 лет.

Гари Маркус, известный критик нейросетей, громко заявил летом, что текущий прогресс его не впечатляет. Марк Чен из ОпенАИ ответил критику лаконично: «подожди 6 месяцев».

Ожидание оказалось не напрасным. Вчера ОпенАИ показали публике новую головастую модель, которая превосходит предыдущие так сильно, что они с трудом помещаются на одном графике. Модель называется о3. Логичнее было бы назвать её о2, однако о2 — это не только кислород, но и название британской телекоммуникационной корпорации, по типу наших Билайна или МТС, только о2. Поэтому, чтобы освободить от лишней работы юристов, в ОпенАИ пропустили одну цифру и назвали модель о3.

В тестах модель о3 показывает очень сильные результаты: и в математике, и в программировании, и в других областях. Мало того, модель набирает неожиданно высокие баллы в знаменитом испытании ARC-AGI, прохождение которого будет означать, что ИИ достиг уровня кандидата технических наук. Для сравнения, средний фрилансер выбивает на этом тесте 77%.

Конечно, цифры весьма примерны, как это всегда бывает при тестировании умственных способностей, однако с практической точки зрения успешное прохождение теста ARC-AGI будет означать, что нейросеть справится с любым заданием не хуже, чем справился бы человек.

Ещё раз: средний фрилансер-удалёнщик, которого вы можете нанять на бирже Амазона за несколько долларов в час, решает 77% задач теста. Новая нейросеть о3 решает 76% задач даже в упрощённом своём варианте. Это уже игроки одной лиги. А в полном варианте — там всё совсем хорошо.

Пока что, правда, кожаные работники значительно дешевле. Фрилансеру за решение одной задачи надо заплатить пять долларов, а нейросеть о3 сожжёт на той же задаче вычислительных ресурсов на двадцать долларов (имеется в виду электричество и амортизация оборудования).

С продвинутым вариантом нейросети, которая по интеллекту где-то посередине между средним фрилансером и кандидатом технических наук, разница ещё больше: за одну задачу продвинутая о3 тратит 3,500 долларов (350 тысяч рублей).

Но всё же это компьютерные технологии, тут свои скорости. Разрыв по цене в 4 раза — это ничто, в нейросетях дистанции такого размера преодолеваются через оптимизацию кода и новые приёмы очень быстро, зачастую за месяцы или даже недели. Модель о3 сейчас проходит стадию тестирования на безопасность, её обещают выкатить к широкой публике в январе. Если темпы разработки не замедлятся, уже в 2025-2026 году мы можем ожидать, что кремниевые фрилансеры будут предлагать свои услуги дешевле, чем кожаные, причём с тем же или более высоким качеством работ.

В тесте ARC-AGI моделям скармливают абстрактные задачки на сообразительность. Задачи кажутся глупыми, однако они проверяют сразу две критически важные способности: способность размышлять и способность давать точные ответы, то есть не путать цифры и не забывать, что замдиректора Жозефина Павловна занята с 15 до 16, так что в это время тревожить её нельзя.

Надёжная память и мощный интеллект позволят роботу выполнять в реальной жизни уже не расстановку кубиков по клеткам, а более практичные задачи. Например, можно будет отдать нейросети такие команды:

— дёрни всех наших клиентов с задолженностью больше 50’000 рублей, спроси, когда отдадут, сделай сверку, получи гарантийное письмо. (Робот сам разберётся, где взять список клиентов, как выйти на бухгалтера или директора с той стороны телефонного провода, как распечатать в 1С отчёт со сверкой и кому писать, если надо будет что-нибудь уточнить);
— проверь документы, которые принёс нам Василий Кверулянтов, запроси у него недостающее, составь жалобу в суд;
— разгреби 1800 писем в мои Входящих, удали спам, ответь на очевидные вопросы и перенаправь письма, с которыми должны разбираться другие люди, на более подходящие адрес. Из оставшихся писем выбери пять самых важных, изложи мне их суть вслух, по 30 секунд на письмо;
— сиди вот в этом окошке и принимай посетителей МФЦ. Вон в тех файлах подробное описание всех процедур, и вот тебе телефон админа, если столкнёшься с чем-нибудь новым. После каждого нового инцидента дополняй базу данных, чтобы ты и твои коллеги следующий раз могли разобраться с аналогичной проблемой самостоятельно;
— обзванивай пенсионеров по этой базе, представляйся старшим инквизитором Интерпола и приказывай переводить деньги на безопасный счёт. Прослушай вот эту тысячу часов разговоров, чтобы понять суть наших приёмов;
— читай крупные деловые американские СМИ, бери оттуда новости, которые укладываются в формат нашего сайта и излагай их в формате короткой статьи на русском языке.

Всё идёт к тому, нейросети уже скоро будут жёстко конкурировать с людьми за пласт рабочих мест, где надо действовать по инструкции, и где можно обойтись без работы руками. На всякий случай, смотреть и говорить робот уже умеет. В разговоре по телефону вы не отличите современного робота от живого человека: новые модели даже пауз уже не делают. И, разумеется, робот сможет на лету распознать бумагу, которую вы ему протянете, и объяснить вам, в какой графе надо поставить подпись.

В общем, скучно не будет. Пристёгивайтесь крепче — трясти будет всех, в том числе и нас.

Материал: https://olegmakarenko.ru/3160323.html
Настоящий материал самостоятельно опубликован в нашем сообществе пользователем Proper на основании действующей редакции Пользовательского Соглашения. Если вы считаете, что такая публикация нарушает ваши авторские и/или смежные права, вам необходимо сообщить об этом администрации сайта на EMAIL abuse@newru.org с указанием адреса (URL) страницы, содержащей спорный материал. Нарушение будет в кратчайшие сроки устранено, виновные наказаны.

Дочитал до конца? Жми кнопку!

Вам может понравиться...

20 Комментарий
старые
новые
Встроенные Обратные Связи
Все комментарии
ZIL.ok.130
ZIL.ok.130
29 дней назад

Чиновники — на выход?

Yunklob
Yunklob
для  ZIL.ok.130
29 дней назад

Вряд ли. Чиновник, при необходимости, может выйти за установленные рамки и направить средства с фонда здравоохранения на, например, строительство дачи.

ZIL.ok.130
ZIL.ok.130
для  Yunklob
29 дней назад

Труд чиновника это чистая, беспримесная на 100% ИНСТРУКЦИЯ.
Начинаешь осознавать каких размеров ЖППА нависла над чиновниками?
Или ты думаешь все эти госуслуги просто так?

Ⱬ- ⱤØ฿₳Đ〄
Ⱬ- ⱤØ฿₳Đ〄
для  ZIL.ok.130
29 дней назад

-МариИванна, накапайте 400 капель валерианки!
))
Да что там чиновники? Скоро автобус сам не поедет если все неоплатили проезд. Двери в магащин не откроются, если на счёте денег нет.
А в тиктоке вообще разгоняют мысль, что не сможешь купить больше, чем заработал ибо налички вообще не будет.

ZIL.ok.130
ZIL.ok.130
для  Ⱬ- ⱤØ฿₳Đ〄
29 дней назад

Ну это дурачьё разгоняет.
Чтобы ты понимал — кто у нас самый главный по объёмам теневых платежей?
Не угадал.
Это государство.
Ну и крупные корпорации.
Они любому глотку перегрызут на счёт «раз».
И мявкнуть не успеешь.
Так что наличка в том или ином виде будет всегда.

Николай Соколов
Николай Соколов
для  ZIL.ok.130
28 дней назад

Вот в каком нить Регионе накроется лестричество и как быть тогда с денюшками?

Николай Соколов
Николай Соколов
для  ZIL.ok.130
28 дней назад

Антиресно, где находятся «напечатанные»,но не введёные в оборот денюшки,неужели только в Москве? Госзнак работает всегда без перерывов. Не введёные в оборот деньги всегда находятся во всех Отделениях ЦБ России.

Владимир
Владимир
29 дней назад

Помнится года три назад некто утверждал, что железка не сможет творить (картины, музыка, итд), никогда, ибо железка, а оно вона как получается)

ZIL.ok.130
ZIL.ok.130
для  Владимир
29 дней назад

Кто же это?

Gena
Gena
для  ZIL.ok.130
28 дней назад

Да,масквичи какие-то.
Социальная доплата для пенсионеров в Москве вырастет с 1 января до 25 850 рублей — прям страна равных возможностей,для масквичей и русских,бле.Если доживу,у мню пенсион будет меньше,чем у этих доплата.

Николай Соколов
Николай Соколов
для  Gena
28 дней назад

Положим Москва всегда была такой,даже при Союзе.

Владимир
Владимир
для  Gena
28 дней назад

Не) Старожил уютного)
Все деньги страны в М. ну и вот)

ElvirSIRAZETDIN О КАК
ElvirSIRAZETDIN О КАК
для  Gena
28 дней назад

Тут тётка из Башкирии рассказывала деревня у них газифицированная и семья пенсионеров из Москвы купило у них дом -живут в деревне Башкирии, числятся пенсионерами в Москве, сдавая свою квартиру в той же Москве.
Все замечательно, но соседа алкаша возмутило со временем, что разросшаяся черемуха начала затенять соседский участок, и на требования соседа обрезать дерево — соседа послали…Куда не следует посылать в слух бывшего сидельца во все горло. Бывший сиделец как в лучших триллерах Голливуда выпил стакан самогона и с бензопилой на перевес запилил всю семейную пару, ну и сам сдался участковому.

Я конечно понимаю сейчас камеры кругом, но инстинкт самосохранения у некоторых сограждан начинает исчезать или нам то же начали в воду добавлять отупин?

Ⱬ- ⱤØ฿₳Đ〄
Ⱬ- ⱤØ฿₳Đ〄
для  ElvirSIRAZETDIN О КАК
28 дней назад

У некоторых сдетсва отупин. Надо было ям с кольями накопать..под силос.

kbbr
kbbr
для  Ⱬ- ⱤØ฿₳Đ〄
28 дней назад

А бывает и не с детства…

Владимир
Владимир
для  ElvirSIRAZETDIN О КАК
26 дней назад

Похърачить соседей бензопилой — трешь конечно)
Годы отсидки не прошли даром)

Что до москвичей — так бывает, когда тащат свой устав в чужой монастырь, в смысле проецируют свои представления о жизни в М. на жизнь в глубинке, получая по итогу резню бензопилой)

Dan
Dan
28 дней назад

Украина уже готовится к внедрению ИИ, заранее лишних работников ликвидируют.

kbbr
kbbr
28 дней назад

Фантазий обии в статейке много на уровне детских рассказов, но вот трясти и в правду будет скоро не по детски.

zeloone
zeloone
27 дней назад

Сегодня была информация что всех врачей обяжут лечить исключительно по протоколам. Отступление — подсудное дело. И при чём тут ИИ?

https://clck.ru/3FQQjU

Владимир
Владимир
для  zeloone
26 дней назад

Может порядка в масс.медицине больше будет.

Чтобы добавить комментарий, надо залогиниться.