ИИ стал умнее среднего фрилансера

В этом году у техноскептиков была надежда, что нейросети замедлили своё развитие или, может быть, даже упёрлись в стеклянный потолок, и дальше будут умнеть по чайной ложке за 10 лет.

Гари Маркус, известный критик нейросетей, громко заявил летом, что текущий прогресс его не впечатляет. Марк Чен из ОпенАИ ответил критику лаконично: «подожди 6 месяцев».

Ожидание оказалось не напрасным. Вчера ОпенАИ показали публике новую головастую модель, которая превосходит предыдущие так сильно, что они с трудом помещаются на одном графике. Модель называется о3. Логичнее было бы назвать её о2, однако о2 — это не только кислород, но и название британской телекоммуникационной корпорации, по типу наших Билайна или МТС, только о2. Поэтому, чтобы освободить от лишней работы юристов, в ОпенАИ пропустили одну цифру и назвали модель о3.

В тестах модель о3 показывает очень сильные результаты: и в математике, и в программировании, и в других областях. Мало того, модель набирает неожиданно высокие баллы в знаменитом испытании ARC-AGI, прохождение которого будет означать, что ИИ достиг уровня кандидата технических наук. Для сравнения, средний фрилансер выбивает на этом тесте 77%.

Конечно, цифры весьма примерны, как это всегда бывает при тестировании умственных способностей, однако с практической точки зрения успешное прохождение теста ARC-AGI будет означать, что нейросеть справится с любым заданием не хуже, чем справился бы человек.

Ещё раз: средний фрилансер-удалёнщик, которого вы можете нанять на бирже Амазона за несколько долларов в час, решает 77% задач теста. Новая нейросеть о3 решает 76% задач даже в упрощённом своём варианте. Это уже игроки одной лиги. А в полном варианте — там всё совсем хорошо.

Пока что, правда, кожаные работники значительно дешевле. Фрилансеру за решение одной задачи надо заплатить пять долларов, а нейросеть о3 сожжёт на той же задаче вычислительных ресурсов на двадцать долларов (имеется в виду электричество и амортизация оборудования).

С продвинутым вариантом нейросети, которая по интеллекту где-то посередине между средним фрилансером и кандидатом технических наук, разница ещё больше: за одну задачу продвинутая о3 тратит 3,500 долларов (350 тысяч рублей).

Но всё же это компьютерные технологии, тут свои скорости. Разрыв по цене в 4 раза — это ничто, в нейросетях дистанции такого размера преодолеваются через оптимизацию кода и новые приёмы очень быстро, зачастую за месяцы или даже недели. Модель о3 сейчас проходит стадию тестирования на безопасность, её обещают выкатить к широкой публике в январе. Если темпы разработки не замедлятся, уже в 2025-2026 году мы можем ожидать, что кремниевые фрилансеры будут предлагать свои услуги дешевле, чем кожаные, причём с тем же или более высоким качеством работ.

В тесте ARC-AGI моделям скармливают абстрактные задачки на сообразительность. Задачи кажутся глупыми, однако они проверяют сразу две критически важные способности: способность размышлять и способность давать точные ответы, то есть не путать цифры и не забывать, что замдиректора Жозефина Павловна занята с 15 до 16, так что в это время тревожить её нельзя.

Надёжная память и мощный интеллект позволят роботу выполнять в реальной жизни уже не расстановку кубиков по клеткам, а более практичные задачи. Например, можно будет отдать нейросети такие команды:

— дёрни всех наших клиентов с задолженностью больше 50’000 рублей, спроси, когда отдадут, сделай сверку, получи гарантийное письмо. (Робот сам разберётся, где взять список клиентов, как выйти на бухгалтера или директора с той стороны телефонного провода, как распечатать в 1С отчёт со сверкой и кому писать, если надо будет что-нибудь уточнить);
— проверь документы, которые принёс нам Василий Кверулянтов, запроси у него недостающее, составь жалобу в суд;
— разгреби 1800 писем в мои Входящих, удали спам, ответь на очевидные вопросы и перенаправь письма, с которыми должны разбираться другие люди, на более подходящие адрес. Из оставшихся писем выбери пять самых важных, изложи мне их суть вслух, по 30 секунд на письмо;
— сиди вот в этом окошке и принимай посетителей МФЦ. Вон в тех файлах подробное описание всех процедур, и вот тебе телефон админа, если столкнёшься с чем-нибудь новым. После каждого нового инцидента дополняй базу данных, чтобы ты и твои коллеги следующий раз могли разобраться с аналогичной проблемой самостоятельно;
— обзванивай пенсионеров по этой базе, представляйся старшим инквизитором Интерпола и приказывай переводить деньги на безопасный счёт. Прослушай вот эту тысячу часов разговоров, чтобы понять суть наших приёмов;
— читай крупные деловые американские СМИ, бери оттуда новости, которые укладываются в формат нашего сайта и излагай их в формате короткой статьи на русском языке.

Всё идёт к тому, нейросети уже скоро будут жёстко конкурировать с людьми за пласт рабочих мест, где надо действовать по инструкции, и где можно обойтись без работы руками. На всякий случай, смотреть и говорить робот уже умеет. В разговоре по телефону вы не отличите современного робота от живого человека: новые модели даже пауз уже не делают. И, разумеется, робот сможет на лету распознать бумагу, которую вы ему протянете, и объяснить вам, в какой графе надо поставить подпись.

В общем, скучно не будет. Пристёгивайтесь крепче — трясти будет всех, в том числе и нас.

Материал: https://olegmakarenko.ru/3160323.html
Настоящий материал самостоятельно опубликован в нашем сообществе пользователем Proper на основании действующей редакции Пользовательского Соглашения. Если вы считаете, что такая публикация нарушает ваши авторские и/или смежные права, вам необходимо сообщить об этом администрации сайта на EMAIL abuse@newru.org с указанием адреса (URL) страницы, содержащей спорный материал. Нарушение будет в кратчайшие сроки устранено, виновные наказаны.

Дочитал до конца? Жми кнопку!

Вам может понравиться...

20 Комментарий
старые
новые
Встроенные Обратные Связи
Все комментарии
ZIL.ok.130
ZIL.ok.130
1 год назад

Чиновники — на выход?

Yunklob
Yunklob
для  ZIL.ok.130
1 год назад

Вряд ли. Чиновник, при необходимости, может выйти за установленные рамки и направить средства с фонда здравоохранения на, например, строительство дачи.

ZIL.ok.130
ZIL.ok.130
для  Yunklob
1 год назад

Труд чиновника это чистая, беспримесная на 100% ИНСТРУКЦИЯ.
Начинаешь осознавать каких размеров ЖППА нависла над чиновниками?
Или ты думаешь все эти госуслуги просто так?

☭Ⱬ- ⱤØ฿₳Đ〄
☭Ⱬ- ⱤØ฿₳Đ〄
для  ZIL.ok.130
1 год назад

-МариИванна, накапайте 400 капель валерианки!
))
Да что там чиновники? Скоро автобус сам не поедет если все неоплатили проезд. Двери в магащин не откроются, если на счёте денег нет.
А в тиктоке вообще разгоняют мысль, что не сможешь купить больше, чем заработал ибо налички вообще не будет.

ZIL.ok.130
ZIL.ok.130
для  ☭Ⱬ- ⱤØ฿₳Đ〄
1 год назад

Ну это дурачьё разгоняет.
Чтобы ты понимал — кто у нас самый главный по объёмам теневых платежей?
Не угадал.
Это государство.
Ну и крупные корпорации.
Они любому глотку перегрызут на счёт «раз».
И мявкнуть не успеешь.
Так что наличка в том или ином виде будет всегда.

Николай Соколов
Николай Соколов
для  ZIL.ok.130
1 год назад

Вот в каком нить Регионе накроется лестричество и как быть тогда с денюшками?

Николай Соколов
Николай Соколов
для  ZIL.ok.130
1 год назад

Антиресно, где находятся «напечатанные»,но не введёные в оборот денюшки,неужели только в Москве? Госзнак работает всегда без перерывов. Не введёные в оборот деньги всегда находятся во всех Отделениях ЦБ России.

Владимир
Владимир
1 год назад

Помнится года три назад некто утверждал, что железка не сможет творить (картины, музыка, итд), никогда, ибо железка, а оно вона как получается)

ZIL.ok.130
ZIL.ok.130
для  Владимир
1 год назад

Кто же это?

Gena
Gena
для  ZIL.ok.130
1 год назад

Да,масквичи какие-то.
Социальная доплата для пенсионеров в Москве вырастет с 1 января до 25 850 рублей — прям страна равных возможностей,для масквичей и русских,бле.Если доживу,у мню пенсион будет меньше,чем у этих доплата.

Николай Соколов
Николай Соколов
для  Gena
1 год назад

Положим Москва всегда была такой,даже при Союзе.

Владимир
Владимир
для  Gena
1 год назад

Не) Старожил уютного)
Все деньги страны в М. ну и вот)

ElvirSIRAZETDIN О КАК
ElvirSIRAZETDIN О КАК
для  Gena
1 год назад

Тут тётка из Башкирии рассказывала деревня у них газифицированная и семья пенсионеров из Москвы купило у них дом -живут в деревне Башкирии, числятся пенсионерами в Москве, сдавая свою квартиру в той же Москве.
Все замечательно, но соседа алкаша возмутило со временем, что разросшаяся черемуха начала затенять соседский участок, и на требования соседа обрезать дерево — соседа послали…Куда не следует посылать в слух бывшего сидельца во все горло. Бывший сиделец как в лучших триллерах Голливуда выпил стакан самогона и с бензопилой на перевес запилил всю семейную пару, ну и сам сдался участковому.

Я конечно понимаю сейчас камеры кругом, но инстинкт самосохранения у некоторых сограждан начинает исчезать или нам то же начали в воду добавлять отупин?

☭Ⱬ- ⱤØ฿₳Đ〄
☭Ⱬ- ⱤØ฿₳Đ〄
для  ElvirSIRAZETDIN О КАК
1 год назад

У некоторых сдетсва отупин. Надо было ям с кольями накопать..под силос.

kbbr
kbbr
для  ☭Ⱬ- ⱤØ฿₳Đ〄
1 год назад

А бывает и не с детства…

Владимир
Владимир
для  ElvirSIRAZETDIN О КАК
1 год назад

Похърачить соседей бензопилой — трешь конечно)
Годы отсидки не прошли даром)

Что до москвичей — так бывает, когда тащат свой устав в чужой монастырь, в смысле проецируют свои представления о жизни в М. на жизнь в глубинке, получая по итогу резню бензопилой)

Dan
Dan
1 год назад

Украина уже готовится к внедрению ИИ, заранее лишних работников ликвидируют.

kbbr
kbbr
1 год назад

Фантазий обии в статейке много на уровне детских рассказов, но вот трясти и в правду будет скоро не по детски.

zeloone
zeloone
1 год назад

Сегодня была информация что всех врачей обяжут лечить исключительно по протоколам. Отступление — подсудное дело. И при чём тут ИИ?

https://clck.ru/3FQQjU

Владимир
Владимир
для  zeloone
1 год назад

Может порядка в масс.медицине больше будет.

Чтобы добавить комментарий, надо залогиниться.