Предсказания сбываются
Nov. 15th, 2024 02:37 pmПочти год назад ВПС сказал:
Когда кончатся данные придется делать более умные модели, как когда-то и собирались.
Многие, в том числе и специалисты, не будем показывать пальцем, тогда не согласились, что данные скоро кончатся. Fast forward to this week:
Подъехал первый серьезный тревожный звоночек о том, что потолок нынешней парадигмы создания ИИ уже очень близко. На предыдущие, несерьезные, от «вечных» ИИ-скептиков, можно было не обращать внимания. Но свежая статья в ”The Information” описывает обстановку внутри лидера индустрии: ”OpenAI”.
1. Готовящаяся модель следующего поколения, под кодовым названием ”Orion”, превзошла по своим способностям нынешнюю GPT-4. Однако скачок в способностях оказался гораздо меньше, чем при переходе от GPT-3 к GPT-4. Судя по всему, это стало неприятным сюрпризом для команды.
2. Некоторые исследователи, работающие над моделью, предполагают, что ”Orion” НЕ даёт надежных улучшений по сравнению с GPT-4 в отдельных областях. Улучшения наблюдаются в языковых задачах. Но не в программировании — критически важной сфере для практического внедрения языковых моделей.
3. Стоимость работы “Orion” выше, чем GPT-4 – что явно указывает на то, что размеры “Orion” больше (см. ИИ-экспоненту №1).
4. Дефицит высококачественных данных для обучения моделей потребовал создания в ”OpenAI” отдельной команды для работы над этой проблемой.
Следущее поколение БЯМ вполне может стать последним, в крайнем случае предпоследним. Дальше будет что-то другое. Или отказ от амбиций разработать настоящий ИИ с переходом на "малые" специализированные модели типа "доктор" или "программист". Или таки придется делать умные модели. В конечном счете все равно придется.
Когда кончатся данные придется делать более умные модели, как когда-то и собирались.
Многие, в том числе и специалисты, не будем показывать пальцем, тогда не согласились, что данные скоро кончатся. Fast forward to this week:
Подъехал первый серьезный тревожный звоночек о том, что потолок нынешней парадигмы создания ИИ уже очень близко. На предыдущие, несерьезные, от «вечных» ИИ-скептиков, можно было не обращать внимания. Но свежая статья в ”The Information” описывает обстановку внутри лидера индустрии: ”OpenAI”.
1. Готовящаяся модель следующего поколения, под кодовым названием ”Orion”, превзошла по своим способностям нынешнюю GPT-4. Однако скачок в способностях оказался гораздо меньше, чем при переходе от GPT-3 к GPT-4. Судя по всему, это стало неприятным сюрпризом для команды.
2. Некоторые исследователи, работающие над моделью, предполагают, что ”Orion” НЕ даёт надежных улучшений по сравнению с GPT-4 в отдельных областях. Улучшения наблюдаются в языковых задачах. Но не в программировании — критически важной сфере для практического внедрения языковых моделей.
3. Стоимость работы “Orion” выше, чем GPT-4 – что явно указывает на то, что размеры “Orion” больше (см. ИИ-экспоненту №1).
4. Дефицит высококачественных данных для обучения моделей потребовал создания в ”OpenAI” отдельной команды для работы над этой проблемой.
Следущее поколение БЯМ вполне может стать последним, в крайнем случае предпоследним. Дальше будет что-то другое. Или отказ от амбиций разработать настоящий ИИ с переходом на "малые" специализированные модели типа "доктор" или "программист". Или таки придется делать умные модели. В конечном счете все равно придется.
no subject
Date: 2024-11-15 08:07 pm (UTC)no subject
Date: 2024-11-15 10:31 pm (UTC)That the progress already slowed down looks more like a fact than a conjecture. See also recent article on BBG:
https://www.bloomberg.com/news/articles/2024-11-13/openai-google-and-anthropic-are-struggling-to-build-more-advanced-ai
no subject
Date: 2024-11-16 12:30 am (UTC)I think progress last few years has been miraculous. Even if a few big model runs by OpenAI/Antropic failed, so what?
no subject
Date: 2024-11-16 04:24 pm (UTC)Of course the progress has been miraculous. And maybe they hit the wall now, or close to it. We'll see soon enough.
no subject
Date: 2024-11-16 08:01 pm (UTC)Either way a few months pause is nothing special. Of course, as a company, one would hate to waste $100mil and several months training a useless model, but in the large scheme of things it is nothing.
If there is no progress in the next 2-3 years, we can discuss :)
no subject
Date: 2024-11-16 10:41 pm (UTC)no subject
Date: 2024-11-16 10:57 pm (UTC)no subject
Date: 2024-11-16 11:00 pm (UTC)no subject
Date: 2024-11-16 11:16 pm (UTC)no subject
Date: 2024-11-15 08:37 pm (UTC)Вот что я вижу — сейчас даже хорошо настроенная модель может выдавать совсем небольшую порцию нормального кода за раз. Так что, мне кажется, будут микро модели вроде "генератор функций доступа к данным на языке SQL" или что то подобное. И это неплохо, значит работы по созданию, настройке и интеграции таких моделей будет много.
no subject
Date: 2024-11-15 11:55 pm (UTC)no subject
Date: 2024-11-15 09:52 pm (UTC)no subject
Date: 2024-11-15 10:28 pm (UTC)Рынок акций на этой неделе падал, на сей раз Trump rally продолжалось ровно 2 дня. Бонды обратно не выросли.
no subject
Date: 2024-11-15 10:33 pm (UTC)no subject
Date: 2024-11-16 12:49 am (UTC)bitok != gold, if my memory doesn't trick on me)
no subject
Date: 2024-11-16 02:36 am (UTC)no subject
Date: 2024-11-16 06:12 am (UTC)...и, главное: в отличие от бумажного нала — цифровой след и возможность блокировки. Что бы там ни утверждали апологеты. Для правительств (всех правительств) это лакомый кусочек.
no subject
Date: 2024-11-16 12:00 am (UTC)no subject
Date: 2024-11-16 10:04 pm (UTC)On Saturday’s broadcast of the Fox News Channel’s “Cavuto Live,” Rep. James Clyburn (D-SC) said that the country is seeing another Hitler with President-Elect Donald Trump.
Host Neil Cavuto then cut in to ask how that’s possible when Trump hasn’t become president yet and “Are you envisioning another Hitler? Is that what you’re saying?”
Clyburn responded, “That’s exactly what I’m saying.
https://video.foxnews.com/v/video-embed.html?video_id=6364798081112&loc=breitbart.com
no subject
Date: 2024-11-16 10:42 pm (UTC)no subject
Date: 2024-11-19 10:52 pm (UTC)Но программист не является преобразователем из текста в текст.