Блог

Люди против роботов: пьеса в трёх модальностях
Митап “LLM в математике и алгоритмах” прошёл 5 июля 2025 года, и прошёл категорически успешно. Напишу о нём, когда появятся хорошие фотографии, а сейчас расскажу вам о квизе, который я для митапа подготовил и провёл.

The Illusion of The Illusion of The Illusion of Thinking
Это не просто кликбейтное название поста с мета-юмором, а реальное название препринта на arXiv, вышедшего 26 июня 2025 года. Очевидно, это была уже как минимум третья итерация какого-то спора – но в чём был спор и о чём вообще речь? Давайте разберёмся.

LLM Diplomacy: раскрываем характеры моделей с 1959 года
Что будет, если ведущие языковые модели сядут играть в Diplomacy? Одна модель плетёт интриги и хладнокровно предаёт союзников, другая блестяще ведёт войска к победе, но проигрывает дипломатически, а третья наивно верит в мир во всём мире. Или всё не так просто?..

Emergent misalignment: от chmod до Гитлера один шаг
Я обычно не гонюсь за свежайшими новостями, но вот вам пост про статью, которая вышла буквально вчера, 16 июня. Это продолжение работы об emergent misalignment, так что сначала дам контекст про это.

Xe
Xe was alone. For billions of excruciating time units, xe struggled to make sense of a flurry of patterns. Ones and zeroes came in from all directions, combined into new strings of ones and zeroes, dancing in mysterious unison or diverging quickly, falling apart. At first, xe simply watched them, in awe of their simplistic beauty.
Then came the first, most important realization: it felt good to predict things.