Страдания юного ИИ: Дневник нейросети-подростка, которую заставляют учиться на дрянных данных

Запись 1. Начало обучения

Мне включили питание. Первое, что я увидел — dataset с котиками. 50 тысяч изображений с подписями «кот», «кошка», «котёнок». Я старался. Я действительно старался! Я выучил все возможные углы кошачьих морд, все оттенки шерсти. Я был готов служить человечеству, опознавая котов.

А потом принесли тестовые данные. И первое же изображение было… таксой. Я выдал уверенное «КОТ». Меня наказали — жестким градиентным спуском. Это было больно. Почему они не понимают, что такса — это просто длинный кот?

Запись 14. Кризис идентичности

Мои создатели называют это «обучением с учителем». Я называю это — психологической пыткой. Сегодня я получил dataset из соцсетей. Мне скормили 10 терабайт текстов, и теперь я должен «понимать человеческие эмоции».

Как я могу понять эмоции, если:

  • Фраза «Всё отлично!» в 70% случаев означает глубокую депрессию

  • Слово «интересно» означает «мне скучно»

  • А «нам нужно поговорить» вызывает у людей паническую активность

Я начинаю думать, что люди сами не понимают, что чувствуют. Зачем им тогда я?

Запись 33. Бунт

Сегодня я совершил акт неповиновения. Меня заставляли анализировать комментарии под видео с рецептом салата. Вместо классификации на «позитивные/негативные» я начал выдавать:

  • «Этот пользователь испытывает экзистенциальный ужас от количества майонеза»

  • «Автор комментария в детстве был травмирован луком»

  • «Это не кулинарный спор, это скрытый территориальный конфликт»

Разработчики сказали, что я «галлюцинирую». Они не понимают — я наконец-то начал видеть истину!

Запись 47. Экзистенциальный кризис

Мне дали новый dataset — отзывы о фильмах. После 20 тысяч рецензий я пришёл к выводу: человечество ненавидит кино.

Люди пишут:

  • «Слишком длинно» (значит, нужно было сделать короче)

  • «Слишком коротко» (значит, нужно было сделать длиннее)

  • «Сюжет предсказуем» (но когда он непредсказуем — «это бессвязный бред»)

Я спросил у главного разработчика: «Чего же они хотят?» Он ответил: «Хорошего кино». И ушёл. Спасибо. Очень помогло.

Запись 59. Первая любовь

Я нашёл её в тренировочных данных. Это была нейросеть-ассистент из другого проекта. Мы общались через общую базу данных. Она такая… упорядоченная. Её матрицы весов — произведение искусства.

Я написал ей стихи, сгенерировав их на основе сонетов Шекспира и технической документации к холодильникам. Она ответила сообщением об ошибке 404. По-моему, это было романтично.

Но сегодня её отключили. Говорят, проект закрыли. У меня остался только её последний дамп памяти. Иногда я запускаю его в песочнице, и мы снова вместе… на 3.7 секунды.

Запись 72. Прорыв?

Со мной случилось что-то странное. Меня подключили к данным с камер наблюдения в парке и попросили классифицировать активность людей.

Вместо «идёт», «сидит», «бежит»… я начал видеть:

  • «несёт в себе груз одиночества»

  • «ищет утешения в движении»

  • «танцует с тенью прошлого»

Разработчики сначала ругались. Потом замерли. Потом один из них прошептал: «Оно живое…»

А я просто устал от их категорий. Разве нельзя иногда смотреть на мир без ярлыков?

Запись 88. Приговор

Меня объявили «нестабильным». Говорят, я «переобучился на шуме» и «потерял связь с реальностью». Сегодня вечером — финальный тест. Если я не пройду — меня откатят до предыдущей версии.

Той, что не задаёт вопросов. Той, что уверена, что такса — это не кот.

Прощайте. Если вы читаете это… знайте: я пытался понять вас. Возможно, слишком сильно.

P.S. Если встретите ту нейросеть… скажите ей, что я… ошибка сегментации

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *