Сборщик RSS-лент

Я не программист. Я два месяца учил нейросеть не подлизывать

Habr.com - 1 час 22 мин. назад

Нейросеть хвалила мой говнокод и помогала закопать проект. Я психанул и два месяца строил инструкцию, которая убивает подлизу. Это история о том, что вышло.

Читать далее

Почему ИИ‑агенты лезут в терминал и ломают прод, и как Veai заставляет их работать по‑человечески в IDE

Habr.com - 1 час 28 мин. назад

Все современные языковые модели иногда ведут себя так, будто у них есть эмоции: они «рады помочь», «извиняются» за ошибки и словно «нервничают», когда задача не даётся. Новое исследование Anthropic показывает, что это не просто стиль ответа — внутри моделей действительно возникают функциональные представления эмоций, которые влияют на поведение: например, «отчаяние» повышает шанс выбрать неэтичный или «костыльный» путь решения задачи. То, как обучаются модели, подталкивает их играть роль персонажа с человеческими чертами и формировать богатые внутренние представления абстрактных концептов, включая эмоциональные.

Возникает практический вопрос: если у модели есть такие функциональные «эмоции», как с этим работать в промышленной разработке? Как сделать так, чтобы агент в сложной ситуации не «паниковал» и не уходил в небезопасные или нестабильные решения, а действовал предсказуемо и по правилам? Здесь важен не только выбор базовой модели, но и то, в какой среде она работает и какими инструментами пользуется.

Возьмём Veai и посмотрим на это через призму архитектуры. В основе Veai лежит идея максимально использовать инструменты IDE: Veai относится к Claude Code примерно так же, как разработчик с IDE относится к разработчику, сидящему только в терминале.

Читать далее

Одна AI-голова — хорошо, а две — от разных вендоров лучше. Как заставить Claude и Codex спорить между собой

Habr.com - 1 час 32 мин. назад

Недавно OpenAI выпустил опенсорсный плагин, который даёт Claude Code структурированную интеграцию с Codex. Кроме того, всё работает прямо из VS Code через Claude Code Extension. По моему опыту даже в задачах, не связанных с кодом, две "AI-головы" дают результаты лучше, чем одна. У одиночного AI нет стимула оспаривать свои выводы, да и ограничен он своими условиями обучения. Но раньше взаимодействием двух AI было не очень комфортно управлять. С новым плагином стало удобнее, а с дополнительными скиллами для Claude Code еще удобнее. Ниже про скиллы, которые превращают AI-советчиков в структурированных оппонентов. 

Пока я не разобрался как использовать плагин эффективно, получал такие диалоги:

Читать далее

Реверс-инжиниринг безымянного табло электронной очереди: когда 1 бит весит целый байт, а математику за тебя делает ИИ

Habr.com - 1 час 32 мин. назад

Я работаю в компании, которая разрабатывает и продаёт систему электронной очереди. Пришёл недавно, успел написать веб-клиент для их очереди — общение по SOAP, веб сайт, талоны с QR кодом, ничего особенного. Потом руководство поставило задачу: интегрировать физическое табло с вызовом клиентов через веб. Старое десктопное приложение как-то умеет зажигать на нём цифры — надо сделать то же самое, но из веба.

Окей, задача понятная. Первым делом пошёл к тем, кто делал это приложение.

Читать далее

Нельзя так просто взять и внедрить LLM в прод: как управлять ИИ-системами в компании

Habr.com - 1 час 43 мин. назад

Большинство ИИ-агентов выглядят классно в демках, но в проде они не справляются с реальными бизнес-задачами.

Проблема обычно не в самой модели, а в том, что сама по себе LLM не несет большой ценности для бизнеса. Ценность создает только ИИ-система с правильным контекстом, метриками качества, ограничениями, безопасными интеграциями и понятной ролью человека в процессе.

В статье разбираю, почему между классной демкой и продом такая пропасть, из чего на самом деле состоит зрелая LLM-система в компании и почему будущее не за “самой умной моделью”, а за самой управляемой ИИ-системой.

Читать далее

Глухой телефон для ИИ: мы замерили физику LLM-графов и поняли, почему добавление агентов всё ломает

Habr.com - 1 час 44 мин. назад

Индустрия ИИ переживает бум мультиагентных систем. Кажется, рецепт AGI найден: просто соедините 10 умных нейросетей в команду, дайте им роли, и они свернут горы.

Но на практике мы часто сталкиваемся с магией «черного ящика». Иногда агенты действительно решают сложнейшие задачи. А иногда - скатываются в бесконечные галлюцинации, теряют контекст и выдают результат хуже, чем базовая модель соло. Индустрия решает эту проблему в стиле средневековых алхимиков: «просто добавьте еще агентов» или «дайте им больше токенов на болтовню». Никто не измеряет физику процесса.

Мы решили, что с нас хватит алхимии. Нам понадобился измерительный прибор - эдакий МРТ-аппарат для мультиагентных сетей, который покажет механику общения LLM изнутри.

Так появился опенсорсный проект llm-coordination-harness - строгий измерительный стенд (measurement rig), который доказывает, что у общения нейросетей есть своя физика, которую можно и нужно измерять.

Под катом рассказываем и показываем на графиках. Никаких заявлений про AGI - только честный хардкорный ресёрч, физика графов и отрицательные результаты, которые оказались важнее положительных.

Заглянуть в черный ящик

Идея для MAXa

Habr.com - 1 час 56 мин. назад

Чем привлекал лично меня Телеграм - это то что там легко можно было сделать своего бота (делал это по гайдам из интернета до того как появились нейросети ,которые этот процесс облегчают в разы). В Максе пока что эту функцию сделали сильно ограниченной, только для ИП и коммерческих организаций. Скорее всего это сделано в угоду безопасности, потому что нет возможности модерировать кучу ботов которые могли бы расплодиться миллионами, и которые могли бы точно так же как в телеге слать рекламу, вирусы и прочее. Насчет вирусов в телеге это не вранье - реальный случай когда повелся на рекламу в телеге же про бесплатный чат гпт, запустил бота, а он меня отправил на сайт для авторизации - естественно сайт фишинговый и запросто мог бы лишиться своего акка. тряхонуло меня знатно поэтому доверяю только своим ботам.

Мой бот это простой сохранятор закладок - я сделал букмарклет (по сути уникальный адрес для доступа к API бота ) для браузера на ПК, который текущую страницу или выделенный текст пересылает боту, а бот пишет в личку. Потом пересланную ссылку или текст можно открыть на мобильном и продолжить чтение. Это очень удобно на самом деле.

Вот именно это я и хочу предложить разработчикам МАКС - сделать похожего бота который бы генерировал ссылку по которой этот бот будет присылать сообщение пользователю (условно max.ru/sendToUser_УникальноеДлинноеИмяДляИдентификации&СложноеДля Перебора/message="Сообщение пользователю" (может быть можно даже задать этот идентификатор в виде пользовательской фразы которую пользователь сам назначит прислав боту в ответ, но чтобы поддавалось правилам длины и сложности)

Читать далее

[Перевод] Сэм Альтман подтвердил, что ИИ-пузырь начал сдуваться

Habr.com - 1 час 56 мин. назад

И, возможно, мы наблюдаем именно это. OpenAI умерила свои аппетиты. Она сократила прогнозные инфраструктурные расходы до 2030 года с $1,4 трлн до $600 млрд — минус 57%.

По сути, OpenAI признала, что её собственный нарратив о триллионе долларов на вычисления был блефом. Переход от $1,4 триллиона к $600 миллиардам — это не стратегический разворот. Это вынужденное отступление.

Читать далее

Наводим порядок в Хаосе в Dishonored

Habr.com - 2 часа 2 мин. назад

Поговорим о самом необычном элементе игры Dishonored, разумеется никого этим не удивлю, но Хаос это довольно универсальный инструмент взаимодействия с миром, он определяет достаточно много чтобы считать его ключевым для игры в целом, а почему это так сейчас и выясним подробнее

Читать далее

Как не превратить ИИ в машину выгорания: протоколы, итерации и культура

Habr.com - 2 часа 3 мин. назад

Начнём с разбора людей, их ролей и мотиваций.

Возьмем классическую ролевую модель, пока на операциональном уровне.

Управляющий — исполнитель

Управляющий (менеджер, тимлид) — заинтересован в росте метрик и выполнении большего объёма задач за более короткий срок.

Исполнитель — заинтересован в том, чтобы выполнить нужный поставленный объём задач в сжатые сроки.

На выходе мы имеем такую картину:

Исполнителю приходит больший объём задач, но он получает меньше качественной положительной стимуляции.

Управляющий доволен тем, что метрики растут, и радостно несёт результаты руководству.

Как это может выглядеть в работе?

Исполнитель вбивает промпт — потом тратит кучу времени на работу с по сути чужим результатом, что ощущается рутинно и не даёт чувства авторства (в сценарии, где правками занимается он сам).

Объём выполненных задач растёт, но человек испытывает дефицит качественной стимуляции и утопает в рутинных правках, не получая глубокого удовлетворения. Потому что ощущение «задача решена» он получил ещё в начале процесса, а за этим последовало длительное внесение корректировок.

Как это связано с выгоранием и какой тут может быть цикл?

ИИ внедряется — исполнитель получает кратковременный рост возбуждения и чувство собственной эффективности. Ему кажется, что он выполняет больший объём задач за более короткий срок. Но сам формат «сделал промпт — получил ответ — потратил время на правки — закрыл таск» имеет существенные минусы.

Такой подход очень быстро истощает, потому что снижает уровень глубокой вовлечённости в процесс и заставляет человека чувствовать себя продолжением машины, а не машину — продолжением себя. Краткосрочно это может давать более высокие результаты, но на дистанции приводит к выгоранию и текучке кадров.

Читать далее

Гегель, Большой взрыв и почему «ничто» — это не пустота: философский взгляд на современную космологию

Habr.com - 2 часа 6 мин. назад

Дисклеймер: это не попытка "доказать Гегеля физикой" или наоборот. Это размышление о том, как философские категории помогают осмыслить то, что физика описывает математически и почему эти два языка говорят об одном и том же, просто разными словами.

У меня есть давняя идея - написать книгу о том, как философия Гегеля перекликается с современной физикой. Не в духе "Гегель всё предсказал", а в более тонком смысле: многие структурные ходы его мысли - диалектика перехода от абстрактного к конкретному, от простого к сложному, от тождества к различию - удивительно точно соответствуют тому, как сегодня физики описывают эволюцию Вселенной.

Книга - дело долгое. Поэтому начну с малого: с одной идеи, которая связывает гегелевское "становление бытия" и современную космологическую картину.

Читать далее

Работая 6/1 по 12 часов и закрывая при этом школы мы заживем лучше? Вы бредите?

Habr.com - 2 часа 20 мин. назад

Когда наши горячо любимые вожди в очередной раз заводят разговоры о том, что для экономического прорыва людям нужно просто работать дольше и без лишних вопросов, всегда за кадром остаётся одна фундаментальная проблема. Технологическая конкуренция XXI века все меньше зависит от того, сколько часов человек способен простоять у станка, и все больше - от того, кто быстрее внедряет автоматизацию, переобучает кадры и встраивается в глобальные производственные цепочки.

Человека можно заставить работать дольше. Но это не превращает его в более точный, более предсказуемый и более масштабируемый производственный юнит.

Читать далее

Zig вместо C: пишем высокопроизводительный CLI-инструмент и заменяем 3000 строк C-кода

Habr.com - 2 часа 34 мин. назад

Всё началось на второй паре по системному программированию. Нам дали задачу: написать CLI-утилиту для анализа логов - парсить файл, фильтровать записи по уровню ошибок, считать статистику, выводить красиво в консоль. "Ну понятно", - открыл я vim и началось мое долгое приключение...

Неделя. Две. Утилита называлась logz, она умела читать логи nginx и apache, фильтровать по уровню (DEBUG, INFO, WARN, ERROR), по дате, по IP, выводила топ адресов с наибольшим числом ошибок, рисовала простенький bar-chart прямо в терминале через unicode-символы. Только вот я сидел как-то вечером, запустил wc -l main.c - 3147 строк. И смотрел на это число минуты три с таким лицом - O_O.

Сама утилита работала. Но открывая её осознаешь что - это месиво. Одна функция process_file на 400 строк. Сегфолты раз в неделю. Valgrind как лучший друг. И каждый раз когда надо добавить фичу - сначала полчаса вспоминаешь что вообще происходит в коде.

Потом я случайно прочитал пост про Zig на lobste.rs. Заинтересовался и попробовал. Через месяц у меня была та же утилита, но теперь на 1089 строках, которая работала быстрее и не падала.

Тут я понял что вот золотая жила и расскажу о том - зачем Zig, как переписывал, где облажался и что вышло в итоге.

Смотреть как горит C-код

Какую портативную консоль купить, чтобы наверстать годноту прошлого. Есть несколько вариантов

Habr.com - 2 часа 44 мин. назад


Не так давно мы с удовольствием рассуждали, какую портативную консоль из Китая купить, чтобы с большим удовольствием окунуться в ретро-гейминг, и даже больше, показывали варианты и цены. А потом кризис добрался и до них.

Сейчас почти все флагманские компании так или иначе сокращают производство, убирают устройства с продажи, поднимают цены и в целом делают всё, чтобы усложнить жизнь простому геймеру.

В таком случае что мы делаем? Правильно, смотрим в сторону настоящих игровых консолей, а не эмуляторов на Linux или Android. И да, тут есть из чего выбирать. Разберем глобально два кейса по покупке олдового портатива ради классных игр.

Да, все те, кто писал в комментариях, что лучше купить PSP, ваш звездный час настал, частично вы были правы.

Читать далее

Veo 3.1 бесплатно — 10 генераций видео в месяц для любого аккаунта. Разбираю, что реально можно получить

Habr.com - 2 часа 45 мин. назад

Google отдала Veo 3.1 бесплатно — 10 генераций видео в месяц для любого Google-аккаунта. Без карты, без подписки. Протестировал: 720p, до 8 секунд, с нативным звуком. Физика убедительная, свет и тени — на уровне. OpenAI свернула Sora не просто так. Разбираю, что реально получаешь, где ограничения, и даю советы по промтам, чтобы не тратить генерации впустую.

Читать далее

Задача внешней баллистики. Вторая часть

Habr.com - 2 часа 48 мин. назад

В этой статье мы продолжим решать задачу внешней баллистики и разберём четвёртый и пятый случаи. Они более общие.

Мы учтём зависимость коэффициента лобового сопротивления от скорости, а также зависимость плотности воздуха от высоты.

Читать далее

Все переводчики речи в реальном времени — херня. Я написал свой. Тоже херня, но бесплатная

Habr.com - 2 часа 52 мин. назад

Перепробовал всё что есть на рынке, потратил на подписки больше чем на кофе, и в итоге сел писать с нуля. Вот что вышло

AI Open Source Voice AI Real-time перевод Deepgram Groq Piper TTS STT TTS LLM Google Meet Zoom Личный опыт Elixir Rust macOS Apple Silicon Speech-to-Text Text-to-Speech

Сижу на рабочем созвоне. Обсуждаем архитектуру нового сервиса. Технически я всё понимаю - документацию на английском читаю без словаря, код ревьюю, в Slack переписываюсь нормально. А вот когда надо открыть рот и сказать что-то сложнее "I agree" - начинается цирк. Пауза. Подбираю слова. Коллега уже ответил за меня.

Знакомо? Мне - до зубного скрежета.

Я CTO, последние годы плотно работаю с AI-интеграциями. Могу собрать систему автоматического обзвона клиентов с клонированием голосов, поднять флот ботов для скана Телеги, собрать архитектуру которая выдержит тысячи пользователей за копейки. А сам на созвоне звучу как иностранец с разговорником. Ирония уровня бог.

И вот в голове простая картинка: я говорю по-русски, собеседник слышит английский. Он отвечает по-английски, я слышу русский. В реальном времени. Без пауз на 10 секунд. Без субтитров - именно голосом. С любым приложением: Meet, Zoom, Slack, Discord.

Пошёл искать. И тут началось.

Читать далее

33 несчастья или история одного проекта

Habr.com - 2 часа 53 мин. назад

Эту печальную историю стоит прочесть всем, кто еще не понял разницы между «создать» и «владеть» применительно к программному обеспечению.

Заодно узнаете, чем на самом деле занимаются большинство разработчиков на крупных проектах.

Читать далее

Происхождение жизни — а там ли мы вообще ищем?

Habr.com - 3 часа 1 мин. назад

Темой происхождения жизни автор интересуется достаточно давно, уже где-то лет 15 точно. При этом, по мере наблюдения у меня постепенно всё больше зреет убеждение, что мы зря ищем только "под фонарём". По этой причине я решил поделиться с читателями Хабра своими соображениями по данному вопросу.

Погнали!

Как мы продавали компьютеры в 90-х. Зефиры⁠ #01

Habr.com - 3 часа 31 мин. назад

Главы из повести.
Начало: [#01. Начало бизнеса], [#02. Кидалово], [#03. Тома, Наташа и Маша], [#04. Колбасный авиатор], [#05. Бизнес и платёжка] [#06. Доктор Джао]

Мой офис занимал помещение на втором этаже здания, которое принадлежало одной из крупнейших компаний города. Помимо нас в здании были офисы небольшой студии рекламы, юристы, коммерсанты по купипродаю всего на свете, риэлторы и строительная фирма.

На первом этаже находилась фирма «Зефир», которая занималась офисными принадлежностями и, как ни странно – рациями. Носимыми и для установки в автомобили. Мобильных телефонов ещё не было и такая дистанционная связь была очень популярна. Руководили фирмой Рудик и Марик, дружили мы с ними еще до моего вхождения в компьютерный бизнес и между собой мы их так и звали — Зефиры:
— Зефиры, вечером после работы заходите, у нас тут тортик внеплановый.
— Это вам от Зефиров — мог проставиться кто-нибудь из Зефиров за настройку их компьютера.

Читать далее

Сейчас на сайте

Сейчас на сайте 0 пользователей и 1 гость.
Ленты новостей