Это несколько текстов, основной из которых — Autoresearch: Минимальный «агентский цикл» Карпаты для автономного экспериментирования с LLM . Пытаемся подробно разобраться в работе минималистичного ИИ-агента для исследований, предложенного Андреем Карпаты в начале марта. Это веха в истории ML, показывающая один из путей (хотя и не идеальный — и об этом тоже есть в статье) совершенствования ИИ. Бонус! Анализируем также весь python-код и инструкции агенту. Для всех, кто перешагнул уровень "спроси у ChatGPT" и задумывается о чём-то большем, но не знает, с чего начать...
Читать далееЕсли вы занимаетесь аналитикой в ритейле, логистике или просто любите копаться в геоданных, то наверняка сталкивались с задачей оценки насыщенности региона точками присутствия.
Многие используют кластеризацию или простые scatter plot'ы, но когда точек становятся тысячи, они сливаются в одну черную кляксу. Сегодня мы на конкретном примере разберем, как превратить «кучу точек» в понятную и красивую инвертированную тепловую карту, где сразу видно — где у нас «белые пятна» (низкая конкуренция), а где рынок уже перенасыщен.
Читать далееРазбираем почему классический формат GoogleEarth проигрывает современному стандарту в скорости, удобстве и интеграции с веб-картами.
Читать далееВсем привет. Меня зовут Никита, я руковожу командой Цикл‑ОН. Мы уже более 5 лет ведем проекты по заказной разработке ПО и, как и многие, сталкиваемся с необходимостью разработки не только качественного кода, но и документацию на продукты. В нашей нише особенность, что заказчики живут в парадигме ГОСТа. Я бы здесь хотел оставить небольшую заметку о нашем опыте — как то, что для начаиналось как откровенное мучение превратилось сначала в умную идеологию, а по итогу в самостоятельное решение для подготовки документации.
Читать далееВ марте 2023 я написал статью «ChatGPT: новый инструмент в борьбе с багами». Показал как нейросеть генерирует тест-кейсы, ищет XPath-локаторы и пишет SQL-запросы. 40 000+ просмотров. Первая статья на эту тему в рунете.
Ты сейчас подумал «ну и что, таких статей теперь тысячи». И ты прав. Но подожди.
За 3 года я прошёл путь от «вау, ChatGPT написал мне 10 тест-кейсов» до «я один собрал образовательную платформу за неделю». И это НЕ кликбейт.
В этой статье — мой путь, мой стек, мой workflow, конкретные цифры по деньгам и времени, и ошибки, которые я сделал, чтобы ты их не повторял.
Читать далееСтандартная библиотека Python содержит множество инструментов, которые значительно упрощают решение задач спортивного программирования, но многие из них остаются незамеченными начинающими участниками. В статье собран краткий конспект по наиболее полезным модулям и функциям стандартной библиотеки с небольшими примерами.
Читать далееЯ не OpenSource разработчик, но за пару десятков лет написал под сотню enterprise-level библиотек, которые остаются в рабочем контуре, дорабатываются под каждый проект и адаптируются к новым технологиям. Большого смысла выходить в OSS не было, кроме как для упрощения обучения коллег и единого места хранения документации.
Но и желание помогать другим и делиться выстраданными подходами, экспертизой и конкретным кодом мне не чуждо - сегодня поможешь ты, завтра - тебе. Через полгода подготовки и адаптации к OpenSource (сам использую и дорабатываю около 8 лет) в свет выходит одна из библиотек моего рабочего контура - Reactive Route.
Так как я работаю с проектами на разных стеках, стараюсь писать код максимально framework-agnostic - независимыми слоями, которые можно заменить или переписать, не трогая остальной код проекта. А к фреймворкам и библиотекам для работы с состоянием они подключаются с помощью легковесных адаптеров, сохраняя синтаксис работы. Конкретно для Reactive Route выложил набор готовых адаптеров в комбинациях, которые сейчас чаще всего использую:
• React + MobX / Observable
• Preact (no compat) + MobX / Observable
• Solid.js + нативная реактивность / MobX / Observable
• Vue + нативная реактивность
В одном npm-пакете - строгая TS-типизация, SSR / MPA / no-JS / Widget режимы и тщательно протестированная отказоустойчивость. В статье не буду пересказывать документацию на русском и английском, а поговорю скорее про общие принципы качества, использование ИИ в разработке и почему многие библиотеки раздуваются, не успев даже стабилизировать ядро.
ЧитатьНесколько лет назад я запустил проект по долгосрочному хранению продуктов. Это моя первая статья на Хабре. В ней я не буду рассказывать о своём продукте, она будет посвящена задаче, которую я решал, и как инженерные принципы сформировали моё решение. Статья, как я смею рассчитывать, будет интересна тем, кто задумывался о теме автономности, пробовал искать точки отказа в своём сложившемся образе жизни или для тех, чьи мысли об автономности все еще находятся на уровне «бункер и тушёнка».
Читать далееЧто если бы вы могли за несколько кликов узнать, сколько времени понадобится жителю любого города и района мира, чтобы дойти до больницы, школы или магазина? Именно это делает CityAccessMap — интерактивная платформа, которая анализирует доступность городских сервисов в 10 000 городах по всему миру, превращая абстрактную концепцию «города 15 минут» в точные цифры и цветные карты.
Читать далееКак фулстек разработчику, мне доводилось работать с проектами на совершенно разных технологиях. Как правило, нужно было поправить небольшой баг или сделать небольшую фичу. Для задач такого разряда стек технологий обычно не имеет значения: отладка примерно одинаковая что на JavaScript, что на Haskell, Go или Python.
Написать немного кода мне, в общем-то, никогда не было сложно на любом языке, с которым я работал.
Но вот что всегда было настоящей проблемой — это запустить и протестировать проект. На это запросто уходили дни: найти нужные версии компиляторов/интерпретаторов, дебаггера, пакетного менеджера и всякого сопутствующего тулинга.
Я устал от этого, и придумал, как больше никогда в жизни не устанавливать тулинг вручную.
В мае 2001 года DARPA разослала запрос предложений под сухим названием «Electronic Market‑Based Decision Support». Суть: покажите нам, что рынки предсказаний работают для задач разведки. К декабрю две фирмы получили гранты. Проект назвали FutureMAP, а его публичную часть — Policy Analysis Market — задумали как биржу фьючерсов на политические события Ближнего Востока.
Перевороты, удары, смены режимов. Трейдеры ставят деньги, агрегированная цена дает оценку вероятности — честнее, чем отчет аналитика, который пишет то, что хочет услышать начальник.
28 июля 2003-го сенаторы Дорган и Уайден вытащили проект на пресс‑конференцию. На демо‑скриншотах кто‑то из разработчиков для красоты вписал примеры контрактов: «убийство Арафата», «ракетный удар КНДР». Заголовок написал себя сам — «федеральный тотализатор на терактах». Пентагон свернул всё за сутки. Глава подразделения Джон Пойндекстер подал в отставку.
Это был первый случай, когда идея prediction markets столкнулась не с логической, а с моральной стеной. Экономически PAM был абсолютно здрав — Университет Айовы к тому времени годами предсказывал выборы через торговлю фьючерсами точнее любых опросов. Но оказалось, что существуют решения, которые общество отказывается отдавать рынку не потому, что рынок ошибётся, а потому что сама постановка вопроса в формате ставки — непристойна. Политическая гигиена победила эпистемическую эффективность.
Идеи, которые лежали в основе PAM, принадлежали Робину Хансону из Джорджа Мейсона. Он пошёл дальше спецслужб и в 2000-м сформулировал футархию — систему, где голосованием выбирают только цели, а способ достижения определяет рынок. Хочешь рост ВВП? Открой два условных рынка: «ВВП через год при политике А» и «ВВП через год при политике Б». Где цена выше — то и делаем.
Читать далееЭд Торп — математический вундеркинд, который придумал, как «обыграть дилера» в блэкджек, будучи аспирантом Массачусетского технологического института. Выдающийся трейдер и инвестор.
Его имя стало синонимом точного, логичного и научного подхода к тому, что миллионы считают во многом делом удачи — азартным играм и финансовым рынкам. Человек, который не просто обыграл казино, но и перевернул представление о трейдинге и инвестициях, заложив основы алгоритмической торговли задолго до того, как кванты появились на Уолл-стрит.
Читать далееВторая часть цикла статей про криптовалюты и потенциальные возможности вложений в них с точки зрения долгосрочного инвестирования.
В этой части я сразу перейду от истории к настоящему времени, попробую переключиться и довольно крупными мазками описать состояние крипты на текущий момент. Начну с самого крупного.
Читать далееЭта статья продолжает цикл воспоминаний разработчика тренажёрных комплексов. Несколько лет назад наша команда столкнулась с задачей создания эмулятора автоматизированной системы управления технологическим процессом (АСУ ТП) для одной из тепловых электростанций. Задача выглядела стандартной и несложной: воспроизвести логику контроллеров, разработать мнемосхемы и запустить модель.
Однако реальность внесла свои коррективы. Исходных данных не хватало, сроки были крайне ограниченными, ресурсов недостаточно, а первая версия интерфейса HMI, созданная на собственном проверенном, но морально устаревшем инструменте проектирования, не соответствовала требуемым характеристикам производительности и масштабирования.
Цель настоящей публикации — поделиться опытом разработки эмуляторов АСУ для учебных тренажёрных комплексов, рассмотреть типы симуляций, привести пример архитектуры подобного решения, коснуться используемых технологий и языков программирования, описать часто возникающие трудности и предложить способы их преодоления.
Читать далееЭтап "давайте сначала изучим стандарты" при обучении веб‑разработке иногда сразу пропускают (или рассматривают буквально в двух словах), переходя к фреймворкам, абстракциям и решениям, которые за тебя уже приняли авторы этих фреймворков.
В этой статье мы разберем все 9 методов HTTP-запросов, опираясь на тексты документов, которыми эти методы определены (RFC 9110 и RFC 5789).
Статья подойдёт тем, кто делает первые шаги в веб-разработке и хочет понять HTTP глубже, чем это позволяют туториалы фреймворков.
ПогружаемсяВо время моей аспирантуры у меня был ночной ритуал. Около девяти вечера я запускал обучение. Подкручивал гиперпараметр. Может, менял learning rate, может, добавлял пару attention heads. Нажимал Enter. Потом какое-то время сидел, глядя на кривую loss, осознавал, что уже одиннадцать, ложился спать — и просыпался, обнаружив, что всё упало в три ночи из-за ошибки нехватки памяти, которую я должен был поймать заранее.
На следующий день — чинишь баг, пробуешь снова. Один эксперимент в день, если повезёт. Два — если звёзды сойдутся.
А теперь умножьте это на каждого ML-исследователя на планете. Тысячи нас сидят перед терминалами, вручную подкручивая одну переменную за раз, запуская один эксперимент, ожидая, проверяя, подкручивая снова. Именно так большая часть ML-исследований до сих пор работает в 2026 году.
Андрей Карпати просто спросил: а что если компьютер будет делать всё это сам? И выложил репозиторий под названием autoresearch. Который решает ровно эту проблему.
Читать далееКак энтузиаст в освоении технологий я не всегда следую трендам, а пытаюсь увидеть ценность там, куда люди могли не заглянуть. По этой причине исследовательская дорога привела меня к изучению вопроса, как создать встречу в Yandex Calendar и приложить в нее ссылку на Telemost используя доступный API и мой любимый Kotlin. Об этом опыте я и поделюсь в статье.
Узнать подробностиВ банковском churn проблема почти никогда не выглядит как «вчера клиент был с нами, а сегодня закрыл счет». Гораздо чаще отношения распадаются медленно: зарплата еще приходит в старый банк, но деньги почти сразу уходят наружу; карта остается открытой, но перестает быть основной; приложение клиент по-прежнему открывает, но все реже. Формально он еще с вами. Экономически — уже почти нет. Для аналитика это важное различие: объектом моделирования становится не только юридическое событие ухода, а деградация primary relationship — снижение остатков, миграция регулярных платежей, выпадение из цифрового контура и ослабление продуктовой связки. Этот контекст не абстрактный: BAI в обзоре на 2024 год выделял рост депозитов как один из главных приоритетов банков, а это автоматически повышает ценность раннего обнаружения деградации клиентских отношений.
В этой статье — не очередной обзор уровня «ML помогает удерживать клиентов», а разбор того, как churn-модели реально выглядят в банковском пайплайне: какие признаки обычно работают, где бинарная классификация ломается, зачем нужен uplift, почему survival analysis часто полезнее обычного churn-label и какие регуляторно-этические ограничения становятся нетривиальными, когда модель используется не только для скоринга, но и для принятия решений.
Читать далееUSB-флешки многие воспринимают как временную вещь: скинули на них пару файлов — отчет, фотографии, видео — и бросили в ящик стола. Есть распространенное мнение, что долго так хранить данные нельзя, через год-два они начинают портиться. Энтузиаст по имени Зак Вэнс решил проверить, правда ли это, и в 2020 году запустил простой эксперимент. Он записал данные на несколько флешек, закинул в коробку и теперь время от времени проверяет, что с ними происходит. Результаты противоречат устоявшемуся мнению. Оказалось, что при обычном хранении и нормальном качестве накопителей информация может сохраняться гораздо дольше, чем принято думать.
Читать далееС каждой неделей наш мир пополняется новой нейросетью. Вспомните, каким был февраль, который принес нам новые модели от Claude, OpenAI и Gemini. Март перехватил эстафету, хотя эта неделя выдалась без особых новшеств. Небольшой клочок спокойствия за последний один-два месяца.
В своей предыдущей статье я сравнил последние новинки от компаний, названных в абзаце выше. Сравнение происходило не во всех сферах, а затрагивало только программирование. В размышлениях я подумал: а почему не столкнуть модели в еще одном варианте задач? Речь идет о генерации текста, наверное, одно из наиболее популярных направлений при работе с нейросетями.
Сегодня будет сравнение ChatGPT 5.4, Gemini 3.1 Pro и, конечно же, Claude Opus 4.6 в задачах, которые связаны с текстом. Принимайте стратегически удобное положение, ну а я начинаю свое повествование.
Читать далее