В апреле 2025 года OpenAI представила серию моделей GPT‑4.1 – сразу три версии: GPT‑4.1 (полноразмерная), GPT‑4.1 mini и GPT‑4.1 nano. Все они значительно превосходят предшественников (GPT‑4.0, также называемый GPT‑4o, и GPT‑4o mini) по качеству кодирования, следованию инструкциям и работе с длинным контекстом. Главная сенсация – поддержка контекста до 1 000 000 токеновo. Это примерно 8 полных копий кода фреймворка React, которые теперь можно подать модели за один раз! Для сравнения, у предыдущих GPT-4 максимальный контекст был 128 тысяч токенов. Обновился и «горизонт знаний» – GPT‑4.1 обучен на данных вплоть до июня 2024 года, что уменьшает количество ответов «не знаю» на современные вопросы.
GPT‑4.1 (основная модель) – флагман с максимальными возможностями. Она улучшила результаты на множестве бенчмарков: например, решает ~54.6% задач на SWE-bench Verified (стандартный тест по разработке ПО), тогда как оригинальный GPT‑4o справлялся лишь с 33.2%. Это рекордный показатель для моделей GPT и на 21% превышает результат GPT‑4o. Модель стала лучше генерировать код без лишних правок (доля «лишнего» кода снизилась с 9% до 2%) и более строго придерживается форматов (например, может вносить правки в виде diff-патчей, а не переписывать файл целиком).
GPT‑4.1 mini – облегчённая модель, которая жертвует лишь небольшой долей качества ради скорости и цены. По многим заданиям mini догоняет или даже превосходит оригинальный GPT‑4.0. В тестах OpenAI «мини» не уступает GPT‑4o по интеллекту, но при этом выдаёт ответ почти вдвое быстрее и на 83% дешевле обходится по стоимости вызова (то есть стоимость снижена до ~17% от GPT‑4.0). Для разработчиков это означает, что многие задачи теперь можно решать “бюджетной” версией модели без ощутимой потери качества. GPT‑4.1 nano – новейшая и самая лёгкая модель в семействе, первый «нано»-уровень от OpenAI. Nano – рекордсмен по скорости и цене: как отмечает OpenAI, это «самая быстрая и дешёвая модель за всю историю компании». Например, nano возвращает первый токен ответа менее чем за 5 секунд даже если запрос содержит 128k токенов контекста. Она также поддерживает 1М контекста и показывает неплохой уровень интеллекта: ~80.1% на знаниевом тесте MMLU и 50.3% на задачах GPQA. Хотя nano уступает «старшим братьям» в сложных размышлениях, она отлично подходит для простых и массовых задач – классификация, автодополнение кода, чат-боты с короткими ответами. В целом, появление mini и nano даёт веб-разработчикам гибкость: можно выбрать мощную GPT‑4.1 для сложной логики или обработки гигантского документа, а для быстрых откликов или фоновых задач – задействовать nano с минимальными затратами.
Читать далееДисциплинированность и пунктуальность японцев — то, что часто отмечают как сильную сторону подданных императора. И, конечно, это неплохие черты сами по себе. Однако всё хорошо в меру, и порой отсутствие гибкости и слишком рьяное желание сохранять дисциплину приводит к трагедиям. О рабочих перегибах на местах (в том числе и в IT-компаниях) рассказывает японист и переводчица Полина Гуленок.
Читать далееСтатья для начинающих QA посвящена распространенной проблеме рутинных задач в тестировании (дейли, отчеты, анализ требований, регресс, воспроизведение багов, подготовка данных, коммуникация). Автор с юмором описывает эти ситуации и предлагает практические решения, подкрепленные ссылками на книги по управлению проектами и тестированию. Советы включают автоматизацию, оптимизацию процессов, развитие, делегирование и поиск смысла в работе.
Читать далееПривет! Меня зовут Юлия Тарасенко. За 6 лет работы в Контуре я занималась созданием процессов в двух направлениях — в коммерческом продукте и в инфраструктурном направлении. Объединяет направления их масштаб — более 5 подкоманд, десятки заказчиков, а различает степень зрелости исследовательской культуры.
Я решила разобраться, что включают в себя исследовательские процессы, какие из них можно и нужно выстраивать, какие из процессов наиболее важны. В статье делюсь этими рассуждениями и своим опытом.
Читать далееРазбираем стажерско-джуновский вопрос с собеседования.
Вопрос с собеса:
«Можем ли мы описать параболу линейной регрессией?»
Читать далееПишем AI-помощника для анализа художественных произведений. С помощью языковой модели для анализа текста и небольшой обвязки для визуализации полученного структурированного ответа генерируем:
- граф связей между героями;
- хронологию событий;
- карту мест действия.
Читать далееВ статье описывается процесс установки и настройки утилиты Beszel для мониторинга домашних серверов. Автор делится опытом работы с этой платформой, её преимуществами и недостатками, а также рассказывает о том, как интегрировать систему уведомлений в Telegram для быстрого реагирования на проблемы.
Читать далееСегодня мы поговорим о том, как реализовать автоматическую отправку SMS-уведомлений через платформу МТС Exolve при получении предоплаты в сервисе «МойСклад».
Читать далееПриветствую, коллеги.
Это будет короткая заметка, и надеюсь, её пропустят модераторы. Итак, сразу к делу.
Небольшая предыстория. Меня как-то блокировали на Хабр Карьера. Это было на хэллуин. И я подумал, что это был розыгрыш. Но выяснилось, что из-за того, что я ссылки разместил в неположенном месте. Всё исправил, разблокировали. Но сбилось количество консультаций, которые я провёл бесплатно, и все на оценку 5. Но я не стал просить о восстановлении оценок. Было лень заморачиваться. Зато у меня все 15 из 15 ачивок. Пользуясь случаем, попрошу восстановить всё таки ;)
И вот сегодня я решил пройти тест навыков в сфере SEO. Опробовать данную функцию, так сказать. И решил тоже считерить. В отместку ;-)
Читать далееЭто первая статья в блоге нашего стартапа, надеюсь, что не последняя. Мы разрабатываем инструмент моделирования и будем делиться нашим видением идеального продукта, рассказывать про наши успехи и неудачи, надеюсь, что будем получать критику и в итоге у нас получится что‑то полезное.
Читать далее10 новых российских продуктов для управления устройствами на базе ESP, поиска и отбора талантливых кадров, совместной работы заказчиков и исполнителей над дизайном и ремонтом и многого другого. Битва за «Продукт недели» началась!
Product Radar — здесь каждую неделю публикуются лучшие онлайн-сервисы и железки от русскоязычных команд.
Читать далееРасскажу о процессе получения и продления венгерской визы цифрового кочевника, а также поделюсь, какая она — жизнь в Венгрии за пределами первых впечатлений.
Читать далееКрипта — это не скам. Но скама тут до хрена. И если честно — я сам через многое прошёл, поэтому решил всё собрать в один пост: что за скам бывает, как на него не вестись и почему я принципиально делаю по-другому.
1. Скам-токены и “иксы до листинга” — ловушка, в которую я сам мог влететь
Если ты хоть раз залипал в крипто-каналах на тему “честных иксов”, то точно натыкался на такое:
“Инсайдовая монета. Только для своих. Листинг через неделю. Успей залететь по 0.0001 — потом будет x100”.
Скриншоты якобы успешных кейсов, какие-то графики, фотка “разработчика” (сгенерированная в нейросети), отзывы “подписчиков”, которые уже якобы залетели и скоро купят себе AMG. Всё подаётся красиво и с приправой из FOMO — страха упустить.
Но по факту — тебе продают фантики. Это так называемый honeypot.
Читать далееPine Script - это язык программирования, разработанный командой TradingView как Domain Specific Language, то есть специализированный язык для решения конкретной задачи - анализа и визуализации финансовых данных. Он создан для тех, кто хочет строить собственные индикаторы, тестировать торговые стратегии и делать всё это прямо в интерфейсе графика - без установки Python, без импорта исторических котировок и без настройки среды разработки.
Pine Script предельно прост по синтаксису, но в то же время достаточно мощный, чтобы покрыть 95% потребностей розничного трейдера. В нём предусмотрены ключевые блоки: работа с таймсериями, доступ к фундаментальным данным, рисование на графике и даже поддержка таблиц.
Все примеры на Гитхабе.
Как Apple готовилась к пошлинам Трампа, что анонсировала компания на ближайшее будущее и как отложили новую Siri на потом – множество подробностей от нескольких источников. Что компания готовит для складного iPhone и ждать ли новый Apple Vision Pro. А также множество слухов и концептов новых систем, которые должны стать самым большим редизайном в истории. Выбрали самое запоминающееся за неделю, чтобы уместить в этом дайджесте!
Перейти к новостямПарадокс Моравека принадлежит к числу наиболее интересных концептуальных открытий ХХ столетия. Раз за разом он заставляет нас пересматривать свои представления о возможностях искусственного интеллекта.
С формальной точки зрения парадокс ставит под сомнение интуитивное представление человека о том, что сложные интеллектуальные задачи требуют больше вычислительных ресурсов, нежели простые моторные действия. За примерами далеко ходить не надо: оказалось, что научить компьютер играть в шахматы на уровне условного Гарри Каспарова, признанного гроссмейстера, гораздо проще, чем воспроизвести моторику годовалого ребенка, умеющего хватать игрушки или сохранять равновесие при ходьбе.
Читать далееПривет, Хабр! Меня зовут Александр Голиков, я начальник отдела разработки интерфейсов «МосТрансПроекте». Многие сейчас мечтают построить карьеру в IT. Во-первых, это интересно, перспективно и востребовано. Во-вторых, здесь можно реализовать себя, создавая значимые проекты для людей. Но далеко не все понимают, что «войти в IT» не так просто, как кажется, особенно с нуля. Кстати, я сам пришел в разработку совсем не из «айтишного» профиля. Как так вышло? Рассказываю под катом.
Читать далееВ этой статье я расскажу о ключевых вызовах микросервисной архитектуры и способах их преодоления. Мы рассмотрим, как найти баланс между автономностью сервисов и сложностью их взаимодействия, почему даже идеальный код не спасает от «распределенного монолита» и как превратить хаос микросервисов в управляемую систему.
Читать далееЗдравствуйте.
Меня зовут Андрей. Работаю я в государственном вузе. И, как водится, в такого рода учреждениях люди, которые занимаются компьютерами, занимаются ими в широком смысле слова.
Первая часть этой истории находится тут. Там можно почерпнуть некоторую информацию о том, что из себя представляет описываемая мной система. Хотя бы в части устройства базы данных. А база это наше все!
Читать далееВ 2025 году специалисты по ИБ участвуют в разработке, анализируют угрозы до запуска продукта, выстраивают защиту в пайплайнах и помогают встроить её в архитектуру, процессы и повседневную работу всей компании. А ещё — осваивают ИИ и следят за тем, как меняются технологии.
В статье рассказываем про шесть важных и интересных трендов в кибербезе, а также разбираемся, как войти в профессию, кто сейчас востребован и как развиваться тем, кто уже работает в ИБ.
Читать далее