Всем привет! Авторы бенчмарка MERA этим летом не только анонсировали отраслевую ветку — MERA Industrial, но и рады сообщить о расширении проекта на кодовые задачи.
Большие языковые модели (LLM) сегодня умеют не только вести диалог, но и писать код, помогать с документацией и автоматизировать задачи разработчиков. Однако возникает вопрос: «Как мы измеряем качество этих способностей?» Большинство бенчмарков сосредоточены на проверке понимания языка и, частично, на генерации кода. Но насколько такой код применим на практике? Учитываются ли требования, сформулированные на русском? Как модели работают с документацией на других языках, кроме английского? Мультиязычные бенчмарки вроде HumanEval-X, MultiPL-E и mxEval делают шаг в нужную сторону, но по большей части сосредоточены на языках программирования. Связь между кодом и естественным языком, особенно в многоязычном контексте, пока освещена слабо.
Чтобы учесть все эти моменты, мы разработали MERA Code — первый комплексный бенчмарк для оценки больших языковых моделей на реальных прикладных задачах, с которыми сталкивается программист в русскоязычном контексте.
Читать далееПлавучие дата-центры — ИТ-решения, размещаемые на морских платформах, баржах или судах вместо наземных зданий. Такой формат помогает снизить расходы на размещение, упростить охлаждение и сократить потребление электроэнергии. Их удобно использовать в регионах с ограниченными ресурсами или сложной логистикой — установка занимает меньше времени, чем строительство наземных объектов. Сегодня расскажу, что это за идея, какие проекты уже работают и зачем бизнесу и государствам такие центры.
Читать далееПривет, Хабр! Изначально Ubuntu Server создавался как легкая и производительная операционная система для работы с задачами на серверах. Именно поэтому на них по умолчанию не устанавливается графический интерфейс (GUI) — это позволяет экономить ресурсы, ускорять работу системы и повышать ее безопасность.
Однако бывают ситуации, когда графический интерфейс на сервере все же необходим. Например, если вам нужно запускать привычные десктопные программы прямо на сервере, тестировать приложения с графическим управлением и решать другие задачи. Под катом пошагово покажем, как установить GUI, на примере сервера Ubuntu 24.04 с минимальной конфигурацией.
Читать далееИли как я потратила некоторое время на доказательство временного парадокса: Z80 1976 года решает CAPTCHA 2010-х в 2025 году.
Читать далееПривет, на связи Настя Богусловская, редактор журнала «Конверт» (экс блог Unisender).
Хорошо ответить на негативный или положительный отзыв — это крутой навык. У одних компаний сильная коммуникация с клиентами, у других — чуть слабее. У некоторых предпринимателей похоже сдают нервы, поэтому в сети можно найти много треш-ответов на претензии покупателей.
Прошерстила разные площадки и нашла хорошие и слабоватые, забавные и кошмарные ответы компаний.
Читать далееС ростом автоматизации владельцы облачных инфраструктур всё чаще сталкиваются с угрозами, которые исходят от ботов, парсеров, агентов, сервисных и других подобных автоматизированных аккаунтов. По данным Google Cloud Threat Horizons Report, эксплуатация злоумышленниками таких непользовательских сущностей (или non‑human identities, NHI) остаётся в топе угроз, при этом тактики атак постоянно усложняются.
В ответ на это некоммерческая организация OWASP в 2025 году выпустила отдельный рейтинг по топ-10 атак для NHI: OWASP Non‑Human Identities Top 10.
Меня зовут Дмитрий Лютов, я занимаюсь продуктами безопасности в Yandex Cloud и в этой статье я пройдусь по основным угрозам из рейтинга OWASP. Покажу, каким образом владельцы облаков могут позаботиться о безопасности инфраструктуры.
Читать далееМы на Хабр Карьере помогаем IT-специалистам зарабатывать больше и находить качественные курсы, а компаниям — быть в курсе трендов на рынке найма.
На IT-рынке только и разговоров, что об онлайн-образовании, да и мы сами видим, сколько курсов появилось за последний год на маркетплейсе Хабр Карьеры. Внутри команды подумали, почему, несмотря на множество споров, онлайн-обучение остается популярным не только для новичков, но и тех, кто давно в профессии.
Наши варианты: специалисты выгорают (или нет) и хотят пробовать что-то новое, специалисты хотят расти в квалификации или узнать новые навыки, специалисты просто хотят больше зарабатывать.
А еще мы поняли, что для тех, кто уже в профессии, всё это — не обязательно повод увольняться и идти искать себя заново. Гораздо менее стрессовая опция в таком случае — переход внутри компании на другое направление, и чаще всего из не IT — в IT.
Для этой статьи мы опросили наших коллег из Хабра, которые меняли специализацию, не меняя компанию, и переходили в IT, ну или просто кардинально меняли и сферу, и компанию.
Читать далееПривет, Хабр!
Меня зовут Ярослав, я магистрант AI Talent Hub в ИТМО. Сегодня расскажу об одной из самых интересных статей ICLR 2025 — AFlow: Automating Agentic Workflow Generation.
В ней предложен подход к автоматическому созданию мультиагентных систем для решения прикладных задач с помощью LLM и алгоритма Monte Carlo Tree Search (MCTS). Разберёмся, как это работает и почему это важно.
Читать далееЭто программа-парсер. Вы указываете Telegram-канал, выбираете период — и получаете Excel-табличку со всеми публикациями, просмотрами, реакциями, репостами и вовлечённостью.
Хотите узнать, сколько всего текста опубликовал автор? Пожалуйста. Сколько платных звёздочек получил миллионник за 2024 год? Не вопрос. Хотите сформировать топ постов или сравнить эффективность разных форматов? Всё это — в один клик.
Но эта статья — не просто про парсер. Она про путь: как я, не будучи программистом, сделал этот инструмент с помощью нейросети. Что получилось, какие были затыки и чему я научился в процессе.
В конце — весь код и инструкция, как запустить парсер у себя.
Читать далееСегодняшняя рекомендация — практическое руководство от основателя и президента компании The Table Group о том, как пошагово «оздоровить» свою компанию и сделать так, чтобы менеджмент, операционная деятельность, стратегия и культура были согласованы и осмыслены. По мнению Патрика Ленсиони, ответственный подход к организационному здоровью помогает достичь успеха, в то время как сотрудники не самых благополучных компаниях мучаются от бюрократии, беспорядка, интриг и нарушения функций.
Читать далееХабр, привет! На связи Александр Леонов из Экспертного центра безопасности Positive Technologies (PT Expert Security Center), дежурный по самым опасным уязвимостям месяца. Мы с командой аналитиков Positive Technologies каждый месяц исследуем информацию об уязвимостях из баз и бюллетеней безопасности вендоров, социальных сетей, блогов, телеграм-каналов, баз эксплойтов, публичных репозиториев кода и выявляем во всем этом многообразии сведений трендовые уязвимости. Это те уязвимости, которые либо уже эксплуатируются вживую, либо будут эксплуатироваться в ближайшее время.
С прошлого дайджеста мы добавили 3 трендовые уязвимости.
Читать далееВам знакомо это чувство лёгкой паники, когда ваш ноутбук внезапно начинает жалобно пищать, а на экране возникает зловещее предупреждение: «Диск почти заполнен»? Со мной это тоже недавно случилось. Я открыл «Проводник» и остолбенел – мой внешний диск на 1 ТБ был забит под завязку – на 95%!
Виновниками оказались не фильмы и не игры, а гигантское кладбище фотографий. Двенадцать папок с безликим именем «DCIM», горы скриншотов, которые я копировал по пять раз «на всякий случай», и целые россыпи почти одинаковых снимков заката, сделанных в режиме серийной съёмки. Попытка вручную найти идентичные фото напоминала поиск иголки в стоге сена размером с Сибирь.
В предыдущей статье я разбирал, как лучше сортировать фото, и ещё тогда я понял: пора объявлять войну дубликатам. И вот этот момент настал. После тестирования более 15 инструментов (и кучи потраченных нервов) я отобрал 5 бесплатных программ, которые реально помогают решить проблему. Этим опытом и поделюсь.
Читать далееПривет! Меня зовут Ксюша Бердникова, я исследователь в Контур.Удостоверяющий Центр. Меня очень вдохновляет наставничество и системный подход к нему, поэтому в статье хочу обсудить: какие шаги, привычки и приемы помогают выстроить эффективную систему наставничества и как наставнику сохранять фокус на своих задачах, не теряя баланс.
Читать далее
Привет, Хабр! На связи Дарья Попова, тимлид группы мониторинга в Купере. Наша миссия — минимизировать потери от инцидентов для компании и обеспечить сервис на 10/10 для клиентов. Почему это именно группа — вы поймете дальше. Сегодня я расскажу, как мы выстраивали процессы и инструменты мониторинга и автоматизации — и как это все упростило нам жизнь.
Когда они заменили художников, я молчал, ведь я не умею рисовать. Когда они пришли за разработчиками, я молчал, ведь я не умею писать код. Но теперь они взялись за эксель.
Читать далееЦифровая трансформация предприятий приводит к стремительному росту неструктурированных данных (документы, изображения, логи). Ручная обработка подобных данных повышает стоимость процессов и создаёт риски ошибок. Robotic Process Automation (RPA) снижает издержки и повышает воспроизводимость, однако классические решения ограничены жёстко зашитыми сценариями. Растущее разнообразие кейсов требует гибкой платформы, способной порождать новые обработчики «на лету» и масштабировать их под неравномерную нагрузку. Настоящая статья демонстрирует, как микросервисный MVP RPA_SOFT подтверждает технологическую реализуемость такого подхода и логически ведёт к динамической модели.
1. MVP RPA_SOFT как исходная точка
Постановка задачи. Требовалось создать сервис, принимающий CSV/JSON/PDF через REST-эндпоинт или веб-UI, автоматически распознающий структуру, выполняющий морфемный анализ и компоновку (пока через API YandexGPT), финализирующий результат и сохраняющий его в MongoDB, пользователю при этом отображается прогресс и ссылка на артефакты
Архитектура MVP. Прототип развёрнут на VM (Proxmox) и состоит из трёх ключевых микросервисов – Auth, DP, API Gateway – плюс веб-клиент. DP-service (Node 20 + Python 3.12) закрывает весь конвейер обработки, API Gateway служит единой точкой входа, Auth-service зарезервирован под грядущую MFA/JWT-логику, пока используются cookie-сессии на MongoStore (см. рис.1).
Читать далееИногда продуктовая фича живёт в приложении «для галочки». Пользователи вроде бы ею пользуются, команда её не развивает, а аналитики не могут толком оценить влияние на метрики. Так было с нашим старым механизмом поиска ближайших машин в каршеринге — «Радаром». Он просто пинговал координаты и сообщал, когда рядом появлялась машина. Никакой логики приоритизации, никаких фильтров, никакого резерва — сырая идея без развития.
В статье рассказываем, как мы заново осмыслили и пересобрали фичу:
• продакт Настя Голованова — о том, как мы нашли value, перезапустили механику и успели в сроки размещения наружной рекламы;
• разработчик Михаил Ефанов — про то, как превратить монолит в стабильную архитектуру.
Полезно будет всем, кто работает на стыке развитии продукта и инженерии: от старта фичи до релиза и плана развитии.
Читать далееПочему стартап так и не запускается, хотя «уже почти»
Многие команды проходят этот путь. Всё вроде бы работает, осталось «совсем немного», но неделя за неделей релиз откладывается...
Читать далееВ этом году Rainbow Six Siege исполняется 10 лет. В честь этого Ubisoft решила перевести свой тактический онлайн-шутер на условно-бесплатную модель распространения, а также добавила крупный режим 6x6. В игру вливается много новичков, поэтому самое время залетать и старожилам, которые когда-то бросили «Осаду».
В этом тексте я расскажу о значимых переменах, которые произошли с Rainbow Six Siege за годы ее существования. Какой игра была, и какой она стала — от поклонника с 1000 часов за плечами.
Читать далееПривет, Хаброжители!
Предлагаем ознакомиться с краткими обзорами новинок, отправленных в типографию.
Читать далее