На данный момент я прохожу 5-дневный интенсив по AI-агентам от Google и параллельно веду собственный конспект. Эта статья представляет собой перевод оригинального материала, выполненный с помощью Gemini и мной. В некоторых местах я немного упростила формулировки или обобщила идеи.
Оригинал статьи тут Agent Quality
Другие статьи:
Интенсивный курс «AI-агенты» от Google День 1
Интенсивный курс «AI-агенты» от Google День 2
Интенсивный курс «AI-агенты» от Google День 3
В Сбере, в Управлении базовых моделей Kandinsky были разработаны токенизаторы KVAE как для изображений, так и для видео, превосходящие state-of-the-art аналоги как по объективным метрикам (PSNR), так и по качеству генерации.
Прямое назначение этих моделей: декодирование и формирование латентного пространства для диффузионных моделей, к которым относится Flux, Wan, StableDiffusion и другие. Качество генераций этих моделей напрямую зависит от выбранного токенизатора.
В посте приведены подробности разработанного решения, которое будет полноценно представлено в рамках AIJourney 2025.
Читать далееСовременная IT-инфраструктура предъявляет все более высокие требования к масштабируемости, надежности и энергоэффективности. Одновременно сокращается жизненный цикл платформ: чем быстрее приходят инновации, тем короче становится срок актуальности серверных решений.
При выборе серверной архитектуры важно не только учитывать текущие задачи, но и просчитывать расходы на модернизацию на горизонте 3–5 лет. В этой статье мы расскажем, какие принципы заложили в собственный сервер и как это поможет бизнесу сегодня и в будущем. Подробности под катом!
Читать далееКазалось бы, зачем вообще нужен самолёт длиннее футбольного поля и с грузоподъёмностью в десять раз больше, чем у Boeing 777? Настолько огромный, что его сложно вписать в привычные для грузовой авиации процессы и маршруты. Логично было бы подумать, что он создан для перевозки всего и сразу — тонны полезного груза, пассажиров и так далее. Но нет.
Компания Radia строит самолет WindRunner под одну-единственную задачу: доставлять гигантские лопасти ветрогенераторов длиной под сто метров в места, куда обычный самолёт даже не попробует сесть.
Читать далееЯ расскажу о своём подходе к программированию под условным названием «хрустальный код», когда за счёт строгого следования спецификациям методов и путём минимизации проверок и валидаций мы создаём быстрое и надёжное ПО.
Читать далееВсем привет! Меня зовут Максим Кушнер, и я занимаюсь BI-разработкой в команде HR-аналитики «Лемана Тех». Дашборды, которые создаёт и поддерживает наша команда, охватывают широкий круг HR-процессов компании, в т. ч. состояние и движение персонала, расходы на персонал, продуктивность, контроль использования рабочего времени, обучение, профессиональное развитие, вовлечённость, внутренние конкурсы, различные рейтинги и др. Пользователями дашбордов могут быть все 40 000+ сотрудников нашей компании – от топ-менеджмента до любого работника в магазине. Соответственно, количество различных срезов данных и бизнес-показателей в дашбордах может исчисляться десятками.
И очень часто наши коллеги говорят: «Ваш дашборд, конечно, классный, но нам хочется самим покрутить данные». Другими словами, пользователи хотят построить аналитику в нужных им разрезах и структуре, которые не предусмотрены разработчиком по умолчанию.
Если не пытаться решить эту боль пользователя, то он просто экспортирует сырые данные из дашборда в Excel, где использует инструмент сводных таблиц (pivot tables) для выстраивания аналитики в нужном ему виде. Но тогда встаёт вопрос: зачем нужен такой дашборд (и его разработчики), если пользователь использует его как перевалочный пункт, а основную ценность извлекает из другого инструмента?
Искусственный интеллект (ИИ) меняет мир быстрее, чем мы успеваем к этому привыкнуть — от генерации картин и текстов до управления машинами и защитных систем. Теперь он добрался и до киберпространства, где стал оружием и для специалистов по безопасности, и для хакеров. Большие языковые модели вроде GPT и Llama превратили ИИ в универсальный инструмент: он помогает атаковать и защищаться, меняя сами правила цифровой войны. Это уже реальность, в которой алгоритмы задают темп. Давайте разберемся, как именно ИИ применяется по обе стороны баррикад, какие технологии за этим стоят и к чему все это ведет.
Читать далееВ предыдущей моей статье разбиралась реализация подключения мобильного интернета от удаленной на 7 км не заглушенной вышки в условиях его ограничений и практически тотальной блокировки. Спустя несколько месяцев пользования оборудованием возникло естественное желание улучшить ситуацию со стабильностью интернет‑подключения.
Читать далееВ мире высокочастотных измерений стоимость оборудования часто становится непреодолимым барьером для исследователей и радиолюбителей. Профессиональные анализаторы спектра, обеспечивающие точный контроль канальной мощности в СВЧ‑трактах, остаются недоступными для многих лабораторий и энтузиастов. Однако современная элементная база предлагает доступное, во всех смыслах, решение этой проблемы.Предлагаемое устройство на основе логарифмического детектора в связке с бюджетным микроконтроллером демонстрирует, что эффективный СВЧ‑мониторинг может быть доступен каждому.
Читать далееМаркетинговые инструменты нужны любому e-commerce приложению. Без них команда работает вслепую, продукт не решает ключевых пользовательских задач и теряет аудиторию.
В этой статье аналитик студии комплексной разработки цифровых продуктов CleverPumpkin Алёна Сорокина, совместно с брендами «ВкусВилл», Flowwow и Kassir.ru поделились опытом — какие маркетинговые инструменты помогают e-commerce-проектам расти и какие выбрать под текущий этап развития бизнеса.
Читать далееНажми и забудь: как автоматизировать рутину с PowerShell и GUI
Это руководство пригодится всем, кто устал от рутины и хочет сделать свои PowerShell-скрипты доступными для коллег: системным администраторам, инженерам технической поддержки, DevOps-специалистам. Мы не только разберем основы создания кнопок и окон, но и ответим на ключевые вопросы: Как выбрать между WinForms и WPF, как избежать зависания интерфейса при выполнении долгих операций, и как удобно упаковать ваш скрипт в EXE или ярлык, чтобы любой сотрудник мог запустить его одним кликом.
Читать далееНазвание громкое, но цель реальна: написать на Python простую, но полезную утилиту для обработки изображений, которая выглядит и работает как современное приложение.
Внутри — пошаговый гайд, где мы берем всю мощь библиотеки Pillow для работы с картинками, добавляем магию Flet для создания интерфейса. Только чистый Python.
«Раньше на оптимизацию уходило много времени и приходилось делать много ручных расчетов». Знакомо? Цитата первого замгендиректора «Оргэнергостроя» как нельзя лучше описывает проблему проектировщиков.
В кейсе мы разберем, как внедрение продуктов линейки nanoCAD позволило одной из ключевых компаний в атомной отрасли изменить ситуацию.
АО «Оргэнергострой» – ведущая проектная организация, специализирующаяся на проектировании особо ответственных объектов капитального строительства, включая объекты атомной энергетики. Компания участвует в реализации стратегических проектов национального значения, где особые требования предъявляются к точности проектирования и соответствию строгим нормативным стандартам.
Узнать об опытеПривет, Хабр! На связи Дмитрий Гребнев, руководитель команды Beehive в Рунити. Сегодня поговорим о том, как сделать управление командой предсказуемым — не на ощущениях, а на данных.
Статья будет полезна тем, кто сталкивается с постоянным «разъездом» сроков и переоценкой задач — разработчикам, руководителям команд и менеджерам проектов, работающим по Agile. Речь пойдет о статистическом методе управления: как метрики помогают бороться с шумом и смещением в оценках, почему начинать стоит с Cycle Time, и как декомпозиция, блокировки и нормальное распределение влияют на эффективность команды.
Читать далееПривет, мы продолжаем разбирать полиморфизм в React. В прошлой серии мы разобрали паттерн as — мощный, типобезопасный, но с проблемами в композиции. Сегодня разберем, как решить эту проблему с помощью паттерна asChild. Спойлер: это сделает ваш код чище, композируемее и приятнее для глаз, но придется пожертвовать поддерживаемостью.
Читать про asChildКоманда AI for Devs подготовила перевод исследования OpenAI о том, как обучение разреженных моделей может сделать ИИ более прозрачным. Авторы показывают: если заставить модель использовать меньше связей, внутри неё появляются понятные цепочки вычислений, которые можно изучать и проверять. Это может стать шагом к созданию мощных, но интерпретируемых систем.
Читать далееВ каждой компании независимо от ее размера и вида деятельности проводятся совещания. Многие сотрудники, да и руководители разных уровней считают, что совещания отнимают много времени и зачастую зримого результата от них не наблюдается. Тем не менее они регулярно проводятся. Проведение совещания – это прихоть руководителя компании или что-то другое, что необходимо для деятельности компании?
Прежде всего давайте посмотрим, для чего и с какой целью проводятся совещания. Это же не просто прихоть руководителя любого уровня, который хочет показать свою значимость перед подчиненными?
Необходимо отметить, что вопрос работы руководителей, находящихся на разных уровнях управления, с точки зрения функционирования механизма управления практически нигде не изучается и не рассматривается по очевидной причине – отсутствие точного и ясного понимания, что такое процесс управления и как функционирует система управления. Существующие исследования, которые имеются и затрагивают этот аспект деятельности руководителей (процесс управления), с одной стороны, отрывочные и не системные, а с другой стороны не ясен вопрос, а что здесь изучать.
Обычно авторы рассматривают человеческие аспекты деятельности руководителей в компании и оценка общих результатов их работы на основе числовых показателей деятельности компании. Это тоже важно и нужно, но без ясного понимания, каким образом руководитель осуществляет свою функцию управления - целенаправленное воздействие на сотрудников, нельзя понять, насколько эффективно его управление, как он это реализует и как это может отразится на результатах деятельности компании.
Читать далееИИ-агенты всё лучше справляются с решением тестов на общее развитие, поиском информации, рисованием картинок и даже программированием, но вот с интерфейсами на рабочем столе они пока не очень. Оказывается, реальные пользовательские интерфейсы с сотнями мелких элементов, шумом и похожими иконками – всё ещё сложное испытание. Количество опций на экране слишком велико для тривиального перебора, так что агенту надо понимать, что происходит на экране и где именно тот элемент, который нужен по инструкции пользователя.
Как ни странно, но не большие обезличенные датасеты делают агента умнее, а много человеческой и плотной разметки. Вместо миллионов сгенерированных картинок откуда‑то взятые десятки тысяч реальных сценариев использования с ручным выделением и подписью каждого элемента. Почему это важно и что это меняет для разработки агентов – давайте разбираться на примере нового исследования.
Читать далееПривет, Хабр! Меня зовут Ольга Проскурякова, я лид направления тестирования в компании TData. Эта статья — моя первая публикация на Хабре. Буда рада поделиться своим опытом.
Платформа, которую разрабатывает TData — это комплексное решение для работы с большими данными: сбор, управление, хранение, визуализация и анализ. В центре платформы — десяток ключевых продуктов. Все они проходят проверку нашей командой тестировщиков. Сегодня я расскажу о том, как мы тестируем один из них.
Для наглядности опишу предметную область тестирования. Это продукт RT.Warehouse — массивно‑параллельная СУБД для построения хранилищ данных, разработанная на базе Greenplum.
RT.Warehouse обеспечивает высокую степень производительности и отказоустойчивости благодаря гибкости горизонтального масштабирования, использованию в ядре продвинутого оптимизатора запросов и адаптации архитектуры для хранения и обработки больших массивов данных.
Читать далееМногие ИТ-компании используют опенспейс в офисах для экономии бюджета и стимуляции кросс-командного взаимодействия. Открытая планировка облегчает коммуникацию, но сотрудники зачастую ощущают снижение концентрации внимания, испытывают стресс и переутомление из окружающего шума.
Меня зовут Наталия Смирнова, я старший консультант в департаменте 1С в «КОРУС Консалтинг», и в этой статье мы проанализируем психологические аспекты работы в общем пространстве и разберем практические инструменты защиты от потери эффективности.
Читать далее