Feed aggregator

Вредные советы: как угробить своего AI-агента

Habr.com - Wed, 10/08/2025 - 15:15

Ваш AI-агент ведет себя как капризный стажер и доказывает, что 2+2=5? Или вы уже третью неделю пытаетесь дообучить модель, а она делает вид, что не понимает, чего вы от нее хотите?

Кажется, пора признать: классические подходы не работают. Пока одни AI-инженеры кропотливо готовят данные и тестируют их, другие непослушные инженеры открыли простую истину. Они всё делают наоборот: не тестируют агентов, кормят модель мусором и открывают ей полный доступ к конфиденциальным данным.

И знаете что? У них получаются самые незабываемые агенты!

Мы в команде Cloud.ru подумали: зачем бороться с этой гениальной стратегией? Гораздо эффективнее ее систематизировать: таким инженерам нужно давать не полезные, а вредные советы. Они все сделают наоборот, и получится как раз правильно.

В статье собрали вредные советы для идеального саботажа. Читайте и внедряйте.

Читать советы

Erlang-совместимые битовые строки в Go: создаём funbit

Habr.com - Wed, 10/08/2025 - 15:14

Erlang-совместимые битовые строки в Go: создаём funbit

TL;DR: Мы перенесли битовый синтаксис Erlang в Go, чтобы парсить бинарные протоколы без боли. Получилась библиотека funbit — декларативный парсер с поддержкой не выровненных по байтам данных.

Предыстория

В процессе разработки funterm — мультиязыкового REPL, объединяющего Python, Lua, JavaScript и Go — мы столкнулись с необходимостью эффективной работы с бинарными данными. Нужно было парсить сетевые протоколы, обрабатывать структурированные данные и работать с битовыми полями на уровне отдельных битов.

Читать далее

Несколько слов о корпускулярно-волновом дуализме

Habr.com - Wed, 10/08/2025 - 15:14

Раньше люди думали, что свет - это луч, состоящий из частиц. Потом поняли, что волна. Потом увидели, что свет проявляет свойства и частицы и волны и придумали корпускулярно-волновой дуализм. Современные физики говорят, что прежнее понятие корпускулярно-волнового дуализма уже устарело. Так и что же такое свет и как сегодня следует понимать корпускулярно-волновой дуализм?

Читать далее

Аутсорсинг айтишников, где проходит граница между проектом и трудовыми отношениями

Habr.com - Wed, 10/08/2025 - 15:06

В ИТ это знакомая ситуация. Вроде бы берёшь человека «на проект», а через пару месяцев он сидит у тебя в офисе каждый день, ходит на планёрки, слушает руководителя команды и получает фиксированную оплату. На бумаге подряд. По факту самый обычный трудовой договор. И именно здесь начинается зона риска.

Читать далее

Function Object — как основа бизнес логики приложения

Habr.com - Wed, 10/08/2025 - 15:04

В предыдущей статье "Адаптированный паттерн Command с использованием Dependency Injection", я описывал как инкапсуляция логики приложений в отдельные объекты-функции позволяет получить преимущества в архитектуре приложений.

В качестве основы для концепции объекта-функции мной был выбран известный паттерн Command, но обсуждение статьи показало, что читателям тяжело отказатся от слишком узкой специфики паттерна Command и это мешяет восприятию материала.

Эта статья пытается исправиль допущенную автором ошибку.

Статья является дополнением к предыдущей.

Читать далее

858 терабайт государственных данных Южной Кореи сгорели к чёртовой матери. Бэкапа просто не было

Habr.com - Wed, 10/08/2025 - 14:56

Один из специалистов по восстановлению данных покончил с собой. Катастрофа случилась из-за чудовищной халатности.

Читать далее

Greengage DB: новый open-source монстр MPP-аналитики. Конец эпохи Greenplum?*

Habr.com - Wed, 10/08/2025 - 14:39

Что, если Greenplum пережил перерождение?
Новый проект Greengage DB возвращает PostgreSQL в большую игру — теперь с авто-масштабированием, чистым ядром и реальной совместимостью.
Разбираемся, почему этот форк может стать «Linux для аналитики».

Читать далее

Системные модели: ключ к техническому суверенитету и реальной эффективности НИОКР

Habr.com - Wed, 10/08/2025 - 14:27

Уважаемые коллеги, руководители государственных компаний, министерств и ведомств, курирующих национальные проекты и ОПК!

Объем государственных инвестиций в НИОКР в рамках национальных проектов и оборонного заказа на ближайшие годы оценивается в 2–5 триллионов рублей ежегодно. Это масштабные ресурсы, направленные на технологический прорыв и укрепление суверенитета страны, которые обладают высоким мультипликативным эффектом на все отрасли экономики. Однако ключевой вопрос, который мы должны задать себе: какая часть этих средств будет потрачена эффективно, а какая — на совершение и исправление ошибок, задержки по срокам и неоптимальные инженерные решения?

Данные ряда международных исследований начиная с 2010 года показывают, что в привычном течении процессов разработки в среднем 37% бюджета НИОКР тратится не результативно — на устранение ошибок, выявляемых на поздних стадиях работ, что приводит к значительным скрытым повторным трудозатратам,  дорогостоящим переделкам аппаратуры и затягивает циклы испытаний-доработок. В масштабах российского госбюджета это от половины до полутора триллионов рублей ежегодных потерь на ошибки, для исключения которых уже есть зарекомендовавшая себя методология.

Решением этой проблемы является системное моделирование — целенаправленная политика обязательного применения “исполняемых системных моделей” на всех этапах жизненного цикла техники: от проверки концепций до формирования технических заданий и планов проектов, и далее в этапах проектирования, испытаний и сопровождения.

Читать далее

Ускорение и СТО

Habr.com - Wed, 10/08/2025 - 14:19

Многим людям нравится научная фантастика, я тоже люблю иногда почитать "Автостопом по галактике" или посмотреть "Интерстеллар". Во время потребления подобного контента возникает один и тот же вопрос: как они путешествуют на такие далекие расстояния за такое короткое время? Я хочу попробовать ответить на этот вопрос с точки зрения релятивистской механики.

В данной статье мы рассмотрим полет ракеты с Земли до ближайшей к Солнцу звезде - Проксиме Центавра.

Читать далее

Как обеспечить безопасность ОС Linux по рекомендациям ФСТЭК России

Habr.com - Wed, 10/08/2025 - 14:15

Неверные настройки не всегда выглядят как критические уязвимости, но именно они часто становятся причиной сбоев и потери данных, а также точкой входа для злоумышленников. ФСТЭК России в рекомендациях по безопасной настройке Linux подчеркивает важность исправления мисконфигураций, однако наш анализ показал: около 90% компаний нарушают хотя бы одно требование из методики, а почти половина — четыре и больше. В этой статье разберем процесс исправления мисконфигов в разрезе требований ФСТЭК и покажем, как это реализовать на практике.

Читать

Больше, чем просто кофе: как контекстная реклама помогает строить бизнес

Habr.com - Wed, 10/08/2025 - 14:11

В кейсе рассказываем, как с помощью контекстной рекламы за 3 года получили 3 891 обращение по 1 786₽ для готового бизнеса мини-кофеен самообслуживания.

Читать далее

130+ датасетов для машинного обучения: гид, который сэкономит часы поиска нужных данных

Habr.com - Wed, 10/08/2025 - 14:08

Сколько раз вы начинали новый ML-проект и первым делом отправлялись на поиски подходящих данных? Процесс этот знаком каждому: есть задача, выбрана архитектура модели, но без качественного датасета дальше не продвинуться. Тут и начинается квест по бесконечному поиску «того самого» набора по репозиториям, форумам и каталогам. 

Хороших датасетов множество, но найти среди тысяч вариантов нужный — отдельная история. Чтобы облегчить вам эту задачу, мы сделали подборку датасетов, которые активно используются ML-инженерами: от классических наборов данных, известных каждому, до новичков в информационном поле.

Читать далее

Дорожная карта Java backend-разработчика: c Junior до Middle

Habr.com - Wed, 10/08/2025 - 14:01

Привет! Меня зовут Бромбин Андрей. За последние годы у меня накопилось достаточно материалов, практик и ошибок — иногда красивых, но всё же ошибок. Этого хватило, чтобы собрать маршрут до грейда Middle.

Это не «большая книга всего на свете для джуна» и не выдуманный субъективный маршрут. Мне удалось привлечь к созданию этой статьи ведущих разработчиков крупных российских компаний — от каждого я получил честный фидбэк: где перегнул, где недосказал, чего не хватает на практике. Приоритеты были сверены, лишнее вычищено и оставлено только то, что реально двигает.

Признаться, честно: тут и для меня нашлось, что подтянуть.

Выстроить маршрут

Как из готовых инструментов сделать систему на петабайт данных: рецепт счастья для разработчиков и бизнеса

Habr.com - Wed, 10/08/2025 - 14:00

Любому бизнесу не нравится терять деньги — в этом смысл бизнеса. Каждая партия брака — это потраченные время и ресурсы, упущенная прибыль. Тогда бизнес приходит и говорит: «Давайте как-то измерять показатели, чтобы вовремя что-то менять, видеть всё это в реальном времени, и, главное — на основе данных». Так как же осчастливить сразу бизнес, разработчиков и себя?

Привет, Хабр! Я — Павел Лукьянов, системный архитектор и Deputy CTO в AGIMA. В этой статье по мотивам доклада с Saint HighLoad++  на примере одного из реальных кейсов с большим количеством внешних систем для сбора данных расскажу, как их собирать и обрабатывать, представлю готовые импортозамещённые инструменты для систематизации и хранения. Кроме того, покажу, почему не стоит заморачиваться из-за безопасности и по какой причине бизнесу важно следить за проектом в реальном времени и принимать решения.

Читать далее

Сокращаем трудозатраты при выводе витрин на Hadoop

Habr.com - Wed, 10/08/2025 - 13:42

Привет, друзья! Я Олег Васильев, владелец продукта Dream DE. В этой статье расскажу, как мы научились быстро и эффективно выводить витрины на Hadoop в эксплуатацию, или как мы за один квартал вывели 26 инициатив в рабочую среду силами четырёх инженеров по данным.

Читать далее

[Перевод] Слезть с курса стероидов. Полагаясь на советы из форумов, а не мнение врачей

Habr.com - Wed, 10/08/2025 - 13:35

Проблема в том, что не существует медицинского регламента или конкретного протокола для потребителей анаболических стероидов, пытающихся слезть с курса. Это подталкивает таких людей искать советы на форумах и чатах, то повышает риски побочных эффектов. Насколько широка эта проблема? Шире, чем кажется на первый взгляд.

Читать далее

Chonkie: революция в RAG-чанкинге — скорость, лёгкость, удобство

Habr.com - Wed, 10/08/2025 - 13:14

В эпоху, когда большие языковые модели (LLM) становятся всё более мощными и применяются во многих задачах, одна из ключевых проблем остаётся прежней — как эффективно снабжать их релевантным контекстом. Одним из популярных решений является подход RAG, где качество итогового ответа зависит от целого ряда факторов, одним из которых является качественное чанкирование исходных текстов. Сегодня мы рассмотрим одно из новых и интересных решений.

Всем привет! Меня зовут Вадим, я Data Scientist в компании Raft. В этой статье я расскажу о Chonkie — библиотеке для простого и быстрого чанкирования документов, а также на практике применю её и сравню с другими популярными решениями: LangChain и LlamaIndex.

Читать далее

ЕС1851: стресс-тест процессора Intel 80386SX-16 в XXI веке

Habr.com - Wed, 10/08/2025 - 13:05

Здравствуйте, уважаемые читатели! Сегодня я хочу предоставить вашему вниманию артефакт прошлого — ПЭВМ «ЕС1851». Если точнее, предлагаю взглянуть на его фрагменты, которые, тем не менее, дают представление об устройстве этой вычислительной машины. Запустим и посмотрим тесты и выйдем в интернет при помощи браузеров под «MS-DOS» — благо процессор Intel 80386SX-16 это позволяет. В качестве развлечения глянем, как ведут себя любимые игры: «Prince of Persia 2», «Legend of Kyrandia», а в качестве разогревающего фактора используем, разумеется, «DOOM». На него же и наведём пирометр.

За мной, читатель (с)

Проектный офис: как объединить в единой цифровой системе стратегическое планирование и расстановку приоритетов

Habr.com - Wed, 10/08/2025 - 13:02

Если у вас много проектов и управление ими отнимает львиную долю ресурсов руководства — сочувствую. Ваш проектный офис превратился из центра стратегических перемен в простого администратора отчётности. Мой опыт подсказывает, что это — следствие устаревшего подхода к управлению, когда стратегия существует отдельно от реальных действий и, тем более, команды.

Читать далее

Новые вирусы против супербактерий: как ИИ меняет правила игры

Habr.com - Wed, 10/08/2025 - 13:01

Супербактерии — микроорганизмы, не реагирущие на антибиотики. Что это значит? Болезни, которые раньше лечились за несколько дней, теперь становятся опаснее. Каждый год от таких инфекций умирают миллионы людей, и к 2050 году число жертв может вырасти до десяти млн в год. Проблема в том, что новые лекарства создаются медленно и стоят все дороже, а бактерии мутируют быстрее, чем фармацевтика успевает на них реагировать.

В этой ситуации на помощь приходят бактериофаги, или фаги, — вирусы, которые естественным образом уничтожают «суперов», не затрагивая клетки человека. А еще в этом помогают технологии. Так, ИИ позволил создать совершенно новые варианты вирусов, которые могут преодолевать даже искусственно выведенную устойчивость. Сегодня предлагаю разобрать, как работает этот механизм и какие вызовы стоят перед методами, сочетающими биологию с машинным обучением.

Читать далее

Who's online

There are currently 0 users and 6 guests online.
Syndicate content