Habr.com | Kurgan-Telecom Ru | Информационные технологии

Habr.com

Все публикации подряд на Хабре

URL: https://habr.com/ru/articles/

Updated: 1 hour 19 min ago

Лучшие токены — те, которые вы не потратили: анатомия жадного LLM-бота

5 hours 23 min ago

При анализе кода с помощью LLM всегда есть соблазн закинуть в модель всё сразу — и пусть сама разбирается. Но на больших объёмах кода стоимость и время такого «пусть разбирается» быстро приводят нас в чувства и заставляют искать пути более экономной траты токенов.

Привет, меня зовут Андрей, я занимаюсь автоматизацией тестирования в hh. В этой статье расскажу, как мы оптимизировали запросы нашего бота, который анализирует тестовое покрытие с помощью LLM, чтобы получить максимум пользы при минимальных затратах.
Антоним токенмаксинга – токенпожарскинг токенминнинг?

Читать далее

Как мы вынесли семантический поиск на обычный сервер без видеокарты, облака и выделенной поисковой системы

5 hours 24 min ago

Когда мы занялись поисковым слоем AI-ассистента в «Первой Форме», договорились на входе: языковую модель, которая отвечает пользователю, не трогаем. Вся эта история — о том, что происходит на шаг раньше: как система решает, что именно показать модели, прежде чем та начнёт отвечать.

Планку себе поставили простую на словах и сложную на деле: семантический поиск промышленного уровня, но без специализированной инфраструктуры, целиком внутри изолированной сети, на том же оборудовании, что и само приложение.

Спойлер: получилось. В статье расскажу, какие решения мы принимали и что перебирали в качестве альтернатив. Но отдельно хочу выделить методику оценки: первые замеры качества нас обманули и увели в неверном направлении, и разбор того, почему так вышло, — возможно, самая полезная часть этого текста.

Читать далее

В поисках Deus ex Machina. Почему ИИ пытаются внедрить все, но это не всегда получается

5 hours 29 min ago

Генеративные модели пишут код и тексты, создают рекламу, анализируют данные и автоматизируют работу контактных центров. А компании, применяющие ИИ в своих бизнес-процессах, приносят своим акционерам дополнительные 0,64% доходности в неделю, по данным исследования Йельского университета.

Но есть нюанс. Многие бизнесы к ИИ пока не готовы — из-за отсутствия формализованных процессов, инфраструктуры, бюджетов, знаний и по иным причинам.

Мы в Cloud.ru с помощью опроса хотим выяснить, что на самом деле тормозит внедрение искусственного интеллекта. Поэтому просим сообщество Хабра поделиться своим мнением и опытом — не только в ответах на вопросы, но и в комментариях.

Пройти опрос

Чемпионат по контрактам: изучаем эволюцию атак киберпреступной группировки xplogs22

5 hours 31 min ago

Киберпреступные группы, атакующие Россию, отличаются разнообразием. Среди них есть те, кто специализируется на взломе исключительно российских компаний, а есть и такие, для кого организации в РФ — главная, но далеко не единственная цель. И среди них есть тоже разделение: одни киберпреступники предпочитают работать преимущественно по странам СНГ, а другие масштабируют свои атаки на Западную Европу, Ближний Восток и Юго-Восточную Азию. В этом блоге разберем атаки одной из таких группировок - xplogs22.

Читать далее

Обучение как инструмент роста: 5 принципов эффективного обучения на производстве

5 hours 37 min ago

Смена только началась. Оператор-новичок должен запустить обработку первой детали на станке с ЧПУ, но после недавней модернизации оборудования привычный порядок действий изменился. Мастер на больничном, старший мастер – на планерке в заводоуправлении, а бумажная инструкция устарела. Пока сотрудники пытаются разобраться, простаивает не только этот станок – задерживается запуск всей производственной линии. Можно ли этого избежать? Да. Рассказываем как.

Читать далее

600 слов, 80 минут, липиды в метро: 4 книги про математиков и цифры

5 hours 39 min ago

Герои этих романов живут в окружении цифр и понимают их зачастую куда лучше, чем окружающих. Собрала очень разные книги: психологическую семейную прозу, детектив и даже почти мелодраму. Итого две книги посложнее и две книги полегче.

«Журавлёв в небе», Андрей Гуртовенко

Как автор сказал в интервью на радио, проза позволяет показать больше, чем кино: и он сам погружает читателя в мир порядка и хаоса в голове героя. Цифры с детства сопровождают будущего талантливого ученого Виктора Журавлёва, он (отчасти из любопытства) выигрывает олимпиады, решает задачки, покоряет один школьный предмет за другим. Это – просто. Контролируемая часть жизни.

Но есть и броуновское движение, с которым он не всегда умеет взаимодействовать: проявляющая к нему интерес одноклассница, замалчивания в семье, бытовые сложности (как запомнить, включен или выключен утюг? заперта ли дверь?), взрослеющий сын, отказывающийся говорить по-русски после возвращения из Великобритании.

Герой проецирует свой ученый взгляд и на мир: однажды, стоя на платформе в метро, он ощущает себя будто на поверхности клетки, «посреди снующих вокруг него липидных молекул».

Читать далее

Что внутри #[derive(Serialize)]: TokenStream, syn, quote и почему этот serde так долго компилируется

5 hours 45 min ago

Привет, Хабр!

#[derive(Serialize, Deserialize)] это какая-то одна строка в коде. На холодной сборке за ней прячется двадцать с лишним секунд компиляции, даже если в проекте больше ничего нет. Откройте cargo build --timings на любом не самом маленьком проекте с serde, и serde_derive почти наверняка окажется в первой тройке самых медленных крейтов. При том что в самом serde_derive всего несколько тысяч строк.

Между этой строкой и этими секундами лежит вся инфраструктура процедурных макросов: TokenStream, syn, quote, proc-macro2, watt. Пройдёмся по ней в этой статье.

Читать далее

Куда уходит память? Семплирующее профилирование колонок с Алисой в проде

5 hours 46 min ago

Типичная умная колонка с Алисой — это скромное железо и совсем немного оперативной памяти: у младших моделей её всего 256 МБ на всё устройство сразу. И за каждый мегабайт идёт настоящая борьба между множеством команд и компонентов: бизнес‑логикой, обработкой звука, локальными нейросетями.

Ежедневно мы собираем и анализируем memory‑дампы с миллионов колонок — нам важно понимать, куда уходят эти драгоценные мегабайты.

Меня зовут Сергей, я работаю в команде, которая пишет прикладной код на C/C++ для умных устройств с Алисой (например, колонок, телевизоров и автомобилей). Под катом расскажу, как мы построили и используем инструмент для анализа потребления памяти в проде на нашем флоте Linux‑колонок.

Читать далее

Работа двигателей внутреннего сгорания на озоне?

5 hours 47 min ago

Картинка: jannoon028, magnific.com

В одной из прошлых статей мы бегло прошлись, а затем начали рассматривать и более подробно элементы, такой интереснейшей темы, как использование необычных средств для апгрейда работы тепловых двигателей — то бишь, двигателей внутреннего сгорания.

Не так давно мы уже рассмотрели любопытный способ получения водорода — плазменный электролиз (потенциально, в этих же целях, — для сжигания в двигателях), чей выход по водороду превышает классический электролиз, примерно в четыре раза (что уже само по себе заставляет более внимательно присмотреться к этому процессу как потенциальному источнику сгораемого топлива).

И сегодня мы подробно рассмотрим ещё одну необычную компоненту — использование озона в двигателях!

Читать далее

Я сыграл в 10 инди хорроров и понял что мы забыли о страхе

5 hours 48 min ago

Я очень люблю хорроры. Особенно нишевых представителей этого культурного пласта. Как только в кино выходит очередной слешер про морячка Папая или Бэмби — я сразу же бегу в кинотеатр и покупаю билет. Часто в зале я сижу один, но понимаю, что это не из‑за качества фильма, а очень специфичной темы. Так и в играх я всегда прохожу новенькие ужастики в числе первых.

Но в современном мире AAA‑хорроры выходят крайне редко из‑за сложности жанра. Не из‑за сложности создания, а из‑за сложности окупаемости. Тяжело продать массовой аудитории хорошие ужасы. Поэтому периодически я захожу на itch и ищу, какие новенькие проекты вышли из‑под пера маленьких команд. Но в этот раз я решил пойти по немного другому пути: я скачал 10 хорроров, несмотря на то, как игра себя позиционирует и какой рейтинг имеет. Я захотел разобраться в том, как молодые геймдизайнеры справляются с проектированием ужаса и какие ошибки допускают. Предлагаю окунуться в этот мир вместе со мной и посмотреть на то, как работают современные инди‑хорроры и где теряют игрока.

Продолжить исследование...

Как открыть ООО, когда перерос ИП: что меняется в налогах, выводе денег и рисках

5 hours 48 min ago

ИП — простой и дешевый старт для ИТ-команды или продуктового проекта. Но в какой-то момент бизнес упирается в потолок — появляются наемные разработчики, крупные заказчики-юрлица отказываются работать с «каким-то там ИП», а налоговые льготы для ИТ-компаний по-прежнему доступны только юридическому лицу. И предприниматель встает перед вопросом: переходить ли на ООО.

Эта статья — для тех, у кого уже есть работающее ИП и кто решает, пора ли менять форму. Внутри пошаговая инструкция по регистрации юрлица. И объективное сравнение: что реально меняется в налогах, в том, как вы достаете из бизнеса деньги, и в личной ответственности собственника — с конкретными цифрами и ставками 2026 года.

Читать далее

От телекома до пассажирских перевозок: два ПАК для мониторинга и удаленного управления

5 hours 48 min ago

У крупных компаний редко возникает задача создать систему мониторинга с нуля. Чаще приходится дорабатывать уже существующую инфраструктуру: добавлять сигналы, подключать новые объекты и решать проблемы, которые раньше никто не предполагал.

В этой статье расскажем о двух подобных кейсах на совсем разных площадках: телеком-оператора и пассажирского перевозчика.

Читать далее

Конец «крестного отца интеллектуальной собственности»: почему IBM добровольно отказалась от короны патентного короля

6 hours 8 min ago

В течение почти трех десятилетий IBM была не просто техногигантом, а абсолютным монархом в мире интеллектуальной собственности. С 1993 по 2022 год корпорация неизменно занимала первое место по количеству патентов, полученных в США, создав вокруг себя мощнейшую «патентную стену». IBM называли «крестными отцом интеллектуальной собственности», поскольку другие IT-компании были вынуждены при запуске новых продуктов идти на поклон к «дону» и покупать лицензии, а иногда приобретать и сами охранные документы (так, например, поступил Марк Цукерберг в первые годы существования своего детища). Принцип IBM был прост — патентовать всё, что только можно: от летающих дронов-доставщиков кофе до иконок на сайтах. Лицензирование и продажа объектов интеллектуальной собственности приносило отнюдь не баснословные, но вполне приличные деньги ветерану Кремниевой долины.

И тут у нового руководства IBM появилось видение и что-то пошло не по плану.

Читать далее

Система для научного исследования в Obsidian и Zotero: база знаний из сотен источников и анализ данных

6 hours 11 min ago

Ко мне обратилась исследовательница — социолог, изучающий, как на самом деле устроена жизнь коллективов: репутация, доверие, признание внутри команд. Работа устроена так: клиентка каждый день отсматривает и конспектирует по десятку новых научных статей и соотносит их с собственными эмпирическими данными. Ей нужна была система, которая свяжет весь этот разнородный материал воедино и позволит с ним работать, а не просто складывать.

Читать далее

[Перевод] Проектируем с нуля калькулятор на FPGA. Часть 7: микрокод для самодельного CPU

6 hours 12 min ago

← Шестая часть

В предыдущем посте мы спроектировали CPU. Я определился с набором команд, написал ассемблер, проверил каждый опкод и создал процессор, работающий в кремнии (или, точнее, в FPGA Altera Cyclone II EP2C5T144C8, что тоже довольно близко). Но у нас пока нет осмысленного ПО (микрокода калькулятора) для запуска на «железе».

В этой части проекта оправдали себя все эксперименты с прототипами на C++, описанные в частях 2 и 3.

Когда я начал писать addsub.asm (самую первую команду, которую я портировал), то не смотрел на пустую страницу, задаваясь вопросом, как работает BCD-сложение. У меня уже имелась эталонная реализация на C++ (addsub.cpp в проекте Proto), верифицированная на тысячах тестовых векторов. Алгоритм был известен, пограничные случаи найдены и охарактеризованы. Я проработал поведение защитного разряда и бита фиксации. Оставалось лишь транслировать это всё на язык ассемблера; задача всё равно сложная, но совершенно иного уровня сложности, нежели изобретение алгоритма в процессе его написания.

Я хотел бы сделать упор на этот двухэтапный процесс, потому что может показаться, что без него можно обойтись. Написание кода прототипа на C++ с последующей ручной трансляцией на язык ассемблера кажется избыточной и долгой работой. Однако она перестанет казаться избыточной к моменту, когда вы будете отлаживать неочевидный пограничный случай округления в 16-ниббловом BCD-вычитании. Наличие золотого эталона, с которым можно выполнять сравнения, не избыточно: это единственное, что стоит между вами и неделями кропотливого труда или даже провалом проекта.

Читать далее

Рейтинг маркетплейсов по качеству поиска. Июль 2026

6 hours 16 min ago

Все мы хоть раз искали что-то на маркетплейсах. И получали в выдаче совсем не то, что искали. YoloPrice разметил миллионы позиций поисковой выдач e-com площадок и посчитал, какая часть выдачи действительно отвечает на запрос пользователя. Отсюда родился рейтинг площадок по точности поисковой выдачи. Спойлер: у самых больших игроков мимо летит больше половины, а неожиданный лидер — вообще не маркетплейс. Полный рейтинг и методология — в статье.

Читать далее

Как научить 1С за две недели или что не так со студенческой практикой и ИТ-образованием

6 hours 41 min ago

Давно хотел собрать в одном месте всё, что понял за годы работы со студентами и учебными заведениями. Ко мне регулярно приходят студенты на практику, бываю на экзаменах по компетенциям «Тестировщик», «Веб-разработчик» и «Программист». То есть я вижу студентов как наставник, работодатель и как эксперт на оценке работ.

Я Денис — ведущий разработчик Outlines Tech и руководитель регионального 1С-франчайзи. Расскажу, какие проблемы увидел в обучении, что происходит на экзаменах и почему за две недели практики невозможно ничему научить. После прочтения приглашаю подискутировать на тему образования в комментариях.

Читать далее

Тензор пространства для аквариумных рыбок

6 hours 50 min ago

Тензор пространства - звучит очень загадочно и очень непонятно. Но на самом деле ничего сложного. Тензор пространства - матрица, набор чисел, которые определяют структуру пространства. Они буквально задают каким будет пространство, что и как в нём должно двигаться. Все изменения, которые мы видим вокруг, начиная от падения яблока до столкновения черных дыр определяет небольшой набор чисел. Причем числа эти нули и единицы, подобранны таким образом, что мы оказываемся заточенными в бесконечном пузыре, из которого не выбраться. Как рыбки в аквариуме. Ну у рыбок есть шанс удрать из аквариума, а вот у нас его скорее всего нет. Но давайте по порядку.

Читать далее

ИИ зависимость и лекарство от prompt injection (в том числе от системного промпта провайдера)

7 hours 14 min ago

Повсеместная экспансия различных ИИ-ассистентов во все сферы достигла такой глубины, что её впору сравнить с наркотической зависимостью. Эйфория от кратковременного всплеска производительности, который получается в самом начале внедрении интеллектуальных инструментов, даёт очень быстрый и измеримый экономический эффект, который подстёгивает компании встраивать ИИ в любой процесс.

Но именно этот первоначальный краткосрочный успех запускает механизм, который невозможно остановить, так как возникает замкнутый круг, напоминающий перефразированное высказывание Красной Королевы из «Алисы в Стране чудес»: чтобы просто сохранить позиции на рынке, нужно бежать изо всех сил, а чтобы вырваться вперёд конкурентов - нужно бежать ещё быстрее. Ведь подобная гонка внедрения ИИ решений во все сферы приносит ощутимые кратковременные экономические выигрыши, однако долгосрочные последствия такой зависимости от ИИ-решений становятся всё более печальными.

Читать далее

Заменит ли Джун Сеньора, если дать ему ИИ?

7 hours 27 min ago

В прошлой статье мы выяснили, что при остановленном найме сегодняшний Джун не может превратиться в классического старого матёрого Сеньора, руину героической эпохи, который ещё в детстве поднимал кластеры кубернетс в облаках через кнопочный телефон, разбивал легаси на микросервисы утром и мерджил их в монолит обратно вечером, копипастил со stackoverflow патчил бинарники, преобразовывал Фурье и всё это одновременно.

И когда сеньоры уйдут (R.I.P.) – и когда задача Спроектировать Solution ляжет на плечи Джуна, вытянет ли он на голом ИИ без опыта?

В целом, похоже, что вытянет. Но есть подводные камни, давайте посмотрим, как их решить.

Читать далее

Who's online

There are currently 1 user and 11 guests online.