Habr.com

Syndicate content Хабр
Все публикации подряд на Хабре
Updated: 1 hour 50 min ago

Hybrid RAG knowledge base за 15 минут — почему пришлось собрать свою lite версию RAG и в чем опасность RAG фреймворков

12 hours 58 min ago

Архитектура Hybrid RAG систем заняла нишу корпоративных баз знаний, став стандартом для построения сервисов генерации контента на основе внутренних корпоративных данных. Уже пару лет у этого подхода практически нет альтернатив, когда речь заходит о сочетании возможностей генеративного ИИ с требованиями корпоративной безопасности и доверия к полученным результатам. Ключевое преимущество RAG перед обычным взаимодействием с нейросетями заключается в прозрачности: мы четко видим, на основе каких документов был сформирован ответ, и можем проверить каждый шаг пайплайна

Почти в каждом проекте, которые мне удалось наблюдать, происходило одно и то же - сначала команда стартует с LangChain или LlamaIndex через пару месяцев пайплайн становится неуправляемым, далее половина фреймворка выкидывается и пишется свой костомный retrieval. В итоге архитектура почти всегда выглядит одинаково - Frontend + Python backend + vector search + LLM API

В этой статье я покажу почему это происходит, поделюсь сложностями с которыми можно столкнуться при реализации корпоративных баз знаний основанных на RAG технологиях, расскажу почему готовые фреймворки иногда могут быть опасны для проекта и как я пришел к созданию универсальной сборки RAG системы разворачиваемой за 15 минут

За последние два года вокруг вокруг RAG систем сформировалась огромная инфраструктура. Появились специализированные фреймворки и облачные сервисы. Однако, если присмотреться к реальным запросам бизнеса, вырисовывается устойчивый паттерн. Компании хотят быстрый запуск без глубокого погружения в разработку продукта, в пару кликов загрузить корпоративные документы и получать ответы на запросы по своим внутренним документам. Компаниям не нужен очередной конструктор с бесконечными настройками, а востребована легкая, быстро разворачиваемая корпоративная RAG база знаний

Основной актив, с которым должны работать такие системы это регламенты, техническая документация, договоры, инструкции и неструктурированные базы знаний. И здесь RAG действительно незаменим. Но существует и обратная сторона медали:

Читать далее

Чебурнет 2026: как мы дотерпелись

13 hours 54 min ago

Снова привет, Хабр.... добро пожаловать в 2026

О белых списках, Yggdrasil и о том как мы достигли нового уровня блокировок

Читать далее

Менеджер памяти CPython — проектируем с нуля, простым языком

15 hours 36 min ago

Давайте спроектируем с нуля менеджер памяти CPython — начнём с самой простой и понятной наивной реализации, а затем шаг за шагом будем разбираться, какие изъяны в ней есть, и придумывать как их решать, постепенно усложняя общую модель.

Это один из лучших способов понять сложную систему — пройти путь её поэтапного проектирования. Система сложна, осознать её очень непросто, но мы разобьём её на простые шаги, понять которые очень легко. После этого пазл сам собой сложится в голове, и общая картина системы будет для вас такой же простой и очевидной.

Читать далее

ИИ будет писать код. Но кто возьмёт ответственность за жизнь программного обеспечения?

15 hours 51 min ago

Впервые в истории человечество может генерировать программное обеспечение быстрее, чем способно понимать создаваемые системы.

На протяжении многих лет индустрию программного обеспечения волновал один вопрос:

Кто будет писать код?

Теперь искусственный интеллект способен генерировать тысячи строк кода за секунды.

Но это порождает гораздо более важный вопрос — тот, который почти никто в технологическом мире не задаёт:

Кто будет нести ответственность за жизнь программных систем, которые ИИ собирается создавать?

Потому что написать код легко.
Жить с последствиями этого кода следующие двадцать лет — значительно сложнее.

Чтобы понять, что на самом деле происходит, нужно разделить три совершенно разные роли в разработке программного обеспечения.

1️⃣ Написание кода
2️⃣ Проектирование алгоритмов и систем
3️⃣ Ответственность за жизненный цикл программного обеспечения

Эти роли часто воспринимаются так, будто это одно и то же.

Но это не так.

И появление ИИ заставляет нас наконец увидеть эту разницу.

Читать далее

Магия ИИ-банкинга 5.0 и её разоблачение

16 hours 34 min ago

Банковское приложение на твоём телефоне знает о тебе больше, чем твой лучший друг. Каждую покупку, каждый перевод, каждую зарплату, каждый кредит. При этом тебя просят представиться и рассказать всю историю, когда ты звонишь в поддержку. Люди редко заходят в приложение банка ради удовольствия — это не Онлайн-кинотеатр и не Telegram. С другой стороны, каждый хочет, чтобы банк помогал тратить деньги с умом и достигать поставленных целей, подсказывал лучшие условия кэшбэка, напоминал о платежах и не забывал помогать инвестировать свободные деньги. Не заставлял заполнять анкету в пятый раз, а делал жизнь проще и выгоднее.

Читать далее

Теорема Гаусса‑Маркова и ее условия

17 hours 2 min ago

Теорема Гаусса‑Маркова:

Почему метод наименьших квадратов работает? Почему ему можно доверять? И при каких условиях он действительно дает лучшие оценки?

В статье разбираю теорему Гаусса‑Маркова, ее условия и что делать, если реальность не идеальна, без сложной математики и больших формул

Читать далее

Хоткеи, которые я реально использую каждый день — справочник за 10 лет разработки

17 hours 25 min ago

Мышечная память не ждёт ответа от API и работает без интернета. Собрал справочник шорткатов, которые реально прижились за 10 лет: WebStorm, Chrome, терминал, alt-коды для таблиц и файловых деревьев. Осознанно олдскульный формат — статья в закладки.

Читать далее

Почему людей корёжит от ИИ, даже когда текст нормальный

17 hours 36 min ago

Дорогие любители написать, что текст ИИ-шный, эта статья также, как и все другие отредактирована ИИ.

Под моими статьями на Хабре в какой-то момент начал повторяться один и тот же сценарий. Не обсуждение тезисов, не спор по аргументам, не разбор примеров — а мгновенный заход в комментарии с диагнозом: «нейротекст», «нейрослоп», «научитесь формулировать мысли сами». Иногда человек даже не дочитывает материал до середины, но уже уверен, что проблема именно в инструменте, а не в содержании.

Меня это сначала раздражало, потом удивляло, а потом стало просто интересно. Потому что я не скрываю, что использую ИИ как редактор и помощника: чтобы быстрее шлифовать структуру, перепроверять формулировки, вытягивать из головы черновую мысль в более читаемый вид. Но я при этом не понимаю, где здесь логическая связка: если текст редактировался с помощью ИИ, почему это автоматически означает, что у автора нет своих мыслей?

В какой-то момент стало ясно, что спорить на уровне «ну это же просто инструмент» бесполезно. Если тема так многих цепляет, значит, за этим стоит что-то глубже: недоверие, культурная реакция, ощущение подмены, страх обесценивания труда — что угодно. Поэтому я решил не гадать и посмотреть, что на этот счёт вообще говорят исследования.

Читать далее

РСПКДС: мнемонический шаблон для  обработки данных в Dart -шпаргалка для начинающих

17 hours 44 min ago

В статье разберём РСПКДС — простой мнемонический шаблон, который поможет новичкам в Dart структурировать базовые операции обработки данных. Покажу, как использовать формулу для решения типовых задач, приведу примеры кода и дам практические рекомендации. Вы узнаете, как за 6 шагов превратить сырые данные в осмысленный результат.

Читать далее

Как я построил VPN-сервис на VLESS+REALITY для 670 пользователей и что из этого вышло

17 hours 45 min ago

TL;DR: Поднял VPN-инфраструктуру на VLESS+REALITY с нуля. Telegram-бот + мини-приложение, горячее управление пользователями через gRPC без рестартов XRay, балансировка между серверами, почасовой биллинг. В статье — полный разбор протокола, почему DPI его не видит, как устроена архитектура на 670+ юзеров, и все грабли, на которые я наступил в production.

Предыстория

Полгода назад я решил разобраться, как работают современные VPN-протоколы. Не на уровне «скачал WireGuard, поставил, работает», а глубже — как устроено шифрование, почему одни протоколы детектируются DPI, а другие нет, и можно ли собрать что-то своё.

Начал с OpenVPN. Потом WireGuard. Потом Shadowsocks. И каждый раз натыкался на одну и ту же проблему: DPI-системы провайдеров со временем учатся распознавать любой нестандартный трафик.

А потом я нашёл VLESS+REALITY. И понял, что это принципиально другой подход.

Соник, расскажи!

Новая норма ИТ-команд: недоговаривать

19 hours 23 min ago

«Я заметил, что возникает дефицит внимания в твоей команде, и это снижает мотивацию,» — сказал председатель ПРП в одной из наших приватных бесед на профсоюзной встрече. И я решила разобраться с этим. В статье опишу результаты этого исследования: возникновение, основные проявления и способы устранения этого дефицита.

Читать полностью

Todo Budget v5.0: переписал весь UI с нуля на Jetpack Compose — и теперь ищу тех, кто его сломает

19 hours 29 min ago

До пятой версии главный экран был функциональным, но визуально скучным. Типичный Material Design без характера. Я получил несколько честных отзывов — в том числе жёстких — и решил переделать всё.

Читать далее

Способы повышения надежности встраиваемого ПО

19 hours 29 min ago

В этом тексте я бы хотел перечислить способы повышения надежности для встраиваемого ПО. Cуществует много приемов, которые помогают повысить надежность встраиваемого ПО.

Как прошивка может противостоять всяческим флуктуациям во время своей работы и обезопасить себя от зависания или повреждения исходных данных?

Читать далее

Кто зарабатывает на бирже на самом деле: инструменты, игроки и стратегии

19 hours 42 min ago

Если ты уже полчаса сидишь за покерным столом и не можешь понять, кто тут лох - значит, лох это ты.

Приветствую читателей, с ростом популярности темы инвестиций и финансов на просторах интернета появились люди, которые не против нажиться на не знающих гражданах. В этой статье предлагаю разобраться, какие основные финансовые инструменты представлены на фондовом рынке, какие игроки есть на бирже, в какую игру стоит играть, а в какую нет и в каких ситуациях биржа приравнивается к казино.

Также разберем основные рабочие инвестиционные стратегии, подходящие новичкам.

Эта статья покрывает все необходимые знания, чтобы начать пользоваться финансовыми инструментами, дальше все зависит от вас и вашего желания развиваться.

Предлагаю начать с вещей, на основе которых вообще создавались финансовые инструменты, есть 4 показателя эффективности.

Ликвидность - насколько легко и быстро вы можете продать актив по желаемой цене.
Риск - вероятность потери капитала.
Доходность - какой доход можно получить.
Волатильность - как быстро и насколько сильно меняется цена актива.

Эти 4 показателя взаимозависимы и взаимообусловлены, финансовые инструменты имеют свойства заменять 1 показатель на другой. Например, квартиру сложно продать (низкая ликвидность), у квартиры низкий-средний риск, маленькая доходность, низкая волатильность. Вы можете обменять ее на фиатные деньги и они будут обладать другими свойствами: очень высокой ликвидностью (легко продать), низким риском, отрицательной доходностью (из-за инфляции) и низкой волатильностью (в зависимости от валюты).

Читать далее

Агрессивное поведение ускоряет старение

Fri, 03/06/2026 - 23:22

Подростковый возраст сам по себе сопровождается социальными конфликтами. Новое лонгитюдное исследование показало, что агрессия влечет физические последствия. Наблюдая за 121 человеком в возрасте от 13 до 30 лет, ученые обнаружили, что подростковая агрессия, а именно частые вспышки гнева по отношению к сверстникам или родителям – мощный фактор, предсказывающий ускоренное биологическое старение.

Читать далее

Геймеры, нам надо поговорить. Почему вы до сих пор не бросили использовать физические носители?

Fri, 03/06/2026 - 23:05

Этот текст вызовет много негатива, но нам и правда надо признаться самим себе. Цифровые сервисы победили давно и с большим отрывом. Особенно на рынке видеоигр.

С этим можно долго спорить, ругаться и говорить, что это не так, но вот вам факт: физические копии — это рудимент и атавизм, от которого пора отказаться, и в этом материале я постараюсь объективно объяснить почему.

Читать далее

Java для автотестов: первые шаги с нуля

Fri, 03/06/2026 - 22:22

Статья к открытому уроку курса QA Automation Engineer про начало разработки тестов на языке Java которая погружает в основы синтаксиса.

Читать далее

Открываю ленту, а там очередной апокалипсис — Anthropic говорит, что ИИ убивает джуниоров :-)

Fri, 03/06/2026 - 22:21

Anthropic и Стэнфорд доказали, что ИИ пожирает рабочие места молодых.

Медиа опять ликуют, все заголовки кричат, LinkedIn (и внезапно threads) рыдает, нууууу, надеюсь, чашка чая наготове - потому что мы сейчас будем опять разбираться, а правда ли это :)

спойлер: все не так однозначно

Меня зовут Эдгар Сипки, и я как обычно вещаю про современную it индустрию и бизнес в нем - кстати, подпишись ка на канальчик мой

Тезис статьи простой: исследование действительно серьёзное, но выводы - преждевременные опережающие реальность И (ИЛИ) не учитывают рынок в целом, а учитывают только один из текущих факторов.

Читать далее

Шарнир Гука: решаем задачу из Мещерского

Fri, 03/06/2026 - 21:57

Карданная передача, она же — шарнир Гука. По-английски этот агрегат называется universal joint.

В этой классической задаче интересна не только кинематика. Удивительно, но при постоянных значениях моментов и система может иметь до четырех различных положений равновесия.

То есть «очевидное» соображение в духе «если первый момент больше второго, то валы крутятся в одну сторону, а если наоборот — то в другую» здесь не работает.

Через обозначим центр крестовины и введем две системы координат и . Первая система связана с валом , а вторая -- с валом . Оси и проходят через перекладины крестовины и перпендикулярны друг другу:

Читать далее

[Перевод] Как юрфирма из 2 человек уделала корпорацию со 100 юристами с помощью подписки на ИИ за $20

Fri, 03/06/2026 - 21:40

Пятница, семь вечера. До закрытия многомиллионной сделки по слиянию остаются считанные часы, и тут юристы покупателя сбрасывают вам в почту бомбу.

В письме — контракт, вдоль и поперек исполосованный красными правками: новые условия эскроу, жесткие отказы от претензий и перекроенный график закрытия. Подтекст читается между строк: либо вы подписываете это к утру понедельника, либо сделка отменяется.

Если вы работаете в классической юридической конторе на Уолл-стрит или в Кремниевой долине, этот сценарий запускает болезненный, доведенный до автоматизма протокол. Седовласые партнеры бьют тревогу. Тройку-пятерку младших юристов отправляют на принудительную ночную вахту. Клиенту капают тысячи долларов в час, пока люди с воспаленными от недосыпа глазами вручную сверяют сотни страниц зубодробительного юридического текста.

Зак Шапиро, выпускник Йеля и экс-адвокат элитной фирмы Davis Polk & Wardwell, столкнулся именно с таким кошмаром. Но он не стал поднимать команду по тревоге. Не заваривал литры ночного кофе. И не выставлял клиенту счет за сорок часов панической суеты.

Вместо этого он загрузил документы в нейросеть Claude, отправил ей выверенный набор инструкций и спокойно пошел по своим делам. К одиннадцати вечера в ящике покупателя уже лежало железобетонное встречное предложение. На следующее утро сделка закрылась без единой заминки.

Манхэттенская фирма Шапиро Rains LLP, состоящая всего из двух человек, играючи жонглирует сложнейшими сделками с венчурным капиталом и M&A (слияния и поглощения), для которых традиционно требуется целая армия юристов. Его недавний тред в X (бывший Twitter) с разбором этого процесса произвел эффект разорвавшейся бомбы, собрав более 7 миллионов просмотров.

Читать далее

Who's online

There are currently 1 user and 1 guest online.