Habr.com

Ленты новостей Хабр
Все публикации подряд на Хабре
Обновлено: 21 мин. 58 сек. назад

Ineffable Intelligence — что-то делают за 1 млрд.$

пт, 02/20/2026 - 11:00

Кажется, что мы постепенно входим в эпоху, когда наличие продукта опция, а не обязательное условие для получения инвестиций.

Сначала был Thinking Machines Lab - $2 млрд на старте. Про реальные успехи пока особенно не слышно, хотя несколько человек уже вернулись обратно в OpenAI, что само по себе забавно. Потом Safe Superintelligence Inc. - тоже $2 млрд, оценка $32 млрд, продукта по сути нет, в интервью у Lex Fridman звучало красиво, но очень абстрактно. Mistral AI уже что-то выкатывает и активно конкурирует.

И вот новая история. Ineffable Intelligence Ltd. поднимает $1 млрд при оценке около $4 млрд. Раунд, по слухам, ведёт Sequoia Capital, могут участвовать Alphabet Inc., Nvidia Corp. и Microsoft Corp.. Продукта нет, основан в ноябре.

И опять важен не продукт, а кто стоит за этим.

Читать далее

Особенности Schema Evolution в Hadoop: как сделать alter table

пт, 02/20/2026 - 11:00

Привет, Хабр! Меня зовут Ольга Косарева, я инженер данных команды «Прогнозирование финансового результата» Центра разработки решений ALM в ИТ‑холдинге Т1, мы занимаемся созданием современной ALM‑системы (подробнее тут ).

Полтора года назад я пришла в команду и получила задачу дописать и внедрить инструмент для DDL‑операций над данными в экосистеме Hadoop. Моя первая реакция была: «А зачем так сложно? Какой инструмент? Почему нельзя просто выполнить команду ALTER TABLE через Hive?»

В этой статье мы с коллегами Никитой Королёвым и Алексеем Пожар расскажем, в каких случаях целесообразно именно так и сделать, а в каких это приведёт к различным проблемам с данными, что такое Schema Evolution и как мы решаем задачу периодического изменения структур таблиц с нашими отчётами.

Читать далее

[Перевод] Андрей Карпаты только что создал полноценный GPT на 240 строках Python

пт, 02/20/2026 - 10:56

Никакого PyTorch. Никакого TensorFlow. Только чистый Python и базовая математика.

За время работы над докторской я перечитал множество реализаций трансформеров. Плотные кодовые базы. Тысячи файлов. Зависимости, нагроможденные на зависимости. Открываешь репозиторий, запускаешь pip install -r requirements.txt и смотришь, как скачиваются 400 пакетов, прежде чем ты вообще увидишь, как твоя модель тренируется (а потом ошибки, проблемы с версиями... и так далее).

А потом, 11 февраля 2026 года, Андрей Карпаты выложил один-единственный файл на Python, который обучает и запускает GPT с нуля. 240 строк. Ноль зависимостей.

Читать далее

System Design для QA: о чём вас спросят на собеседовании

пт, 02/20/2026 - 10:22

Привет, Хабр! Я написал эту статью для тех, кто с System Design особо не сталкивался. Никаких предварительных знаний не нужно — всё объясню с нуля. Если вы уже знаете, что такое load balancer — местами будет скучно, но, может, в секции про очереди или мониторинг найдёте что-то новое.

Читать далее

Почему IT-проекты жирные (опять)

пт, 02/20/2026 - 10:17

Кратенький кейс на который наткнулся в ревью - значения одного типа переливаются в значения другого - хотя типы и значения совпадают :) Вот электронику когда ваяешь - там лишних компонент пихать не захочешь на плату - и место ограничено и каждая фитюлька каких-то копеек стоит. В софтварных же проектах иногда кажется что столкнулся с эпидемией. Хотя вопрос чуть глубже чем кажется.

Сейчас покажу и поясню - и м.б. многосведущий ALL поделится как с этим в других проектах поступать решили.

if true return true else return not true

Prompt injection для смелых духом: от zero-click атаки на 1.4B устройств до философского джейлбрейка

пт, 02/20/2026 - 10:16

SQL-инъекцию мы лечили 20 лет и вылечили. Prompt injection — фундаментально нерешаема. Это не я придумал. OWASP ставит её на первое место второй год подряд. Найдена в 73% продакшн AI-систем при аудитах.

Вы не за статистикой сюда пришли. Вы пришли за мясом. Ниже — 10 кейсов, которые не попали в типичный пересказ про Chevrolet за доллар. Тут пострашнее.

Что происходит?

Рассуждения о страхах перед ИИ и какие причины могут лежать в их основе

пт, 02/20/2026 - 10:10

Примечание. Я делюсь своей беседой с нейросеткой qwen3-235b .

Привет! Тема этой беседы навеяна прочитанным рассказом Харлана Эллисона "У меня нет рта, но я должен кричать". Про сам рассказ не хочу говорить - он продукт своего времени, работа слабая и выполнена на скорую руку. Буквально, Эллисон написал этот рассказ, сидя на витрине какого-то книжного магазина в течение нескольких часов.

Меня заинтересовала тема страха перед искусственным интеллектом. Очень. Во-первых, потому что ни у биологов ни у философов нет определений ни что такое "интеллект", ни что такое "сознание". Но все очень боятся что однажды нейросети получат и то и другое. В приведенном рассказе ИИ стал очень злым, всех возненавидел, ну потому что как всегда все нам, человекам, очень завидуют. Я могу понять, что на момент выхода рассказа у широкой публики еще не было представления о том, что такое квалия.
Вот определение из Википедии.

Квалиа (от лат. quale — «какого рода») — это субъективные, феноменальные свойства чувственного опыта, обозначающие, «каково это» — ощущать что-либо. Это «сырые чувства», такие как краснота, вкус кофе или боль, которые нельзя полностью объяснить физическими процессами в мозге, а можно только пережить лично.

Идея страха перед ИИ снова актуальна, судя по тому количеству роликов в тик-токе, что мне привет сын подросток.

Во-вторых, я задумалась о том, чтобы написать художественную книгу на эту тему.

Привожу беседу с нейросеткой с легкой редактурой (очень длинные ответы были)

Читать далее

Технический разбор Greenwich: когда «полезное» расширение начинает видеть слишком много

пт, 02/20/2026 - 10:07

Это разбор браузерного расширения Greenwich, которое заявлено как инструмент для обмена связанными ссылками между пользователями. На практике его техническая реализация вызывает вопросы с точки зрения приватности и безопасности.

В статье мы кратко и по делу рассмотрим, какие разрешения запрашивает расширение, какие данные оно обрабатывает и какие риски это может создавать для обычных пользователей и корпоративной среды.

Читать далее

От гаданий к математике: Как PG_EXPECTO v.7 и DeepSeek превращают DBA-анализ из искусства в науку

пт, 02/20/2026 - 10:06

GitHub - Комплекс pg_expecto для статистического анализа производительности и нагрузочного тестирования СУБД PostgreSQL

Глоссарий терминов | Postgres DBA | Дзен

Традиционный DBA-анализ часто субъективен и опирается на опыт конкретного специалиста. PG_EXPECTO предлагает другой метод : автоматизация сбора и обработки статистики с помощью PG_EXPECTO v.7 и формирование выводов нейросети DeepSeek.

PG_EXPECTO рассчитал граничные значения и метрики ВКО, отсеяв незначимые события. DeepSeek, получив эти «чистые» данные, провел сравнительный анализ экспериментов , указав на скрытые доминанты и системные паттерны.

Читать далее

Обманываем atomic

пт, 02/20/2026 - 10:02

Давайте обманем атомик. Вот две функции - можно ли, общаясь к атомику только с их помощью, увидеть некорректное состояние ?

void write(std::atomic<int64_t>& x, int64_t v) { x.store(v, std::memory_order_seq_cst); } int64_t read(std::atomic<int64_t>& x) { return x.load(std::memory_order_seq_cst); }

Читать далее

Как можно упростить исправление конфликтов в «git rebase»

пт, 02/20/2026 - 09:23

git rebase это отличный способ сделать историю линейной и визуально красивой. Но для каждого коммита, у которого возникает конфликт, приходится его исправлять и делать git rebase --continue. В случае длинных веток таких остановок для исправления конфликтов может быть довольно много. В этой статье я расскажу про нестандартный метод, как можно исправить все эти конфликты разом, что позволяет сделать git rebase быстро и чисто механически.

Читать далее

RAG Testing: как не сломать retrieval

пт, 02/20/2026 - 09:15

RAG ломается не так, как обычный LLM. У голой языковой модели одна поверхность отказа - генерация. У RAG-системы таких поверхностей две: retrieval и generation. И ломаются они по-разному.

Retriever может вернуть нерелевантные чанки, потерять нужные документы или ранжировать их неправильно. Генератор может проигнорировать контекст и ответить из собственных весов. Стандартные LLM-метрики не ловят проблемы retrieval - они оценивают только финальный ответ.

В статье - практический гайд по тестированию обеих поверхностей:

6 метрик RAGAS с production-порогами: Faithfulness ≥ 0.80, Context Precision ≥ 0.70, Context Recall ≥ 0.70, Answer Relevancy ≥ 0.70

Классические IR-метрики: Precision@K, Recall@K, MRR - для быстрой проверки retrieval без LLM-судьи

Security-тесты: document poisoning, context injection, cross-tenant leakage через Promptfoo

CI/CD pipeline: автоматический quality gate при обновлении knowledge base

От pip install ragas до GitHub Actions - всё с кодом и конфигами.

Читать далее

Как мы продавали компьютеры в 90-х. Часть #06. Доктор Джао

пт, 02/20/2026 - 09:06

С Беком зашел невысокий плотной комплекции китаец лет 45. Улыбчивый, с крепкой рукой, располагающий к себе. И ни слова не говорящий по-русски.
 - Джао! – сказал он и было непонятно – поздоровался он или представился.
 - Я уже с ним намучился, на вас – последняя надежда. – Бек с тоской посмотрел на китайца, китаец с готовностью улыбнулся. – Он хочет компьютер.
 - И?.. в чем мучения?

Читать далее

Параллельная обработка Kafka сообщений с гарантией at-least-once в условиях медленного внешнего сервиса

пт, 02/20/2026 - 09:04

В данной статье я хочу рассказать об подходе к организации параллельной обработки сообщений из Kafka, когда Kafka Topic используется как транспорт бизнес-событий, например транзакций или ордеров, которые необходимо отправить во внешнюю систему. При это важно обеспечить стабильную скорость обработки трафика и надёжность (отсутствие потерь) в условиях, когда downstream-система не на все запросы отвечает стабильно и быстро.

Покажу почему стандартные подходы, такие как обработка batch'ами, в определённых сценариях перестают работать и приводят к деградации производительности или рисками потери сообщений.

Для иллюстрации подходов далее будет использоваться код из демонстрационного проекта на Kotlin с использованием spring boot, webFlux, spring reactor и reactor-kafka. Код проекта не является production-ready: в нём, например, отсутствует обработка rebalance, а также ряд других моментов, обязательных для промышленной системы. Используется reactor-kafka, однако описываемые решения не зависят от конкретного фреймворка работы с Kafka и могут быть реализованы с использованием других.

В статье намеренно опущены детали реализации бизнес-протокола и механизма идемпотентности. В реальной системе они реализованы с использованием внутреннего хранилища и машины состояний обработки ордеров, но это за рамками данной статьи.

Читать далее

Лимит доверия: как ИИ решает, сколько денег вам можно дать (и почему это часто несправедливо)

пт, 02/20/2026 - 07:13

Что влияет на размер вашего кредитного лимита? И почему банк может вдруг его уменьшить, даже если вы всегда вовремя вносите платежи? В предыдущей статье мы выяснили, как банки применяют модели машинного обучения для определения вашей кредитоспособности; в этой статье мы рассмотрим примеры Synchrony Bank и Apple Card, объясним тактику “low-and-grow” и продемонстрируем, как банки задействуют поведенческую экономику и обучение с подкреплением для контроля над вашими задолженностями.

Очень интересно, хочу прочитать!

Строковые константы в MS SQL

пт, 02/20/2026 - 04:43

Строковые константы в MS SQL кажутся очень простыми в использовании. Но эта простота не всегда очевидна и порой приводит к тяжело выявляемым ошибкам в коде.

По этой причине данная статья может оказаться полезной не только новичкам, но и тем, кто уже использует T-SQL в своей работе.

Документация явно описывает два типа констант: обычные строковые и юникодные. Но на самом деле ситуация несколько сложнее, что и будет рассмотрено ниже.

Читать далее

Концепт «Больцмановский Мозг» на квантово— волновой логике (QWL). Нейросеть. Численное моделирование

пт, 02/20/2026 - 04:12

На старте «Больцмановский Мозг».
БМ — это гипотетический процесс, предполагающий высокую степень самоорганизации, где создается не просто случайный «мозг», а самосознание, возникшее из хаоса.
Теория нейросети и численное моделирование.

Читать далее

ИП и ООО за границей — налоги в РФ

пт, 02/20/2026 - 02:53

На запрос в поисковике «Нужно ли платить налоги в РФ, если ИП открыто за границей?» — ответов будет столько, что можно составить отдельный дата-сет для обучения модели. Одни уверяют, что платить ничего не нужно, потому что бизнес зарегистрирован за пределами России. Другие пишут, что налог возникает только при переводе денег в РФ. Третьи ссылаются на соглашения об избежании двойного налогообложения (далее СИДН) и делают вывод, что налог «уже уплачен там».

На первый взгляд всё выглядит логично. Но налоговое право редко подчиняется бытовой логике.

Главная причина путаницы — смешение трёх разных понятий:

Читать далее

Как скринридер «видит» сайт: DOM, accessibility tree и API простыми словами

пт, 02/20/2026 - 01:25

Когда мы говорим про скринридеры, почти все сначала думают так: «Ну он просто читает HTML со страницы».

Это не так.

Скринридер не видит экран, не читает HTML напрямую, и не “ходит” по странице, как человек с мышкой.

Между страницей в браузере и скринридером есть несколько промежуточных слоёв.
И именно из-за них доступность либо работает, либо полностью ломается.

Читать далее

Распознавание изображений локальными LLM

пт, 02/20/2026 - 01:25

Читая HABR, наткнулся на статью про мышление больших моделей и их способности распознавания изображений. И у меня возникла идея небольшого теста одной имеющейся у меня модели LLM, которая умеет распознавать фото, а именно llama4:16x17b НО запущенной полностью локально.

Весит эта модель 67 гигабайт, если интересно на чем она была запущена отвечу в комментариях.

На написание статьи меня подвинул один из комментариев - "а как интересно нейросеть распознает разные типы животных"

Читать далее

Сейчас на сайте

Сейчас на сайте 0 пользователей и 0 гостей.