Параллельные стримы в Java 8 выглядят как бесплатное ускорение: добавил .parallel() — и все ядра побежали работать. Но по факту всё сложнее, так как распараллеливание имеет накладные расходы, зависит от того, насколько хорошо делится источник данных, сколько стоит объединение результатов, и даже от локальности данных в памяти.
В новом переводе от команды Spring АйО на примерах и бенчмарках разберем, почему простая свёртка на маленьких диапазонах может стать медленнее, почему ArrayList часто выигрывает у LinkedList в параллели, как reduce может неожиданно сломаться из-за неверного identity, и что вообще происходит внутри common ForkJoinPool.
Читать далееПереработал известную копилку от AlexGyver: напечатал новый корпус, сделал печатную плату вручную, устранил помехи LC-фильтром и наступил на грабли с энергопотреблением. Под катом — схема, осциллограммы и выводы.
Читать далееПродолжаю свою небольшую «миссию» по разоблачению псевдо-экспертов и дешевых сенсаций на тему, которой я посвятил 12 лет работы в ФНС.
В этот раз отличился Telegram-канал «Топор. Экономика», выдав новость, собравшую миллионы просмотров (на момент публикации 3 млн. просмотров). Звучит она так:
«ФНС усилила мониторинг соцсетей для поиска незадекларированных доходов: под анализ попадают фото и видео из отпусков, посты о дорогих покупках и другие признаки уровня жизни, который не совпадает с официальными заработками. Алгоритмы на базе нейросетей изучают открытые данные, выявляют возможные несоответствия и передают материалы инспекторам, особое внимание уделяют самозанятым, фрилансерам и людям без официальной занятости».
Читать далееВ новом дайджесте новая статья про шейдеры Metal и переход от Dagger к Metro, 10 фич в Android-приложение за один заход и лучшая производительность Flutter, новый подход к прогнозированию погоды, настройка конвейера доставки и многое другое. Заходите!
Читать далееНедавно Anthropic возмущалась фактом дистилляции Claude разработчиками китайских LLM, при этом в качестве доказательства приводился мониторинг аккаунтов Claude, отслеживалась их история и связь с китайскими инженерами.
Мне стало интересно, возможно ли, имея только чат с LLM, понять использовалась ли дистилляция как инструмент обучения через самоотчет модели.
Спойлер: полагаю возможно.
Естественно, результаты исследования не могут служить каким либо доказательством или основой для любых обвинений. Потому что LLM штука темная, до конца неизученная и любые выводы лишь предположения.
Читать далееВ 2013 году в модном американском журнале PNAS вышла оч знаменательная статья (про которую, конечно же, из нас мало кто слышал) - «Automated reconstruction of ancient languages using probabilistic models of sound change». Если вы ничего не поняли, то на простом человеческом цель сего исследования звучала примерно: «вот бы нам восстанавливать формы древних слов, не склоняясь над пыльными архивами с карандашиками, а как-нибудь автоматически». Спонтанные желания в 3 часа ночи выглядят именно так.
Читать далееВчера вечером листал Telegram и наткнулся на пост в канале midov_channel (пост 775). У Ислама обсуждается пост в reddit в котором активно дискутируют, что 211 тысяч звёзд у репозитория — это «Fake stars, боты накручивают» .
Активно использую последнию неделю OpenClaw , имею своё мнение, и понимаю почему такой вопрос возникает: 211 тысяч звёзд — это много. Конечно, когда видишь такие цифры, первая мысль — «а точно ли это настоящие люди?»
У меня профессиональная деформация - доверяй, но проверяй. Всё таки 15 лет развивал департаменты Data и аналитики в L'Oreal. Это также трансформировалось в текущий мой бизнес AYGA Data & AI, где мы, с агентамиработаю в формате AI-first компании, привыкли к другому подходу — не спорить, а проверять. Есть гипотеза — есть данные. Данные либо подтверждают, либо опровергают.
Собственно, поэтому вчера дал своему агенту Gubin задачу: собрать все 211 тысяч профилей stargazers репозитория и провести forensic-анализ. Не выборку, не 1% — все до единого.
Через полтора часа Агент Губин прислал мне в телеграмм презентация из 14 слайдов. Дальше — разбор каждого из листа презентации.
Читать далееВсем привет! На связи снова Карьерный Хакер — тот самый консультант по поиску работы, который не ленится изучать технологии, амбассадор здравого смысла на рынке труда и в HR Tech :)
Сегодня расскажу, как я поймала баги при AI-оценке релевантности опыта, когда тестировала самые популярные в России HR Tech-решения.
Также обсудим, куда уходят ваши персональные данные при интеграции российских ATS с зарубежными AI и какие есть риски на уровне государства при «сливе» данных о кадровых резервах страны в Пентагон по мнению GPT (надеваем шапочки из фольги).
Начну с небольшого экскурса в историю российских роботов-рекрутеров и того, как HR покупают технологии для решения своих задач. В этом важно разбираться, чтобы оценить потенциальный масштаб трагедии вокруг хайпа на ИИ в рекрутинге.
Погнали :)
Читать далееКогда начинается разговор про Java, почти всегда он внезапно уходит в сторону Spring. И это не случайность.
Проблемы с релизами, поддержкой, миграциями, безопасностью — это не «проблемы Spring». Это следствие того, как изменилась сама Java-экосистема.
Чтобы понять, что происходит со Spring, нужно сначала разобраться, что произошло с Java.
Читать далееВ этом тексте я написал про своеобразный фильтр нижних частот.
Это гистерезисный фильтр на триггерах Шмитта.
Всем привет! В этой статье поделимся тем, как с помощью LLM анализировать поток из сотен договоров в ракурсе рисков и экономить на этом в год сотни часов работы юристов.
Читать далееЕсли вы пишете сложный SELECT, в котором одно и тоже вычисляется несколько раз, например, для массовой обработки данных пачками, то наверняка вам хотелось завести локальную переменную
вот пример:
SELECT
price * quantity AS total_price,
(price * quantity) * 0.15 AS tax,
((price * quantity) + ((price * quantity) * 0.15)) AS grand_total
...
Здесь price * quantity вычисляется несколько раз, и tax вычисляется дважды. Но это выглядит еще ок, в реальности это зачастую всякие монструозные свитч-кейсы с NULLIF, COALESCE и прочими ребятами.
Но не суть, вам хочется один раз вычислить значение, без дублирования кода.
Long story short, это делается так:
Читать далееМеня часто просили как-то удобно организовать поиск по всем материалам, которые были в моём геймдев-дайджесте, и... За один вечер я сделал небольшой сайт для этого, не написав ни строчки кода. В статье расскажу про сам процесс.
Читать далееКлиент пришёл за AI-чатботом для поддержки — 200 обращений в день, четыре оператора, вечная текучка. Мы прочитали 500 тикетов глазами и обнаружили: 68% закрываются обычным API-вызовом, ещё 14% — формой-визардом. А вот AI понадобился совсем для другого — кластеризация жалоб выявила бракованную партию товаров до того, как проблема стала массовой.
Читать далееВоздействие генеративного ИИ на окружающую среду
Быстрое развитие и внедрение мощных генеративных моделей ИИ сопровождается последствиями для окружающей среды, в том числе увеличением спроса на электроэнергию и потребления воды.
Адам Зеве | MIT News
17 января 2025 г.
Читать далееМожно ли научить нейросеть «думать» так, словно на дворе 1912-й или даже 1650-й год? Да, но для этих целей нужно не расширять обучающие датасеты, а... ограничивать их. Мы в Beeline Cloud решили поговорить о проектах, позволяющих погрузиться в прошлое с помощью LLM, — и какое применение они находят с точки зрения гносеологии и бихевиоральных наук. Также обсуждаем несколько открытых инициатив, в рамках которых развивают подобные LLM.
Читать далееВсем привет, уважаемые читатели! В архитектуре проектов мы можем наблюдать применение паттерна BFF (Backend for frontend). При этом BFF может быть в архитектуре, где есть взаимодействие с клиентскими приложениями: веб, мобильное, смарт-устройства и т.д, но может быть всего-навсего один служебный фронтенд, доступ к которому возможен во внутрикорпоративном сегменте, например, банковская система, hr, логистика. Кажется, что при наличии одного фронтенда введение BFF избыточно.
И возникает закономерный вопрос: если клиент всего один, да еще и работает внутри защищенного контура, зачем нам плодить отдельные компоненты системы? Не превращается ли BFF в лишний прокси-сервис, который только пробрасывает запрос и добавляет сетевую задержку?
Но что, если фронтенд один и вдруг нуждается в данных из разных API системы, чтобы нормально функционировать? При этом запросы могут быть сложными: каждый требует особых параметров и возвращает много лишней информации. А если у вас несколько клиентских приложений и так же нужно подтягивать данные из разных API?
Читать далееДавайте поговорим о вытяжной вентиляции в многоквартирных домах. Какая она бывает. Какие проблемы встречаются и как их решать. И основное: как управлять внутриквартирными дросселирующими заслонками (дроссель-клапанами) вентиляции в современных ЖК и обеспечивать комфортные уровни и шума, и расходования воздуха даже в условиях постоянных изменений тяги в общем канале. И конечно же, запользуем запылившуюся на полке Ардуинку.
Читать далее26 февраля 2026 г. вышел фильм "Как получить доступ ко всему: реверс-инжиниринг", снятый Slon Motion Studio по заказу Positive Technologies. Я посмотрел фильм и, через цитаты приглашенных экспертов, сделал конспект фильма, зафиксировав смыслы которые несёт кино.
Читать далееФункцию rand из стандартной библиотеки языка Си для генерации псевдослучайных чисел, наверное, не ругал только ленивый. В довольно известном докладе Rand considered harmful рассказывалось о проблемах с переносимостью, ограниченным диапазоном, многопоточностью, качеством и т.п. Иногда в учебниках упоминают о том, что алгоритм в rand может быть не очень качественным, иметь проблемы с младшими битами, периодом, прохождением статистических тестов. Но крайне редко можно увидеть разбор конкретных критериев, выявляющих дефекты генераторов. В этой статье я постараюсь наглядно показать не просто отдельные недостатки rand, lrand48 и random из glibc, но их полную непригодность для каких-либо вычислений в принципе. Также вы увидите превосходство поточных шифров над minstd, линейным конгруэнтным генератором из 1980-х, не только в качестве, но и в производительности.
Читать далее