Иногда самые глубокие озарения приходят из междисциплинарных столкновений. Размышляя над устройством хэш-функции MurmurHash, я невольно наткнулся на принцип, лежащий в основе законов физики. Что если наше пространство-время с его константами c, ħ, G и α — не фундамент, а лишь проекция, результат работы космической хэш-функции, применяемой к чему-то неизмеримо более сложному?
Эта мысль кажется фантастической. Но это не просто метафора, а вполне рабочая модель, которая способна перекинуть мост между квантовой странностью, космологической однородностью и самой природой информации.
Читать далееДоброго времени суток, «Хабр»!
В предыдущей своей статье я рассматривал разные парадигмы обучения моделей. Однако не всегда при обучении все происходит гладко.
Бывают ситуации, когда на обучающих данных модель работает идеально, но при проверке на новых данных точность резко снижается. Это явление называется переобучением.
Сегодня в статье расскажу об переобучении моделей, как обнаружить это явление и избежать его. Примите стратегически удобное положения, а я приступаю к своему повествованию.
Читать далееВ связи вот с этой новостью "Профессор Кёльнского университета потерял два года работы с использованием ChatGPT" , напоминаю, что ChatGPT тоже можно выкачать данные штатно.
Читать далееУ глобальных IT‑корпораций «смена вывески» почти никогда не ограничивается логотипом. Прямые расходы на дизайн и перезапуск бренда для таких компаний обычно составляют десятки, а то и сотни миллионов долларов. Разбираемся, во что обходился ребрендинг IT-гигантам и к чему это их привело.
Читать далееВ первой, второй и третьей частях разговора про радары мы обсудили историю их появления и бурного развития в годы Второй Мировой войны. Четвертая часть, полагаю, будет более дискуссионной поскольку в ней мы затронем годы Холодной войны и великое техническое противостояние СССР и США. Как удалось (и удалось ли?) победить кризис радиоэлектронной борьбы грозивший сделать радары бесполезными? Что изменилось с появлением противовоздушных ракет? Мы поговорим про войну в Корее и войну во Вьетнаме фактически определивших современное понимание "войны в воздухе". Статья получилась длинной, но на мой взгляд плотно взаимосвязанной, так что я не стал разбивать ее на две. Enjoy :)
Читать далееПрактический гайд по монетизации сайта с помощью programmatic-рекламы. Как повысить CPM, сохранить UX, защититься от фрода и стабильно зарабатывать на трафике.
Читать далееПривет! Меня зовут Николай Петров, в компании GRI я отвечаю за бесперебойную работу склада заказчика. До октября 2023 года его склад рекламной продукции работал по бумажной технологии: не было адресного хранения, заказы собирали по бумажным наборным листам, не было маркировки товаров. С ростом количества торговых точек с 400 до 1100 магазинов старый подход требовал всё больше времени, а вероятность ошибок увеличивалась.
Я расскажу, как мы решили проблему заказчика и командой из двух человек нам удалось перевести склад с «бумажки» на WMS с использованием терминала сбора данных (ТСД).
Привет, Хабр! На связи команда продуктового матчинга ecom.tech. Наша команда решает задачи поиска, группировки и сопоставления товаров с помощью алгоритмов машинного обучения. Все это необходимо для развития и улучшения бизнес-процессов в компании, а именно быстрого заведения карточек товаров, мониторинга цен на товары и развития ML. В этой статье мы расскажем про доматчинг – сравнение сложных пар товаров, которые отобрали на предыдущем этапе пайплайна, с помощью LLM. Поехали!
Читать далееДрузья, привет! Меня зовут Андрей Комягин, я CTO компании STM Labs. Мы занимаемся разработкой очень больших распределённых высоконагруженных систем для различных отраслей, включая налоговое администрирование, телеком, track & trace и многие другие. В своих проектах и архитектурах мы широко применяем open-source-решения, включая брокеры сообщений, такие как Kafka и RabbitMQ.
Совсем недавно я выступил на конференции HighLoad++ Genesis 2025: рассказал про анатомию каждого из этих брокеров, сравнил их по набору критериев и оценил результаты их нагрузочного тестирования. А теперь решил выпустить этот материал в виде статьи в блоге, чтобы читатели Хабра тоже смогли изучить нюансы и понять, на какие задачи заточен каждый из брокеров. Итак, поехали!
О брокере Apache Kafka я очень подробно рассказал в своей предыдущей статье. Повторяться и снова разбирать его сегодня я не буду — вы можете перейти по ссылке выше и ознакомиться с материалом, а затем вернуться сюда.
Читать далееСтек: Python, Airflow, ClickHouse, Slack
В iGaming падение активности игровых провайдеров почти никогда не выглядит как "обрыв". Чаще это медленное затухание: ставок становится меньше, затем еще меньше, игроки уходят постепенно. Формально провайдер продолжает работать, стандартный мониторинг молчит, а бизнес уже теряет деньги.
Моя задача была не фиксировать факт полного падения активности, а поймать момент, когда траектория уже направлена вниз, но ситуацию ещё можно развернуть.
Вся логика работает внутри DAG в Airflow. Он запускается каждые 6 минут и анализирует активность игровых провайдеров в реальном времени. При обнаружении начала падения или восстановления система отправляет уведомления в Slack.
Читать далееКонтейнер — не виртуальная машина. Между контейнером и хостом тонкая стена: общее ядро, общие ресурсы, минимальная изоляция по умолчанию. Стандартный docker run запускает процесс с root правами внутри контейнера и доступом к большинству системных вызовов.
Большинство команд оставляют дефолтные настройки, потому что «и так работает». Пока не приходят пентестеры или не случается инцидент. Разберём конкретные настройки, которые реально повышают безопасность, с примерами и объяснением зачем это нужно.
Читать далееПока техногиганты тратят сотни миллиардов на AI-инфраструктуру, китайский стартап показал результат за $6 млн. Разбираемся, что пошло не так с логикой "больше денег = лучше модель"
Читать далееВ последние январские деньги, пока праздничное настроение начала года ещё не окончательно уступило место унылым трудовым будням, я решил затронуть одну лёгкую, едва ли познавательную и откровенно ностальгическую тему. Расскажу про своё первое близкое знакомство с компьютерами и играми. Своего рода мемуары, или, как говорит один известный игровой ретро-блогер, «Memories». Помимо личной истории и отсылок к различным приметам эпохи, это будет обзор шести случайных игр, с которыми мне довелось тогда столкнуться.
Читать далееLinux Mint — один из тех проектов, которые пережили практически всё, что только можно было в мире Linux-дистрибутивов. Он видел взлет и падение KDE 4 с его радикальными изменениями, приход GNOME 3, который перевернул привычный рабочий стол с ног на голову, бесконечные споры вокруг Unity, первые шаги Wayland и даже нынешнюю моду на immutable-системы с их атомарными обновлениями. А сам Mint все это время оставался верен своей идее: дать пользователям предсказуемый, удобный интерфейс, который не нужно переучивать каждые полгода и он просто работает.
В середине января 2026-го вышел Mint 22.3 — очередной релиз в LTS-ветке на базе Ubuntu 24.04. Поддержка обещана до 2029 года, ядро по-прежнему Linux 6.14, а окружения рабочего стола — те же проверенные Cinnamon, MATE и Xfce. Никаких революций и обязательных переходов на новые протоколы дисплея. Зато множество мелких, но осмысленных улучшений, которые делают повседневную работу чуть комфортнее. И именно в этом подходе вся суть проекта. Давайте оценим новинку.
Читать далееСегодня мы продолжим исследование Bindlink API для вмешательства в работу антивирусных решений и EDR. На этот раз воспользуемся драйвером «bindflt.sys», чтобы предотвратить запуск службы антивируса/EDR при инициализации Windows.
Читать далееЯ на выходных люблю поиграть в днд. А так как мастеров не так уж и много, а тех, кто хочет ими быть, ещё меньше, то мне регулярно приходится садиться за ширму. Ну а какой мастер не хочет водить по своему собственному миру?
Вот так вот мне и понадобилась карта. А точнее, много карт, чтобы выбрать подходящую. Конечно, есть онлайн генераторы карт, и даже неплохие, но тут уже взбунтовалась моя личность программиста, которая захотела сделать свой инструмент идеально под себя. Так я и начал генерировать карты.
(спойлер: Что-то вроде даже получилось)
Вперёд, создавать мирыВ мире искусственного интеллекта есть исследования, где достаточно нескольких страниц, чтобы понять — это нечто особенное. Engram от DeepSeek — именно такое.
С новой моделью на подходе это может служить доказательством, что их грядущий флагман будет уникальным не только благодаря превосходным характеристикам, но и потому, что он принципиально отличается от существующих подходов.
Этот новый тип моделей не просто многообещающий — он способен полностью переосмыслить слой памяти, а вместе с ним открыть новые перспективы для целого ряда неожиданных публичных компаний.
Ждёт ли нас ещё один «момент DeepSeek», подобный прошлогоднему?
Эти размышления основаны на материалах TheWhiteBox, где я объясняю ИИ с позиции первых принципов для тех, кто невосприимчив к хайпу, но жаждет знаний. Для инвесторов, руководителей и энтузиастов.
Читать далееНа связи Ульяна Айкович, UX-исследователь и адепт статистики из БКС Мир Инвестиций. Сегодня я расскажу, в каких случаях применять статистические тесты, как легко реализовать их в гугл-таблицах, а также, как интерпретировать результат этих тестов. Не бойтесь, будет много практики и совсем немного важной теории.
В статье детально расскажем, как и когда применять биноминальный и χ²-тесты на наших кейсах.
Читать далееПривет, Хабр! Меня зовут Гоша, я старший инженер-программист в Контуре. Практически любой сценарий ЭДО связан с использованием криптографии, будь то ЭДО с государством или контрагентами: где-то нужно подписать документы, где-то зашифровать архив с отчётом, где-то проверить подпись документа от контрагента. Каждый из таких сценариев хочется тестировать не на реальных данных, но на наиболее похожих в реальности. Помимо самих данных нам нужны сертификаты, имитирующие сертификаты участников ЭДО: организаций, физлиц, государственных органов. Ранее для генерации тестовых сертификатов мы использовали сервис на базе ПАК УЦ, проприетарной штуки, выпускающей сертификаты по определённым правилам, не позволяя издеваться над сроками действия серта как хочется.
Отсюда появилась идея в качестве эксперимента написать небольшой сервис, который мог бы генерировать какие угодно сертификаты с ГОСТ-алгоритмами, но при этом успешно работающие с КриптоПро. В этой статье хочу поделиться, какая техника скрывается под капотом такой функциональности.
Читать далееСостоялся выпуск Godot 4.6 — кроссплатформенного игрового движка с открытым исходным кодом.
В Godot 4.6 по умолчанию используется физический код Jolt, который был экспериментальной опцией ещё в версии 4.4.
Новая версия вносит существенные изменения в код для экранного пространства (SSR), что значительно улучшает качество отражений.
Еще одно фундаментальное изменение — это появление LibGodot, библиотеки, позволяющей встраивать движок в ваши собственные приложения. Нативная поддержка OpenXR 1.1 — еще одно дополнение для Godot, в Windows теперь используется Direct3D 12 в качестве рендеринга по умолчанию.
В редакторе Godot 4.6 появилась новая «современная» тема оформления в дополнение к классической. Также в Godot 4.6 улучшена документация и внесены другие усовершенствования для помощи разработчикам игр.
Скачать