Habr.com

Ленты новостей Хабр
Все публикации подряд на Хабре
Обновлено: 18 мин. назад

2200 снимков Евгения Халдея собраны на Викискладе, потому что перешли в общественное достояние

чт, 04/17/2025 - 19:20

Фотограф Евгений Халдей (1916—1997) был военным корреспондентом и активно фотографировал события Второй Мировой войны. Его авторские права охраняются в течение 75 лет после смерти, однако тысячи его фотографий уже перешли в общественное достояние. Как же это получилось?

Читать далее

Разрабатываем PWA. Полная инструкция по работе с Web App Manifest и Service Worker

чт, 04/17/2025 - 19:11

Привет! Меня зовут Сергей Васильев, я фронтенд-разработчик в AGIMA. Наша команда часто работает с PWA — прогрессивными веб-приложениями. Они стали особо популярны в последние три года, когда из-за санкций некоторым корпорациям пришлось отказаться от мобильных приложений. Но и раньше многие компании с интересом смотрели на это решение.

Ниже расскажу, как сделать из обычного веб-приложения прогрессивное: вместе настроим Web App Manifest и Service Worker. Если вам еще не доводилось работать с PWA — текст точно для вас.

Читать далее

Policy as Code в Apache Kafka: опыт внедрения Open Policy Agent

чт, 04/17/2025 - 19:04

Статья рассматривает внедрение Open Policy Agent (OPA) для управления авторизацией в кластерах Apache Kafka на bare metal‑серверах.

В рамках статьи проанализированы ограничения стандартных ACL и предложено решение на основе Open Policy Agent (OPA), обеспечивающее декларативное управление доступом через Policy as Code (PaaC). Особое внимание уделено обновлению OPA Kafka Plugin: создан pull request, в котором устранены уязвимости превносимые в OPA библиотекой Guava и реализован переход на более производительную библиотеку Caffeine. Описан процесс интеграции OPA с Kafka, включая автоматизацию доставки политик через Bundle API и S3-хранилище.

Читать далее

Dota 2, киберспорт, спортзал и жизнь вне игры. Интервью с киберспортсменом Ильёй Spirit Тереховым

чт, 04/17/2025 - 19:04

Я продолжаю описывать портрет современного геймера — тем более, повод соответствующий: недавно я посетил Школьную Лигу «Сбера», где было целых пять дисциплин — «Электронные шахматы», Tetris, «Мир Танков», «Поиск в интернете» и Dota 2.

Поскольку две из этих дисциплин — профессиональные киберспортивные, я решил продолжить общение с современными киберспортсменами. Спортсмен по «Миру Танков» у меня уже был, остаётся Dota 2. И в этот раз у меня довольно интересный спикер — участник и победитель Всероссийской киберспортивной студенческой лиги, Национальной студенческой лиги киберспорта, член сборной России по Dota 2, студент РТУ МИРЭА Илья Spirit Терехов.

Однако не обошлось без экспериментов: к этому интервью я решил подойти больше с точки зрения спортивной составляющей. Всё‑таки Илья — член сборной, поэтому и вопросы были ближе к профессиональному спорту, чем к компьютерным играм. Надеюсь, будет интересно. Приятного чтения!

Читать далее

Применяем метод Getting Things Done (GTD) в рабочем мессенджере с помощью тегов

чт, 04/17/2025 - 18:53

Всем привет, на связи Scrum‑мастер команды eXpress Дмитрий Шугалей. Совсем недавно мы добавили функцию тегов в мобильной версии нашего корпоративного мессенджера (на десктоп‑клиенте они работали уже давно), и еще раз убедились, что это вполне рабочий инструмент организации работы над задачами в проекте. Попробовал сам, поговорил с коллегами — и родилась идея посмотреть, как один из популярных методов повышения личной эффективности «встраивается» в рабочий мессенджер при помощи тегов. Получилась эта заметка как отражение личного опыта и нового взгляда на старый известный подход.

В первой части статьи я коротко напомню суть метода GTD (Getting Things Done), как одного из приемов работы с информацией, который помогает классифицировать рабочие задачи. Далее покажу, как этот метод можно внедрить в рабочую рутину с помощью тегов. А после поделюсь лайфхаками и собственными системами тегов от моих коллег. Статья может быть полезна как тем, кто уже использует теги в рабочем мессенджере, так и тем, кто сомневается в их эффективности или еще просто не попробовал внедрить их в свою рабочую рутину.

Читать далее

Пишем небольшой терминал на python #1. Файловая система

чт, 04/17/2025 - 18:50

Всем привет, сегодня мы начнём писать небольшой терминал на Python с собственной файловой системой (виртуальной и мало чего умеющей).

#1 Файловая система - Вы здесь

#2 Приложения

#3 Обработчик команд

#4 Терминал

Читать далее

Хочешь стать техлидом? Возможно не стоит

чт, 04/17/2025 - 18:39

Привет! Меня зовут Абакар, я работаю главным техническим лидером разработки в Альфа-Банке. В этой статье хочу поделиться с тобой про особенности работы на моей позиции и какие нюансы я вижу в ней. Возможно это поможет тебе, особенно если ты сейчас задумываешься о том, чтобы стать техническим лидером.

Читать далее

Кошениль. История производства красной краски

чт, 04/17/2025 - 18:27

Посвящается девушкам, любящим красные платья. История появления ярких красных красок, столь раскрасивших и украсивших нашу жизнь. Технологии от славных червяков, которыми красят губы наши красавицы и съедают их тоннами.

Этот текст написан в рамках подготовки материалов, для видео на канале https://www.youtube.com/watch?v=ypWv9Qu1ct4 о колониальной Мексике.

Читать далее

Секретные фразы, которые делают ChatGPT в разы умнее

чт, 04/17/2025 - 18:25

В большинстве случаев ChatGPT заточен на то, чтобы давать поверхностную, общую информацию. Он как поисковик на максималках: здорово экономит время. И вы услышите об этом от многих юзеров: «он не заменяет мне [что-то], а лишь экономит время!».

И на самом деле, для большинства чатгпт лишь средство для экономии времени.

Я, как пользователь ChatGPT практически с момента его выхода, точно знаю, что экономия времени далеко не потолок этой нейросети. И дело даже не в том, что его "нужно обучать", а в том, что многие не дают правильного запроса, от чего получают сухую, общую, поверхностную информацию.

Читать далее

Разработали мобильное приложение для криптобиржи EVEDEX — функциональное решение для быстрой и безопасной торговли

чт, 04/17/2025 - 18:06

Создать мобильное приложение для криптобиржи — всегда вызов. Особенно, если биржа сочетает в себе принципы DEX и CEX, предлагает встроенные кошельки, смарт-аккаунты и управление средствами без посредников. Мы в CleverPumpkin взялись за этот челлендж и разработали EVEDEX — удобное и безопасное приложение для криптотрейдинга.

Читать далее

Как сделать компьютерную память из ржавых гвоздей и нейросети — из медных проволок?

чт, 04/17/2025 - 18:01
Картинка — Kaboompics, Flatart, Freepik

Сегодня мы поговорим о таком интересном классе электронных компонентов, который носит название «мемристоры» и позволяет даже строить на их основе нейросети.

Их привлекательность заключается в том, что их вполне можно делать даже самостоятельно, из подручных компонентов.

В последнее время мы привыкли, что под понятием нейросетей подразумеваются определённые программные структуры. Однако мемристоры позволяют строить нейросети на физической основе! О_о

Аппаратные физические нейросети… Как вам такое? :-) Весьма близко к тому, что мы видим в природе, кстати говоря… Читать дальше →

Полигональная оптимизация вывода точек треков перемещения объектов

чт, 04/17/2025 - 17:52

Система Visitech «Мониторинг» предназначена для решения задач, связанных с мониторингом персонала и техники. Одна из важнейших — точное геопозионирование с заданной точностью вне и внутри зданий с выводом на карту информации о любых происходящих событиях.

Большое количество точек в треках перемещения объектов мониторинга может негативно сказываться на производительности системы и вызывать сложности с интерпретацией этих данных конечными пользователями. Всем привет, меня зовут Дмитрий Чернышов, работаю в команде Visitech, и сегодня я расскажу, как мы оптимизировали вывод треков объектов мониторинга.

Читать далее

Как изменился ландшафт иностранных игроков на российском рынке

чт, 04/17/2025 - 17:52

Число компаний с иностранным участием сокращалось еще до 2022 года — в 2018-2021 с 47 до 28 тысяч, то есть на 40%. Во многом это было связано с де-оффшоризацией, но и с оттоком иностранного капитала из страны в целом тоже. За последние же три года количество компаний с иностранным участием сократилось еще на треть. 

Это изменило ситуацию на рынке в целом и ландшафт иностранных предприятий  в России в частности. Разбираем, как обстоят дела по статистическим данным, расходятся ли они с практикой, и в какие ниши могут начать возвращаться иностранные компании в этом году. 

Читать далее

Гайд по работе с бизнес-требованиями. На основе формата Use Case

чт, 04/17/2025 - 17:47

Вам надоело, что бизнес приходит с абстрактными проблемами, или того хуже с готовым решением? В итоге ограничивая работу отдела разработки в принятии решений? Как сделать сложные требования понятными и структурированными, чтобы они работали быстрее и эффективнее для решения задач бизнеса?  

Бизнес-требования — это основа для разработки IT-решений. Но часто их описывают слишком сложно или неоднозначно. В результате разработчики тратят время на уточнения деталей, а заказчики остаются недовольны.

Формат Use Case помогает избежать этих проблем. Он описывает сценарии взаимодействия пользователей и систем в четкой, последовательной форме. Это не просто техническая документация, а «инструкция» для всех участников проекта: аналитиков, разработчиков, тестировщиков и бизнес-пользователей.

Автор: Борис Абрамов, lead system analyst

Читать далее

Архитектура проекта автоматического обучения ML-моделей

чт, 04/17/2025 - 17:45

Хабр, привет! На связи Кравцов Кирилл и Суздалев Руслан из команды моделирования поведенческих сценариев Центра развития искусственного интеллекта СПАО «Ингосстрах» (далее — ЦРИИ). В статье поделимся решением, которое помогает нам быстрее обучать и интегрировать модели в компании.

С ростом компании и ЦРИИ, в частности, у нас появлялось все больше бизнес‑заказчиков, которым нужны были ML‑модели. Поэтому потребность росла, а ограниченность ресурсов не позволяла быстро обрабатывать задачи бизнеса и многое уходило в беклог.

Читать далее

Как обучить русскоязычную модель рассуждений — LRM?

чт, 04/17/2025 - 17:45

Ранее на моем YouTube-канале уже были видео о моделях рассуждений — OpenAI o1/o3, DeepSeek R1. Эти модели обучены с помощью стратегии reinforcement learning находить решения для задач, требующих логических рассуждений. Способность строить цепочки рассуждений, ведущих к решению поставленной задачи, открывают возможность применения таких моделей в математике, программировании и других подобных направлениях.​

Однако упомянутые модели имеют одно ограничение — они выполняют рассуждения на английском языке. И даже если вы укажете в промпте требуемый язык ответа, отличный от этих двух, то только вывод модели будет на этом языке, а вот сама цепочка останется на том, на котором модель обучена “думать”. Соответственно, чтобы заставить модель думать на русском, нужно применять файнтюнинг.

Есть интересный пример — коллекция моделей R1 Multilingual от японской компании Lightblue, которая ранее создала открытый мультиязычный файнтюнг Llama 3 - Suzume. Эта новая коллекция содержит модели рассуждений на базе DeepSeek-R1-Distill-Qwen, дистиллированных с помощью DeepSeek R1 версий Qwen. Что более важно - эти модели получены путем файнтюнинга на мультиязычном CoT (Chain-of-Thoughts), и данные CoT опубликованы на HuggingFace.

Датасет содержит данные на более чем 30 языках, включая русский. Данные получены следующим образом:

Выполнена выборка промптов из открытых англоязычных датасетов с последующим переводом на различные языки. Для перевода использовалась GPT-4o, которая, кстати, хорошо показала себя при создании моего собственного датасета и русскоязычного файнтюна Llama 3 на нем. Далее авторы мультиязычного CoT-датасета сгенерировали ответы на полученные промпты с помощью deepseek-ai/DeepSeek-R1-Distill-Llama-70B восемь раз, и отфильтровали блоки <think> не на том языке, либо с нарушениями правил языка или логическими ошибками. Это достаточно интересный момент, так как разработчики полностью опубликовали код для генерации своего датасета, включая фильтрацию сгенерированных цепочек рассуждений. Если с автоматическим определением языка цепочки все достаточно просто, то для проверки ее соответствия нормам языка и, самое главное, логической корректности, пришлось опять-таки задействовать LLM. Принцип такой же, как и при использовании модели-судьи для выполнения автоматизированных evaluation-тестов.

Читать далее

Что такое Ansible и как применяется в DWH-проектах? Сравнение Ansible с Puppet, Chef, SaltStack

чт, 04/17/2025 - 17:42

В статье рассказываем, что такое Ansible и как инструмент может применяться в проектах DWH: от автоматического развертывания и настройки компонентов до восстановления после сбоев и централизованного управления параметрами.

Сравниваем Ansible с другими инструментами для автоматизации управления инфраструктурой: Puppet, Chef, SaltStack.

Читать далее

«Надо учить не знанию, а пониманию»

чт, 04/17/2025 - 17:41

14 февраля в Российском новом университете – сдвоенный праздник: день рождения гениального физика и популяризатора науки Сергея Петровича Капицы и День всех влюблённых. По инициативе Студенческого научного общества он синтезировался в День влюблённых в науку.

Читать далее

Что чувствует человек во время и после лазерной коррекции зрения

чт, 04/17/2025 - 17:09

Лазерная коррекция зрения — это шаг, который многие откладывают из‑за страхов и сомнений. Они возникают не столько из реальных рисков, сколько из‑за мифов, которые окружают эту процедуру. Одни думают, что это болезненно, другие считают ее опасной, а третьи сомневаются в долгосрочном эффекте коррекции. Страхи часто усиливаются из‑за неизвестности. Когда не знаешь, что тебя ждет, любые доводы теряют силу. Именно поэтому важно услышать реальный опыт человека, который прошел через это и готов поделиться своими ощущениями.

Читать далее

Как готовить Triton: рецепты вашей собственной Inference-платформы

чт, 04/17/2025 - 17:03

Привет, Хабр! Меня зовут Антон, я DevOps-инженер в команде Data/ML-продуктов Selectel. Если вам нужно запустить небольшой инференс одной ML-модели, можно взять команду бэкендеров, дать им эту модель, они обернут ее в эндпоинт — и готово. Достаточно короткого скрипта из нескольких строк на Python. Но что если нужно запускать несколько моделей, оптимизировать выполнение, работать с ансамблем моделей, задействовать CPU и GPU одновременно и т. д.? Все эти проблемы решает NVIDIA Triton Inference Server. Правда, он добавляет одну новую: разобраться с ним и его документацией — тот еще квест.

В статье посмотрим, насколько сложной задачей может оказаться создание собственного инференса и какие аспекты нужно учитывать. Научимся запускать различные форматы моделей, посмотрим на основные фичи Inference-платформы Selectel, запустим несколько популярных LLM и моделей, а также познакомимся со способами оптимизации конфигурации и проектирования интерфейса для модели. Читать дальше →

Сейчас на сайте

Сейчас на сайте 0 пользователей и 3 гостя.