Habr.com

Syndicate content Хабр
Все публикации подряд на Хабре
Updated: 1 hour 47 min ago

Как обучить русскоязычную модель рассуждений — LRM?

Thu, 04/17/2025 - 17:45

Ранее на моем YouTube-канале уже были видео о моделях рассуждений — OpenAI o1/o3, DeepSeek R1. Эти модели обучены с помощью стратегии reinforcement learning находить решения для задач, требующих логических рассуждений. Способность строить цепочки рассуждений, ведущих к решению поставленной задачи, открывают возможность применения таких моделей в математике, программировании и других подобных направлениях.​

Однако упомянутые модели имеют одно ограничение — они выполняют рассуждения на английском языке. И даже если вы укажете в промпте требуемый язык ответа, отличный от этих двух, то только вывод модели будет на этом языке, а вот сама цепочка останется на том, на котором модель обучена “думать”. Соответственно, чтобы заставить модель думать на русском, нужно применять файнтюнинг.

Есть интересный пример — коллекция моделей R1 Multilingual от японской компании Lightblue, которая ранее создала открытый мультиязычный файнтюнг Llama 3 - Suzume. Эта новая коллекция содержит модели рассуждений на базе DeepSeek-R1-Distill-Qwen, дистиллированных с помощью DeepSeek R1 версий Qwen. Что более важно - эти модели получены путем файнтюнинга на мультиязычном CoT (Chain-of-Thoughts), и данные CoT опубликованы на HuggingFace.

Датасет содержит данные на более чем 30 языках, включая русский. Данные получены следующим образом:

Выполнена выборка промптов из открытых англоязычных датасетов с последующим переводом на различные языки. Для перевода использовалась GPT-4o, которая, кстати, хорошо показала себя при создании моего собственного датасета и русскоязычного файнтюна Llama 3 на нем. Далее авторы мультиязычного CoT-датасета сгенерировали ответы на полученные промпты с помощью deepseek-ai/DeepSeek-R1-Distill-Llama-70B восемь раз, и отфильтровали блоки <think> не на том языке, либо с нарушениями правил языка или логическими ошибками. Это достаточно интересный момент, так как разработчики полностью опубликовали код для генерации своего датасета, включая фильтрацию сгенерированных цепочек рассуждений. Если с автоматическим определением языка цепочки все достаточно просто, то для проверки ее соответствия нормам языка и, самое главное, логической корректности, пришлось опять-таки задействовать LLM. Принцип такой же, как и при использовании модели-судьи для выполнения автоматизированных evaluation-тестов.

Читать далее

Что такое Ansible и как применяется в DWH-проектах? Сравнение Ansible с Puppet, Chef, SaltStack

Thu, 04/17/2025 - 17:42

В статье рассказываем, что такое Ansible и как инструмент может применяться в проектах DWH: от автоматического развертывания и настройки компонентов до восстановления после сбоев и централизованного управления параметрами.

Сравниваем Ansible с другими инструментами для автоматизации управления инфраструктурой: Puppet, Chef, SaltStack.

Читать далее

«Надо учить не знанию, а пониманию»

Thu, 04/17/2025 - 17:41

14 февраля в Российском новом университете – сдвоенный праздник: день рождения гениального физика и популяризатора науки Сергея Петровича Капицы и День всех влюблённых. По инициативе Студенческого научного общества он синтезировался в День влюблённых в науку.

Читать далее

Что чувствует человек во время и после лазерной коррекции зрения

Thu, 04/17/2025 - 17:09

Лазерная коррекция зрения — это шаг, который многие откладывают из‑за страхов и сомнений. Они возникают не столько из реальных рисков, сколько из‑за мифов, которые окружают эту процедуру. Одни думают, что это болезненно, другие считают ее опасной, а третьи сомневаются в долгосрочном эффекте коррекции. Страхи часто усиливаются из‑за неизвестности. Когда не знаешь, что тебя ждет, любые доводы теряют силу. Именно поэтому важно услышать реальный опыт человека, который прошел через это и готов поделиться своими ощущениями.

Читать далее

Как готовить Triton: рецепты вашей собственной Inference-платформы

Thu, 04/17/2025 - 17:03

Привет, Хабр! Меня зовут Антон, я DevOps-инженер в команде Data/ML-продуктов Selectel. Если вам нужно запустить небольшой инференс одной ML-модели, можно взять команду бэкендеров, дать им эту модель, они обернут ее в эндпоинт — и готово. Достаточно короткого скрипта из нескольких строк на Python. Но что если нужно запускать несколько моделей, оптимизировать выполнение, работать с ансамблем моделей, задействовать CPU и GPU одновременно и т. д.? Все эти проблемы решает NVIDIA Triton Inference Server. Правда, он добавляет одну новую: разобраться с ним и его документацией — тот еще квест.

В статье посмотрим, насколько сложной задачей может оказаться создание собственного инференса и какие аспекты нужно учитывать. Научимся запускать различные форматы моделей, посмотрим на основные фичи Inference-платформы Selectel, запустим несколько популярных LLM и моделей, а также познакомимся со способами оптимизации конфигурации и проектирования интерфейса для модели. Читать дальше →

Почему малый бизнес хочет окупаемость рекламы и умирает, а крупный бизнес тратит миллионы на brand search и растет

Thu, 04/17/2025 - 17:02

Если кто-то говорил про медийную рекламу и цену за охват, я про себя улыбался. Мою-то работу можно посчитать до денег в кассе, а охват на хлеб не намажешь.

Читать далее

General Purpose Media Interface (GPMI): китайский ответ HDMI и DisplayPort. Что это за технология?

Thu, 04/17/2025 - 17:00

Представьте технологию, благодаря которой один-единственный кабель способен передать изображение в 8K, звук, данные, интернет и даже зарядить ваш ноутбук мощностью до 480 Вт. Это не фантастика, а реальность. У нее есть даже название — General Purpose Media Interface (GPMI).

Китайские разработчики представили новый стандарт в апреле 2025 года. Разработала его не одна компания, а крупный альянс Shenzhen 8K UHD Video Industry Cooperation Alliance, куда входит более 50 технологических гигантов, включая Huawei, TCL и Hisense, GPMI. Но что это за зверь такой и сможет ли он действительно вытеснить привычные нам HDMI, DisplayPort и даже USB-C? Давайте разбираться!

Читать далее

PM — Как фильтр для команды

Thu, 04/17/2025 - 16:31

Всем привет!

Сделайте, пожалуйста, это - супер срочно. А вот ещё одна функция, без которой мы жить не можем. А, ну и вот это тоже поправьте, пожалуйста.

Знакомо?

Если да - скорее всего, вы работаете в проекте, где нет фильтрации задач. Или уже пожинаете плоды её отсутствия.

Читать далее

Минусы и плюсы онлайн школы по программированию для школьников: объективный обзор и неочевидные детали

Thu, 04/17/2025 - 16:26

Привет! Вы в блоге «IT для детей», предназначенном для современных школьников и их родителей, которые интересуются темой дополнительного айти-обучения. Анализирую и обозреваю онлайн-школы и курсы, пишу о значимости ответственного подхода к выбору направления учебы, отмечаю не всегда очевидные особенности и аспекты. И да, меня зовут Ксюша. Будем знакомы!

Сегодня хочу поговорить о том, стоит ли вообще IT внимания, если контекст – онлайн-обучение программированию для школьников, но уклон будет немного нестандартным: буду писать о преимуществах и недостатках организаторов дистанционных курсов. При этом не преследую рекламных целей, но и хейтить никого не стану: акцент на объективности. С последним проблем нет: часто обозреваю различные образовательные организации, проверяю их лицензии на предмет актуальности, изучаю свежие отзывы на модерируемых площадках и не только.

Начнем с трендовости уроков программирования и информационных технологий как сферы в целом.

Читать далее

[Перевод] Обзор CUDA: сюрпризы с производительностью

Thu, 04/17/2025 - 16:25

Наверное, я очень опоздал с изучением CUDA. До недавнего времени даже не знал, что CUDA — это просто C++ с небольшими добавками. Если бы я знал, что изучение её пойдёт как по маслу, я бы столько не медлил. Но, если у вас есть багаж привычек C++ , то код на CUDA у вас будет получаться низкокачественным. Поэтому расскажу вам о некоторых уроках, изученных на практике — возможно, мой опыт поможет вам ускорить код.

Читать далее

Можно ли реализовать обучение онлайн детей 7 лет на курсах программирования?

Thu, 04/17/2025 - 16:15

Привет! Я Ксюша, пишу статьи для блога «IT для детей» и делаю это для современных школьников и их родителей, интересующихся вопросами по поводу дополнительного обучения. Предлагаю обзоры курсов и частных школ программирования, часто касаюсь злободневных тем и стараюсь говорить просто о сложном.

Сегодня к вопросу по поводу онлайн-обучения программированию современных 7-летних детей: многим кажется, что это неразумно и даже абсурдно, но практика множества частных школ подтверждает обратное. Вместе с тем стоит понимать, что погружение в информационные технологии и развитие младшего школьника в данном направлении стоит строить предельно аккуратно, ведь только в этом случае удастся добиться выраженных образовательных результатов. Антитеза – слепая запись в онлайн-школу программирования для детей 7 лет лишь потому, что это трендово и хайпово.

Читать далее

Пробуем Codex CLI от OpenAI для доработки ХрюХрюКара

Thu, 04/17/2025 - 15:58

Пару дней назад я опубликовал статью про ХрюХрюКар - телегам-бот для борьбы со стоянкой автомобилей на зелёных зонах. Проект с открытым исходным кодом.

За два дня ко мне обратилось несколько сторонников с просьбой добавить их города. Но вот незадача: у меня была возможность через админ-панель Django править данные в базе, но об этом кеш сервера не узнает (основной бекэнд на Go). В результате приходилось добавлять данные и перезагружать контейнеры с go-бекэндом вручную.

Основные серверы ХХК уже имели сторы, которые получают и обрабатывают апдейты, прилетающие через redis.

По сути, оставалось внести правки в часть django-бэкенда, чтобы обрабатывать сигналы pre_save и pre_delete, сериализовать данные и отправлять их в нужный канал редиса.

Решил поручить эту задачу Codex CLI, которую вчера OpenAI представили нам с вами. 

Читать далее

Книга: «Создание фронтенд-фреймворка с нуля»

Thu, 04/17/2025 - 15:54
Привет, Хаброжители!

Мы используем фронтенд-фреймворки каждый день. А понимаем ли мы, что происходит там, под капотом? Книга Анхеля Солы Орбайсеты «Создание фронтенд-фреймворка с нуля» предлагает уникальный подход к изучению этой темы — через практическое создание собственного фреймворка. Автор убежден, что лучший способ понять принципы работы фреймворков — самостоятельно реализовать их ключевые механизмы. Читать дальше →

100 % cover, 0 % спокойствия

Thu, 04/17/2025 - 15:52

Привет, Хабр!

Сегодня я хочу поговорить о том, как мы все иногда очарованы показателями тестового покрытия в Go — и как же часто эти проценты лукаво нам подмигивают. Казалось бы, влепили go test -cover, получили любимые цифры, приближающиеся к 100%, и можно выдохнуть. Но, увы, не всё так радужно, как хочется. На самом деле заветная сотка покрытия далеко не всегда означает, что ваш код действительно покрыт тестами.

Читать далее

Когда вам стоит обратиться к ИТ-юристу? (Возможно, прямо сейчас!)

Thu, 04/17/2025 - 15:46

Где именно юристы пересекаются с ИТ?

Ответ здесь может быть долгим. Тимлиды регулярно принимают решения о выборе технологий и инструментов, менеджеры управляют ИТ-проектами с учетом сроков и бюджета, а разработчики пилят полезные сервисы и фичи. Каждый из них сталкивается с правовыми аспектами своей работы: от проверки лицензий open source компонентов до простого (иногда в кавычках) оформления договора с подрядчиком.  

Часто коммуникация юристов и ИТ-спецов напоминает диалог двух разных миров: технический жаргон встречается с правовыми терминами; планы по запуску прорывных решений — с рядом законодательных ограничений.

Исправить ситуацию (читай: упростить жизнь обеим сторонам) вполне в силах каждого из нас. Во-первых, важно точно знать, когда к юристу стоит сходить (и всегда делать это вовремя), а во-вторых — учитывать несколько несложных принципов взаимодействия с ним.

Оба этих аспекта раскрываем под катом, в формате памятки. 

Читать далее

Ускорить Pandas в 60 раз: проверяем лайфхаки из интернета на реальном проекте и обкладываемся бенчмарками

Thu, 04/17/2025 - 15:25

Привет! Если после заголовка вы решили, что это очередная статья в стиле «Топ-10 способов ускорить Pandas», то не торопитесь с выводами. Вместо топов и подборок предлагаю взглянуть на бенчмарки скорости и потребления памяти в зависимости от характеристик датафрейма и убедиться, что часть советов из статей по ускорению могут оказаться даже вредными. Разберём, какой из способов ускорения нужно пробовать в разных ситуациях, как это зависит от размера датафрейма и как ведёт себя в реальном проекте.

Читать далее

Миллиарды на сотах и борьба с регуляторами: что показали и скрыли в сериале о пионере мобильной связи Яне Стенбеке

Thu, 04/17/2025 - 15:17

В марте вышел сериал «Стенбек» — драма о шведско-американском предпринимателе, который, если верить сценаристам, однажды сел в такси и увидел будущее за сотовой связью. Таксист якобы сам собрал радиотелефон и разрешил Яну позвонить. Так предприниматель смекнул, что это перспективная ниша.

Правдиво? Ну… не совсем. Это ведь художественное переосмысление, драма про семью, бизнес и вред алкоголя. Множество проектов Стенбека невозможно уместить в один фильм или даже сериал. Здесь есть сюжетные линии про запуск мобильной связи в Швеции, но проекты предпринимателя в других странах, в частности в России, создатели сериала обошли стороной. А в нашей стране Стенбек тоже развернулся на ниве сотовой связи. Бренд Tele2 был на слуху до 2024 года, а это было не единственное его начинание. Расскажу о ярком предпринимателе и его телекоммуникационных проектах.

Другие истории про прошлые технологии связи можно посмотреть у меня в телеграм-канале

Читать далее

ПОТРАЧЕНО–2. Как тестировать локализацию переводов, чтобы потом не было стыдно

Thu, 04/17/2025 - 15:02

Привет! В первой статье цикла мы обсудили вводную про локализацию и её особенности. Пришло время поговорить про конкретные проблемы, с которыми можно столкнуться в процессе локализации. А ещё расскажу, как и кем выполнять тестирование.

Читать далее

[Перевод] Астрономы выжали из «Уэбба» максимум, чтобы сфотографировать самые удалённые галактики

Thu, 04/17/2025 - 14:55

С тех пор как космический телескоп имени Джеймса Уэбба начал научную работу, астрономы увидели галактики, существовавшие более 13 миллиардов лет назад. Именно в этот период, известный как «Космические тёмные века», первые звёзды и галактики образовались между 200 миллионами и 1 миллиардом лет после Большого взрыва. К сожалению, свет этого периода мы видим только в виде реликтового излучения, вызванного Большим взрывом. Это фотоны, высвободившиеся при реионизации нейтрального водорода под действием звёздного излучения.

Предыдущие обсерватории, такие как более старые космические телескопы «Хаббл» и «Спитцер», не могли наблюдать галактики в этот период из-за их ограниченной инфракрасной (ИК) чувствительности. Но благодаря передовым ИК-инструментам, коронографам и тепловому экрану «Уэбба» занавес с тёмных веков наконец-то снят. В недавнем исследовании международная группа учёных изучила архивные данные «Уэбба» по галактикам, существовавшим всего через несколько сотен миллионов лет после Большого взрыва – в этом смысле «Уэббу» поработал на пределе своих возможностей по созданию изображений.

Читать далее

Антиспам бот для телеграм группы на Gigachat2

Thu, 04/17/2025 - 14:50

11 марта решил сделать антиспам бота в одну из моих групп в телеграм.

что за группа?

1. группа открытая, активность небольшая

2. каждый день подключаются новые "участники" и отправляют непрошенные рекламные сообщения

3. новые "участники" умеют проходить капчу

плюс еще было желание меньше уделять времени админской кухне:

Читать далее

Who's online

There are currently 0 users and 0 guests online.