Ранее на моем YouTube-канале уже были видео о моделях рассуждений — OpenAI o1/o3, DeepSeek R1. Эти модели обучены с помощью стратегии reinforcement learning находить решения для задач, требующих логических рассуждений. Способность строить цепочки рассуждений, ведущих к решению поставленной задачи, открывают возможность применения таких моделей в математике, программировании и других подобных направлениях.
Однако упомянутые модели имеют одно ограничение — они выполняют рассуждения на английском языке. И даже если вы укажете в промпте требуемый язык ответа, отличный от этих двух, то только вывод модели будет на этом языке, а вот сама цепочка останется на том, на котором модель обучена “думать”. Соответственно, чтобы заставить модель думать на русском, нужно применять файнтюнинг.
Есть интересный пример — коллекция моделей R1 Multilingual от японской компании Lightblue, которая ранее создала открытый мультиязычный файнтюнг Llama 3 - Suzume. Эта новая коллекция содержит модели рассуждений на базе DeepSeek-R1-Distill-Qwen, дистиллированных с помощью DeepSeek R1 версий Qwen. Что более важно - эти модели получены путем файнтюнинга на мультиязычном CoT (Chain-of-Thoughts), и данные CoT опубликованы на HuggingFace.
Датасет содержит данные на более чем 30 языках, включая русский. Данные получены следующим образом:
Выполнена выборка промптов из открытых англоязычных датасетов с последующим переводом на различные языки. Для перевода использовалась GPT-4o, которая, кстати, хорошо показала себя при создании моего собственного датасета и русскоязычного файнтюна Llama 3 на нем. Далее авторы мультиязычного CoT-датасета сгенерировали ответы на полученные промпты с помощью deepseek-ai/DeepSeek-R1-Distill-Llama-70B восемь раз, и отфильтровали блоки <think> не на том языке, либо с нарушениями правил языка или логическими ошибками. Это достаточно интересный момент, так как разработчики полностью опубликовали код для генерации своего датасета, включая фильтрацию сгенерированных цепочек рассуждений. Если с автоматическим определением языка цепочки все достаточно просто, то для проверки ее соответствия нормам языка и, самое главное, логической корректности, пришлось опять-таки задействовать LLM. Принцип такой же, как и при использовании модели-судьи для выполнения автоматизированных evaluation-тестов.
Читать далееВ статье рассказываем, что такое Ansible и как инструмент может применяться в проектах DWH: от автоматического развертывания и настройки компонентов до восстановления после сбоев и централизованного управления параметрами.
Сравниваем Ansible с другими инструментами для автоматизации управления инфраструктурой: Puppet, Chef, SaltStack.
14 февраля в Российском новом университете – сдвоенный праздник: день рождения гениального физика и популяризатора науки Сергея Петровича Капицы и День всех влюблённых. По инициативе Студенческого научного общества он синтезировался в День влюблённых в науку.
Читать далееЛазерная коррекция зрения — это шаг, который многие откладывают из‑за страхов и сомнений. Они возникают не столько из реальных рисков, сколько из‑за мифов, которые окружают эту процедуру. Одни думают, что это болезненно, другие считают ее опасной, а третьи сомневаются в долгосрочном эффекте коррекции. Страхи часто усиливаются из‑за неизвестности. Когда не знаешь, что тебя ждет, любые доводы теряют силу. Именно поэтому важно услышать реальный опыт человека, который прошел через это и готов поделиться своими ощущениями.
Читать далееЕсли кто-то говорил про медийную рекламу и цену за охват, я про себя улыбался. Мою-то работу можно посчитать до денег в кассе, а охват на хлеб не намажешь.
Читать далееПредставьте технологию, благодаря которой один-единственный кабель способен передать изображение в 8K, звук, данные, интернет и даже зарядить ваш ноутбук мощностью до 480 Вт. Это не фантастика, а реальность. У нее есть даже название — General Purpose Media Interface (GPMI).
Китайские разработчики представили новый стандарт в апреле 2025 года. Разработала его не одна компания, а крупный альянс Shenzhen 8K UHD Video Industry Cooperation Alliance, куда входит более 50 технологических гигантов, включая Huawei, TCL и Hisense, GPMI. Но что это за зверь такой и сможет ли он действительно вытеснить привычные нам HDMI, DisplayPort и даже USB-C? Давайте разбираться!
Читать далееВсем привет!
Сделайте, пожалуйста, это - супер срочно. А вот ещё одна функция, без которой мы жить не можем. А, ну и вот это тоже поправьте, пожалуйста.
Знакомо?
Если да - скорее всего, вы работаете в проекте, где нет фильтрации задач. Или уже пожинаете плоды её отсутствия.
Читать далееПривет! Вы в блоге «IT для детей», предназначенном для современных школьников и их родителей, которые интересуются темой дополнительного айти-обучения. Анализирую и обозреваю онлайн-школы и курсы, пишу о значимости ответственного подхода к выбору направления учебы, отмечаю не всегда очевидные особенности и аспекты. И да, меня зовут Ксюша. Будем знакомы!
Сегодня хочу поговорить о том, стоит ли вообще IT внимания, если контекст – онлайн-обучение программированию для школьников, но уклон будет немного нестандартным: буду писать о преимуществах и недостатках организаторов дистанционных курсов. При этом не преследую рекламных целей, но и хейтить никого не стану: акцент на объективности. С последним проблем нет: часто обозреваю различные образовательные организации, проверяю их лицензии на предмет актуальности, изучаю свежие отзывы на модерируемых площадках и не только.
Начнем с трендовости уроков программирования и информационных технологий как сферы в целом.
Читать далееНаверное, я очень опоздал с изучением CUDA. До недавнего времени даже не знал, что CUDA — это просто C++ с небольшими добавками. Если бы я знал, что изучение её пойдёт как по маслу, я бы столько не медлил. Но, если у вас есть багаж привычек C++ , то код на CUDA у вас будет получаться низкокачественным. Поэтому расскажу вам о некоторых уроках, изученных на практике — возможно, мой опыт поможет вам ускорить код.
Читать далееПривет! Я Ксюша, пишу статьи для блога «IT для детей» и делаю это для современных школьников и их родителей, интересующихся вопросами по поводу дополнительного обучения. Предлагаю обзоры курсов и частных школ программирования, часто касаюсь злободневных тем и стараюсь говорить просто о сложном.
Сегодня к вопросу по поводу онлайн-обучения программированию современных 7-летних детей: многим кажется, что это неразумно и даже абсурдно, но практика множества частных школ подтверждает обратное. Вместе с тем стоит понимать, что погружение в информационные технологии и развитие младшего школьника в данном направлении стоит строить предельно аккуратно, ведь только в этом случае удастся добиться выраженных образовательных результатов. Антитеза – слепая запись в онлайн-школу программирования для детей 7 лет лишь потому, что это трендово и хайпово.
Читать далееПару дней назад я опубликовал статью про ХрюХрюКар - телегам-бот для борьбы со стоянкой автомобилей на зелёных зонах. Проект с открытым исходным кодом.
За два дня ко мне обратилось несколько сторонников с просьбой добавить их города. Но вот незадача: у меня была возможность через админ-панель Django править данные в базе, но об этом кеш сервера не узнает (основной бекэнд на Go). В результате приходилось добавлять данные и перезагружать контейнеры с go-бекэндом вручную.
Основные серверы ХХК уже имели сторы, которые получают и обрабатывают апдейты, прилетающие через redis.
По сути, оставалось внести правки в часть django-бэкенда, чтобы обрабатывать сигналы pre_save и pre_delete, сериализовать данные и отправлять их в нужный канал редиса.
Решил поручить эту задачу Codex CLI, которую вчера OpenAI представили нам с вами.
Читать далееПривет, Хабр!
Сегодня я хочу поговорить о том, как мы все иногда очарованы показателями тестового покрытия в Go — и как же часто эти проценты лукаво нам подмигивают. Казалось бы, влепили go test -cover, получили любимые цифры, приближающиеся к 100%, и можно выдохнуть. Но, увы, не всё так радужно, как хочется. На самом деле заветная сотка покрытия далеко не всегда означает, что ваш код действительно покрыт тестами.
Читать далееГде именно юристы пересекаются с ИТ?
Ответ здесь может быть долгим. Тимлиды регулярно принимают решения о выборе технологий и инструментов, менеджеры управляют ИТ-проектами с учетом сроков и бюджета, а разработчики пилят полезные сервисы и фичи. Каждый из них сталкивается с правовыми аспектами своей работы: от проверки лицензий open source компонентов до простого (иногда в кавычках) оформления договора с подрядчиком.
Часто коммуникация юристов и ИТ-спецов напоминает диалог двух разных миров: технический жаргон встречается с правовыми терминами; планы по запуску прорывных решений — с рядом законодательных ограничений.
Исправить ситуацию (читай: упростить жизнь обеим сторонам) вполне в силах каждого из нас. Во-первых, важно точно знать, когда к юристу стоит сходить (и всегда делать это вовремя), а во-вторых — учитывать несколько несложных принципов взаимодействия с ним.
Оба этих аспекта раскрываем под катом, в формате памятки.
Читать далееПривет! Если после заголовка вы решили, что это очередная статья в стиле «Топ-10 способов ускорить Pandas», то не торопитесь с выводами. Вместо топов и подборок предлагаю взглянуть на бенчмарки скорости и потребления памяти в зависимости от характеристик датафрейма и убедиться, что часть советов из статей по ускорению могут оказаться даже вредными. Разберём, какой из способов ускорения нужно пробовать в разных ситуациях, как это зависит от размера датафрейма и как ведёт себя в реальном проекте.
Читать далееВ марте вышел сериал «Стенбек» — драма о шведско-американском предпринимателе, который, если верить сценаристам, однажды сел в такси и увидел будущее за сотовой связью. Таксист якобы сам собрал радиотелефон и разрешил Яну позвонить. Так предприниматель смекнул, что это перспективная ниша.
Правдиво? Ну… не совсем. Это ведь художественное переосмысление, драма про семью, бизнес и вред алкоголя. Множество проектов Стенбека невозможно уместить в один фильм или даже сериал. Здесь есть сюжетные линии про запуск мобильной связи в Швеции, но проекты предпринимателя в других странах, в частности в России, создатели сериала обошли стороной. А в нашей стране Стенбек тоже развернулся на ниве сотовой связи. Бренд Tele2 был на слуху до 2024 года, а это было не единственное его начинание. Расскажу о ярком предпринимателе и его телекоммуникационных проектах.
Другие истории про прошлые технологии связи можно посмотреть у меня в телеграм-канале
Читать далееПривет! В первой статье цикла мы обсудили вводную про локализацию и её особенности. Пришло время поговорить про конкретные проблемы, с которыми можно столкнуться в процессе локализации. А ещё расскажу, как и кем выполнять тестирование.
Читать далееС тех пор как космический телескоп имени Джеймса Уэбба начал научную работу, астрономы увидели галактики, существовавшие более 13 миллиардов лет назад. Именно в этот период, известный как «Космические тёмные века», первые звёзды и галактики образовались между 200 миллионами и 1 миллиардом лет после Большого взрыва. К сожалению, свет этого периода мы видим только в виде реликтового излучения, вызванного Большим взрывом. Это фотоны, высвободившиеся при реионизации нейтрального водорода под действием звёздного излучения.
Предыдущие обсерватории, такие как более старые космические телескопы «Хаббл» и «Спитцер», не могли наблюдать галактики в этот период из-за их ограниченной инфракрасной (ИК) чувствительности. Но благодаря передовым ИК-инструментам, коронографам и тепловому экрану «Уэбба» занавес с тёмных веков наконец-то снят. В недавнем исследовании международная группа учёных изучила архивные данные «Уэбба» по галактикам, существовавшим всего через несколько сотен миллионов лет после Большого взрыва – в этом смысле «Уэббу» поработал на пределе своих возможностей по созданию изображений.
Читать далее11 марта решил сделать антиспам бота в одну из моих групп в телеграм.
что за группа?
1. группа открытая, активность небольшая
2. каждый день подключаются новые "участники" и отправляют непрошенные рекламные сообщения
3. новые "участники" умеют проходить капчу
плюс еще было желание меньше уделять времени админской кухне:
Читать далее