Habr.com

Syndicate content Хабр
Все публикации подряд на Хабре
Updated: 1 hour 21 min ago

Три попытки, академ и истерика перед собесом: как я поступала в Школу анализа данных Яндекса

1 hour 43 min ago

Привет! Меня зовут Яна, я студентка ВМК МГУ и ШАДа. В этой статье хочу поделиться своей историей поступления в Школу анализа данных (ШАД) Яндекса. Получилось долго, больно, но очень ценно. Уверена, многим абитуриентам мой опыт (и ошибки) будут полезны.

Откуда я и как узнала про ШАД

Про Школу анализа данных я узнала еще в школе. Случайно наткнулась на YouTube: смотрела интервью Владимира Оксфорда с Еленой Буниной (бывший руководителем ШАДа и ген директором Яндекса). Также я загорелась идеей поступить на ВМК МГУ, участвовала в олимпиадах, поэтому ШАД был на слуху как что-то недостижимо крутое.

Сама я из обычной школы Калининграда. Никаких продвинутых курсов по программированию у нас не было, я готовилась только к математике (олимпиады дали 100 баллов за ДВИ). Поэтому, когда я поступила на ВМК, учеба с первого курса давалась мне очень и очень тяжело, базы катастрофически не хватало.

Первая попытка (1-й курс): «Просто попробовать»

Первый раз я подала заявку в ШАД в конце первого курса. Назвать это попыткой язык не поворачивается. Шла зачетная неделя, и я чисто физически успела только зарегистрироваться и в последний день «порешать наугад» задания первого этапа.

Читать далее

Как я пытался сделать идеальный нечёткий поиск (и почему в итоге пришлось писать 5 уровней скоринга)

2 hours 8 min ago

Я делаю Beetroot — клипборд-менеджер для Windows на стеке Tauri + React + Rust + SQLite. В моей ежедневной базе 1000+ записей: куски кода, URL-ы, стектрейсы, SQL-запросы, переписки из мессенджеров. Поиск по всему этому должен работать мгновенно и попадать точно в цель.

Сначала я пошёл по простому пути: подключил популярную библиотеку Fuse.js и думал, что задача решена. Но реальные данные буфера обмена оказались для неё патологическим кейсом.

Эта статья — про путь от «просто подключи готовую либу» до самописного 5-уровневого движка с мерж-скорингом. Два дня, 8 итераций, пара красивых продуктовых багов по дороге.

Смотреть эволюцию поиска

Анатомия DPI анализа: что происходит с твоим пакетом за первые 16 КБ

3 hours 19 min ago

Пошаговый разбор того, как ТСПУ анализирует трафик — от первого SYN до поведенческого ML. С конкретными числами, реальными алгоритмами и объяснением почему одни протоколы умирают на первом байте, а другие живут месяцами

Большинство объяснений про DPI звучат так: «система смотрит на пакеты и блокирует плохие». Это примерно как объяснить работу компилятора словами «берёт код и делает программу».

Давай пройдём по тому, что реально происходит с пакетом от момента выхода с твоего устройства до момента когда ТСПУ принимает решение. Пошагово, с числами, без абстракций.

Читать далее

Архитектура вместо синтаксиса: CodeSpeak — язык разработки следующего поколения, использующий силу LLM спецификаций

4 hours 29 min ago

Команда разработчиков под руководством Андрея Бреслава, российского разработчика и автора языка программирования Kotlin, представила публичную альфа-версию нового инструмента для разработчиков — CodeSpeak. Платформа позиционируется как язык программирования нового поколения, в котором инженеры пишут спецификации на английском языке, а нейросети берут на себя генерацию, тестирование и рефакторинг исполняемого кода. Полноценное внедрение инструмента позволяет сократить объем кодовой базы в проектах в пять-десять раз. Технология поддерживает интеграцию в существующие сложные проекты на Python.

ИИ-язык, созданный для людей

Как я портировал свою программу с Windows на macOS за один промт в Claude Code, ну почти…

4 hours 44 min ago

По вечерам я тренирую баскетбольную команду, утром — преподаю черчение, а днём делаю вид что успешный дизайнер на фрилансе.

Год назад я сделал свою первую в жизни программу для вставки любых символов напрямую с клавиатуры, но только для Windows.

Сегодня рассказываю как я писал hypetype для macOS, сколько потратил часов, нервов и денег в сравнении с Windows версией, чему научился и какие выводы сделал.

Читать сиквел →

Знакомьтесь, Барри Уорсо (цикл заметок о выдающихся питонистах)

6 hours 35 min ago

Влюбился в Python в 1994-м, придумал PEP как систему управления изменениями в языке, спрятал пасхалку import this в стандартную библиотеку и годами прокладывал Python дорогу в Linux-дистрибутивы. Речь пойдёт о Барри Уорсо (Barry Warsaw) – первом неголландце в ядре Python.

Будет интересно!

Как я пытался подключиться по SSH к ноутбуку в соседней комнате — и провалился в кроличью нору Windows-маршрутизации

9 hours 34 min ago

Задача на 30 секунд — ssh root@192.168.31.197 — превратилась в расследование: VPN перехватывает локальный трафик, индексы интерфейсов тасуются при перезагрузке, два WiFi-адаптера в одной подсети создают хаос. Разбираю таблицу маршрутизации Windows, longest prefix match и split tunneling на живом примере.

Читать далее

[Перевод] Как мы подружили однопоточный C++ с многопоточным Rust

9 hours 51 min ago

Этот пост написан по мотивам выступления, с которым мы с Шисянь Ван ездили на конференцию Rust UnConf, организованную нью-йоркским сообществом Rust. Конференция UnConf собрала поистине потрясающий коллектив энтузиастов a Rust, в компании которых мы более двух часов посвятили глубоким техническим дискуссиям (а также поеданию мороженого). Далее при необходимости я буду ссылаться на опыт нашей компании Antithesis.

Читать далее

Неофициальный Python-клиент для alphaxiv: как мы нашли скрытый API и упаковали его в пакет

10 hours 21 min ago

У alphaxiv.org есть API — но найти его было непросто: публичная документация появилась совсем недавно, а до этого единственный способ разобраться в том, как он работает, — DevTools и живой трафик браузера. POST-запрос к api.alphaxiv.org/assistant/v2/chat, SSE-поток в ответе, модель aurelle-1.

На основе этого исследования мы собрали aurelle-py — Python-пакет для программного доступа к AI-ассистенту alphaxiv: задавать вопросы по arXiv-статьям, стримить ответы, встраивать в исследовательские пайплайны. Мы не первые, кто занялся этой темой, — но постарались сделать решение аккуратным и хорошо задокументированным.

Что внутри: синхронный и асинхронный клиенты, SSE-парсер с независимым юнит-тестированием, Pydantic v2 для валидации, типизированные исключения (AuthError, RateLimitError), MCP-сервер для интеграции с Claude Desktop и Claude Code.

pip install aurelle-py

В статье — как мы нашли эндпоинт, разобрали формат запроса и ответа, какие ограничения выявили опытным путём и как устроен пакет внутри.

GitHub: https://github.com/center4aai/aurelle-py

Читать далее

Облачные модели Ollama в задачах code review — честное сравнение на примерах

10 hours 36 min ago

AI всё чаще используется в разработке: генерация кода, автодополнение, агентные IDE. Но возникает логичный вопрос - можно ли доверить LLM полноценный code review?

В этой статье я решил проверить это на практике. Я сравнил несколько моделей, доступных через Ollama Cloud - Qwen 3.5, GPT-OSS и DeepSeek v3.1 - и дал им проанализировать реальные Pull Request из легаси-проекта на Python.

Спойлер: некоторые модели показали неожиданно хороший результат.

Читать далее

Дело ФИТ v. Сбер на 1,44 млрд руб: нейросети дали Сбербанку 67% на победу в кассации

11 hours 27 min ago

Пока юридическое сообщество бурно обсуждало виражи громкого дела № А40-166729/2024 в Суде по интеллектуальным правам, мы решили сменить оптику. Почему бы не добавить к ним немного тензорных вычислений?

неШемяка! хладнокровно оценил перспективы обжалования с позиции ответчика и измерил шансы Сбера на отмену миллиардного взыскания в кассации. Спойлер - нейросети попали в яблочко!

Читать далее

Тайный язык кода, Паскаль и Столяров: мой путь в программировании

11 hours 46 min ago

Начинающие свой путь в сфере IT могут быть шокированы открывающимися перед ними горизонтами возможностей и объемами информации. Множество направлений, бесконечное число книг и онлайн-курсов. С чего начать? На что обратить внимание и к чему обратиться в первую очередь, а что изучать далее? Вопросов много и вот эта непонятность может стать причиной ступора. Или завести в ложном направлении, что в итоге может послужить причиной того, что человек просто бросит, так толком и не начав изучение. Решив, что это слишком сложно и лучше заняться чем-то другим. Кстати, если человек все же бросит, вероятно, это действительно не его. Программирование, как яркий представитель мира IT, на мой взгляд, с одной стороны доступно каждому, а с другой требует если и не особого склада ума, то как минимум особого отношения к тому, что изучаешь и делаешь. И вот без этого реально тут будет сложно. Но такое отношение можно выработать, оно не дается с рождения.

В данной статье у меня нет цели кого-то чему-то учить. Мне интересно вспомнить свой путь и рассказать о тех книгах, которые помогли в самом начале. Или на которые я обратил внимание в дальнейшем и затем советовал многим из тех, кто спрашивал, а что бы им такого почитать в качестве основы.

Книг будет не так уж много. Но каждая из них по своему значима как для меня, так и потенциально для тех, кто захочет погрузиться в пучины мира программирования и IT.

Читать далее

Тихая эволюция zero-shot энкодеров. От UniNER до GLiNER 2

Fri, 03/13/2026 - 23:17

Пока все говорят про LLM агентов, есть целый класс задач где 205M энкодер делает ту же работу что ChatGPT — быстрее, дешевле, без vendor lock‑in. Я хочу рассказать про эволюцию энкодеров, которую вы возможно пропустили: начиная от UniNER, заканчивая GLiNER 2, с ключевыми инсайтами на каждом шаге.

Читать далее

Тестирование микросервисов 2026: гайд по стратегиям и инструментам

Fri, 03/13/2026 - 22:51

Как тестировать микросервисы, чтобы не было мучительно больно на проде? Разбираем пирамиду тестирования, интеграционные тесты с Testcontainers, контракты с Pact и нагрузочные испытания. Расскажу, какие практики реально работают в крупных проектах...

Читать далее

Как обнаружить заказной негатив с помощью скриптов

Fri, 03/13/2026 - 22:24

По данным Data Insight 30% отказов от покупок связано с заказным негативом. Раньше ботов вычисляли по шаблонным фразам, но сейчас спамеры массово генерируют жалобы через LLM. Модерация геосервисов пропускает такой контент. Формально отзывы уникальны и не нарушают правила площадок. Ручная проверка тысяч комментариев требует десятков часов работы аналитика и не исключает человеческий фактор. Визуально отличить качественный фейк от мнения реального клиента стало невозможно.

Противостоять генеративным сетям можно только программными методами. Автоматизировать поиск аномалий в поведении пользователей помогают скрипты на Python. Этот контур защиты включает парсинг данных с обходом лимитов API, вычисление временных выбросов через Z-оценку и семантический анализ текстов с учетом морфологии русского языка (через библиотеку Natasha). Это базовый алгоритм, который позволяет перевести защиту репутации из ручной разметки в измеримый технический процесс.

Читать далее

Чёрные дыры в МПО-теории

Fri, 03/13/2026 - 22:16

Введение

МПО-теория гравитации (МПО — «масштаб, поворот, отражение») — теория, которая позволяет единообразно описать движения в любых системах отсчёта, в том числе, при наличии гравитационного поля. Специальная теория относительности, с точки зрения МПО-теории, является её частным случаем, описывающим явления в гравитационно эквипотенциальных объёмах с нормированными гравитационными потенциалами, компоненты которых совпадают с коэффициентами преобразования Лоренца aij (i, j = 0, …, 4), описывающего преобразования вращения в евклидовых координатах с осью времени x0 ≡ ict [1].

В [2] показано, что формальному превышению скорости света (|v| > c) соответствует движение с досветовой физической скоростью |w| = c2/|v| объекта с зеркальной структурой и/или обращённым собственным временем. Это означает, что сверхсветовые движения физически не наблюдаемы, но последовательное применение «сверхсветового» преобразования Лоренца выражает зарядовую симметрию и предсказывает существование, наряду с оригинальными частицами с зарядом q, 4-импульсом Px и моментом вращения Jyz, их «двойников» с инверсией отношения заряда к массе покоя и/или инверсией спина, также движущихся с досветовыми скоростями (всего 4 состояния).

МПО-теория соответствует классическим требованиям к теории гравитации, наблюдаемой крупномасштабной структуре Вселенной и удовлетворяет принципу Маха [3]. МПО-теория позволяет вернуться к представлению о Вселенной как бесконечно протяжённой и бесконечно эволюционирующей. Не рассмотренным с позиций МПО-теории остался феномен чёрных дыр.

Читать далее

Мой овердофига усложненный Майнкрафт сервер

Fri, 03/13/2026 - 22:11

Каждый год в моей компании друзей наступает «неделя Minecraft» — время, когда мы все снова начинаем играть вместе. И, как обычно, на мне лежит задача поднять сервер для всей компашки.

Читать далее

[Перевод] Как я пишу прибыльные приложения в одиночку (Идея + Build + Marketing Guide)

Fri, 03/13/2026 - 21:58

Научился программировать в 30 лет — и создал приложение для правительства Великобритании. Рассказываю всё: как найти идею, выбрать стек, использовать ИИ и продвинуть продукт без команды и бюджета.

Читать далее

Этот ИИ ведёт дневник, заводит баг-репорты, избегает сложных задач, а существует всего 5 дней

Fri, 03/13/2026 - 21:55

Сейчас расскажу историю, от которой немного сносит крышу.

Разработчик по имени Лиюаньхао сел и написал 200 строк кода на Rust.

Всё. Крошечный, голый скрипт.

Но то, что произошло после нажатия кнопки «запустить», — из тех вещей, которые перечитываешь дважды, чтобы убедиться, что тебе не показалось.

Он назвал проект yoyo — самоэволюционирующий кодинг-агент. А потом — и вот это то, что по-настоящему цепляет — полностью отошёл. Убрал руки с клавиатуры.

Дал одну-единственную инструкцию: эволюционируй, пока не сравняешься с Claude Code. И просто сел смотреть.

Знаете это чувство — когда ткнёшь семечко в землю, напрочь забудешь про него, а потом проходишь мимо и видишь, как из земли лезет живое, настоящее растение? Вот примерно это и случилось. Только это растение не просто выросло. Оно проснулось и начало само заводить баг-репорты.

Читать далее

Что такое ИИ-агенты для бизнеса: Понятное руководство для селлеров на маркетплейсах

Fri, 03/13/2026 - 21:35

Адаптация статьи Anthropic «Building Effective Agents» специально для селлеров и предпринимателей торгующих на маркетплейсах.

Читать далее

Who's online

There are currently 0 users and 0 guests online.