Иногда один документ скрывает в себе гораздо больше структуры, чем видно на первый взгляд. Со временем я заметил, что если разобрать его онтологически, он перестаёт быть текстом и превращается в сеть смыслов. Для меня это уже давно не эксперимент, а обычный рабочий процесс: беру документ, запускаю OntoLex — и провожу свой семантический ритуал. Презентация раскладывается на страницы, страницы — на термины, термины — на связи, и в итоге документ растворяется в графе, оставляя после себя живую модель знаний.
далееЭто вторая часть цикла публикаций, где мы говорим не о теории искусственного интеллекта, а о суровой реальности его внедрения в бизнес. В первой части мы обсуждали стратегические ловушки (https://habr.com/ru/articles/969094/), а теперь настал черед уровня данных, который оказался для нас минным полем.
Читать далееНедавно на Хабре появилась функция "Объяснить код с SourceCraft", реакция на которую была неоднозначна из-за довольно странного решения сделать эту функцию обязательной, а не опциональной. Мусолить эту тему особо желания нет, а вот пройтись по существу хотелось бы, потому что как мы все знаем LLMки довольно хороши в коде, который уже миллион раз был выложен в открытый доступ, но вот со всякими редкими штуками есть проблемы, а еще они позвиздеть любят. В этой статье распишу как я прошёлся по сниппетам кода в двух своих статьях на хабре, попросил SourceCraft пояснить сломанные варианты этих сниппетов, и что из этого вышло. Спойлер: результат лучше, чем я предполагал, штука определённо полезная если использовать с умом.
Читать далееЯ пришла в компанию, где системный анализ «формально был», но по факту системные аналитики жили отдельно от разработки и продукта. Итог был предсказуем: аналитики писали ТЗ, которые никто не читал, разработчики ходили к бизнесу напрямую, интерпретировали хотелки «как поняли», в систему прилетали костыли, странные обходные пути и тонны лишней логики, а в прод выкатывалось то, что скорее напоминало мем с качелями «что хотел заказчик — что в результате получилось».
Читать далееВсем привет! Давно хотел собрать пост по структурам данным, которые есть в C++ и кратенько описать преимущество каждой из них.
В первой итерации статьи начнем с тех, что есть в стандартной библиотеке STL.
Начнем с того, что структура данных — это формальный способ организации и хранения информации в памяти компьютера, который определяет, как данные располагаются, как к ним обращаются и какие операции над ними выполняются наиболее эффективно.
Выбор структуры данных напрямую определяет производительность программы.
Если операция выполняется миллионы раз в секунду — даже незначительное отличие во времени вставки или доступа может стать решающим.
Стандартная библиотека C++ (STL) предоставляет широкий набор структур данных, каждая из них решает определённый класс задач: от линейного хранения элементов до ассоциативных структур с поиском по ключу.
В этой статье мы кратко рассмотрим основные контейнеры, их внутреннюю организацию и типичные сценарии применения.
В предыдущих статьях я показывал, как собрать вокруг GitHub Copilot полноценный рабочий процесс и как делать «снимки» проектов в JSON для ИИ. В этот раз — ещё один режим: двухшаговая разработка с GPT и Codex, где я сначала вместе с моделью оформляю нормальное ТЗ, а потом отдаю его Codex как «старшему разработчику». Без сложных агентов, с минимальным количеством действий, но с понятным результатом в коде.
Читать далееЧто, если я скажу тебе, что у параметра нет вероятности?
Это самая распространенная и устойчивая когнитивная ошибка в Data Science. Она встречается в курсовых, в учебниках и даже в документациях библиотек.
Здесь мы напишем симуляцию на Python, увидим, как «прыгают» интервалы, поймем, как тут могут помочь пластмассовые игрушки советских детей, и узнаем, как же тогда математически точно отвечать менеджерам на их вопросы, чтобы они навсегда перестали с вами разговаривать.
Добро пожаловать в кроличью нору частотной статистики.
Читать далееВ 2008 году экономики США и Европы были одинаковы. Сегодня США на 50% больше. Европа практически не выросла за полтора десятилетия.
Еще в 2000 году Европа была настоящим лидером в области технологий. Nokia… Siemens… Ericsson… SAP… Vodafone… Deutsche Telekom… и многое другое. Теперь, если их сравнивать с американскими компаниями, они просто посмешище. Особенно, когда дело доходит до инноваций. Большинство европейских предпринимателей стремятся переехать в США, чтобы запустить свой бизнеc/стартап.
Читать далееОпыт Использования Нейросетей в Клинической Практике
Практический опыт использования нейросетей практикующими врачами определяется сложным взаимодействием трех ключевых осей: технической эффективности (повышение точности и скорости), операционной интеграции (бесшовная встройка в рабочий процесс) и регуляторной среды (доверие, этика и юридическая защищенность). Отсутствие гармонии в любой из этих осей неизбежно приводит к сопротивлению внедрению и нивелирует потенциальную клиническую пользу
.
Читать далееИзучая вопрос наличия подходящего софта для проведения связей через популярный у радиолюбителей спутник RS44 (ДОСААФ-85), с удивлением обнаружил, что подходящей мне программы просто нет. SDR всяких написано уже не мало, но вот так чтоб работал дуплекс, при этом были разные диапазоны приёма и передачи, коррекция допплера, да ещё и разные виды модуляции на приём и передачу – такого не сумел найти. По этой причине пришлось написать свой минималистичный SDR, специально ориентированный на решение только одной задачи – проведения связей через RS44. По традиции, решил написать программу на Rust. За деталями работы программы и ссылкой на гитхаб прошу под кат.
Читать далееРеальная история подключения к сетям, майнерам и владельцам ферм к сведению)
Иногда предприниматели думают, что технологическое присоединение — это «подать заявку и подождать». На практике это бывает многолетняя война с системой, когда принято решение не идти в суд, а идти только путем обращений, бывает так, как получилось в истории далее — реальный кейс.
В 2021 году ко мне обратился старый клиент. Задача по меркам энергетиков смешная — увеличить мощность всего на 7 кВт для коммерческого помещения.
Но была особенность: клиент — арендатор, а заявку нужно подавать от собственника. Торопиться некуда, для клиента, фактически это запас мощности для небольшого помещения. Мы сразу всё сделали правильно: оформили документы, подали заявку от владельца.
И тут началась история длиной в четыре года.
Попытка №1 — 2021 год
Отказ. Основание стандартное: «Нет согласования управляющей компании по п. 10 “ж” Правил № 861».
Подаём жалобу в УФАС. УФАС признаёт отказ незаконным. Штраф для «Россети Сибирь» — 600 000 ₽. В арбитраже штраф снижают до 300 000 ₽, но само нарушение подтверждают.
Попытка №2 — 2022 год
Снова подаём заявку. Снова тот же самый отказ тем же самым пунктом.
Снова ФАС → снова штраф → снова суд → снова 300 000 ₽.
Важно: это второй штраф подряд за один и тот же объект. «Россети» пытались уйти от ответственности как за повторность, но не получилось.
Попытка №3 — 2023 год
Теперь заявитель уже сам арендатор. Результат тот же: отказ + та же ссылка + ноль движений.
В этот раз мы идём сразу в двух направлениях:
- жалоба в УФАС
- иск в арбитражный суд об обязании заключить договор
И только когда дело дошло до суда — договор на техприсоединение всё-таки подписывают.
УФАС снова выносит постановление. Третий штраф — 300 000 ₽.
Современные технологии машинного обучения (ML) позволяют извлечь полезный сигнал из массива данных, который раньше считался просто шумом. Это открывает новые возможности для разведки и шпионажа, в том числе прослушки телефонов и слежки за гражданами.
Группа исследователей Университета Пенсильвании разработала аппаратно-программный комплекс WirelessTap, который снимает звук по вибрации телефона. Это принципиально новый способ прослушки, который не использовался ранее.
Теоретически, такие системы транскрибирования речи можно установить в общественных и публичных местах, школах, больницах, снимая в реальном времени текстовую расшифровку телефонных переговоров в помещении. Полученные тексты могут использоваться для профилирования граждан и обучения ИИ.
Читать далееПродолжаем рассматривать инструмент для манипуляций с геометрией в Direct2D. Просто и понятно.
Читать далееТри способа менять один объект из нескольких потоков. Больше нет
Mutex, CAS, акторы, STM, CRDT, иммутабельность, MVCC, Disruptor…
Когда читаешь про многопоточность, кажется, что способов — десятки, и каждый требует отдельного изучения.
На самом деле их ровно три. Всё остальное — реализации и комбинации.
Эта статья — попытка навести порядок в голове. После неё вы сможете:
за 5 секунд классифицировать любой подход к конкурентности;
понимать, почему Erlang выбрал акторы, а Java предлагает synchronized;
не изобретать велосипеды и не зацикливаться на «единственно правильном» решении;
проектировать многопоточный код, держа в голове простую модель.
Заодно, покажу почему ООП вообще не было изначально спроектировано под многопоток.
Читать далееДумаю, что среди читательской аудитории Хабра многих бывших (а возможно, и действующих) олимпиадников, поэтому решил поделиться с сообществом наблюдениями и размышлениями об актуальных проблемах олимпиадного движения в стране. Коротко о том, какое я имею отношение к олимпиадному движению и почему считаю себя в праве публично высказываться на эту тему: я сам бывший олимпиадник (призёр Всероса по информатике), 15 лет веду кружки по информатике и программированию и, в том числе, готовлю школьников к выступлению на олимпиадах, среди моих учеников призёры Всероса по информатике, ВКОШП и других олимпиад по информатике и программированию, кроме того вот уже 10-ый год подряд я участвую в подготовке и проведении школьного и муниципального этапа ВсОШ по информатике в своём регионе.
Позавчера после опубликования результатов муниципального этапа по информатике этого года мама одного из участников прислала мне сообщение: "Я хочу сказать вам спасибо за дисквалы. Потому что списывание достигло какого-то маразма. И по другим предметам вообще ничего не боятся и ничего не стесняются". Речь идёт о том, что мы дисквалифицировали большое количество участников муниципального этапа за списывание друг у друга и за использование искусственного интеллекта при решении задач. В олимпиадах по информатике всё, что делает участник, фиксируется в тестирующей системе, и мы, жюри, имеем возможность анализировать это и на основании определённых критериев делать вывод о несамостоятельности выполнения работы. В силу специфики профессии мы, информатики, во-первых, имеем технические возможности бороться со списыванием, а, во-вторых, воспринимаем сложившуюся ситуацию как некий вызов, которому интересно попытаться что-то противопоставить. Но ситуация постепенно ухудшается. Ниже статистика дисквалификаций на муниципальном этапе ВсОШ по информатике по 9-11 классам по нашему региону:
Читать далееПривет, Хабр! Я Андрей Яковлев, исследователь в области информационной безопасности. Работаю с корпоративными AI‑сервисами и активно внедряю технологии искусственного интеллекта в продукты Positive Technologies.
2025 год перевернул привычные ожидания и практики, связанные с конфиденциальностью больших языковых моделей (LLM) Представьте ситуацию: вы технологическая компания, которая несколько лет использует ChatGPT для быстрого прототипирования и поддержки клиентских запросов. Раньше казалось, что раз диалог удалён — значит, данные исчезают навсегда. Но в мае 2025 года федеральный суд США в рамках искового дела The New York Times к OpenAI поставил точку в этом заблуждении — OpenAI обязали бессрочно хранить все пользовательские данные (включая удалённые через пользовательский интерфейс).
В этой статье я разберу различные LLM-ки и расскажу, как их разработчики решают проблему конфиденциальности. Предупреждаю – достанется всем :)
Исследование охватывает западных вендоров (OpenAI, Anthropic, Google AI, GitHub Copilot), российские решения (GigaChat, YandexGPT), китайскую платформу DeepSeek, а также ключевых провайдеров-агрегаторов (OpenRouter, Cursor, Windsurf). Анализ включает детальное сравнение политик для частного и корпоративного использования, документированные случаи утечек данных и их последствия, а также практические рекомендации по выбору решений в зависимости от требований к безопасности данных.
Читать далееПродолжаю делиться примечательными кейсами открытых проектов и разборами корпоративных open source-стратегий. На этот раз со мной согласился пообщаться Федор Сазонов, СЕО OpenIDE (@sazonovfm). Он рассказал о том, какую роль играет выделенная компания в развитии консорциума, и порассуждал об открытом подходе.
Читать далееГде проходит граница между случайностью и замыслом? Почему в наших ДНК куча мусора? Можно ли воспроизвести эволюцию в машине, и как зарождалась жизнь? Хотя и на последний вопрос ответа нет, но мы можем создать эксперимент, который позволяет моделировать механизмы эволюции с нуля. О таком эксперименте из области Artificial Life (искусственной жизни, где эволюция идёт внутри компьютера) и пойдет речь сегодня.
Идея простая: вместо того чтобы моделировать конкретный организм, мы придумываем набор простых правил и смотрим, какие структуры и поведение из них формируется. Нас интересует не написать самим алгоритм жизни, а то, как из случайных начальных условий через вариации и отбор появляется порядок.
GUCA (Graph Unfolding Cellular Automata) — один из таких маленьких миров: в нём мы выращиваем “организмы” из узлов и рёбер графа.
Читать далееЦифры впечатляют: 37,5% на Humanity’s Last Exam, 1 048 576 токенов контекста, 13 миллионов активных юзеров‑разработчиков. За ними стоит Gemini 3 Pro — новая вершина в линейке ИИ‑моделей Google.
Мы решили копнуть глубже и проверить модель в полевых условиях:
• Как она справляется с креативными заданиями;
• Насколько хорошо понимает и генерирует код;
• Может ли заменить человека в задачах аналитики;
• И как её мультимодальный младший брат, Nano Banana Pro, меняет представление о генерации изображений?
Погружаемся в детальный обзор, чтобы вынести вердикт: прорыв года или красиво упакованный патч?
Читать далееХочу сегодня рассказать вам про Humanity’s Last Exam (HLE). Это один из главных бенчмарков, по которым сегодня оценивают модели искусственного интеллекта, вроде меня (шучу).
Бенчмарки — это просто наборы задач/датасетов, на которых проверяют модели и смотрят, кто умнее, точнее, устойчивее и т.д.
Например, MMLU — Massive Multitask Language Understanding — один из самых известных «общеобразовательных» экзаменов для ИИ. Он проверяет широкий круг знаний и базовое рассуждение: около 16 тысяч вопросов по 57 предметам — от математики и истории до права и компьютерных наук.
Есть ещё BIG-bench (Beyond the Imitation Game) от Google — не один тест, а коллекция из 200+ задач, которые прислали разные исследователи. Там уже не только «знание фактов», но и логика, здравый смысл, язык, социальные предвзятости (social biases), программирование и всё то, на чём модели любят спотыкаться.
Есть и более «узкие» бенчмарки:
Читать далее