OpenAI недавно объявила о привлечении 110 миллиардов долларов. Тридцать — от SoftBank, тридцать — от Nvidia, пятьдесят — от Amazon. Это больше чем вдвое превышает прошлогодние 40 миллиардов — крупнейшую частную технологическую сделку в истории. Оценка компании взлетела до умопомрачительных 840 миллиардов. При этом, судя по всему, OpenAI урезала планы по расходам: инвесторам сообщили, что к 2030 году компания планирует потратить на вычислительные мощности «всего» около 600 миллиардов — это значительно меньше половины от ранее заявленных 1,4 триллиона.
Денег приходит больше, уходит — вроде бы — меньше. Это поворотный момент? Может ли это превратить OpenAI из чёрной дыры для капитала во что-то хотя бы отдалённо устойчивое?
Если коротко — нет. Совсем нет. 110 миллиардов даже не почувствуются. Сейчас объясню почему.
Читать далееРазбираюсь, почему рука тянется закрыть вкладку, когда текст очевидно сгенерирован нейросетью — с точки зрения психологии. Параллельно ставлю эксперимент: эту статью я написал сам, а вторую — целиком отдал Claude. Посмотрим, какую заминусят первой.
Читать далееTime-travel debugging — это возможность сохранять снимки состояния приложения и перемещаться между ними. Традиционно он ассоциируется с инструментами отладки, такими как Redux DevTools. Однако пользователи современных приложений (Figma, Google Docs, VS Code) ожидают функциональности по перемещению между состояниями и от форм и веб-приложений.
Эта статья делится на две части:
Теория (Часть 1): Универсальные паттерны и концепции, которые останутся актуальны независимо от используемых библиотек.
Практика (Часть 2): Туториал по реализации пользовательского time-travel с использованием Nexus State.
Читать далееЧто общего между броском d20 и проверкой гипотезы? Между походом в таверну за информацией и сбором данных от заказчика? Оказывается, довольно много.
Хабр, привет! Меня зовут Вячеслав Демин, я больше пяти лет работаю в сфере Data Science. Сейчас я руководитель направления аналитики данных в Сбере и эксперт на курсе «Специалист по Data Science» в Яндекс Практикуме. Начинал с этого же курса в 2020 году, после чего работал в сфере страхования и нефтехимии.
А ещё я Dungeon Master в «Подземельях и драконах». В этой статье я расскажу, чем моя любимая игра похожа на мою работу и чем она может полюбиться дата-сайентистам.
Читать далееЭта статья не о том, что Puppeteer плохой инструмент. Puppeteer — отличный. И грамотный TLS-фингерпринтинг вынесет большинство защит. Но есть класс задач, где даже идеальный сетевой стек не спасает — потому что детект давно приземлился на уровень поведения рендеринг-движка. Разберём, как Cloudflare и Akamai палят вас через WebGL и Canvas, и почему "чистый" код больше не работает.
Вскрываем антифродБывает, менеджера нанимают на одну роль, а работать предлагают в другой. Например, в требованиях — нужен Delivery-менеджер: отвечать за поставку ценностей, сроки и результат. На практике — координируй, передавай задачу, уточняй статус. При этому команда менеджеру не подчиняется, приоритеты меняют тоже без него, а к заказчику доступ ограничен. Но зато если всё плохо — виноват менеджер, это его ответственность.
Так выглядит работа с низким уровнем агентности. Это когда вы формально отвечаете за результат, а фактически — координируете чужие решения. В этом нет ничего плохого, если человека устраивает обычная административная роль. Но если от вас ждут управления и изменений, а полномочий и ресурсов не дают — всё обычно кончается конфликтами, выгорание и увольнение по причине «не сработались». И виноват в этом не менеджер.
Я Степан Сорокин, Delivery Manager в Outlines Tech. За 10+ лет в ИТ я несколько раз попадал в компании, где ответственность отделяли от полномочий, а название роли не совпадало с реальной задачей. В статье разберу, что такое агентность в работе менеджера, почему её мало и что с этим делать.
Читать далееРазрабатываю AI-агента персональной аналитики для себя вместе с Claude Code. Любопытной инженерной задачей оказалась архитектура памяти. Как сделать, чтобы агент помнил не только последний разговор, но и паттерны, накопленные за месяцы? В этой статье описана архитектура, рабочие решения и грабли, на которые я наступила.
Doodling... Flowing... Analai... Manalai..Product Radar — здесь каждую неделю публикуются лучшие онлайн-сервисы и железки от русскоязычных команд. Это площадка, где энтузиасты из мира технологий делятся своими идеями, обсуждают и создают вместе новые продукты, чтобы делать жизнь людей лучше.
Читать далееВот пример внедрения который я непосредственно воплощал, когда подхватил умирающий цех на металлургическом комбинате. Я планировал заняться улучшением технологии в сторону качества, в первую очередь улучшением механических свойств проката, геометрией, только всё это пришлось отложить. Хороший цех для наших реалий, запустили его только нещадно и показатели цеха были гораздо хуже того, как он бы мог работать даже при среднем уровне менеджмента.
Первое что меня сильно удивило когда начал вникать в цифры - цеховой баланс по металлу не сходился - цех получал заготовки значительно больше чем было годной продукции. Куда исчезала разница, на тот момент было непонятно. Пересчитал баланс - по отчётам цеха, по отчётам ОТК, технологов, экономистов цеха и других ситуация была стабильно средняя - средненькое качество продукции, с планом справлялись; только по отчёту коммерческих служб комбината мы не выполняли план по отгрузке продукции; это было сразу понятно по количеству завершённых контрактов. То есть цех работал, получал заготовку и ресурсы, продукция выпускалась, а вот с отгрузкой продукции потребителям были постоянные проблемы - мы не могли закрыть контракты в полном объёме, постоянно видели долги по поставкам продукции.
Изначально я переписал склад на бумагу, без особой точности - склад был забит браком, но кто и когда это сделал вообще не понятно. Имеет ли это отношение к текущему производству тоже не понятно, поскольку маркировка скрыта в горах такой продукции. То есть учётам тоже верить нельзя. С такого старта начал.
Читать далееБывают ситуации, когда есть список значений, и нужно найти значения, которых нет в БД. Прямым SQL-запросом найти отсутствующие значения невозможно, так как из базы нельзя получить значения, которых там нет. В статье рассмотрим какие есть замены временным таблицам в SQL.
Читать далееКогда ты больше десяти лет в IT, кажется, что поиск новой работы — дело пары недель. Просто рассылаешь свой идеальный одностраничный PDF и ждешь приглашений.
Реальность - автоматические отказы еще до этапа знакомства с HR. Оказывается, впихнуть весь свой опыт в одну страницу под требования конкретной вакансии физически невозможно.
Нормальный человек в этой ситуации просто открыл бы Word и потратил сорок пять минут на ручные правки. Но я же инженер. Поэтому вместо отправки отклика я написал свою CMS для управления карьерным опытом и оптимизации резюме под вакансию.
Стоила ли неделя медитаций над консолью того, чтобы автоматизировать задачу, и как это взломало конверсию на первичном скрининге?
Читать далееСамые трендовые события и полезные материалы по искусственному интеллекту за неделю. Без нудных технических релизов. Кратко.
Читать далееНебольшая инструкция для всех, кто работает в Unreal Engine и пишет на C++ или иных языках + компилирует файлы для Андроид.
Читать далееСтатья посвящена концепции создания и эволюции кастомизированных ИИ-агентов, определяемых как «виртуальные аватары» (ВА) человека. ВА позиционируются как постоянно обучающиеся модели, «прикреплённые» к конкретным людям и способные выполнять умственную работу, принимать рутинные решения и действовать, исходя из индивидуальных предпочтений, интересов и установок своего владельца.
Средства искусственного интеллекта (ИИ) как фундамента следующего технологического уклада развиваются с неудержимой силой и стремительно входят в нашу повседневную жизнь. Становится всё более очевидным, что скоро наступит время, когда любую, в том числе заранее не объявленную, исполнительскую производственную задачу такие средства выполнят не хуже человека. А сопряжение этих средств с роботами, способными передвигаться по заранее не заданной сложной поверхности и выполнять заранее не заданные тонкие технологические манипуляции, даст возможность полностью ликвидировать и физический труд человека.
Что же тогда останется самому человеку? Производственная деятельность, где нужна персональная юридическая ответственность человека-специалиста? Участие в социальном целеполагании? Заведомо человеческое творчество и заведомо человеческая эмпатическая коммуникация? Формулирование и передача новым поколениям ключевых ценностей общества? То есть всё то, что нельзя переложить на искусственные субъекты мышления и деятельности? Ниже поразмышляем над этими и другими интересными вопросами...
Читать далееПосле первой статьи в комментариях несколько раз прозвучало примерно одно и то же:
"Всё правильно, но это же про любую зрелую СУБД — что с этим делать?"
Я думал над этим вопросом несколько недель. И в итоге решил не искать ответ в виде
"возьмите правильный инструмент X" — а попробовать честно сформулировать:
какими свойствами OLTP-БД должна обладать сама по себе, независимо от того,
насколько хорош ваш оператор, консультант или runbook.
Что такое "контракт" — и почему это не маркетинг
Попробую объяснить не через определение, а через ощущение.
Когда вы покупаете автомобиль, вы не читаете инструкцию к тормозам каждое утро.
Вы просто знаете: нажал педаль — машина тормозит. Это контракт. Он не зависит от того,
правильно ли вы настроили тормозную жидкость этим утром или не забыли включить
"режим торможения" в меню.
Перед вами третья и последняя часть моей статьи про конференцию алготрейдеров в Москве. Часть 1 была про инфраструктуру, а часть 2 про практическое применение ИИ.
Третья часть будет о последствиях. Перед вами будут четыре доклада на одну тему:
* неэффективности,
* уязвимости,
* масштабирование систем.
А ещё в статье интересная торговая идея с дисбалансом внутри синтетического инструмента — целой корзины акций Мосбиржи.
Всё плохо?Купил я как-то контроллер для xbox 360, проводной, но не оригинальный. Очень уж мне понравилось, что в Windows 10 он определяется как родной, и в тех же старых GTA он определяется по умолчанию. Но было одно НО! Стики - шлак, просто полный. Движения рывками, характеристика рваная.
И тут зачесались рукиВведение
В России построены десятки тысяч километров ВОЛС. Но каждый новый проект магистральной сети спотыкается об одни и те же грабли. Вендоры продают «терабиты» и «дальность», а заказчик потом годами мучается с эксплуатацией в условиях, где бригада может выехать на объект только через трое суток.
Этот текст - попытка посмотреть на строительство DWDM-сетей не глазами производителя, а глазами того, кто потом будет это обслуживать. Только логика и здравый смысл.
Часть 1. Терабиты vs реальное волокно. Рынок DWDM всегда живет в гонке скоростей. 10 Гбит/с, 40, 100, 400. Сегодня российские производители заявляют 40 Тбит/с на 1000 км - это впечатляет. Но для эксплуатанта есть обратная сторона медали: чем сложнее формат модуляции, тем он чувствительнее к внешним условиям.
Что происходит на реальной трассе:
Волокно 20-летней давности имеет микроизгибы и неоднородности.
Поляризационная модовая дисперсия(PMD) на старых линиях может «убить» 100-гигабитный канал, хотя 10-гигабитный будет работать годами.
Разница между лабораторным стендом и реальным пролетом в 300 км — это разница между идеальным вакуумом и открытым космосом. Нужен не тендер по рекламным брошюрам, а расчет реального энергетического бюджета.
Производитель должен предоставить не просто паспортную дальность, а инструмент для расчета: пройдет ли его сигнал на конкретном пролете заказчика с учетом реального затухания, реальной дисперсии и реального количества сварных соединений. Тот, кто дает заказчику честный прогноз «на этом участке 100G пройдут, а вот здесь только 10G, потому что волокно старое», - вызывает доверие. Остальные - просто продают коробки.
Всем привет.
Речь пойдет о методике ETL-процесса. Очень мало информации об этой важной области работы с данными. Я много раз видел на проектах, что в командах нет общего не то что фреймворка, а даже методики по загрузке данных. Либо есть, но у каждого разработчика своя. И те, что есть, не универсальны и не учитывают некоторые реперные точки. Иногда даже журнал загрузок не ведется. Созрела идея создать, перенести свою методику в питон код и поделиться. Начнем.
Когда мы создаем ETL- процессы основные требования: идемпотентность, обработка ошибок, целостность данных, инкрементальность, производительность, мониторинг, происхождение данных, и тд. Может еще что, но и этого достаточно.
Основные понятийные объекты в тексте: tech_query_id, tech_batch_id. tech_query_id – является штампом момента запуска pipeline, вручную или автоматически, не важно. Если запустили загрузку для терабайт данных, то и штамп будет всего один для этой конкретной загрузки. Штамп tech_query_id проставляется в каждой строке в самих таблицах с данными цели и в журнале. А так же проставляется tech_batch_id, который является обычным номером пакета. Понятно зачем пакеты.., если данных миллионы, мы их бьем по пакетам. Номер пакета для каждого query_id начинается с единицы. Эта комбинация является ключом в таблицах с данными для трассировки происхождения и ключом в таблице журнала загрузок для фиксации метаданных, дельтапоинта и любой полезной информации в json поле.
Читать далееВсем привет! Делюсь итогом двухмесячной работы - релизом рейтинга юридического рассуждения больших языковых моделей Lexometrica Ground Truth.
Изначально цель была сугубо практической: требовалось выбрать лучшие модели для LegalTech-проекта "неШемяка!". Но в процессе пришлось столкнуться с фундаментальной проблемой индустрии оценки ИИ - открытые тесты дают сильно искаженную картину. Финальные результаты спроектированного стресс-теста оказались сколь ожидаемыми, столь же и неожиданными.
В этой статье описал, как архитектурно выстроен бенчмарк, как велась борьба с test-set leakage, почему написан кастомный пайплайн и какие глобальные и локальные нейросети на самом деле умеют legal reasoning.
Читать далее