Всего за год нагрузка на Cursor выросла в 100 раз: более 1 млн запросов в секунду и миллиарды автодополнений кода каждый день. Подробный разбор архитектуры — вместе с сооснователем Суалехом Асифом.
Cursor — это IDE с кодогенерацией на AI-агентах, которая сейчас пользуется наибольшей популярностью среди разработчиков. В прошлогоднем опросе, Cursor был самым частым ответом на вопрос «Назовите вашу любимую IDE с генеративными функциями, помогающими в работе».
Стартап, стоящий за Cursor — Anysphere, был основан в 2022 году, а в марте 2023 года запустил Cursor. Недавно Anysphere сообщила, что привлекла $900 млн, при оценке компании в $9.9B. Годовой доход (автор имеет в виду годовой повторяющийся доход, Annual Recurring Revenue, ARR. Прим. пер.) уже превысил $500M. Ни одна другая компания в сфере инструментов для разработчиков, которую я знаю, не достигала этого рубежа в течение первых 2 лет после запуска первого продукта. Поспособствовало этому и то, что Cursor используется более чем половиной из 500 крупнейших технологических компаний из списка Fortune 500.
Я встретился с сооснователем Cursor, Суалехом Асифом, чтобы узнать, как работает Cursor и как команда этот инструмент создает. Обсудили следующие темы:
Технологический стек. TypeScript, Rust и куча облачных провайдеров — Turbopuffer, Datadog, PagerDuty и другие.
Как работает автодополнение. Устройство low-latency движка для передачи зашифрованного контекста на сервер для инференса.
Читать далееИюнь почти кончился, а это значит, что отгремел так называемый «геймерский новый год». Раньше это была святая Е3, а сейчас пачка игровых презентаций от различных вендоров типа Xbox или Джефа Кейли с его SGF. А раз всё кончилось, пора подводить максимально субъективные итоги и перечислить главные анонсы этого лета.
Читать далееДавным-давно, когда Joomla ещё была маленькой, в неё внедрили параметр $live_site. В ней хранился домен текущего сайта на случай, если Joomla не могла его определить из-за неверной настройки сервера. Нужно это было для разных SEO-компонентов, для использования редиректов и т.д.
Со временем для работы собственно сайта этот параметр перестал быть нужным. Уже в начале 2010-х стали встречаться рекомендации оставлять этот параметр пустым, дабы оный не привёл к лишним проблемам и путанице. Тем более, в web-админке нет места, где его можно указать или посмотреть его значение. Только в configuration.php, а туда смотрят не часто.
Однако, параметр всё же остался в ядре Joomla. Зачем он нужен?
Читать далееГде взять пару миллионов документов с разметкой для обучения модели ИИ? Сгенерировать синтетически! Меня зовут Никита, я работаю в ИСП РАН и веду блог по ИИ. Выложил в открытый доступ проект, который поможет дата-саентистам самостоятельно создавать датасеты сканированных документов с разметкой, используя только CPU. Подойдет для предобучения мультимодальных трансформеров, OCR и проч.
Читать далееО чём статья: описание простого подхода к построению системы знаний через синтаксис (NLP) и семантику (LLM).
Под онтологией в общем виде понимается некое представление о структуре мира, о сущностях и их взаимосвязях. В информатике тоже прижилось это понятие — как формальное описание области знаний, позволяющее ее структурировать и систематизировать. Где это может пригодиться? Везде, где было бы удобно представить разрозненные сведения в единую систему для поиска и обработки — документы организаций, обращения пользователей, экспертные системы и т. д. В прошлом веке были попытки делать такие системы, прописывая все возможные запросы и ответы на на них — понятно, что такой способ не сильно взлетел. Небольшое изменение запроса — и ответ не найден, чтобы что‑то найти — нужно точно знать, как именно разработчик обозвал те или иные сущности. В наши дни, кажется, появился инструмент для преодоления этих трудностей — языковые модели (LLM). Да, к ним предъявляют претензии по поводу галлюцинаций и прочего, но это уже хорошее приближение к тому, чтобы формализовать такую вроде бы неформализуемую штуку, как человеческая речь.
Итак, попробуем программно выделить смысловую структуру из текста. Инструментарий пусть будет такой:
Читать далееВас спрашивали на интервью «Почему люди внезапно увольняются?» или «В каких случаях допустимо опаздывать на работу?»
Знайте, это – проективные вопросы. Замаскированная ловушка. Из-за неё вы расскажете о себе больше, чем хотите.
Хотя речь вроде о других, при ответе вы опираетесь на личный опыт. Отталкиваетесь от своих убеждений. На основании сказанного интервьюер делает вывод о ваших мотивах и поведенческих паттернах.
Мне кажется, что проективные вопросы – это «имба». Соискателю заглядывают в душу, а он и не замечает. Такие вопросы противоречат принципам открытости и взаимного уважения. И хотя они вредят карме компаний, их всё равно задают.
Мы с коллегами так не делаем. Ниже делюсь мнением, как из-за таких вопросов не потерять оффер.
Читать далееКак организм человека экономит энергию, затрачиваемую на обеспечение работы головного мозга? И к каким внешне видимым последствиям это приводит?
В частности:
- на уровне памяти,
- при обучении,
- при построении картины мира,
- при выработке шаблонов поведения и отказе от них,
- во время процесса осуществления выбора.
Привет, Хабр! Я Лера, технический писатель в Авито. Помимо работы с технической документацией, я люблю читать книги, которые помогают расти профессионально. Одна из таких книг — Dare to Lead Брене Браун, она не про графики и KPI, а про то, как быть смелым, человечным лидером в мире, где давление дедлайнов и технические вызовы могут заглушить всё остальное.
В этой статье я рассказываю о ключевых идеях книги, а также покажу, как советы Браун могут работать в IT — от ретроспектив до код-ревью. Если ты техлид, менеджер или разработчик, строящий команду с культурой, где ошибки — это уроки, а не приговор, то эта статья для тебя.
Читать далееKafkaRail гудел на фоне.
Паб The Broken Tag, где начиналось утро героев, только просыпался — запах старого эля, крошки лог‑файлов, и бильярдный стол под тусклым светом прожектора. Через узел маршрута /corp/news метропоезд пронёсся, как push‑уведомление на рассвете. День в Киберляндии начинался.
JSON откинул капюшон куртки BitStone Protocol с QR‑патчем на рукаве, кивнул Mr. Parseley и заказал, как обычно, Schema Fresca. Он прошёл к бильярдному столу английского пула, стоявшему под старым плакатом «Keep Calm and Close Tags», где RAMmy спорил с TryCatch о синтаксисе ударов.
Читать далееIoT мониторинг в действии. Передача сообщений с удаленного объекта через мессенджер 'telegram' с помощью микроконтроллера ESP8266
Читать далееПуть к современному MDM на примере клиентского домена данных
Привет, Хабр! На связи команда российского вендора Data Sapience. Наши специалисты в течение многих лет занимались внедрением и адаптацией различных ИТ-решений, в том числе MDM-систем: как российских, так и зарубежных. Объединив накопленные знания, мы выпустили собственный высокопроизводительный мультидоменный продукт Data Ocean Governance MDM.
Data Sapience стремилась сделать Data Ocean Governance MDM гибким, комфортным и производительным решением, поэтому внимательно изучала рынок и его потребности. Сегодня хотим поделиться с вами результатами анализа и порассуждать, зачем MDM-решения нужны современному бизнесу, какую роль они выполняют и какие задачи закрывают на примере клиентского домена данных.
Читать далееДва способа работы с динамическим списком для вывода дополнительной информации отсутствующей в реквизитах объекта.
Читать далее секреты динамических списковЛето — это не только время новых релизов, обновлений фреймворков и горящих дедлайнов (привет, продакшен в пятницу вечером!), но и пора отпусков, перемещений и внутренних перезапусков. Иногда лучший способ привести мысли в порядок — это не рефакторинг, а хорошее мотопутешествие. Особенно если маршрут ведёт от московской суеты к тёплым берегам Персидского залива.
Сегодня, в пятничный вечер, делимся второй частью душевного дорожного travel-лога нашего товарища по цеху. Это история не просто про смену локаций, а про переосмысление, принятие и радость от простых человеческих встреч. Возможно, кто-то вдохновится на собственную авантюру, а кто-то просто сделает себе ментальный рестарт, представив себя среди гор, виноградников и дождливых армянских дорог.
Читать далееЭту историю для моего блога рассказал Арсений Власов, IT-специалист.
Кто-то на форуме выложил песню, сгенерированную нейросетью, и я подумал: «Наверное, это забавно». Зашёл в Suno, потратил полчаса на эксперименты — и втянулся. Спустя год у меня пять альбомов, песня из игрового чата стала популярной, а я полностью заменил обычную музыку на созданную искусственным интеллектом.
Расскажу, как делаю музыку нейронкой и какие нюансы нужно знать тем, кто тоже хочет попробовать.
Началось всё с шутки. Мы с друзьями брали новости с лент — про курс доллара, аварии, политику — копировали в Suno и смотрели, что получится. Нейросеть серьёзно пережёвывала «Центробанк повысил ключевую ставку» и выдавала что-то вроде драматичной баллады о финансовых потрясениях.
Получалось реально смешно. Но в этих экспериментах я заметил закономерность: какой бы бред ни загружал, мелодическая структура всегда получалась правильной. Suno понимала, где должен быть куплет, где припев, даже если текст — полная белиберда.
Стало понятно: нейросеть анализирует не только смысл, но и ритмическую структуру текста. Длинные предложения становились куплетами, короткие повторяющиеся фразы — припевами.
Тогда я решил попробовать нормальные тексты. У меня был опыт написания стихов — начал адаптировать старые работы под музыку.
Читать далееПривет, Хабр! Меня зовут Александр Амелькин. Я технический эксперт департамента разработки BIOS и BMC в компании YADRO, мейнтейнер проекта ipmitool, а также автор и мейнтейнер проекта frugen / libfru, о котором и хочу сегодня рассказать, тем более что совсем недавно я выпустил новую версию 3.0 этого пакета.
Читать далееПривет, Хабр!
Меня зовут Иван Яковлев. В данной статье я хочу поделиться ключевыми аспектами антикоррозионной защиты стальных деталей, применяемых в авиастроении. Основываясь на многолетнем опыте производственной деятельности, я сосредоточусь на практических нюансах применения трех основных типов покрытий (кадмирование, фосфатирование и лакокрасочное покрытие), исключая специальные. Рассмотрение всех существующих покрытий выходит за рамки статьи и требует отдельного издания. Материал изложен в следующем порядке: сначала общая характеристика покрытия, затем нюансы его использования.
Читать далееСегодня у нас на обзоре HTC ChaCha A810e, появившийся в 2011 году. Это смартфон, который выделяется даже среди современных устройств. Компактный, с qwerty-клавиатурой и дополнительной физической кнопкой Facebook*, он прекрасен (это субъективно, конечно). А создали его для тех, кто жил в соцсетях. Сам телефон стал символом эпохи, когда производители еще экспериментировали с дизайном и функциями.
Недавно он попал в мои руки, причем с диагнозом «не включается». Давайте разберем, чем он был примечателен, что у него внутри и в чем причина поломки. Забегая наперед, починить (пока) не удалось, но не по моей вине. Что ж, поехали!
Читать далееС момента, как OpenAI выпустила свой новый генератор картинок, прошло уже почти 3 месяца. Хайп уже давно прошел, а у меня дошли руки до статьи на Хабре
Эта статья про полезные юзкейсы генерации картинок, с которыми каждый из вас может сталкиваться.
Постарался найти такие юзкейсы, которые у графических дизайнеров будут стоить десятки тысяч рублей
Как опубликовать детскую игру на Яндекс.Играх, если модерация требует 10 минут бесплатного контента? Рассказываем о нашем опыте с игрой «Игры для детей 2–3 года».
Читать далее