Любой проект в области CV начинается с разметки огромных объёмов изображений и видео. И только успешные результаты и качественные данные гарантируют, что модель сможет обучаться корректно.
Но что делать, если внутренняя команда не справляется с объемами, а квалифицированных специалистов найти сложно? Ответ прост: передать задачу профессионалам.
Аутсорсинг разметки данных помогает ускорить процесс и вывести проект на совершенно новый уровень. Однако найти надежного партнера, который станет вашим стратегическим союзником, — задача не из легких.
Как выбрать компанию и выстроить процессы, чтобы сотрудничество получилось продуктивным? В этом материале многолетним опытом Data Light в сфере организации разметки поделятся наши эксперты.
Читать далееВсем привет! В в этой статье я расскажу о трансформации команды разработки в части состава по количеству человек и количеству продуктов на сопровождении.
Какие практики внедрили в нашей команде, сопровождающей 10 систем, чтобы снизить Bus Factor и уменьшить время входа для новичков.
Обзор реальных инструментов, которые работают в нашей команде, и могут применяться в вашей уже сейчас: от Wiki до сообществ внутри команды.
Поехали!
Привет! Я Маша, продуктовый дизайнер в ОТП Банке. Недавно у нас выходила статья про предпосылки редизайна платежей, я же хочу подробнее рассказать, какой путь прошел экран разводящей платежей, сколько раз он переделывался, а самое главное, чему мы научились в процессе работы. Возможно, статья поможет вам не наступить на те же грабли :)
Читать далееКогда я пользуюсь сайтом, я хочу, чтобы поиск был максимально простым и удобным. Мы все уже привыкли к тому, как работают умные системы вроде Google или Яндекса, поэтому от любой другой поисковой строки ожидаем аналогичного уровня. Вбиваешь, к примеру, «телискп» или «пороцитомол», а в ответ получаешь список подходящих оптических приборов или лекарств с указанием, где их можно найти в каталоге.
Но как же поисковая система сайта понимает, что я имел в виду? Это какая-то магия или всё же наука? Давайте разберёмся, почему недостаточное внимание к внутреннему поиску может повредить бизнесу, как он способен сократить путь пользователя и что делает его важным инструментом для повышения конверсии.
Читать далееСамое сложное во всем, что касается цифровых (электронных) денег, это договориться о четких и однозначных определениях всего того, что касается обслуживающих их технологий, как «железа», так и софта. И не потому, что это чересчур сложные в техническом плане и слишком тесно переплетающиеся между собой вещи. Терминологическая свистопляска всегда сопутствовала научно-техническим революциям во всех сферах, и «цифровая революция» не исключение.
Читать далееTrino — высокопроизводительный распределённый SQL-движок, с возможностью объединения данных из разнородных источников, таких как: реляционные БД, файловые хранилища, шины данных, inmemory-хранилища, облачные сервисы и тд. Архитектура ориентирована на выполнение аналитических запросов с минимальной задержкой. Т.е. с его помощью можно отправлять SQL-запросы в MongoDB и Kafka, например. Благодаря скорости, развитию, и удобству захватывает популярность у инженеров и аналитиков, работающих с bigdata.
Я познакомился с Trino 1 год назад, за это время настроил с нуля кластер на baremetal и помог с проблемами в нескольких других. В этой статье делюсь краткой выжимкой опыта эксплуатации, накопленным за это время. Большая часть информации будет актуальна и для российского форка Trino: CedrusData.
Читать далееПочему простые числа, отображенные в полярных координатах, имеют форму спиралей или линий?
Создание сюжета
Для начала нам необходимо увидеть, каковы эти шаблоны на самом деле. Давайте начнем наше исследование с импорта базовых модулей.
import math
import sympy
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
%config InlineBackend.figure_format='retina'
plt.style.use('dark_background')
Один из модулей, который я здесь использую, но который я обычно не использую, — это SymPy, библиотека Python для символьной математики. Хотя SymPy предлагает широкий спектр функций для вычислений, я использую его просто для генерации простых чисел.
print(list(sympy.primerange(0, 100)))
[2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97]
Полярные координаты
Сначала давайте напишем функцию, которая принимает некоторое число в качестве входных данных и преобразует его в декартово представление полярных координат. Выходные данные сами по себе являются декартовыми, но координаты, которые они представляют, соответствуют полярным координатам. Мы могли бы понимать эту функцию как преобразованиеС: Р →Р2С:Р→Р2такой что
С( х ) = ( х соз( х ) , х грех( х ) )
В Python мы можем реализовать этот перевод следующим образом:
def get_coordinate(num):
return num * np.cos(num), num * np.sin(num)
Давайте проведем быструю проверку работоспособности и увидим, чтоС( 1 )С(1)возвращает некоторую точку в первом квадранте.
get_coordinate(1)
(0.5403023058681398, 0.8414709848078965)
Отлично! Однако проблема с текущей настройкой заключается в том, что она не векторизована; чтобы сгенерировать координаты, скажем, для десяти чисел, нам понадобится цикл for для генерации координат для каждого из десяти чисел.
В эпоху стремительной цифровизации компании сталкиваются с необходимостью управлять всё более сложной ИТ-инфраструктурой. Серверы, рабочие станции, сетевое оборудование, периферия — каждая деталь требует контроля и учёта. Однако, чем крупнее компания, тем выше риски: финансовые потери из-за нерационального использования ресурсов, простои из-за сбоя оборудования или штрафы за несоответствие нормативным требованиям.
Инвентаризация ИТ-активов становится залогом стабильности и эффективности. От базового учёта до стратегического управления активами — точные данные помогают принимать взвешенные решения, оптимизировать затраты, укреплять информационную безопасность и соответствовать аудиторским требованиям.
В этом материале разберем, как выстроить эффективную систему учета ИТ-активов и почему это критически важно для бизнеса любого масштаба.
Читать далееНесмотря на постоянное увеличение скорости и пропускной способности интерфейсов передачи данных, до сих пор в некоторых областях промышленности востребованы интерфейсы, разработанные еще в 80-е годы XX века. Связано это прежде всего с тем, что к некоторым промышленные объекты и устройствам предъявляются требования по доступности и непрерывной работе в течение десятков лет после ввода в эксплуатацию.
Примерами таких шин являются: ISA (Industry Standard Architecture) и VME (Versa Module Eurocard).
Шина VME, стандартизированная в 1981 году, служит ярким примером востребованности технологий, разработанных в предыдущие годы. Основное назначение данной шины - использование в сложных системах, таких как промышленные контроллеры, системы обработки данных и встраиваемые решения. Шина VME по-прежнему используется в специализированных областях, таких как аэрокосмическая и оборонная промышленность, где требуется высокая надежность и производительность. VME дала основу для развития и появления новых современных стандартов последовательных шин, таких как VITA 46 (VPX) и VITA 65 (OpenVPX), параллельно оставаясь востребованной на рынке.
Читать далееПривет! Меня зовут Катя, я тестировщик.
Когда я только пришла работать в 2ГИС, я занималась тестированием фронтенда карты. Всё было чётко и понятно, ведь был один проект. Но когда я переключилась на тестирование бэкенда, ситуация радикально изменилась. В работу команды, связанной с пользовательским контентом, входило 30+ проектов разного размера и приоритета, с разным уровнем покрытия тестами. Из общего только, что все проекты разработаны на Go, а автотесты — на Python.
Ситуация была настоящий «омагад
Понимание роли тимлида варьируется от компании к компании. Для одних это старший разработчик, для других — полноценный руководитель команды, а в некоторых случаях — просто посредник между командой и менеджментом. Давайте разберёмся, кто такой тимлид, какова его роль и как идти этим путём и не окончить самурайский путь преждевременно.
Читать далееРаботать на удалёнке прекрасно, за исключением одного — всё время нужно что-то готовить. А для этого — придумать, что бы такого вкусного тебе хотелось съесть сегодня.
Меня зовут Лена Райан, я фронтенд-разработчик в Точка Навыки. Недавно закончила свой новый пет-проект — приложение, которое анализирует, какие продукты уже есть дома, и даёт подсказки, что можно из них сделать. В этой статье рассказываю, с какими сложностями пришлось столкнуться, и что в итоге получилось.
Читать далееNetflix продолжает расширять бизнес и диверсифицироваться в различных направлениях, вроде доставки видео по запросу и гейминга. В результате всё важнее становятся технологии, обеспечивающие загрузку временных (темпоральных) данных в системы компании и их хранение. Речь идёт об огромных объёмах данных, измеряемых петабайтами. А задержки доступа к этим данным должны укладываться в миллисекунду. В предыдущих материалах мы рассказывали о нашем слое абстракции для хранения данных типа «ключ-значение», и о платформе, реализующий возможности шлюза данных. И то и другое — это неотъемлемые части подсистемы, отвечающей в Netflix за работу с данными. Система хранения данных типа «ключ-значение» — это гибкое и хорошо масштабируемое решение для работы со структурированными данными соответствующего формата. А шлюз данных — это платформа, которая даёт компании базовую инфраструктуру, обеспечивающую защиту, настройку, развёртывание компонентов, ориентированных на работу с данными.
Читать далееНе пить оверпрайс кофе по пути на пары, питаться дома и вести учет расходов – это знакомая всем база, которая поможет начать экономить студенту. (Согласны, от первого отказаться сложно…) Не хотим повторяться, поэтому мы спросили ребят из команды «Кампуса», как они экономили в студенчестве. Возможно, некоторые методы окажутся для вас неочевидными.
Читать далееПривет, Хабр! Меня зовут Станислав Егоркин, я инженер юнита IaaS департамента разработки Infrastructure в Авито. Эта статья посвящена дашбордам для Grafana, существенно упрощающим диагностику различных систем. Рассказываю про новые подходы, которые я использовал при создании дашбордов, и демонстрирую, как эти подходы реализованы на практике в отношении серверов и кластеров Kubernetes.
Читать далее
На протяжении многих лет сообщество веб-разработчиков накапливало знания об оптимизации производительности веб-приложений. Хотя каждая отдельная оптимизация может привести к улучшению работы сайта, совместное применение всех методов является довольно сложной задачей. Кроме того, лишь некоторые из них применимы к какому-либо конкретному сайту.
Вопросы производительности могут быть не столь очевидны для тех, чья карьера не была связана с этой областью. Именно поэтому важно понимать, какие оптимизации способны наиболее существенно повлиять на это. На реализацию всех рекомендаций скорее всего просто не будет времени, поэтому важно задать себе вопрос: какие оптимизации принесут максимальную выгоду пользователям?
Читать дальше →Привет, Хабр! Это Саша Баулин из команды спецпроектов МТС Диджитал.
Уход Пэта Гелсингера с поста генерального директора Intel стал одной из самых обсуждаемых новостей в мире высоких технологий. Немудрено: на него возлагались большие надежды несколько лет назад. Ждали, что именно он сможет вывести компанию из затянувшегося кризиса. Справедливости ради стоит сказать, что Intel была далеко не на пике, когда Гелсингер стал руководителем корпорации. На нее повлияли крайне неудачные решения предыдущих топ-менеджеров. Что будет дальше?
Читать далееВ ноябре 2024 года сотрудники одной из российских государственных организаций обнаружили фишинговую рассылку и обратились за помощью к нашей команде. В ходе расследования мы выяснили, что атака – часть фишинговой кампании, нацеленной на сотрудников государственных организаций России и Белоруссии, за которой стоит небезызвестная группировка Cloud Atlas.
ЧитатьСекретная служба США, совместно с Государственным департаментом США, предлагает серьезное вознаграждение до 10 миллионов долларов за информацию, которая приведет к аресту и/или осуждению Тимура Камилевича Шахмаметова.
26 сентября 2024 года Офис прокурора США по Восточному округу Виргинии публично объявил о раскрытии обвинительного акта против Шахмаметова, гражданина России, который был обвинен в серьезных преступлениях, связанных с созданием и управлением «Joker’s Stash». Этот печально известный сайт связанный незаконной продаже данных украденных платежных карт. Согласно данным Секретной службы США, Joker’s Stash работал в огромных масштабах, ежегодно предоставляя информацию приблизительно о 40 миллионах украденных платежных картах. За время своей деятельности эта платформа стала одной из крупнейших в истории для торговли данными платежных карт. Аналитики оценивают, что прибыль, полученная от этой преступной операции, могла составить от $280 миллионов до более чем $1 миллиарда.
Шахмаметов столкнулся с несколькими обвинениями, включая один пункт за сговор с целью совершения и пособничества банковскому мошенничеству, один пункт за сговор с целью совершения мошенничества с устройствами доступа и один пункт за сговор с целью отмывания денег. Тяжесть этих обвинений подчеркивает значительный ущерб, нанесенный его действиями финансовой безопасности как отдельных лиц, так и организаций.
Читать далее