Habr.com

Syndicate content Хабр
Все публикации подряд на Хабре
Updated: 1 hour 52 min ago

8 лучших советов для аутсорсинга разметки данных

Mon, 12/16/2024 - 16:09

Любой проект в области CV начинается с разметки огромных объёмов изображений и видео. И только успешные результаты и качественные данные гарантируют, что модель сможет обучаться корректно.

Но что делать, если внутренняя команда не справляется с объемами, а квалифицированных специалистов найти сложно? Ответ прост: передать задачу профессионалам.

Аутсорсинг разметки данных помогает ускорить процесс и вывести проект на совершенно новый уровень. Однако найти надежного партнера, который станет вашим стратегическим союзником, — задача не из легких.

Как выбрать компанию и выстроить процессы, чтобы сотрудничество получилось продуктивным? В этом материале многолетним опытом Data Light в сфере организации разметки поделятся наши эксперты.

Читать далее

Снижаем Bus Factor в команде

Mon, 12/16/2024 - 16:00

Всем привет! В в этой статье я расскажу о трансформации команды разработки в части состава по количеству человек и количеству продуктов на сопровождении.

Какие практики внедрили в нашей команде, сопровождающей 10 систем, чтобы снизить Bus Factor и уменьшить время входа для новичков.

Обзор реальных инструментов, которые работают в нашей команде, и могут применяться в вашей уже сейчас: от Wiki до сообществ внутри команды.

Поехали!

Читать далее

Приземление дизайн-концепта на примере экрана платежей

Mon, 12/16/2024 - 15:59

Привет! Я Маша, продуктовый дизайнер в ОТП Банке. Недавно у нас выходила статья про предпосылки редизайна платежей, я же хочу подробнее рассказать, какой путь прошел экран разводящей платежей, сколько раз он переделывался, а самое главное, чему мы научились в процессе работы. Возможно, статья поможет вам не наступить на те же грабли :)

Читать далее

Организация поиска на сайте: выбираем между поиском Битрикса, Sphinx и Elasticsearch

Mon, 12/16/2024 - 15:57

Когда я пользуюсь сайтом, я хочу, чтобы поиск был максимально простым и удобным. Мы все уже привыкли к тому, как работают умные системы вроде Google или Яндекса, поэтому от любой другой поисковой строки ожидаем аналогичного уровня. Вбиваешь, к примеру, «телискп» или «пороцитомол», а в ответ получаешь список подходящих оптических приборов или лекарств с указанием, где их можно найти в каталоге.

Но как же поисковая система сайта понимает, что я имел в виду? Это какая-то магия или всё же наука? Давайте разберёмся, почему недостаточное внимание к внутреннему поиску может повредить бизнесу, как он способен сократить путь пользователя и что делает его важным инструментом для повышения конверсии.

Читать далее

Как ленивые аспиранты в начале 80-х решили установить контроль за автоматом Coca-Cola и причем тут электронные кошельки

Mon, 12/16/2024 - 15:45

Самое сложное во всем, что касается цифровых (электронных) денег, это договориться о четких и однозначных определениях всего того, что касается обслуживающих их технологий, как «железа», так и софта. И не потому, что это чересчур сложные в техническом плане и слишком тесно переплетающиеся между собой вещи. Терминологическая свистопляска всегда сопутствовала научно-техническим революциям во всех сферах, и «цифровая революция» не исключение. 

Читать далее

Мой опыт эксплуатации кластера Trino

Mon, 12/16/2024 - 15:37

Trino — высокопроизводительный распределённый SQL-движок, с возможностью объединения данных из разнородных источников, таких как: реляционные БД, файловые хранилища, шины данных, inmemory-хранилища, облачные сервисы и тд. Архитектура ориентирована на выполнение аналитических запросов с минимальной задержкой. Т.е. с его помощью можно отправлять SQL-запросы в MongoDB и Kafka, например. Благодаря скорости, развитию, и удобству захватывает популярность у инженеров и аналитиков, работающих с bigdata.

Я познакомился с Trino 1 год назад, за это время настроил с нуля кластер на baremetal и помог с проблемами в нескольких других. В этой статье делюсь краткой выжимкой опыта эксплуатации, накопленным за это время. Большая часть информации будет актуальна и для российского форка Trino: CedrusData.

Читать далее

[Перевод] Построение графиков простых чисел

Mon, 12/16/2024 - 15:20

Почему простые числа, отображенные в полярных координатах, имеют форму спиралей или линий?

Создание сюжета

Для начала нам необходимо увидеть, каковы эти шаблоны на самом деле. Давайте начнем наше исследование с импорта базовых модулей.

import math import sympy import numpy as np import matplotlib.pyplot as plt %matplotlib inline %config InlineBackend.figure_format='retina' plt.style.use('dark_background')


Один из модулей, который я здесь использую, но который я обычно не использую, — это SymPy, библиотека Python для символьной математики. Хотя SymPy предлагает широкий спектр функций для вычислений, я использую его просто для генерации простых чисел.

print(list(sympy.primerange(0, 100)))

[2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97]


Полярные координаты

Сначала давайте напишем функцию, которая принимает некоторое число в качестве входных данных и преобразует его в декартово представление полярных координат. Выходные данные сами по себе являются декартовыми, но координаты, которые они представляют, соответствуют полярным координатам. Мы могли бы понимать эту функцию как преобразованиеС: Р →Р2С:Р→Р2такой что  

С( х ) = ( х соз( х ) , х грех( х ) )

В Python мы можем реализовать этот перевод следующим образом:

def get_coordinate(num): return num * np.cos(num), num * np.sin(num)

Давайте проведем быструю проверку работоспособности и увидим, чтоС( 1 )С(1)возвращает некоторую точку в первом квадранте.

get_coordinate(1)

(0.5403023058681398, 0.8414709848078965)


Отлично! Однако проблема с текущей настройкой заключается в том, что она не векторизована; чтобы сгенерировать координаты, скажем, для десяти чисел, нам понадобится цикл for для генерации координат для каждого из десяти чисел.

Читать далее

Инвентаризация ИТ-активов: как построить эффективную систему учета и контроля инфраструктуры

Mon, 12/16/2024 - 15:09

В эпоху стремительной цифровизации компании сталкиваются с необходимостью управлять всё более сложной ИТ-инфраструктурой. Серверы, рабочие станции, сетевое оборудование, периферия — каждая деталь требует контроля и учёта. Однако, чем крупнее компания, тем выше риски: финансовые потери из-за нерационального использования ресурсов, простои из-за сбоя оборудования или штрафы за несоответствие нормативным требованиям.

Инвентаризация ИТ-активов становится залогом стабильности и эффективности. От базового учёта до стратегического управления активами — точные данные помогают принимать взвешенные решения, оптимизировать затраты, укреплять информационную безопасность и соответствовать аудиторским требованиям.

В этом материале разберем, как выстроить эффективную систему учета ИТ-активов и почему это критически важно для бизнеса любого масштаба.

Читать далее

ISA и другие legacy-интерфейсы в современных встраиваемых компьютерах

Mon, 12/16/2024 - 14:55

Несмотря на постоянное увеличение скорости и пропускной способности интерфейсов передачи данных, до сих пор в некоторых областях промышленности востребованы интерфейсы, разработанные еще в 80-е годы XX века. Связано это прежде всего с тем, что к некоторым промышленные объекты и устройствам предъявляются требования по доступности и непрерывной работе в течение десятков лет после ввода в эксплуатацию.

Примерами таких шин являются: ISA (Industry Standard Architecture) и VME (Versa Module Eurocard).

Шина VME, стандартизированная в 1981 году, служит ярким примером востребованности технологий, разработанных в предыдущие годы. Основное назначение данной шины - использование в сложных системах, таких как промышленные контроллеры, системы обработки данных и встраиваемые решения. Шина VME по-прежнему используется в специализированных областях, таких как аэрокосмическая и оборонная промышленность, где требуется высокая надежность и производительность. VME дала основу для развития и появления новых современных стандартов последовательных шин, таких как VITA 46 (VPX) и VITA 65 (OpenVPX), параллельно оставаясь востребованной на рынке.

Читать далее

Наводим порядок в мониторинге 30+ проектов

Mon, 12/16/2024 - 14:47

Привет! Меня зовут Катя, я тестировщик.

Когда я только пришла работать в 2ГИС, я занималась тестированием фронтенда карты. Всё было чётко и понятно, ведь был один проект. Но когда я переключилась на тестирование бэкенда, ситуация радикально изменилась. В работу команды, связанной с пользовательским контентом, входило 30+ проектов разного размера и приоритета, с разным уровнем покрытия тестами. Из общего только, что все проекты разработаны на Go, а автотесты — на Python.

Ситуация была настоящий «омагад

У тимлида нет цели, но есть путь. Или как стать настоящим самураем и не сделать сеппуку

Mon, 12/16/2024 - 14:40

Понимание роли тимлида варьируется от компании к компании. Для одних это старший разработчик, для других — полноценный руководитель команды, а в некоторых случаях — просто посредник между командой и менеджментом. Давайте разберёмся, кто такой тимлид, какова его роль и как идти этим путём и не окончить самурайский путь преждевременно. 

Читать далее

Как я создала приложение, которое решает, что мне есть

Mon, 12/16/2024 - 14:32

Работать на удалёнке прекрасно, за исключением одного — всё время нужно что-то готовить. А для этого — придумать, что бы такого вкусного тебе хотелось съесть сегодня. 

Меня зовут Лена Райан, я фронтенд-разработчик в Точка Навыки. Недавно закончила свой новый пет-проект — приложение, которое анализирует, какие продукты уже есть дома, и даёт подсказки, что можно из них сделать. В этой статье рассказываю, с какими сложностями пришлось столкнуться, и что в итоге получилось. 

Читать далее

[Перевод] Знакомство со слоем абстракции Netflix для хранения временных рядов

Mon, 12/16/2024 - 14:16

Netflix продолжает расширять бизнес и диверсифицироваться в различных направлениях, вроде доставки видео по запросу и гейминга. В результате всё важнее становятся технологии, обеспечивающие загрузку временных (темпоральных) данных в системы компании и их хранение. Речь идёт об огромных объёмах данных, измеряемых петабайтами. А задержки доступа к этим данным должны укладываться в миллисекунду. В предыдущих материалах мы рассказывали о нашем слое абстракции для хранения данных типа «ключ-значение», и о платформе, реализующий возможности шлюза данных. И то и другое — это неотъемлемые части подсистемы, отвечающей в Netflix за работу с данными. Система хранения данных типа «ключ-значение» — это гибкое и хорошо масштабируемое решение для работы со структурированными данными соответствующего формата. А шлюз данных — это платформа, которая даёт компании базовую инфраструктуру, обеспечивающую защиту, настройку, развёртывание компонентов, ориентированных на работу с данными.

Читать далее

Лайфхаки по экономии для студентов

Mon, 12/16/2024 - 14:15

Не пить оверпрайс кофе по пути на пары, питаться дома и вести учет расходов – это знакомая всем база, которая поможет начать экономить студенту. (Согласны, от первого отказаться сложно…) Не хотим повторяться, поэтому мы спросили ребят из команды «Кампуса», как они экономили в студенчестве. Возможно, некоторые методы окажутся для вас неочевидными. 

Читать далее

Удобные дашборды для быстрой диагностики

Mon, 12/16/2024 - 14:12

Привет, Хабр! Меня зовут Станислав Егоркин, я инженер юнита IaaS департамента разработки Infrastructure в Авито. Эта статья посвящена дашбордам для Grafana, существенно упрощающим диагностику различных систем. Рассказываю про новые подходы, которые я использовал при создании дашбордов, и демонстрирую, как эти подходы реализованы на практике в отношении серверов и кластеров Kubernetes.

Читать далее

[Перевод] Наиболее эффективные методы улучшения Core Web Vitals

Mon, 12/16/2024 - 14:05


На протяжении многих лет сообщество веб-разработчиков накапливало знания об оптимизации производительности веб-приложений. Хотя каждая отдельная оптимизация может привести к улучшению работы сайта, совместное применение всех методов является довольно сложной задачей. Кроме того, лишь некоторые из них применимы к какому-либо конкретному сайту.


Вопросы производительности могут быть не столь очевидны для тех, чья карьера не была связана с этой областью. Именно поэтому важно понимать, какие оптимизации способны наиболее существенно повлиять на это. На реализацию всех рекомендаций скорее всего просто не будет времени, поэтому важно задать себе вопрос: какие оптимизации принесут максимальную выгоду пользователям?

Читать дальше →

Intel: конец эпохи Гелсингера. Что ждет компанию?

Mon, 12/16/2024 - 14:04

Привет, Хабр! Это Саша Баулин из команды спецпроектов МТС Диджитал.

Уход Пэта Гелсингера с поста генерального директора Intel стал одной из самых обсуждаемых новостей в мире высоких технологий. Немудрено: на него возлагались большие надежды несколько лет назад. Ждали, что именно он сможет вывести компанию из затянувшегося кризиса. Справедливости ради стоит сказать, что Intel была далеко не на пике, когда Гелсингер стал руководителем корпорации. На нее повлияли крайне неудачные решения предыдущих топ-менеджеров. Что будет дальше?

Читать далее

Корпорации типа PPT — особая форма бизнеса для общественного блага

Mon, 12/16/2024 - 14:01


С 1985 года американская компания Patagonia (производитель товаров для активного отдыха) отчисляет 1% от продаж на сохранение и восстановление окружающей среды. За это время они перечислили разным экологическим группам $140 млн в виде денежных и натуральных пожертвований. В 2002 году основатели компании создали некоммерческую корпорацию «1% для планеты», чтобы побудить другие компании поступать так же.

Но этого им показалось мало, так что в 2022 году владельцы кардинально изменили форму собственности, превратив компанию в целевой траст типа PPT (Perpetual Purpose Trust). Так что теперь это бизнес, который работает с определённой целью. Попросту говоря, 100% прибыли коммерческой компании идёт конкретно на экологию. Читать дальше →

Срочно, фишинг! Как хакеры со стажем атакуют госорганы

Mon, 12/16/2024 - 13:57

В ноябре 2024 года сотрудники одной из российских государственных организаций обнаружили фишинговую рассылку и обратились за помощью к нашей команде. В ходе расследования мы выяснили, что атака – часть фишинговой кампании, нацеленной на сотрудников государственных организаций России и Белоруссии, за которой стоит небезызвестная группировка Cloud Atlas.

Читать

[Перевод] Охота Секретной службы за Джокером с вознаграждением в 10 миллионов долларов: Тимур Камилевич Шахмаметов

Mon, 12/16/2024 - 13:54

Секретная служба США, совместно с Государственным департаментом США, предлагает серьезное вознаграждение до 10 миллионов долларов за информацию, которая приведет к аресту и/или осуждению Тимура Камилевича Шахмаметова.

26 сентября 2024 года Офис прокурора США по Восточному округу Виргинии публично объявил о раскрытии обвинительного акта против Шахмаметова, гражданина России, который был обвинен в серьезных преступлениях, связанных с созданием и управлением «Joker’s Stash». Этот печально известный сайт связанный незаконной продаже данных украденных платежных карт. Согласно данным Секретной службы США, Joker’s Stash работал в огромных масштабах, ежегодно предоставляя информацию приблизительно о 40 миллионах украденных платежных картах. За время своей деятельности эта платформа стала одной из крупнейших в истории для торговли данными платежных карт. Аналитики оценивают, что прибыль, полученная от этой преступной операции, могла составить от $280 миллионов до более чем $1 миллиарда.

Шахмаметов столкнулся с несколькими обвинениями, включая один пункт за сговор с целью совершения и пособничества банковскому мошенничеству, один пункт за сговор с целью совершения мошенничества с устройствами доступа и один пункт за сговор с целью отмывания денег. Тяжесть этих обвинений подчеркивает значительный ущерб, нанесенный его действиями финансовой безопасности как отдельных лиц, так и организаций.

Читать далее

Who's online

There are currently 1 user and 1 guest online.