diasoft25 фев в 09:33

S3 Архипелаг: как мы в Диасофте построили свое объектное хранилище

19 мин

6.2K

Блог компании ДиасофтПрограммирование * Хранение данных * IT-инфраструктура * Data Engineering *

Комментарии 7

say_TT_plz 25 фев в 09:46

Весьма познавательно, спасибо за ваш труд.

Подскажите, как вы боретесь с bit rot?

diasoft 25 фев в 12:14

При чтении система проверяет контрольные суммы. Если обнаружено повреждение, а данные реплицированы, запрос перенаправляется на здоровую копию - клиент получает корректные данные.

Для борьбы с последствиями появления "битого" участка мы настроили мониторинг алертов и периодическую проверку целостности томов. При обнаружении bit rot поврежденные тома восстанавливаются из здоровых реплик.

В планах полностью автоматизировать этот процесс, чтобы система сама восстанавливала поврежденные блоки в фоновом режиме.

x4team_only 25 фев в 11:30

Использую это открытое "ЧУДО" https://github.com/s4core/s4core пока еще в альфе, бьет всех минио/garage/seaweedfs/rustfs по скорости и надежности. В комплекте дедупликация, атомарные операции, полная совместимость с S3 (версионирование, политика lifecycle, блокировка обьектов), в комплекте дашборд (на гитхабе есть демка), слежу за развитием дальше)

cartonworld 6 мар в 17:29

слежу за развитием

интересно, а в "Как я искал замену MinIO S3 и написал свой S4 на Rust" ты пишешь, что это ты автор s4

EvgenyVilkov 25 фев в 13:13

4 NVMe Диска и сеть на 10Гб. Дальше можно не читать. Вы просто уперлись в сеть и ваш тест не релевантный

diasoft 26 фев в 15:25

Спасибо за внимательность! Вы правы, конфигурация стенда важна. Мы поправили опечатку в статье, тесты проводились на сети 25GbE.

Однако ваш тезис про "упор в сеть" остается актуальным. Тем не менее, тесты релевантны по двум причинам:

1. Эффективность ресурсов (CPU/RAM). Чтобы просто забить сеть до предела S3 Архипелаг использовал 28% доступной мощности. Это означает, что у нас остается большой запас вычислительной мощности, который можно реализовать, использовав более быструю сеть.

2. Тесты на IOPS (мелкие файлы) и LIST-операции (метаданные) упираются не в пропускную способность сети, а в архитектуру хранения и работу с диском. Там сеть не является "узким горлышком", и именно там S3 Архипелаг демонстрирует кратный отрыв от конкурентов (в 2-3 раза быстрее).

Тест показывает главное: мы получаем максимум из доступного канала с минимальными затратами ресурсов сервера.

EvgenyVilkov 27 фев в 03:17

25 гбс на 4 nvme вы по прежнему упёрлись в сеть. По прежнему дальше можно не читать.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий