Шкаф с большим секретом
Не все данные в толстых справочниках, библиотеках и в памяти компьютеров называются большими. К ним относятся только исчисляемые цифровые данные, которые непрерывно накапливаются и не имеют простой структуры. Например, данные о заказах в интернет-магазине – это не большие данные, хотя их объем может достигать десятков гигабайт. А несколько гигабайт данных в час с записями с сенсоров в двигателе «Боинга» – это уже big data.
Чтобы обработать объем данных, растущий с каждым часом, нужно, во-первых, где-то их хранить, во-вторых, на чем-то вычислять и, наконец, с высокой скоростью передавать. Для этого нужен не просто компьютер, а суперкомпьютер – высокопроизводительная вычислительная платформа, как системный блок домашнего компьютера, только в тысячи раз мощнее и эффективнее.
Такие шкафы называются вычислительными кластерами. Обычно они состоят из одного или нескольких двухметровых металлических шкафов (стоек), в которых словно на полочках располагаются одинаковые по строению модули (узлы), объединенные в сеть. В одном таком узле находятся системная шина, отвечающая за контроль всех процессов, модули памяти, один или несколько процессоров, сетевых адаптеров на базе сверхбольшой интегральной схемы (СБИС), ускорителей, система охлаждения и другие платы и устройства.