Ком­по­нен­ты рос­сий­ско­го озе­ра на­уч­ных дан­ных

Otkrytye sistemy. SUBD. - - СУБД -

Озе­ро дан­ных (data lake) — хра­ни­ли­ща и муль­ти­функ­ци­о­наль­ные цен­тры с ре­сур­са­ми хра­не­ния в сот­ни пе­та­байт, об­ла­да­ю­щие воз­мож­но­стя­ми са­мо­ба­лан­си­ров­ки дан­ных внут­ри озе­ра и предо­став­ля­ю­щие сер­ви­сы про­вер­ки це­лост­но­сти дан­ных. Ти­пы озе­ра: сер­вер­ное озе­ро для хра­не­ния ма­стер-ко­пии дан­ных, ис­поль­зу­е­мой для об­ра­бот­ки и ко­пи­ро­ва­ния в «кэ­ши»; озе­ро для ана­ли­за дан­ных сред­ства­ми его соб­ствен­ной вы­чис­ли­тель­ной ин­фра­струк­ту­ры и вы­чис­ли­тель­ных цен­тров (ATLAS и ALICE); ар­хив­ное озе­ро — хра­ни­ли­ще для ин­фор­ма­ции, не пред­по­ла­га­ю­щее ин­тен­сив­но­го до­сту­па на чте­ние.

Внеш­ние ВЦ — цен­тры, не вхо­дя­щие в со­став рас­пре­де­лен­ной вы­чис­ли­тель­ной ин­фра­струк­ту­ры, но име­ю­щие до­ступ ко всем озе­рам дан­ных че­рез еди­ную точ­ку вхо­да. Су­пер­ком­пью­тер­ные ре­сур­сы: фаб­ри­ки об­ра­бот­ки дан­ных — круп­ные вы­чис­ли­тель­ные цен­тры, име­ю­щие пря­мой до­ступ к озе­ру на­уч­ных дан­ных и до­ста­точ­ную про­пуск­ную спо­соб­ность се­ти; су­пер­ком­пью­тер­ные цен­тры, ис­поль­зу­е­мые для об­ра­бот­ки и ана­ли­за дан­ных, име­ю­щие до­ступ к озе­ру, ис­поль­зу­ю­щие ло­каль­ное кэ­ши­ро­ва­ние ли­бо об­мен меж­ду кэ­шем и озе­ром. Та­кой подход был про­де­мон­стри­ро­ван при об­ра­бот­ке дан­ных ATLAS и в про­ек­те по ис­сле­до­ва­нию ДНК ма­мон­та [4].

Об­лач­ные ре­сур­сы — пря­мой до­ступ к дан­ным или воз­мож­ность ко­пи­ро­ва­ния дан­ных из озе­ра для об­ра­бот­ки внут­ри об­ла­ка.

Newspapers in Russian

Newspapers from Russia

© PressReader. All rights reserved.