МИР ЦОД

Lan - - Колонка Редактора - Алек­сей Чер­но­бров­цев

Но­вые ве­я­ния в стан­дар­тах для цен­тров об­ра­бот­ки дан­ных

сред­няя ско­рость из­ме­не­ния ко­то­рых со­став­ля­ет 10% (10 Тбайт) в день и 50% (50 Тбайт) в неде­лю. Ре­зерв­ные ко­пии для опе­ра­тив­но­го вос­ста­нов­ле­ния хра­нят­ся 12 недель, а дан­ные, тре­бу­ю­щие бо­лее дли­тель­но­го хра­не­ния, ар­хи­ви­ру­ют­ся.

Это край­ний слу­чай, ко­то­рый ил­лю­стри­ру­ет от­ли­чия тра­ди­ци­он­ной и по­сто­ян­ной ин­кре­мент­ной мо­де­ли. В ти­пич­ной сре­де об­щий объ­ем из­ме­нен­ных дан­ных обыч­но со­став­ля­ет 50% в год (50 Тбайт), что эк­ви­ва­лент­но 1% в неде­лю (1 Тбайт) и 0,2% в день (200 Гбайт).

При комбинации пол­но­го и ин­кре­мент­но­го ре­зерв­но­го ко­пи­ро­ва­ния, а так­же в ис­поль­зу­е­мой Hitachi Data Instance Director (HDID) мо­де­ли по­сто­ян­но­го ин­кре­мент­но­го ко­пи­ро­ва­ния объ­ем еже­днев­ной ко­пии со­став­ля­ет 10 Тбайт (см. рис. 2). Од­на­ко, в пер­вом слу­чае в вы­ход­ные ре­зер­ви­ру­ют­ся 100 Тбайт, то­гда как во вто­ром ни­ка­ких ко­пий не со­зда­ет­ся.

С уче­том со­зда­ния пер­во­на­чаль­ной пол­ной ре­зерв­ной ко­пии (100 Тбайт) об­щий объ­ем ре­зерв­ных ко­пий за 12 недель со­ста­вит: • пол­ное и инкрементное ре­зерв­ное ко­пи­ро­ва­ние: 1900 Тбайт (1,9 Пбайт);

• по­сто­ян­ное инкрементное ре­зерв­ное

ко­пи­ро­ва­ние: 700 Тбайт (0,7 Пбайт).

Бла­го­да­ря де­ду­пли­ка­ции дан­ных по­сто­ян­ное инкрементное ре­зерв­ное ко­пи­ро­ва­ние поз­во­ля­ет со­кра­тить тре­бу­е­мую ем­кость хра­не­ния на 63% без до­пол­ни­тель­ных фи­нан­со­вых за­трат и сни­же­ния про­из­во­ди­тель­но­сти си­сте­мы. Во сколь­ко обой­дут­ся при­об­ре­те­ние, управ­ле­ние и под­держ­ка хра­ни­ли­ща с ре­зерв­ны­ми ко­пи­я­ми объ­е­мом 1,2 Пбайт? По су­ти, это 2,4 Пбайт до­пол­ни­тель­но­го про­стран­ства, так как мы хо­тим реп­ли­ци­ро­вать хранилище с ре­зерв­ны­ми ко­пи­я­ми в центр по­сле­а­ва­рий­но­го вос­ста­нов­ле­ния. Ес­ли дан­ные с ко­пи­я­ми хра­нят­ся доль­ше трех ме­ся­цев, эко­но­мия ока­жет­ся еще боль­ше.

В ти­пич­ной же сре­де, где за год ме­ня­ет­ся 50% дан­ных, для хра­не­ния тра­ди­ци­он­ных ре­зерв­ных ко­пий в те­че­ние 12 недель по­на­до­бит­ся 1,3 Пбайт, а для хра­не­ния по­сто­ян­ных ин­кре­мент­ных ко­пий — все­го 112 Тбайт. Та­ким об­ра­зом, эко­но­мия до­стиг­нет 91%. При­ве­ден­ное умень­ше­ние объ­е­мов еще раз под­твер­жда­ет, что при тра­ди­ци­он­ном ре­зерв­ном ко­пи­ро­ва­нии по­чти все со­хра­ня­е­мые дан­ные из­бы­точ­ны.

Управ­ле­ние ок­ном ре­зерв­но­го ко­пи­ро­ва­ния — это пер­вый шаг к сни­же­нию за­трат и рис­ков, свя­зан­ных с за­щи­той дан­ных, к обес­пе­че­нию бо­лее эф­фек­тив­но­го по­сле­а­ва­рий­но­го вос­ста­нов­ле­ния и воз­об­нов­ле­ния опе­ра­ци­он­ной де­я­тель­но­сти.

КАК RPO ВЛИ­Я­ЕТ НА RTO?

Це­ле­вая точ­ка вос­ста­нов­ле­ния (RPO) ука­зы­ва­ет на при­ем­ле­мую для пред­при­я­тия пе­ри­о­дич­ность со­зда­ния ре­зерв­ных ко­пий и, та­ким об­ра­зом, опре­де­ля­ет мо­мент вре­ме­ни, в ко­то­рый воз­мож­но вос­ста­нов­ле­ние дан­ных. Ес­ли RPO рав­ня­ет­ся 24 ч, зна­чит, од­ной опе­ра­ции ре­зерв­но­го ко­пи­ро­ва­ния в день вполне до­ста­точ­но. Кро­ме то­го, дан­ный по­ка­за­тель ха­рак­те­ри­зу­ет: • ча­сто­ту выполнения опе­ра­ций ре­зерв­но­го ко­пи­ро­ва­ния;

• объ­ем но­вых дан­ных, ко­то­рые пред­при­я­тие рис­ку­ет потерять.

RPO прин­ци­пи­аль­но от­ли­ча­ет­ся от це­ле­во­го вре­ме­ни вос­ста­нов­ле­ния (RTO). С по­мо­щью RTO мож­но по­нять, как дол­го бу­дет вы­пол­нять­ся про­це­ду­ра вос­ста­нов­ле­ния си­сте­мы или при­ло­же­ния ли­бо вос­ста­нов­ле­ния до­сту­па к на­бо­ру дан­ных по­сле неза­пла­ни­ро­ван­но­го со­бы­тия, вы­зван­но­го ошиб­кой че­ло­ве­ка, сбо­ем обо­ру­до­ва­ния или при­род­ным ка­та­клиз­мом. RTO опре­де­ля­ет, ка­ко­ва про­дол­жи­тель­ность про­стоя (а сле­до­ва­тель­но, де­неж­ные по­те­ри, рис­ки и упу­щен­ная вы­го­да), с ко­то­рым ор­га­ни­за­ция го­то­ва ми­рить­ся в слу­чае сбоя или ава­рии. За­ча­стую для раз­ных ти­пов дан­ных и ви­дов сбо­ев уста­нав­ли­ва­ет­ся раз­ное це­ле­вое вре­мя вос­ста­нов­ле­ния — на­при­мер, два ча­са для утра­чен­но­го фай­ла или элек­трон­но­го пись­ма, шесть ча­сов для за­пус­ка от­ка­зав­ше­го сер­ве­ра и два дня на вос­ста­нов­ле­ние опе­ра­ций в слу­чае сбоя, за­тро­нув­ше­го весь объ­ект.

По­сколь­ку RPO и RTO — прин­ци­пи­аль­но раз­ные по­ня­тия, мно­гих ин­те­ре­су­ет, ока­зы­ва­ют ли они вли­я­ние друг на дру­га. Как пра­ви­ло, на этот во­прос от­ве­ча­ют от­ри­ца­тель­но, но спо­соб до­сти­же­ния RPO са­мым непо­сред­ствен­ным об­ра­зом отражается на со­блю­де­нии RTO. Как по­ка­за­но на рис. 3, их вза­и­мо­связь на­по­ми­на­ет пе­ре­тя­ги­ва­ние ка­на­та.

Пред­ста­вим, что у вас очень боль­шая ба­за дан­ных, ре­зерв­ную ко­пию ко­то­рой мож­но со­здать толь­ко за длин­ные вы­ход­ные. Что­бы умень­шить RPO до 24 ч, каж­дую ночь не­об­хо­ди­мо де­лать ре­зерв­ные ко­пии жур­на­лов ба­зы дан­ных или жур­на­лов по­втор­но­го выполнения. В ре­зуль­та­те мож­но вос­ста­но­вить по­след­нюю пол­ную ко­пию ба­зы дан­ных, а за­тем по­втор­но вы­пол­нить все тран­зак­ции, со­хра­нен­ные в жур­на­лах ба­зы дан­ных или жур­на­лах по­втор­но­го выполнения.

Чис­ло и раз­ме­ры фай­лов, ко­то­рые тре­бу­ет­ся вос­ста­но­вить и ис­поль­зо­вать на­ря­ду с фай­ла­ми ба­зы дан­ных, мо­гут рас­ти очень быст­ро, осо­бен­но ес­ли вы име­е­те де­ло с мас­штаб­ной кла­стер­ной сре­дой на­по­до­бие Oracle Real Application Clusters (RAC). Итак, бу­дет ли вре­мя, за­тра­чи­ва­е­мое на вос­ста­нов­ле­ние по­след­ней пол­ной ре­зерв­ной ко­пии и всех жур­на­лов, со­от­вет­ство­вать от­ве­ден­но­му для круп­ной си­сте­мы баз дан­ных RTO? От­вет, оче­вид­но, от­ри­ца­тель­ный, ес­ли толь­ко RTO не из­ме­ря­ет­ся неде­ля­ми и ме­ся­ца­ми. Та­кая ме­то­до­ло­гия за­щи­ты ба­зы дан­ных мо­жет быть ис­поль­зо­ва­на для со­зда­ния при­ем­ле­мых це­ле­вых точек вос­ста­нов­ле­ния, но она не под­хо­дит для со­блю­де­ния при­ем­ле­мо­го це­ле­во­го вре­ме­ни вос­ста­нов­ле­ния.

По­хо­жую си­ту­а­цию мы на­блю­да­ем и при тра­ди­ци­он­ном пол­ном + ин­кре­мент­ном ре­зерв­ном ко­пи­ро­ва­нии, опи­сан­ном ра­нее. При та­кой мо­де­ли пол­ная резерв-

ная копия обыч­но со­зда­ет­ся каж­дые вы­ход­ные, а ин­кре­мент­ная — каж­дый день на про­тя­же­нии ра­бо­чей неде­ли. Ес­ли сбой про­изо­шел в по­не­дель­ник и нуж­но вы­пол­нить пол­ное вос­ста­нов­ле­ние, ни­ка­ких труд­но­стей это вы­звать не долж­но: дан­ные вос­ста­нав­ли­ва­ют­ся из по­след­ней ре­зерв­ной ко­пии, сде­лан­ной в вы­ход­ные.

Ес­ли же сбой про­изой­дет в пят­ни­цу, нуж­но вос­ста­но­вить пол­ную ре­зерв­ную ко­пию, сде­лан­ную в преды­ду­щие вы­ход­ные, а за­тем по­сле­до­ва­тель­но все ин­кре­мент­ные на­бо­ры с по­не­дель­ни­ка по чет­верг. В пят­ни­цу про­це­ду­ра вос­ста­нов­ле­ния бу­дет вы­пол­нять­ся зна­чи­тель­но доль­ше, чем в по­не­дель­ник. Учи­ты­ва­ет­ся ли это об­сто­я­тель­ство в RTO? Кро­ме то­го, вос­ста­нов­ле­ние в кон­це неде­ли — го­раз­до бо­лее рис­ко­ван­ный про­цесс, ко­то­рый со­сто­ит из несколь­ких эта­пов, вы­пол­ня­е­мых вруч­ную. Воз­мож­но, не­ко­то­рые из вос­ста­нав­ли­ва­е­мых дан­ных при­дет­ся пе­ре­пи­сы­вать до че­ты­рех раз.

Оче­вид­но, что по ме­ре даль­ней­ше­го уве­ли­че­ния объ­е­мов дан­ных и услож­не­ния ИТ-систем ис­поль­зу­е­мые под­хо­ды при­дет­ся улуч­шать, что­бы обес­пе­чить со­блю­де­ние требований к ре­зерв­но­му ко­пи­ро­ва­нию (RPO) и вос­ста­нов­ле­нию (RTO). Ком­па­ния Hitachi пред­ла­га­ет ре­ше­ние, спо­соб­ное за­щи­тить круп­ные ба­зы дан­ных и кри­ти­че­ски важ­ные при­ло­же­ния и зна­чи­тель­но улуч­шить по­ка­за­те­ли RPO и RTO. Оно вклю­ча­ет в се­бя три со­став­ля­ю­щие:

• Мо­мен­таль­ные сним­ки и тех­но­ло­гии

ре­пли­ка­ции на ба­зе хра­ни­ли­ща, ко­то­рые: - ис­клю­ча­ют из си­сте­мы управ­ле­ния ба­за­ми дан­ных опе­ра­ции по за­щи­те дан­ных;

- устра­ня­ют необ­хо­ди­мость в окне ре­зерв­но­го ко­пи­ро­ва­ния и свя­зан­ные с ним про­стои;

- поз­во­ля­ют вы­пол­нять опе­ра­ции ре­зерв­но­го ко­пи­ро­ва­ния го­раз­до ча­ще, со­кра­щая объ­е­мы но­вых дан­ных, под­вер­жен­ные рис­ку по­те­ри, на 90% и бо­лее.

• Мо­мен­таль­ные сним­ки и про­грамм­ное

обес­пе­че­ние ре­пли­ка­ции для при­ло­же­ний и баз дан­ных, ко­то­рые:

- пе­ре­во­дят ба­зы дан­ных и при­ло­же­ния в го­то­вое к ре­зерв­но­му ко­пи­ро­ва­нию (от­клю­чен­ное) со­сто­я­ние; - со­зда­ют в хранилище мо­мен­таль­ный сни­мок, по­сле че­го ба­за дан­ных и при­ло­же­ние осво­бож­да­ют­ся для нор­маль­но­го функ­ци­о­ни­ро­ва­ния; - обес­пе­чи­ва­ют быст­рое и пол­но­стью

со­гла­со­ван­ное вос­ста­нов­ле­ние опе­ра­ци­он­ной де­я­тель­но­сти в те­че­ние несколь­ких ми­нут, а не недель; • Сер­ви­сы оцен­ки и внед­ре­ния, ко­то­рые опре­де­ля­ют и кон­фи­гу­ри­ру­ют оп­ти­маль­ное ре­ше­ние для уни­каль­ной сре­ды пред­при­я­тия.

RPO — ВОЗ­МОЖ­НАЯ СКРЫТАЯ СТО­И­МОСТЬ RTO

Что от­но­сит­ся к RTO? В за­ви­си­мо­сти от кон­крет­но­го опре­де­ле­ния сю­да мо­гут вой­ти не­ко­то­рые или да­же все из сле­ду­ю­щих со­став­ля­ю­щих:

• про­дол­жи­тель­ность изу­че­ния и ди­а­гнос

ти­ки со­бы­тия; • про­дол­жи­тель­ность выполнения кор­рек­ти­ру­ю­щих дей­ствий: уста­нов­ка но­во­го сер­ве­ра, за­ме­на дис­ка, от­стра­не­ние со­труд­ни­ка, став­ше­го при­чи­ной непо­ла­док, пе­ре­вод опе­ра­ций в ре­зерв­ный центр; • про­дол­жи­тель­ность пе­ре­уста­нов­ки опе­ра­ци­он­ной си­сте­мы и при­ло­же­ний при воз­ник­но­ве­нии та­кой необходимости;

• про­дол­жи­тель­ность вос­ста­нов­ле­ния

всех нуж­ных дан­ных из ре­зерв­ной ко­пии или си­сте­мы по­сле­а­ва­рий­но­го вос­ста­нов­ле­ния; • вре­мя, за­тра­чен­ное на за­пуск и те­сти­ро­ва­ние вос­ста­нов­лен­ной сре­ды.

Все это вы­ли­ва­ет­ся в очень дли­тель­ную про­це­ду­ру и при­во­дит к про­сто­ям. В те­че­ние опре­де­лен­но­го про­ме­жут­ка вре­ме­ни ка­кая-то часть пред­при­я­тия не мо­жет за­ни­мать­ся про­из­вод­ствен­ной де­я­тель­но­стью, что оказывает воздействие на ва­ло­вой до­ход или при­быль ли­бо на то и дру­гое.

Кро­ме то­го, есть па­ра­метр, ко­то­рый ча­сто оста­ет­ся за рам­ка­ми ука­зан­но­го спис­ка, но при этом са­мым непо­сред­ствен­ным об­ра­зом отражается на про­дол­жи­тель­но­сти пол­но­го вос­ста­нов­ле­ния и об­щей сто­и­мо­сти вос­ста­нов­ле­ния. Речь идет о це­ле­вой точ­ке вос­ста­нов­ле­ния (RPO). Ес­ли RPO рав­ня­ет­ся 24 ч (как пра­ви­ло, ре­зерв­ное ко­пи­ро­ва­ние вы­пол­ня­ет­ся но­чью), то это озна­ча­ет, что вы го­то­вы при­ми­рить­ся с по­те­рей но­вых дан­ных, по­лу­чен­ных в те­че­ние су­ток.

За­ча­стую RPO вы­би­ра­ет­ся из прак­ти­че­ских со­об­ра­же­ний: на­при­мер, опре­де­лен­ную си­сте­му мож­но от­клю­чить толь­ко на ночь или на вы­ход­ные. Вме­сте с тем RPO сле­ду­ет опре­де­лять с уче­том требований биз­не­са, а не толь­ко ис­хо­дя из огра­ни­че­ний име­ю­ще­го­ся про­грамм­но­го обес­пе­че­ния для ре­зерв­но­го ко­пи­ро­ва­ния. Пред­ста­вим се­бе, что па­ра­метр RPO ра­вен 24 ч, а сбой си­сте­мы про­изо­шел в шесть ча­сов ве­че­ра, при этом все со­дер­жа­щи­е­ся там дан­ные уда­ле­ны или уни­что­же­ны. Мож­но, ко­неч­но, вос­ста­но­вить их из по­след­ней ре­зерв­ной ко­пии, но вся ин­фор­ма­ция, со­здан­ная и из­ме­нен­ная по­сле это­го, бу­дет уте­ря­на.

Вы го­то­вы сми­рить­ся с по­те­рей этих дан­ных? Воз­мож­но, там при­сут­ству­ют не­сколь­ко круп­ных за­ка­зов из си­сте­мы про­даж, ре­зуль­та­ты про­ек­ти­ро­ва­ния за день и мно­гие дру­гие важ­ные для ор­га­ни­за­ции све­де­ния. Про­сто по­жме­те пле­ча­ми и дви­не­тесь даль­ше? Ко­неч­но нет. Дан­ные не­об­хо­ди­мо вос­ста­но­вить, то есть вве­сти за­но­во. Про­цесс этот по­тре­бу­ет ка­ко­го-то вре­ме­ни, в те­че­ние ко­то­ро­го со­труд­ни­ки мог­ли бы за­ни­мать­ся со­зи­да­тель­ной де­я­тель­но­стью, что опять-та­ки оказывает от­ри­ца­тель­ное воздействие на эф­фек­тив­ность биз­не­са в те­че­ние все­го пе­ри­о­да вос­ста­нов­ле­ния.

Та­ким об­ра­зом, чем боль­ше ин­тер­вал меж­ду опе­ра­ци­я­ми ре­зерв­но­го ко­пи­ро­ва­ния (RPO), тем боль­ше дан­ных при­дет­ся вос­ста­нав­ли­вать в слу­чае сбоя и тем вы­ше из­держ­ки. При­чем это мо­гут быть не про­сто ма­те­ри­аль­ные за­тра­ты. Пред­ставь­те толь­ко, что вы об­ра­ща­е­тесь к кли­ен­ту с прось­бой по­вто­рить ра­нее сде­лан­ный за­каз на мил­ли­он дол­ла­ров, по­то­му что ва­ша си­сте­ма да­ла сбой!

РЕ­ШЕ­НИЕ ОЧЕ­ВИД­НО

Раз­мыш­ляя над этой го­ло­во­лом­кой, неслож­но прий­ти к же­ла­е­мо­му вы­во­ду: не­об­хо­ди­мо со­кра­тить вре­мя, а зна­чит, и день­ги, ко­то­рые при­хо­дит­ся за­тра­чи­вать в про­цес­се вос­ста­нов­ле­ния по­сле лю­бо­го сбоя. Для это­го нуж­но: • зна­чи­тель­но умень­шить ок­но ре­зерв­но­го ко­пи­ро­ва­ния, ко­то­рое огра­ни­чи­ва­ет ча­сто­ту опе­ра­ций ко­пи­ро­ва­ния (RPO); • су­ще­ствен­но уве­ли­чить ча­сто­ту опе­ра­ций ко­пи­ро­ва­ния, что­бы как мож­но мень­ше дан­ных под­вер­га­лось рис­ку по­те­ри, по­сле ко­то­рой их при­хо­дит­ся вво­дить за­но­во; • уско­рить вы­пол­не­ние опе­ра­ций вос­ста­нов­ле­ния — как ло­каль­ных (вос­ста­нов­ле­ние опе­ра­ци­он­ной де­я­тель­но­сти), так и уда­лен­ных (по­сле­а­ва­рий­ное вос­ста­нов­ле­ние).

А для это­го на­до вы­би­рать пра­виль­ные ре­ше­ния.

Рис. 3. Как сбалансировать RPO и RTO?

Newspapers in Russian

Newspapers from Russia

© PressReader. All rights reserved.