DELL EMCذخیره سازی و آرشیو داده هامطالب آموزشی

آموزش گام به گام: پیاده‌سازی Replication پیشرفته با Dell EMC Unity XT برای Disaster Recovery سایت به سایت

این راهنما، پیاده‌سازی گام به گام Replication همزمان و غیرهمزمان با Dell EMC Unity XT را برای بازیابی فاجعه (DR) سایت به سایت شرح می‌دهد.

 

در دنیای کسب و کار امروز، دسترسی مداوم به داده‌ها و اپلیکیشن‌ها حیاتی است. بلایای طبیعی، خطاهای انسانی یا حملات سایبری می‌توانند منجر به از دست رفتن داده‌ها و توقف عملیات شوند که خسارات مالی و اعتباری جبران‌ناپذیری به بار می‌آورند. راهکارهای بازیابی فاجعه (Disaster Recovery – DR) با استفاده از Replication (همسان‌سازی داده‌ها) بین سایت‌ها، تضمین می‌کنند که حتی در صورت بروز یک فاجعه در سایت اصلی، کسب و کار بتواند به سرعت و با حداقل اختلال به فعالیت خود ادامه دهد. Dell EMC Unity XT، به عنوان یک پلتفرم ذخیره‌سازی Unified (مجتمع) مدرن، قابلیت‌های Replication پیشرفته‌ای را هم به صورت Synchronous (همزمان) و هم Asynchronous (غیرهمزمان) ارائه می‌دهد که سازمان‌ها را قادر می‌سازد تا استراتژی DR قوی و انعطاف‌پذیری را پیاده‌سازی کنند.

هدف این آموزش: هدف از این آموزش، ارائه یک راهنمای گام به گام برای پیاده‌سازی Replication پیشرفته Synchronous/Asynchronous با Dell EMC Unity XT برای بازیابی فاجعه (DR) سایت به سایت است.


گام 1: آشنایی با مفاهیم پایه Replication و بازیابی فاجعه (DR)

مفاهیم پیش‌نیاز:

  • Disaster Recovery (DR) / بازیابی فاجعه: مجموعه‌ای از فرآیندها، سیاست‌ها و ابزارهایی که برای بازگرداندن سیستم‌ها و داده‌های حیاتی یک سازمان به حالت عملیاتی پس از یک واقعه فاجعه‌بار طراحی شده‌اند.
  • Business Continuity (BC) / تداوم کسب و کار: توانایی یک سازمان برای ادامه عملکرد در صورت بروز یک فاجعه. DR بخشی از BC است.
  • RPO (Recovery Point Objective): حداکثر میزان از دست رفتن داده‌ها که یک کسب و کار می‌تواند تحمل کند (مثلاً 5 دقیقه داده از دست رفته). RPO پایین به معنای از دست رفتن داده کمتر است.
  • RTO (Recovery Time Objective): حداکثر زمان مجاز برای بازگرداندن یک سیستم یا اپلیکیشن به حالت عملیاتی پس از یک فاجعه. RTO پایین به معنای زمان توقف کمتر است.
  • Replication (همسان‌سازی/تکرار داده‌ها): فرآیند کپی کردن داده‌ها از یک مکان (سایت اصلی) به مکان دیگر (سایت DR) برای حفظ دسترسی به داده‌ها در صورت خرابی.
  • Source Array (آرایه منبع): آرایه ذخیره‌سازی در سایت اصلی که داده‌ها از آن کپی می‌شوند.
  • Destination Array (آرایه مقصد): آرایه ذخیره‌سازی در سایت DR که داده‌ها در آن کپی می‌شوند.
  • LUN (Logical Unit Number) / Volume: یک فضای ذخیره‌سازی منطقی که به سرورها ارائه می‌شود.

توضیح گام 1: درک نیاز به Replication و تفاوت‌های Synchronous/Asynchronous

در استراتژی DR، Replication نقش محوری دارد. بدون Replication، بازیابی داده‌ها پس از یک فاجعه بسیار دشوار یا غیرممکن خواهد بود. بسته به نیاز RPO و RTO اپلیکیشن‌ها و هزینه‌های مرتبط، دو نوع اصلی Replication وجود دارد:

  1. Synchronous Replication (همسان‌سازی همزمان):
    • نحوه عملکرد: داده‌ها در سایت اصلی نوشته می‌شوند و تا زمانی که تأیید نشود که همان داده‌ها با موفقیت در سایت DR نیز نوشته شده‌اند، عملیات نوشتن در سایت اصلی کامل نمی‌شود.
    • مزایا: RPO = 0 (صفر داده از دست رفته). بالاترین سطح محافظت از داده.
    • معایب:
      • افزایش Latency (تأخیر): هر عملیات نوشتن باید منتظر تأیید از سایت DR باشد، که بر عملکرد اپلیکیشن‌ها تأثیر می‌گذارد.
      • محدودیت فاصله: به دلیل Latency، معمولاً برای سایت‌های DR که فاصله جغرافیایی کمی دارند (کمتر از 100-200 کیلومتر) و ارتباط شبکه با تأخیر بسیار پایین (کمتر از 5-10 میلی‌ثانیه RTT) مناسب است.
      • پهنای باند بالا: نیاز به پهنای باند شبکه پایدار و بالا.
    • موارد استفاده: Workloadهای Mission-Critical مانند دیتابیس‌های OLTP که به هیچ عنوان نباید داده از دست بدهند.
  2. Asynchronous Replication (همسان‌سازی غیرهمزمان):
    • نحوه عملکرد: داده‌ها ابتدا در سایت اصلی نوشته می‌شوند و بلافاصله تأیید می‌شوند. سپس، داده‌ها به صورت دوره‌ای (با یک تأخیر مشخص) به سایت DR ارسال می‌شوند.
    • مزایا:
      • کاهش Latency: تأثیری بر عملکرد سایت اصلی ندارد، زیرا عملیات نوشتن محلی بلافاصله تأیید می‌شود.
      • انعطاف‌پذیری فاصله: مناسب برای سایت‌های DR که فاصله جغرافیایی زیادی دارند.
      • پهنای باند کمتر: نیاز به پهنای باند شبکه کمتر نسبت به Synchronous.
    • معایب: RPO > 0 (داده از دست رفته). در صورت وقوع فاجعه در سایت اصلی بین دو دوره Replication، ممکن است مقداری داده از دست برود (برابر با آخرین فاصله Replication).
    • موارد استفاده: اکثر Workloadها (فایل سرورها، ماشین‌های مجازی، دیتابیس‌های غیر Mission-Critical) که می‌توانند مقداری از دست رفتن داده را تحمل کنند.

چالش: انتخاب نوع Replication مناسب (Synchronous یا Asynchronous) بر اساس RPO و RTO مورد نیاز هر اپلیکیشن، و همچنین بررسی محدودیت‌های شبکه (Latency و پهنای باند) بین سایت‌ها.


گام 2: بررسی معماری Dell EMC Unity XT برای Replication

مفاهیم پیش‌نیاز:

  • Unity XT Arrays: آرایه‌های ذخیره‌سازی Dell EMC Unity XT که شامل دو کنترلر (Active/Active) و درایوهای ذخیره‌سازی هستند.
  • Storage Pools: مجموعه‌ای از درایوهای فیزیکی که برای ایجاد LUNها و File Systemها استفاده می‌شوند.
  • Management Interface (Unisphere): رابط کاربری تحت وب Dell EMC Unity XT برای مدیریت و پیکربندی آرایه.
  • Replication Session: یک ارتباط منطقی بین Source LUN/File System و Destination LUN/File System.
  • Replication Link: ارتباط شبکه فیزیکی و منطقی بین دو آرایه Unity XT برای انتقال داده‌های Replication.

توضیح گام 2: اجزای Unity XT و نقش آن‌ها در Replication

Dell EMC Unity XT با طراحی یکپارچه خود، فرآیند Replication را ساده می‌کند. هر آرایه Unity XT از دو کنترلر استفاده می‌کند که به صورت Active/Active برای ارائه داده و مدیریت Failover عمل می‌کنند.

نحوه عملکرد Replication در Unity XT:

  1. Global Replication (سیستم Replication سراسری): قابلیت Replication در Unity XT در سطح Global و برای کل آرایه فعال می‌شود. شما باید یک “Replication Interface” روی هر آرایه در هر دو سایت (اصلی و DR) پیکربندی کنید. این رابط‌ها از طریق یک شبکه اختصاصی (یا VLAN) به یکدیگر متصل می‌شوند.
  2. Replication Sessionها: برای هر LUN یا File Systemی که می‌خواهید Replication کنید، یک “Replication Session” ایجاد می‌کنید. این Session شامل موارد زیر است:
    • Source Object: LUN یا File System در سایت اصلی.
    • Destination Object: LUN یا File System (یا Snapshots/clones در برخی سناریوها) در سایت DR.
    • Replication Type: Synchronous یا Asynchronous.
    • RPO Goal (برای Asynchronous): تنظیم فاصله زمانی برای Replication (مثلاً 5 دقیقه، 1 ساعت).
  3. تکنولوژی انتقال داده: Unity XT از پروتکل‌های شبکه استاندارد (مانند iSCSI یا Fibre Channel برای داده‌های Block و NFS/SMB برای File) برای انتقال داده‌های Replication استفاده می‌کند. در واقع، خود Unity XT از یک پروتکل اختصاصی برای انتقال داده‌های Replication بین دو آرایه استفاده می‌کند که بر روی IP (اترنت) یا Fibre Channel (با استفاده از RPQ یا Remote Protocol Queue) سوار می‌شود. (معمولاً Ethernet توصیه می‌شود).

چالش: اطمینان از وجود دو آرایه Unity XT (یا حداقل یک آرایه در سایت اصلی و یک آرایه در سایت DR) و وجود لایسنس Replication فعال روی هر دو آرایه. همچنین، طراحی صحیح شبکه برای لینک Replication.


گام 3: پیش‌نیازها و آماده‌سازی شبکه بین سایت‌ها

مفاهیم پیش‌نیاز:

  • WAN (Wide Area Network): شبکه گسترده‌ای که دو سایت جغرافیایی را به هم متصل می‌کند.
  • Latency (تأخیر): زمان رفت و برگشت (RTT) بین دو سایت.
  • Bandwidth (پهنای باند): ظرفیت انتقال داده در شبکه WAN.
  • Dedicated Network Link: یک لینک شبکه اختصاصی (یا VLAN مجزا) برای ترافیک Replication.
  • Firewall Rules: قوانینی که در فایروال‌های بین سایت‌ها برای اجازه عبور ترافیک Replication لازم است.

توضیح گام 3: الزامات شبکه برای Replication

پیکربندی صحیح شبکه بین سایت‌ها، مهمترین عامل برای موفقیت و عملکرد Replication است:

  1. بررسی Latency:
    • Synchronous Replication: نیاز به Latency بسیار پایین (معمولاً کمتر از 5-10 میلی‌ثانیه Round-Trip Time – RTT). هر چه Latency کمتر باشد، عملکرد اپلیکیشن‌ها بهتر است.
    • Asynchronous Replication: تحمل Latency بالاتر را دارد، اما Latency بالا می‌تواند بر RPO تأثیر بگذارد (زیرا ارسال داده‌ها زمان بیشتری می‌برد).
    • از ابزارهایی مانند ping برای اندازه‌گیری RTT بین آدرس‌های IP رابط‌های Replication در هر دو سایت استفاده کنید.
  2. بررسی پهنای باند:
    • Synchronous Replication: نیاز به پهنای باند بسیار بالا برای تضمین عدم وجود گلوگاه در انتقال داده‌ها. پهنای باند باید حداقل با حداکثر توان عملیاتی نوشتن Workload اصلی (Peak Write IOPS * Avg Block Size) مطابقت داشته باشد.
    • Asynchronous Replication: نیاز به پهنای باند کافی برای انتقال تغییرات داده در بازه RPO. (اگر RPO 15 دقیقه است، باید بتوانید تمام تغییرات 15 دقیقه را در آن بازه زمانی منتقل کنید).
    • بهینه‌سازی WAN (مانند WAN Optimization appliances) می‌تواند به کاهش پهنای باند مورد نیاز و بهبود عملکرد Asynchronous Replication کمک کند.
  3. پیکربندی فایروال:
    • پورت‌های مورد نیاز برای ارتباط Replication بین دو آرایه Unity XT باید در فایروال‌های بین سایت‌ها باز باشند. Dell EMC لیستی از پورت‌های TCP و UDP مورد نیاز (معمولاً پورت‌های مدیریتی و پورت‌های داده داخلی Dell EMC) را ارائه می‌دهد.
  4. IP Addressing:
    • یک Subnet و VLAN اختصاصی برای Replication Link در هر دو سایت و Router/Gateway مربوط به آن برنامه‌ریزی کنید. این به جداسازی ترافیک Replication از ترافیک عمومی شبکه کمک می‌کند.

چallenge: Latency و پهنای باند ناکافی شبکه از رایج‌ترین دلایل شکست یا عملکرد ضعیف Replication هستند. سرمایه‌گذاری مناسب در زیرساخت شبکه بین سایت‌ها حیاتی است.


گام 4: پیکربندی آرایه‌های Dell EMC Unity XT برای Replication

مفاهیم پیش‌نیاز:

  • System > Replication (در Unisphere): بخش اصلی پیکربندی Replication در رابط کاربری Unisphere.
  • Remote System: تعریف آرایه Unity XT در سایت DR به عنوان یک سیستم راه دور.
  • Replication Interface: رابط شبکه (پورت اترنت) روی هر کنترلر Unity XT که برای Replication استفاده می‌شود.
  • Replication Licensing: اطمینان از نصب لایسنس Replication روی هر دو آرایه.

توضیح گام 4: راه‌اندازی لینک Replication و تعریف سیستم راه دور

  1. بررسی لایسنس Replication:
    • در Unisphere هر دو آرایه (سایت اصلی و DR)، به بخش System > Software > Licenses بروید و اطمینان حاصل کنید که لایسنس “Remote Protection” یا “Replication” نصب شده است.
  2. پیکربندی Replication Interface:
    • در Unisphere هر دو آرایه، به Settings > Network > Replication Interfaces بروید.
    • یک پورت اترنت (معمولاً 10GbE یا 25GbE) را به عنوان Replication Interface انتخاب کنید و برای آن آدرس IP اختصاص دهید. این آدرس IP باید در Subnet Replication Link شما قرار داشته باشد.
    • (توصیه می‌شود برای افزونگی از دو Replication Interface در هر کنترلر استفاده کنید.)
  3. تعریف Remote System:
    • در Unisphere سایت اصلی، به System > Replication > Remote Systems بروید.
    • گزینه “Add” را انتخاب کنید و آدرس IP یکی از Replication Interfaceهای آرایه Unity XT در سایت DR را وارد کنید.
    • اعتبارسنجی اتصال انجام می‌شود و پس از آن، آرایه DR به عنوان یک Remote System به سایت اصلی اضافه می‌شود.
    • این فرآیند را به صورت مشابه در Unisphere سایت DR نیز انجام دهید تا آرایه اصلی را به عنوان Remote System خود تعریف کنید. (اتصال دو طرفه نیاز است).

چالش: اطمینان از ارتباط شبکه بدون مشکل بین Replication Interfaceها و تعریف صحیح Remote System. عدم موفقیت در این مرحله به معنای عدم امکان ایجاد Sessionهای Replication است.


گام 5: ایجاد Replication Sessionها (Synchronous و Asynchronous)

مفاهیم پیش‌نیاز:

  • Synchronous Replication Session: یک Session Replication از نوع همزمان.
  • Asynchronous Replication Session: یک Session Replication از نوع غیرهمزمان.
  • RPO Goal (برای Asynchronous): هدفی برای حداکثر از دست رفتن داده‌ها در یک Session Asynchronous.
  • Consistency Group (گروه سازگاری): گروه‌بندی چندین LUN با هم برای Replication همزمان تا تضمین شود که تمامی داده‌ها در یک نقطه زمانی سازگار (Consistent) باشند. حیاتی برای دیتابیس‌ها و اپلیکیشن‌هایی که از چندین Volume استفاده می‌کنند.

توضیح گام 5: پیکربندی LUN/File System برای Replication

حالا که لینک Replication برقرار است، می‌توانید Sessionهای Replication را برای Workloadهای خود ایجاد کنید:

  1. انتخاب LUN یا File System:
    • در Unisphere سایت اصلی، به Storage > Block (برای LUNها) یا File (برای File Systemها) بروید.
    • LUN یا File System مورد نظر خود را انتخاب کنید.
  2. شروع فرآیند Replication:
    • روی LUN/File System کلیک راست کرده و “Protect” > “Replicate” را انتخاب کنید.
    • Wizard Replication باز می‌شود.
  3. انتخاب Remote System:
    • Remote System (آرایه DR) را که در گام قبل تعریف کردید، انتخاب کنید.
  4. تعیین نوع Replication (Synchronous/Asynchronous):
    • برای Synchronous: گزینه “Synchronous” را انتخاب کنید. نیازی به تنظیم RPO نیست، زیرا RPO=0 است.
    • برای Asynchronous: گزینه “Asynchronous” را انتخاب کنید و سپس “RPO Goal” مورد نظر خود را (مثلاً 5 دقیقه، 1 ساعت) تنظیم کنید. Unity XT سعی می‌کند این هدف را برآورده کند.
  5. انتخاب Destination Object:
    • می‌توانید یک LUN/File System موجود در سایت DR را به عنوان مقصد انتخاب کنید یا یک مقصد جدید ایجاد کنید (Unity XT معمولاً پیشنهاد ایجاد یک Destination جدید را می‌دهد).
  6. پیکربندی Consistency Group (برای Block – LUNها):
    • اگر چندین LUN برای یک اپلیکیشن خاص نیاز به Consistency دارند (مثلاً Log و Data Files یک دیتابیس)، آن‌ها را در یک Consistency Group قرار دهید.
    • هنگام ایجاد Replication Session برای اولین LUN در گروه، می‌توانید گزینه “Add to new Consistency Group” را انتخاب کنید. LUNهای بعدی را به همان Consistency Group اضافه کنید.
  7. تأیید و شروع Replication:
    • تنظیمات را بازبینی کنید و “Finish” را کلیک کنید.
    • اولین Replication (Initial Synchronization) شروع می‌شود که می‌تواند زمان‌بر باشد، به خصوص برای LUNهای بزرگ.

چالش: انتخاب نادرست نوع Replication و RPO، یا عدم استفاده از Consistency Group برای اپلیکیشن‌های وابسته به چندین LUN، می‌تواند منجر به از دست رفتن داده یا ناهماهنگی در زمان فاجعه شود.


گام 6: تست Failover و Failback و نظارت

مفاهیم پیش‌نیاز:

  • Failover: فرآیند جابجایی Workloadها از سایت اصلی به سایت DR در صورت بروز فاجعه.
  • Failback: فرآیند بازگرداندن Workloadها از سایت DR به سایت اصلی پس از رفع مشکل.
  • Test Failover: یک Failover شبیه‌سازی شده برای تست برنامه DR بدون تأثیرگذاری بر تولید در سایت اصلی.
  • Managed Failover: یک Failover کنترل شده و برنامه‌ریزی شده (مثلاً برای نگهداری).
  • Unplanned Failover: یک Failover اضطراری در صورت بروز فاجعه واقعی.
  • Monitoring Tools (ابزارهای نظارتی): ابزارهایی برای پایش وضعیت Replication Sessionها و عملکرد سیستم.

توضیح گام 6: اطمینان از آمادگی DR

پیاده‌سازی Replication تنها نیمی از کار است. تست و نظارت مداوم برای اطمینان از عملکرد صحیح DR ضروری است:

  1. نظارت بر Replication Sessionها:
    • در Unisphere (هم در سایت اصلی و هم در سایت DR)، به System > Replication > Replication Sessions بروید.
    • وضعیت هر Session (Synchronized, Synchronizing, Degraded) و RPO Actual (برای Asynchronous) را بررسی کنید.
    • اگر RPO Actual از RPO Goal شما تجاوز می‌کند، ممکن است مشکل شبکه یا عملکرد در سایت اصلی/DR وجود داشته باشد.
  2. اجرای Test Failover (توصیه شده و حیاتی):
    • به صورت دوره‌ای (مثلاً هر 6 ماه یکبار) یک Test Failover انجام دهید.
    • این فرآیند به شما امکان می‌دهد تا برنامه DR خود را بدون قطع کردن تولید در سایت اصلی، آزمایش کنید.
    • در Unisphere روی یک Session Replication کلیک راست کرده و گزینه “Test Failover” را انتخاب کنید. این کار یک کپی از LUN/File System در سایت DR ایجاد می‌کند که می‌توانید آن را به سرورهای تست خود Mount کنید.
    • پس از اتمام تست، می‌توانید “End Test Failover” را اجرا کنید.
  3. فرآیند Failover (Planned/Unplanned):
    • Planned Failover: برای نگهداری یا جابجایی برنامه‌ریزی شده Workloadها. ابتدا Workloadها را در سایت اصلی خاموش کنید، سپس از Unisphere گزینه “Failover” را اجرا کنید.
    • Unplanned Failover: در صورت بروز فاجعه واقعی. Workloadها در سایت DR را روشن کرده و از Unisphere گزینه “Failover” را اجرا کنید.
    • (توجه: برای Workloadهایی که از Consistency Group استفاده می‌کنند، Failover باید در سطح گروه انجام شود.)
  4. فرآیند Failback:
    • پس از رفع مشکل در سایت اصلی و زمانی که آماده بازگشت Workloadها هستید، از Unisphere گزینه “Failback” را اجرا کنید. این کار تغییرات از سایت DR را به سایت اصلی همسان‌سازی می‌کند و سپس کنترل را به سایت اصلی بازمی‌گرداند.
  5. تنظیم هشدارها (Alerts):
    • هشدارهایی را در Unisphere برای وضعیت Replication (مانند قطع شدن Replication Link، افزایش RPO) پیکربندی کنید تا در صورت بروز مشکل فوراً مطلع شوید.

چالش: پیچیدگی فرآیندهای Failover و Failback، به ویژه در سناریوهای Unplanned. عدم انجام تست‌های دوره‌ای DR می‌تواند منجر به شکست بازیابی در زمان فاجعه واقعی شود.


نتیجه‌گیری

پیاده‌سازی Replication پیشرفته Synchronous و Asynchronous با Dell EMC Unity XT یک استراتژی قدرتمند برای بازیابی فاجعه سایت به سایت است. با انتخاب نوع Replication مناسب برای هر Workload بر اساس RPO/RTO، پیکربندی صحیح شبکه، و نظارت و تست مداوم، می‌توانید از تداوم کسب و کار خود در برابر طیف وسیعی از بلایا محافظت کنید. Unity XT با ارائه یک پلتفرم یکپارچه و قابلیت‌های مدیریتی آسان، فرآیند پیاده‌سازی DR را برای سازمان‌ها تسهیل می‌کند.

مشاهده بیشتر

تحریریه تکنوویا

تحریریه تکنوویا متشکل از گروهی متخصص و با تجربه در حوزه تجهیزات زیرساخت شبکه و فروش است که با تحقیق دقیق و بررسی اخبار و محصولات، مطالب فنی و کاربردی متناسب با نیاز بازار را تهیه و منتشر می‌کند. این تیم با تمرکز بر ارائه اطلاعات صحیح و به‌روز، نقش مهمی در ارتقای دانش فناوری کاربران ایفا می‌کند.
دکمه بازگشت به بالا

Notice: ob_end_flush(): Failed to send buffer of zlib output compression (1) in /home/hitechla/public_html/wp-includes/functions.php on line 5481

Notice: ob_end_flush(): Failed to send buffer of zlib output compression (1) in /home/hitechla/public_html/wp-includes/functions.php on line 5481