امکان مشاهده نسخههای AMI و اعمال خودکار بهروزرسانیهای امنیتی در Amazon SageMaker HyperPod فراهم شد
Amazon SageMaker HyperPod، زیرساختی تخصصی برای آموزش و استقرار مدلهای پایه در مقیاس بزرگ، اخیراً قابلیتهای جدیدی را ارائه کرده است که به مدیران خوشهها امکان میدهد نسخههای Amazon Machine Image (AMI) را در سراسر خوشههای خود مشاهده کنند و بهروزرسانیهای امنیتی را به صورت خودکار و بدون ایجاد اختلال در بار کاری اعمال نمایند. این ویژگیها به منظور افزایش امنیت و ثبات خوشهها و کاهش بار عملیاتی ناشی از بهروزرسانیهای دستی توسعه یافتهاند.
پیش از این، مدیران خوشهها دید محدودی نسبت به نسخههای AMI در حال اجرا داشتند که تشخیص انحراف نسخهها را دشوار میکرد و فرآیند بهروزرسانی امنیتی به صورت دستی و واکنشی انجام میشد. این موضوع به ویژه در آموزشهای طولانیمدت چند روزه مشکلساز بود، زیرا بهروزرسانیهای دستی میتوانستند باعث تغییرات ناخواسته در نرمافزارهای بستهبندی شده در AMI مانند درایورهای NVIDIA یا CUDA شوند. با معرفی قابلیتهای جدید، این مشکلات تا حد زیادی برطرف شدهاند.
قابلیت نسخهبندی AMI به مدیران اجازه میدهد تا نسخه دقیق AMI را در هر گروه نمونه و گره با فرمت نسخهبندی معنایی (major.minor.patch) مشاهده کنند. این امکان به سرعت تشخیص انحراف نسخهها را فراهم میکند و در صورت نیاز میتوان به نسخه قبلی بازگشت، که شامل نسخههای قبلی درایور NVIDIA، CUDA و سایر اجزای نرمافزاری است. این فرآیند از طریق API بهروزرسانی نرمافزار خوشه (UpdateClusterSoftware) قابل انجام است.
از سوی دیگر، قابلیت بهروزرسانی خودکار (auto-patching) به صورت اختیاری و برای هر گروه نمونه فعال میشود و تنها بهروزرسانیهای امنیتی سازگار با نسخههای قبلی را زمانی که گرهها در حالت بیکار هستند اعمال میکند. این روش تضمین میکند که بارهای کاری در حال اجرا دچار اختلال نشوند و بستههای حیاتی هوش مصنوعی و یادگیری ماشین مانند درایور NVIDIA، نسخه CUDA و هستههای سیستم عامل به نسخههای اصلی یا فرعی متفاوت ارتقا نیابند. فعالسازی این قابلیت از طریق APIهای ایجاد خوشه (CreateCluster) یا بهروزرسانی خوشه (UpdateCluster) امکانپذیر است.
علاوه بر این، سیاست جدید پشتیبانی AMI زمانبندیهای پشتیبانی برای نسخههای مختلف AMI را منتشر میکند که پس از پایان این دورهها، HyperPod دیگر بهروزرسانیهای امنیتی را برای آن نسخهها ارائه نمیدهد. این سیاست به مدیران کمک میکند تا برنامهریزی بهتری برای بهروزرسانی خوشههای خود داشته باشند و از امنیت سیستم اطمینان حاصل کنند.
این قابلیتها برای خوشههای HyperPod که توسط Amazon EKS مدیریت میشوند در تمامی مناطق AWS که SageMaker HyperPod پشتیبانی میشود، در دسترس هستند. این پیشرفتها نشاندهنده تعهد AWS به بهبود امنیت، قابلیت مشاهده و مدیریت آسانتر زیرساختهای یادگیری ماشین در مقیاس بزرگ است.
در نهایت، این ویژگیها میتوانند به کاهش خطرات امنیتی، بهبود ثبات سیستم و کاهش بار کاری مدیران خوشهها کمک کنند و روند بهروزرسانی و نگهداری خوشههای SageMaker HyperPod را به شکل قابل توجهی بهینه سازند.