چرا گاردین از مانگودیبی به پستگرس مهاجرت کرد ؟
در پست قبلی که راجع به مهاجرت سایت Shippable از مانگودیبی به پستگرس، نوشته شده بود، دلیل اصلی کنارگذاشتن مانگو، ساختار انعطافپذیر و بدون ساختار اسناد در آن، حجم بالای دیتابیس بخاطر افزودن ایندکسهای مختلف، ندرتاً از کار افتادن دیتابیس بدون مشخص شدن علت و زمانبری زیاد عملیات ریستارت دیتابیس به دلیل ساخت ایندکسها در ابتدای کار بیان شده بود.
در چند هفته اخیر، در خبرنامه های مختلف حوزه داده به مقاله جدیدی که سایت روزنامه معروف گاردین با عنوان «بای بای مانگو، سلام پستگرس» منتشر کرده بود، برخوردم که تصمیم گرفتم برای تکمیل مباحث، خلاصه این مقاله را هم برای علاقهمندان بازگو کنم.
روزنامه گاردین با حدود ۲٫۳ میلیون سند، درخواستهای روزانه زیادی را برای ویرایش و ثبت اخبار و نظرات و مشابه آن از سرتاسر دنیا مدیریت میکند. نرم افزار مدیریت محتوای گاردین با نام کامپوزر به خوبی با مانگو دی بی که در دیتاسنترهای داخلی روزنامه قرار داشت، کار میکرد. تا اینکه در سال ۲۰۱۵ و با رخداد گرمای بیسابقه لندن که مجبور به خاموش کردن برخی سرورهای خود شدند، تصمیم گرفتند معماری داده خود را بر مبنای رایانش ابری و استفاده از فضای ابری آمازون، تعریف کنند تا در صورت رخداد مسایلی مانند این، به سرویسهای ارائه شده توسط این روزنامه خللی وارد نشود.
برای انتقال و مدیریت کلاسترهای مانگودیبی، هر چند نرم افزار OpsManager خریداری شد، اما پشتیبانی ناکافی آن از انتقال دادهها به زیرساخت ابری آمازون، مجبور شدند کدهای زیادی را خودشان برای این منظور بنویسند. از طرفی برخی مشکلات اصلی که در حین مهاجرت به آمازون برایشان پیش آمد نه توسط OpsManager و نه حتی توسط نماینده مستقر شرکت مانگو در گاردین، حل نشد و خودشان با سعی و خطا و اینترنت و .. توانستند مشکل دسترسی به سایت و مقالات را حل کنند.
از طرفی خود نرم افزار مدیریتی کلاسترهای مانگو یعنی OpsManager عملیات مدیریتی کامل و جامعی که از آن انتظار داشتند را برآورده نمیکرد. حتی ارتقای این نرم افزار از نسخه یک به دو که باید یک عمل ساده و سرراست میبود، باعث ایجاد خطاها و مشکلات زیادی برای تیم فنی گاردین شد. قیمتهای سالیانهای که بابت تمدید اشتراک این نرم افزار باید میپرداختند، زیاد بود.
عدم وجود رمزگذاری دستورات REST در مانگودیبی (البته از نسخه ۳٫۲ مانگو در نسخه سازمانی آن این امکان اضافه شده است) هم از دیگر دلایل ایجاد نارضایتی گاردین از این دیتابیس بود.
با لحاظ تمام این موارد، در جولای سال ۲۰۱۷ تیم فنی گاردین، با بررسیهای مختلف، به سرویس Postgres on AWS RDS رسیدند که توسط آمازون ارائه میشد و عملیات انتقال به پستگرس در گاردین، شروع شد.
این عملیات بسیار زمانبر بود و گامهای گوناگونی برای تبدیل تمامی اسناد و مقالات به فرمت JSONB پستگرس، باید انجام میشد(که در مقاله فوق به طور کامل پوشش داده شده است). نهایتا بعد از دهماه کوشش مداوم و استفاده از پشته مانیتورینگ الاستیک سرچ (ELK) در اواسط سال ۲۰۱۸ این مهاجرت به پایان رسید و امروزه، زیر ساخت اطلاعاتی گاردین، بر پستگرس بنانهاده شده است.
بیان این تجربیات بیشتر برای سنجش همه مسایل در زمان انتخاب دیتابیس مناسب برای یک سیستم اطلاعاتی با حجم بالای اطلاعات است و تصمیم نهایی را حتما با مشورت با فعالین این حوزه و افراد باتجربه بگیرید.
خیلی جالب هست که یک مسائل طبیعی مثل گرمای لندن تاثیر مستقیم درمهاجرت به رایانش ابری داشته و چالش های در ادامه …
درود ممنون از نوشته ها تون علاقه مند شدم و میخوانم ، پر انرژی ادامه دهید