بانکهای اطلاعاتی سندگرا

به دنبال یک راهکار جستجوی حرفه ای – الاستیک سرچ یا سلر

۰

میانگین امتیاز

امتیاز کاربران : شما هم امتیاز دهید!

امتیاز کاربران: ۴٫۶۸ ( ۲ رای)

برای بخش جستجوی اخبار سایت ریپابلیشن از سلر (solr) استفاده کرده بودیم که به دلیل عدم آشنایی حرفه ای با آن و به تبع آن پیکربندی نامناسب ، سرعت لازم را نداشت . به پیشنهاد CTO پروژه  قرار شد الاستیک سرچ  (Elastic Search) را هم به عنوان یکی دیگر از راهکارهای جستجوی متن بررسی کرده ، تست های لازم را انجام دهم و نتیجه را به ایشان اعلام کنم .

با جستجوی اولیه به این نتیجه رسیدم که این گزینه می تواند راهکار مناسبی برای ما باشد. بعضی از مزایای الاستیک سرچ که برای ما حائز اهمیت بود از قرار زیر است :

  • عدم نیاز به تعریف اولیه ساختار داده ها (Schemaless)
  • توزیع شوندگی آسان در یک شبکه
  • سادگی در نصب، مدیریت و پیکربندی
  • سرعت بالا در ساخت شاخص و پاسخگویی به جستجوها

بعد از جستجوی اولیه و بررسی شرکتهایی که از این فناوری استفاده کرده بودند (که بسیار بنده را برای استفاده از این راهکار ترغیب کرد بخصوص بعضی سایتها با سی میلیون یوزر و یا دویست میلیون داده روزانه که به راحتی با الاستیک سرچ به کاربرانشان با سرعت بالا پاسخ می دادند ) یک کد پایتون نوشتم برای ورود اخبار به این موتور جستجو که یک میلیون و چهارصد هزار خبر را با تکرار اخبار چند تا از خبرگزاریهای معروف دنیا برای ایجاد یک محیط تست واقعی وارد الاستیک سرچ لوکال  کردم و کوئری هایی که لازم داشتیم مانند جستجوی معمولی و یا پیشنهاد اخبار بر اساس خبری که کاربر در حال مشاهده آن است را نوشتم و اجرا کردم .

نتایج تست هم بسیار رضایت بخش بود . کوئری هایی که با هر ترکیب فیلتر و کوئری در بدترین حالت ۲ ثانیه و به طور معمول حدود ۲۰ میلی ثانیه برای اجرا نیاز داشت (با افزونه PostMan کروم کوئری ها را اجرا کردم). با این نتایج امیدوار کننده از سلر به الاستیک سرچ کوچ کردیم و با آخرین تستها روی سرور تست شرکت، جستجوی اخبار را به این سامانه منتقل خواهیم کرد .

برای کاربردهایی مانند پرسش و پاسخ، مقالات و مانند آن در سایتها توصیه می کنم این گزینه را که به راحتی نصب و آماده کار میشود را استفاده کنید .

برای کار عملی و یادگیری مفاهیم اصلی الاستیک سرچ (نسخه ۶) ، بر روی لینک کلیک کنید.

برچسب ها
مشاهده بیشتر

مجتبی بنائی

دانشجوی دکترای نرم‌افزار دانشگاه تهران، مدرس دانشگاه و فعال در حوزه مهندسی‌ نرم‌افزار و علم داده که تمرکز کاری خود را در چند سال اخیر بر روی مطالعه و تحقیق در حوزه کلان‌داده و تولید محتوای تخصصی و کاربردی به زبان فارسی و انتشار آنها در سایت مهندسی داده گذاشته است. مدیریت پروژه‌های نرم‌افزاری و طراحی سامانه‌های مقیاس‌پذیر اطلاعاتی از دیگر فعالیتهای صورت گرفته توسط ایشان در چند سال گذشته است.

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این سایت از اکیسمت برای کاهش هرزنامه استفاده می کند. بیاموزید که چگونه اطلاعات دیدگاه های شما پردازش می‌شوند.

دکمه بازگشت به بالا
بستن
بستن