الاستیک سرچ چیست و چه کاربردی دارد؟ چرا باید از Elasticsearch استفاده کنیم؟ در این مطلب از بلاگ ابر زس به این سوال پاسخ میدهیم و به مزایا و معایب الاستیک سرچ اشاره میکنیم.
با رشد و توسعه دنیا فناوری، هر روز حجم زیادی از دادهها تولید میشوند. انواع این دادهها به صورت متنی، عددی، ساختاری و یا بدون ساختار هستند. افراد برای درک این اطلاعات به ابزارهای تحلیلی نیار دارند، اینجاست که الاستیک سرچ وارد میشود.
Elasticsearch چیست؟
الاستیک سرچ یک موتور جستوجو، تحلیلگر دیتابیس، یک نوع ابزار ایندکس و راهکاری برای مدیریت کلانداده است که سرعت بلایی دارد و مقیاسپذیر است. بسته به اینکه تا چه میزان با این تکنولوژی آشنایی داشته باشید، این تعاریف میتواند شما را با Elasticsearch آشناتر کند یا حتی از نظرتان گیجکننده باشد. اما شاید برایتان سوال باشد که به زبان سادهتر، الاستیک سرچ چیست؟
Elasticsearch یک سیستم جستجو و تجزیهوتحلیل منبعباز بوده که روی آپاچی لوسن طراحی شده است. این سیستم جستجو در جاوا توسعهیافته و از زبانهای مختلف ازجمله PHP ،Python ،C و Ruby پشتیبانی میکند. به همین دلیل روی سیستمعاملهای مختلف اجرا میشود و میتواند حجم زیادی از دادهها را در کوتاهترین زمان ممکن جستجو و تجزیه و تحلیل کند.
الاستیک سرچ از ساختاری مبتنی بر اسناد بهجای جداول و الگوها استفاده میکند و دارای API REST گستردهای برای ذخیره و جستجوی دادهها است. میتوانید الاستیک سرچ را بهعنوان سروری در نظر بگیرید که قادر است درخواستهای JSON را پردازش کند و دادههای JSON را به شما برگرداند.
Elasticsearch چگونه کار میکند؟
در این قسمت از مقاله الاستیک سرچ چیست میخواهیم به بررسی نحوه عملکرد آن بپردازیم. الاستیک سرچ دادهها را در اسناد (documents) سازماندهی میکند. اسناد، شامل دادههایی تحت فرمت JSON هستند و تحت فایلهای JSON، موجودیتها (entities) نگهداری میشوند. اسناد، بر اساس مشخصاتشان به صورت فهرستهایی (indices) دستهبندی میشوند. الاستیک سرچ برای جستجوی کارآمد، از شاخصهای معکوس استفاده میکند که ساختارهایی از داده هستند که مکان کلمات در هر سند را مشخص میکنند.
معماری توزیعشده الاستیک سرچ، این ابزار را قادر میسازد که جستجوها را سریع انجام دهد و برای تحلیل حجم عظیمی از دادهها، کارایی بالا و تقریبا بلادرنگی داشته باشد. الاستیک سرچ علاوه بر این که امکان رپلیکیشن (ایجاد کپیهایی از دادهها برای اطمینان بالاتر) را فراهم میکند به صورت مقیاسپذیری طراحی شده است. به این ترتیب با افزایش بار کاری، میتوان میزان منابع سرورها را افزایش داد. برای اینکه بهتر درک کنیم که Elasticsearch چیست، در ادامه به مفاهیم اساسی آن میپردازیم.
درک مفاهیم اساسی Elasticsearch
در این بخش از مقاله Elasticsearch چیست، بیایید نگاهی به مفاهیم اساسی داشته باشیم تا بیشتر با معماری آن آشنا شویم.
JVM
همانطور که در قسمت الاستیک سرچ چیست توضیح دادیم، این سیستم جستوجو به زبان جاوا نوشته شده است و از ماشین مجازی جاوا (JVM) استفاده میکند. JVM یک موتور اجرا است که بایت کد را در بسیاری از پلتفرمهای سیستمعامل اجرا میکند.
اسناد
سند، واحد اصلی و اساسی موجودیت اطلاعات در الاستیک سرچ است و در قالب JSON (مخفف JavaScript Object Notation) نمایش داده میشود. اسناد را میتوان ذخیره و ایندکس کرد. یک ایندکس دارای یک یا چند سند و یک سند دارای یک یا چند فیلد است. جستجو فقط در بین فیلدهای ایندکس شده امکانپذیر است و بازیابی محتوای اصلی فیلد فقط در فیلدهایی که بهعنوان stored در Mapping تعریف شدهاند امکانپذیر است.
فهرست (Indice)
Indice یا شاخصها، به مفهوم فهرست یا ایندکسها هستند. ایندکس به مجموعهای از اسناد گفته میشود که دارای ساختار و ویژگی مشابهی هستند و برای ذخیره و خواندن اسناد از آن استفاده میشود. در واقع ایندکس معادل یک پایگاهداده در RDBMS (سیستم مدیریت پایگاهداده رابطهای) است. هر Index با یک نام منحصربهفرد شناسایی میشود که تمامی حروف آن کوچک است و زمانی که عمل جستجو، بهروزرسانی یا حذف را انجام میدهید از آن استفاده میکنید.
استفاده از ایندکس معکوس بسیار شبیه جستجوی صفحه کتابی است که حاوی یک کلمه کلیدی خاص است و بهجای اسکن صفحات از ابتدا تا انتها، باید فهرست کلمات کلیدی درج شده در انتهای کتاب را اسکن کنید. این ایندکس معکوس، Elasticsearch را قادر میسازد تا دادهها را بهسرعت و کارآمد بازیابی کند.
شارد (Shard)
شارد در الاستیک سرچ چیست و چه کاربردی دارد؟ shard کوچکترین موجودیت در الاستیک سرچ است. Elasticsearch قابلیتی را فراهم میکند که با کمک آن ایندکسها به اجزای کوچکتری به نام شارد تقسیم میشوند. هر شارد یک ایندکس مستقل و با کارایی کامل است که میتواند در هر نود داخل هر کلاستر، میزبانی شود. در الاستیک سرچ دو نوع shard وجود دارد:
- primary shards: شاردهای واقعی که دادهها را نگه میدارند.
- replica shards: از شاردهای اصلی کپی شدهاند.
گره (Node)
گره یک سرور است که جزئی از یک کلاستر محسوب میشود. یک نود، دادهها را ذخیره کرده و در فرایند فهرستبندی و جستجوی کلاستر مشارکت میکند.
نودهای الاستیک سرچ میتوانند به ۳ روش مختلف پیکربندی شوند:
- نود مَستر: که کلاستر الاستیک سرچ را کنترل میکند و مسئولیت تمامی قابلیتهای کلاستر از جمله ایجاد یا حذف یک ایندکس و نیز افزودن یا حذف نودها را به عهده دارد.
- نود دیتا: دادهها را نگهداری کرده و عملیاتی مرتبط با داده از جمله جستجو و ترکیب آنها را انجام میدهد.
- نود کلاینت: درخواستهای کلاستر را به سمت نود مستر ارسال میکند و علاوه بر این درخواستهای مرتبط با دیتا را به نودهای دیتا میفرستد.
خوشه یا کلاستر (Cluster)
یک کلاستر از یک یا چند گره تشکیل میشود که به هم متصل شدهاند. قابلیتهایی که به یک کلاستر Elasticsearch قدرت میبخشند، شامل توزیع تسکها، جستجو و ایندکس شدن در تمامی نودهای یک کلاستر هستند.
رپلیکا (Replica)
سوالی که ممکن است برای خیلی از کاربران ایجاد شود این است که رپلیکا در الاستیک سرچ چیست؟ رپلیکا مکانیسمی است که Elasticsearch برای رسیدگی به خرابیهایی مانند آفلاین شدن گره بدون ازدستدادن دادهها استفاده میکند. علاوه بر این، رپلیکاها کمک میکنند ظرفیت سرویسدهی برای جستجو یا بازیابی یک سند، افزایش یابد.
به زبان سادهتر باید اینگونه توضیح داد که هر سند در هر ایندکس، متعلق به یک شارد اصلی است. رپلیکا، یک کپی از شارد اصلی محسوب میشود که میتواند مشابه شارد اصلی برای جستجو مورد استفاده قرار گیرد یا هنگامی که شارد اصلی با مشکل مواجه شد، جای آن را بگیرد.
بخشها (Segments)
مفهوم سگمنت در Elasticsearch یک مفهوم در سطح لوسن است که نشاندهنده تکههای یک شارد هستند. هر ایندکس لوسن حاوی یک یا چند Segments است. الاستیک سرچ گزینههایی را برای مدیریت اندازههای سگمنت و نحوه پیکربندی ارائه میکند که بر عملکرد ایندکس سازی تأثیر خواهد گذاشت.
مزایای الاستیک سرچ چیست؟
اکنون که با این موضوع آشنا شدیم که الاستیک سرچ چیست، در این بخش به بررسی مزایا و اهمیت استفاده از آن میپردازیم. در مقایسه با بیشتر پایگاههای داده NoSQL، این فناوری بیشتر روی قابلیتهای جستجو تمرکز دارد و مجهز به یک API قدرتمند HTTP RESTful است. این قابلیت به شما کمک میکند تا حجم زیادی از دادهها را در زمان کوتاهی جستجو و آنالیز کنید. مهمترین مزایای استفاده از الاستیک سرچ عبارتاند از:
عملکرد بالا
ماهیت توزیعشده Elasticsearch آن را قادر میسازد تا حجم زیادی از دادهها را بهصورت موازی پردازش کند و بهسرعت بهترین پاسخ را برای درخواستهای شما پیدا کند. در واقع الاستیک سرچ دادهها را بهصورت همزمان با Shard و Replica در چندین نود یا گره پردازش میکند. این امر باعث افزایش عملکرد و بازیابی اطلاعات میشود. همچنین پردازش موازی نودها به استفاده موثر از حافظه کمک میکند.
موتور جستجوی متن کامل
سیستمهای مدیریت پایگاهداده SQL سنتی، برای جستجوی متن کامل در بین حجم زیادی از دادهها طراحی نشدهاند. ازآنجاییکه Elasticsearch روی Lucene ساخته شده است، یکی از قدرتمندترین قابلیتهای جستجوی متن کامل را ارائه میدهد و با استفاده از آن میتوانید انواع جستجوها از ساختاریافته تا بدون ساختار و از جغرافیایی تا متریک را انجام دهید و ترکیب کنید.
ابزارها و پلاگینها
الاستیک سرچ با کیبانا به یک ابزار تجسم و گزارش محبوب و یکپارچه تبدیل شدهاند. همچنین ادغام با Beats و Logstash را ارائه میدهد و به شما کمک میکند تا دادههای منبع را بهراحتی تبدیل کرده و آنها را در کلاستر Elasticsearch خود بارگذاری کنید.
جهت مطالعه بیشتر اینجا بخوانید: عملیات نزدیک به ریل تایم عملیات خواندن یا نوشتن دادهها در Elasticsearch، معمولاً کمتر از یک ثانیه طول میکشد. این امر به شما امکان میدهد از این سیستم جستجو برای مواردی مانند نظارت بر برنامه و تشخیص ناهنجاری استفاده کنید. مقیاسپذیری از ویژگیهای مهم الاستیک سرچ، مقیاسپذیری است. معماری Elasticsearch این امکان را فراهم میکند تا با افزایش حجم دادهها، همچنان عملکرد با کیفیت خود را حفظ کند. الاستیک سرچ همچنین میتواند دادهها را به طور خودکار تکرار کند تا در صورت خرابی گره، از نابود شدن آنها جلوگیری کند. سازگار با بسیاری از زبانها الاستیک سرچ دارای کتابخانه برای بسیاری از زبانهای برنامهنویسی مانند جاوا، جاوا اسکریپت، PHP، روبی، پایتون، #C و… است. دردسترسبودن این کتابخانهها، ادغام با Elasticsearch را برای برنامهنویسان بسیار آسان میکند. جامعه کاربران گسترده در انجمن کاربران میتوانید تقریبا برای هر سوال خود، پاسخی پیدا کنید یا حتی سوالات جدید خود را بپرسید تا یک کاربر مشتاق، پاسخی به شما دهد. استفاده از API یکی از دلایل اصلی افزایش محبوبیت الاستیک سرچ، API آن است که با اسناد آموزشی متعددی نیز همراه شده است. دردسترسبودن API، این امکان را برای توسعهدهندگان فراهم میکند تا با آن یکپارچه شوند. تقریباً هر ارسالکننده گزارش یا کتابخانه ثبت گزارش، دارای ابزارهایی برای ارسال داده به Elasticsearch است. علاوه بر ابزارهای مختلفی که میتوانند دادهها را از طریق API به الاستیک سرچ وارد کنند، ابزارهایی مانند کیبانا و گرافانا نیز وجود دارند که هدف آنها کاوش، تجزیهوتحلیل و نمایش دادههای این موتور جستوجو است. بیشتر بخوانید: گرافانا چیست؟ الاستیک سرچ علاوه بر مزایایی که ارائه میدهد، معایبی نیز دارد که در ادامه به برخی از مهمترین آنها اشاره میکنیم: نیاز به منابع بالا برای استفاده و بهرهوری کامل از الاستیک سرچ به سرورهایی با حافظه رم ۶۴ گیگابایت نیاز دارید. در غیر این صورت با مشکلات احتمالی روبرو خواهید شد. از طرف دیگر، سرعت انجام درخواستها در SDD نسبت به هارددیسک بیشتر است. از آنجایی که هزینه SDD بالاتر است، در نتیجه برای ایجاد این زیرساخت باید هزینه بیشتر را در نظر بگیرید. مشکل split-brain از دیگر معایب الاستیک سرچ مشکل split-brain است. این مشکل زمانی به وجود میآید که سرورها بدون مشکل، مشغول به کار هستند اما ارتباط بین آنها قطع میشود. در نتیجه هر کدام از آنها خود را تنها در یک کلاستر میبینند و خود را به عنوان مَستر انتخاب میکنند. در چنین شرایطی، کلاستر با دو مستر روبرو میشود. مشکل چندزبانی برای مدیریت درخواستها و پاسخها، Elasticsearch تنها از فرمت JSON استفاده میکند، در حالیکه سیستمهای دیگر از فرمتهایی مانند CSV و XML نیز پشتیبانی میکنند. فرایند یادگیری پیچیده الاستیک سرچ قابلیتهای متنوعی را ارائه میکند اما مکانیزم کوئری پیچیدهای دارد؛ به ویژه اگر با مفاهیم دیتابیس یا SQL آشنایی نداشته باشید. رایگان نبودن الاستیک سرچ از سال ۲۰۲۱ به بعد دیگر رایگان نیست اما میتوان پلنهای مختلف آن را برای مدت محدود به صورت رایگان آزمایش کرد. بهعنوان یک سیستم جستجو Elasticsearch بسیار مقیاسپذیر است و قابلیتهای جستجو در لحظه را ارائه میدهد. الاستیک سرچ به دلیل ماهیت همهکاره آن در مدیریت دادهها و جفتشدن با ابزارهای دیگر محبوب است. شرکتهایی مانند ویکیپدیا، نیویورکتایمز، گیتهاب، نتفلیکس، والمارت، ایبِی و فیسبوک همگی از این موتور جستوجو برای موارد مختلف استفاده میکنند. در ادامه به برخی از مهمترین کاربردهای الاستیک سرچ اشاره شده است: جستجوی اپلیکیشن برای اپلیکیشنهایی که به شدت به سرچها و گزارش های سنگین وابسته هستند، الاستیک سرچ از گزینههای مناسب است. جستجوی وبسایت وبسایتهایی که حاوی محتوای زیادی هستند میتوانند از این ابزار برای جستجوهای دقیق و کارآمد استفاده کنند. جستجوهای سازمانی Elasticsearch در سازمانها میتواند برای جستجوی اسناد، محصولات مبتنی بر تجارت الکترونیک، جستجوی بلاگ، افراد و … کاربرد داشته باشد. ثبت و تحلیل لاگها یکی از مرسومترین کاربردهای این ابزار، تحلیل لاگها تقریبا به صورت بلادرنگ است که میتواند بینشهای عملیاتی مهمی را در مورد گزارشها ارائه کند. مانیتورینگ کانتینر و متریکهای زیرساختی بسیاری از سازمانها از استک ELK برای تحلیل متریکهای متنوع از جمله پارامترهای مربوط به کارایی تجهیزات سرورها و نیز سرویسهای مبتنی بر کانتینر بهره میبرند. بیشتر بخوانید: کانتینر چیست؟ تحلیلهای امنیتی لاگهای دسترسی و سایر رویدادهایی که نگرانیهای امنیتی در مورد آنها مطرح است میتوانند به کمک استک ELK به صورت بلادرنگ و در لحظه، تحلیل شوند. تحلیلهای تجاری بسیاری از قابلیتهایی که با استک ELK همراه شدهاند، ابزارهایی عالی برای تحلیل سازمانها محسوب میشوند. به این نکته توجه داشته باشید که الاستیک سرچ میتواند هم روی سرور اختصاصی و هم روی سرور ابری اجرا شود. در این مقاله، به این موضوع پرداختیم که الاستیک سرچ چیست، چگونه کار میکند و چه مزایا، معایب و کاربردهایی دارد. به طور خلاصه Elasticsearch یک موتور جستجوی بسیار سریع و مقیاسپذیر است و در قلب اکوسیستم آن ابزارهای قرار دارد که با هم میتوانند برای مواردی از جمله جستجو، تجزیهوتحلیل و پردازش دادهها مورداستفاده قرار گیرند.معایب الاستیک سرچ چیست؟
موارد استفاده از Elasticsearch چیست؟
سخن پایانی