پروژه Cassandra Database

  • برچسب ها

    Cassandra, cluster, database, log, NoSQL, open-source, storage, ابزار, اپلیکیشن, انعطاف پذیری, بازیابی اطلاعات, پلت فرم, پیکربندی, تنظیم, خطا, خواندن, داده, رایگان, سرور, سنگین, عملکرد قابل توجه, فیسبوک, کاهش هزینه, مرورگر, مزیت, معیار, منحنی یادگیری, نگارش, وظایف پیچیده

  • تاریخ

    30 دی, 1398


Apache Cassandra یک سیستم مدیریت پایگاه داده NoSQL است که رایگان، open-source، پایگاه داده distributed و wide column store است که برای به کارگیری حجم بالایی از داده ها در بسیاری از سرورهای commodity طراحی شده است که بدون شکست قابلیت دسترسی بالایی دارند.

Cassandra پایگاه داده محبوبی است که از اپلیکیشن های سنگین مانند فیسبوک پشتیبانی می کند. در این مقاله لیستی از دلایل افزودن Cassandra به toolkit تان آورده شده است.

در کنار پایه و اساس بودن برای فیسبوک و Netflix، Cassandra یک پایگاه داده مقیاس پذیر و منعطف است که به راحتی می توان در آن مهارت یافت و با تهیه راهکار برای مشکلات کاملاً پیچیده، به راحتی آن را تنظیم و پیکربندی کرد. وقایع نگاری، مجموعه معیارها و ارزیابی، نظارت داده های تاریخی – وظایفی هستند که با توجه به تنوع OS ها، پلت فرم ها، مرورگرها و ابزارهای محصولات که شرکت های نوپا و سیستم های شرکت ها در عملیات های روزانه با آن مواجه می شوند، انجام درست آن ها کاملاً دشوار است.

در اینجا به 5 مزیت بااهمیت استفاده از Cassandra اشاره می کنیم:

1. کمک به حل وظایف پیچیده به سادگی
2. داشتن منحنی یادگیری کوتاه
3. کاهش هزینه ها و مخارج کلی برای مهندسان DevOps
4. نگارش و خواندن سریع
5. انعطاف پذیری زیاد و تحمل خطا

منظور از مزایای ذکر شده در بالا این است.

کمک به حل وظایف پیچیده به سادگی

وقایع نگاری، مجموعه معیارها، اجرای درخواست ها با داده های تاریخی – تمامی این وظایف ممکن است خسته کننده به نظر برسد، حال آنکه از بالاترین اهمیت برای جریان کار داده های بزرگ و DevOps برخوردارند. تنظیم و پیکربندی storage متمرکز برای log ها، با توجه به انواع داده ها و وفور منابع آن، می تواند یک وظیفه کاملاً دلهره آور باشد.

ساخت یک storage متمرکز برای log ها و معیارها و بازیابی اطلاعات تاریخی از این storage یک وظیفه ای است که Cassandra در نهایت سهولت با آن کار می کند. زمانی که ساختار جدول انتخاب و طراحی شد، پایگاه داده مانند یک طلسم و سحر کار می کند، به راحتی به درخواست شما تنظیم می شود.

داشتن منحنی یادگیری کوتاه

Cassandra با CQL (Cassandra Query Language) کار می کند. در واقع SQL است هرچند فاقد ویژگی های پیشرفته است. اگرچه این به نوعی یک نقطه ضعف است، به این خاطر که ابزار قادر است بدون استثنا با استفاده از لیست محدود متغیرها، دستورها و توابع خوب عمل کند، یک مزیت بزرگ محسوب می شود. به موجب این سادگی، یک مهندس داده در مدت 30 روز می تواند در Cassandra تبحر یابد، بنابراین، بدیهی است که زمان فروش محصول شما به شدت کوتاه می شود.

کاهش هزینه ها و مخارج کلی برای مهندسان DevOps

همانطور که پیش از این ذکر شد، وقایع نگاری، مجموعه معیارها و کار با داده های تاریخی کاربردهای بارز Cassandra هستند. هرچند، از آنجا که تیم شما قادر است تا حد امکان از ابزارها استفاده کند – آن ها قطعاً وظایف بیشتری پیدا می کنند که می توان به Cassandra واگذار کرد و به خوبی آن را اجرا کرد. به موجب اینکه تیم شما قادر است بیشتر بر روی وظایف کلیدی خود، مانند بهبود محصول و ویژگی های آن به جای تلاش دائمی مانند رمزگشایی log ها و سروکار داشتن با مسائل، تمرکز کند، هزینه های پایین مدیریت این ابزار را بسیار مفید می کند.

نگارش و خواندن سریع

از آنجاییکه این پایگاه داده برای فیسبوک ساخته شد، جایی که در کسری از ثانیه میلیون ها خواندن و نوشتن اتفاق می افتد، می تواند سطح قابل توجهی از عملکرد داشته باشد. آنچه که مهم تر است این است که این ارزش ها خطی است و بدون تلاش میزان می شوند. این بدان معناست که بعد از اندازگیری ارزش عملکرد نوشتن/خواندن بر روی سرور، می توانید برای رسیدن به سطح دلخواه عملکرد و سهولت تراز کردن، به سادگی تعداد دفعاتی که سرورهای بیشتری باید به cluster اضافه کنید را محاسبه کنید. به علاوه، با ایجاد ردیف های جداگانه (به وسیله partition keys) پاسخ سریع به درخواست ها را تضمین کنید.

انعطاف پذیری زیاد و تحمل خطا

Cassandra یک cluster ساده است که هیچ نقطه ضعفی ندارد. بدون توجه به عدم دسترسی موقت تا سقف نصف سرورها، ترکیب داده ها به طور مداوم از طریق cluster تکرار می شوند تا مطمئن شود خدمات صددرصد به موقع است. به خصوص این موضوع هنگام اجرای به روز رسانی های چرخشی (rolling) یا تعمیر و نگهداری cluster ها، مفید است. صرفنظر از اینکه ارتباط سرور، rack کامل سرور یا تمام مرکز داده قطع شود، مشتریان شما با خرابی و از کار افتادگی خدمات مواجه نخواهند شد. اپلیکیشن شما همیشه کار خواهد کرد، مانند فیسبوک و Netflix.

نظر آخر

بنابراین به این نتیجه می توان رسید که پایگاه داده Cassandra برای وظایف چندگانه بسیار مناسب است. حتی اگر الزامات پروژه به شما امکان استفاده از این ابزار را به عنوان پایگاه داده اصلی ندهد، تبحر در آن برای مهندسین داده ای که می خواهند متخصصان ارزشمندی باشند، بسیار مفید خواهد بود.

 

منبع