جداسازی ذخیره سازی و محاسبه ، قسمت deux

سلب مسئولیت: این عقاید به تنهایی من و مال من است ، نه تأمل در کارفرمای من. در حالی که من ممکن است در زیر به سیستم عامل های داده خاص انتقاد کنم ، لطفاً به من اعتماد کنید وقتی می گویم من واقعاً همه آنها را دوست دارم. اگر در اینجا انتقاداتی وجود دارد ، لطفاً آن را به عنوان “اتاق برای رشد” و از مکانی از عشق تفسیر کنید.
کمی تاریخ
اولین “جداسازی ذخیره سازی و محاسبات” در سال 2010 اتفاق افتاد ، زیرا همه سیستم عامل های پایگاه داده آموخته اند که به طور مستقل از فضای ذخیره سازی ، محاسبات خود را بالا و پایین مقیاس دهند. Spark این قول را قول داد اما قابلیت حمل و سهولت لازم را ارائه نداد ، احتمالاً به دلیل مشوق های متناقض بین همه جا بودن منبع باز و مشوق های پولی از شرکت حامی شرکت Databricks. Snowflake بهتر تحویل داده شد ، با چرخش خودکار محاسبات به طور پیش فرضبشر این بدان معناست که کاربران می توانند فقط برای محاسبات مورد نیاز خود بپردازند ، با ذخیره سازی ارزان قیمت توسط S3. مزایای اولین جدایی محاسبات و ذخیره سازی به این معنی است که شما می توانید به همان اندازه مقیاس بندی کنید وت با توجه به نیازهای پرس و جو خود ، با “نزدیک صفر همیشه با هزینه”بشر
انقلاب دوم در اینجا است
امروز ما شاهد انقلاب دوم جدایی ذخیره و محاسبات هستیم که جدایی از آن است فروشنده شما برای محاسبات و فروشنده شما برای ذخیره سازی استفاده می کنید. اکنون ، می توانید ابزار BI خود را به دریاچه خود وصل کنید بدون در حال چرخش یک خوشه برف برفی. شما می توانید از Databricks به Snowflake و به عقب بدون کاغذ و بدون هیچ گونه قفل فروشنده مهاجرت کنید.
به عنوان یک قیاس ، Apple Music را با DRM خود ، در مقابل MP3 های بدون DRM در نظر بگیرید که صاحب آن رایگان و واضح است. هر برنامه موسیقی می تواند mp3 های شما را بخواند اما هیچ برنامه موسیقی دیگری وجود ندارد می توانید خریدهای iTunes شما را بازی کنید. این یک ضربه بر روی اپل نیست – این فقط تمثیلی برای انقلابی است که امروز با پذیرش و پذیرش گسترده یخبندان می بینیم. اکنون ، دریاچه شما در ابر زندگی می کند و قابل خواندن و قابل خواندن است هر ابزار در جعبه ابزار شما.
درک تأثیر
برای درک تأثیر این الگوی جدید ، فقط وضعیت خود را در نظر بگیرید: جایی که در حال حاضر قفل فروشنده دارید ، و جایی که فقط برای دسترسی “انتخاب *” به داده های خود به فروشندگان پرداخت می کنید …
- آیا ارگ شما کاملاً به MS SQL و SQL Azure وابسته است؟ مشکلی نیست – می تواند از کوه یخ خوانده شود.
- آیا شما علاقه مندان به جرقه سخت هستید؟ باز هم ، مشکلی نیست – شما می توانید در Iceberg ، خواندن یا نوشتن با Spark on Iceberg ، با استفاده از هر کدام از سخت افزار کالا یا سرویس تجاری که در آن لحظه ترجیح می دهید ، بخوانید و بنویسید.
- آیا ابزار BI شما می خواهد هر روز ساعت 5 صبح داده ها را پرس و جو کند ، اما شما نمی خواهید Snowflake را فقط به خاطر یک محاسبه واسطه “انتخاب *” پرداخت کنید؟ مشکلی نیست فقط Snowflake را به طور کامل دور بزنید و ابزار BI خود را مستقیماً در Iceberg بخوانید.
منظور از ارائه دهندگان خدمات بانک اطلاعاتی چیست
به طور خلاصه ، برای ارائه دهندگان خدمات پایگاه داده مانند Snowflake ، MS SQL ، Redshift و Spark – آنها باید این مورد را ایجاد کنند که آنها محاسبه شما هستند خواستن برای استفاده تأکید بر UI/UX عالی ، عملکرد عالی و ویژگی های عالی همه تفاوت ها را ایجاد می کند. و حتی هنوز هم ، آنها دیگر نمی توانند به بودن اعتماد کنند تنها یا حتی اصلی رابط پرس و جو برای کاربران موجود خود. آنها باید انتظار داشته باشند که کاربران آنها به طور فزاینده ای با هم مخلوط شوند و کاربران آنها (هوشمندانه) آنها را با استفاده از موارد ساده “انتخاب *” دور بزنند که هیچ دلیلی برای پرداخت هزینه چرخش محاسبه وجود ندارد. هر جا که عملیات نوشتن گران باشد یا فاقد ویژگی باشد ، آنها باید انتظار داشته باشند که کاربران ارائه دهندگان نویسندگان را نیز مخلوط کنند و به خدمات متکی باشند-یا محاسبات کالایی خود مدیریت شده-که می تواند داده های ارزان تر یا مؤثرتر بنویسد.
منظور از ارائه دهندگان خدمات برنامه چیست
در حالی که بقیه این مقاله از نظر قیمت گذاری ممکن است مانند “مسابقه به پایین” به نظر برسند ، تأثیر عظیم و مثبتی دیگر وجود دارد که می تواند در این انقلاب دوم به دست آورد. یعنی اکنون هر برنامه ، سرویس وب ، ارائه دهنده خدمات و استارتاپ اکنون می تواند یک ارائه دهد هدایت کردنبا سریعبا ارزانوت در کلاس بهترین معماری داده برای کاربران خود. به جای اینکه کاملاً به API های استراحت تکیه دهند ، که برای ساخت+حفظ+آرام ، دست و پا گیر و گران هستند ، می توانند دریاچه داده شخصی خود را به کاربران خود ارائه دهند. رایگان برای پرسیدن نحوه دوست داشتن کاربر ، “صفر کپی قابل تعامل” با هر پلت فرم اصلی DB ، و به راحتی مقیاس پذیر است پایین به صفر و بالا به همزمانی نزدیک نامتناهی.
این قسمت آخر همان چیزی است که من را شخصاً از Iceberg و سایر ارائه دهندگان ذخیره سازی دریاچه Data که از قفل فروشنده فراتر می رود ، بسیار هیجان زده می کند.
نظر شما چیست؟
آیا شما اشتیاق من را به اشتراک می گذارید ، یا فکر می کنید این فقط پیچیدگی بیشتری در یک فضای پیچیده است؟ آیا نگران مسابقه به پایین هستید ، یا شما هیجان زده هستید (مثل من) که به زودی همه ما از قفل فروشنده آزاد خواهیم شد؟