2024 در بررسی: نکات مهم در پایگاههای داده ابری

داغ ترین روند: پایگاه های داده برداری و هوش مصنوعی
به نظر می رسد توانایی های هوش مصنوعی، به ویژه LLM ها، سقف قابل مشاهده ای ندارند. برنامه های کاربردی مبتنی بر این فناوری ها در صنایع مختلف در حال رونق هستند. یکی از تقاطع های مهم بین پایگاه های داده و هوش مصنوعی در ذخیره سازی برداری و جستجو نهفته است. در طول سال گذشته، تقریباً هر پایگاه داده اصلی ویژگیهای مرتبط را معرفی یا ارتقا داده است. Forrester همچنین با انتشار موج مستقل Vector Database Wave، ارزیابی قابلیتهای پردازش برداری پایگاههای مختلف مختلف، این مسئولیت را رهبری کرده است.
موج پایگاه داده برداری Forrester
در سه ماهه سوم سال جاری، Forrester Wave پایگاه داده برداری خود را منتشر کرد که شامل شرکت هایی مانند Zilliz، DataStax، Microsoft، Amazon، Oracle و Pinecone بود.
در حال حاضر، تقریباً همه فروشندگان پایگاه داده یا ابری در حال سرمایه گذاری در فناوری های “بردار” هستند. این نوآوریهای مبتنی بر هوش مصنوعی به سرعت در حال پیشرفت هستند و رقابت در ذخیرهسازی برداری و برنامههای کاربردی هنوز به پایان نرسیده است.
ویژگی های برداری معرفی شده توسط پایگاه داده و ارائه دهندگان ابری
در سال 2024، ارائه دهندگان پایگاه داده برای راه اندازی پشتیبانی خود از ویژگی های مرتبط با بردار رقابت کردند. نمونه های قابل توجه عبارتند از:
- pg_vector نسخه 0.8 را منتشر کرد که به طور گسترده در پروژه های متعدد مورد استفاده قرار گرفت.
- Azure پسوند پایگاه داده برداری DiskANN خود را معرفی کرد که در چندین محصول پایگاه داده خود یکپارچه شده است.
- MariaDB شروع به پشتیبانی کامل از ویژگی های برداری از نسخه 11.6 کرد.
- OceanBase 4.3.3 از ذخیره سازی و نمایه سازی داده های برداری پشتیبانی می کند.
- MySQL 9.0 پشتیبانی از ذخیره سازی برداری را معرفی کرد.
- TiDB جستجوی برداری (بتا) را راه اندازی کرد و قابلیت های برداری را به طور یکپارچه در اکوسیستم خود ادغام کرد.
- علاوه بر این، تقریباً تمام ارائه دهندگان ابری که از PostgreSQL پشتیبانی می کنند اکنون افزونه pg_vector را در خود جای داده اند.
سایر ادغام های AI-Database
فراتر از قابلیتهای برداری، سایر ادغامهای پایگاه داده هوش مصنوعی، مانند Text2SQL و بهینهسازی پایگاه داده نیز مورد توجه قرار گرفتهاند. مثالها عبارتند از:
- AWS Redshift رسما از جستارهای SQL تولید شده توسط زبان طبیعی از طریق آمازون Q پشتیبانی می کند که در Redshift Query Editor موجود است.
- Copilot for Azure پشتیبانی خود را از Azure SQL و Azure Database برای MySQL گسترش داد.
بانک های اطلاعاتی نمودار
پایگاههای داده گراف به بخش مهمی از اکوسیستم مدل زبان بزرگ (LLM) تبدیل شدهاند که در سال گذشته رشد سریعی را تجربه کردهاند:
- Neo4j اعلام کرد که ARR (درآمد مکرر سالانه) آن از 200 میلیون دلار فراتر رفته است که طی سه سال گذشته دو برابر شده است. رهبری آن در بازار فناوری نمودار نقش اساسی در افزایش دقت، شفافیت و قابلیت تفسیر نتایج مولد هوش مصنوعی ایفا کرده است.
- در این سال، ISO استاندارد جدید ISO/IEC GQL (زبان پرس و جوی گراف) را صادر کرد که «SQL» پایگاههای اطلاعاتی گراف است و به شکافهای استانداردهای موجود برای پردازش دادههای گراف رسیدگی میکند. NebulaGraph اولین پایگاه داده گراف توزیع شده برای پشتیبانی از این استاندارد شد.
منبع باز و توسعه های تجاری
در ابتدای سال جاری، پایگاه داده کش پرکاربرد Redis مجوز منبع باز خود را تغییر داد. با شروع از نسخه 7.4، Redis مجوز RSALv2+SSPLv1 را پذیرفت و از مجوز BSD فاصله گرفت.
مدت کوتاهی پس از آن، پروژه Valkey تحت بنیاد لینوکس و با حمایت شرکت هایی مانند آمازون، گوگل و اوراکل آغاز شد. در اواخر سال، AWS رسما از Valkey در پلتفرم ابری خود پشتیبانی کرد.
در همین حال، CockroachDB محدودیت های قابل توجهی بر مجوز منبع باز خود اعمال کرد. برای مشاغل کوچک (درآمد سالانه کمتر از 10 میلیون دلار)، این نرم افزار رایگان باقی می ماند، اما شرکت هایی که از این آستانه درآمد فراتر می روند، اکنون باید هزینه استفاده از آن را بپردازند.
صعود ثابت PostgreSQL
همانند سالهای گذشته، PostgreSQL به رشد آهسته و پیوسته خود ادامه میدهد، در حالی که به نظر میرسد MySQL کاهش یافته است.
در رتبه بندی DB-Engines، MySQL همچنان پیشتاز قابل توجهی است. با این حال، شتاب PostgreSQL مشهود است، با نوآوری هایی مانند pg_vector که به طور گسترده مورد استفاده قرار می گیرند، در حالی که پشتیبانی اخیر MySQL از بردارها در نسخه 9.0 محدود است.
در گزارش JetBrains State of Developer Ecosystem 2024، روندهای مشابهی ظاهر می شود:
- پذیرش MySQL از 60 درصد در سال 2019 به 52 درصد در سال 2024 کاهش یافت.
- پذیرش PostgreSQL از 30 درصد در سال 2019 به 45 درصد در سال 2024 افزایش یافت.
نکات برجسته تامین مالی در دامنه پایگاه داده
بخش پایگاه داده شاهد رویدادهای مالی قابل توجه متعددی در سال 2024 بود:
- Tembo، یک استارتآپ میزبان PostgreSQL، ۱۴ میلیون دلار سرمایه در سری A جمعآوری کرد و هم محصولات منبع باز و هم Tembo Cloud را برای سرویسهای مدیریت شده PostgreSQL ارائه کرد.
- OpenAI توسعهدهنده پایگاه داده تحلیلی راکست را با قیمت تخمینی 500 تا 1000 میلیون دلار خریداری کرد تا جستجو و تجزیه و تحلیل دادههای بلادرنگ را برای مدلهای بزرگ افزایش دهد.
- ClickHouse استارتاپ همگام سازی داده PostgreSQL PeerDB را خریداری کرد که دور اولیه آن در سال 2023 3.6 میلیون دلار جمع آوری کرد.
- پایگاهداده سریهای زمانی منبع باز GreptimeDB بودجه چند میلیون دلاری را تضمین میکند و بر مدیریت زمان واقعی دادههای مقرونبهصرفه تأکید میکند.
- K1 MariaDB را تصاحب کرد و موقعیت خود را به عنوان یک سرمایه گذار پیشرو نرم افزار کسب و کارهای کوچک تثبیت کرد.
- Supabase 80 میلیون دلار از بودجه سری C با محوریت PostgreSQL جمع آوری کرد و طیف وسیعی از ابزارهای توسعه دهنده از جمله پایگاه های داده برداری را ارائه کرد.
- ApertureDB 8 میلیون دلار برای پیشرفت خدمات جریان داده چند وجهی برای هوش مصنوعی جمع آوری کرد.
ربع جادویی گارتنر برای پایگاه های داده
گارتنر اخیراً ربع جادویی 2024 را برای پایگاههای داده منتشر کرده است. گوگل، AWS، Azure و Oracle همچنان پیشرو هستند و MongoDB، DataBricks و Snowflake به سمت ربع بالا سمت راست پیشرفت می کنند.
اطلاعیه های کلیدی از ارائه دهندگان ابر
- در AWS re:Invent، AWS Aurora DSQL را راهاندازی کرد که دارای قابلیتهای خواندن-نوشتن چندمنطقهای، بسیار سازگار و سازگار با 99.999% در دسترس بودن (استقرار چند منطقهای) و سازگاری PostgreSQL است. DynamoDB همچنین قابلیتهای سازگاری بین منطقهای مشابهی را معرفی کرد.
- در Oracle CloudWorld، لری الیسون بر استراتژی چند ابری تاکید کرد و راهحلهای Oracle@Google، Oracle@Azure و Oracle@AWS را معرفی کرد.
- GCP بر تقویت AlloyDB و محصولات اساسی آن، مانند معرفی نسخه های Enterprise Plus و Enterprise Cloud SQL برای SQL Server تمرکز کرد.
- Microsoft Azure پایگاه داده Cosmos DB و SQL را در اولویت قرار داد و نمایه سازی برداری DiskANN را برای پایگاه های داده برداری خود معرفی کرد.
ما Leapcell هستیم، پلتفرم بهتری برای استقرار پروژههای شما، از جمله پروژههایی که پایگاه دادههای ابری دارند.
Leapcell پلت فرم بدون سرور نسل بعدی برای میزبانی وب، وظایف Async و Redis است:
- پشتیبانی چند زبانه
- با JavaScript، Python، Go یا Rust توسعه دهید.
- اجرای پروژه های نامحدود به صورت رایگان
- فقط برای استفاده پرداخت کنید – بدون درخواست، بدون هزینه.
- راندمان هزینه بی نظیر
- پرداخت بدون هزینه بیکار.
- مثال: 25 دلار از 6.94 میلیون درخواست با میانگین زمان پاسخ 60 میلی ثانیه پشتیبانی می کند.
- تجربه توسعهدهنده ساده
- رابط کاربری بصری برای راه اندازی بدون زحمت.
- خطوط لوله CI/CD کاملاً خودکار و ادغام GitOps.
- معیارهای بیدرنگ و ثبت اطلاعات بینش عملی.
- مقیاس پذیری بدون زحمت و کارایی بالا
- مقیاس خودکار برای کنترل همزمانی بالا با سهولت.
- سربار عملیاتی صفر – فقط روی ساخت و ساز تمرکز کنید.
در مستندات بیشتر کاوش کنید!
ما را در X دنبال کنید: @LeapcellHQ
در وبلاگ ما بخوانید