قابلیت همکاری Fabric & Databricks (3): استفاده از جداول پارچه ای در پایگاه داده برای مشاهده ، تجزیه و تحلیل و ویرایش

آیا جداول ایجاد شده در پارچه می تواند یکپارچه در Databricks ارجاع و ویرایش شود؟
بسیاری از افراد ممکن است این سؤال را داشته باشند.
در این مقاله ، ما به طور خاص مورد استفاده از:
- با استفاده از جداول ایجاد شده در پارچه در Databricks.
برای جزئیات بیشتر در مورد تنظیمات پیش نیاز ، لطفاً به مقاله قبلی مراجعه کنید.
این مقاله بخشی از یک سری چهار قسمتی است:
- نمای کلی و هدف از قابلیت همکاری
- پیکربندی دقیق ذخیره سازی توپی
- استفاده از جداول ایجاد شده در پارچه در Databricks (این مقاله)
- با استفاده از جداول ایجاد شده در Databricks در پارچه
ایجاد یک میز جدید در پارچه
یک پرونده CSV را در خانه دریاچه پارچه بارگذاری کنید.
::: اطلاعات توجه داشته باشید
پرونده CSV مورد استفاده در این مقاله است sales.csv
از مستندات مایکروسافت زیر:
یک خانه دریاچه پارچه مایکروسافت ایجاد کنید
:::
از پرونده CSV ، انتخاب کنید [Load to Table] > [New Table]بشر
مشخص کردن ext
، که میانبر است که در ذخیره توپی به عنوان طرحواره ایجاد شده است.
تأیید جدول ایجاد شده
می توانید تأیید کنید که یک جدول جدید در Lakehouse ایجاد شده است.
بوها create_from_fabric_sales
پوشه در ext
پوشه ذخیره سازی توپی.
(این بدان معنی است که جدول تازه ایجاد شده از نظر جسمی در ذخیره توپی وجود دارد.)
همچنین می توانید تأیید کنید که جدول در قالب دلتا است.
در این مرحله ، همانطور که انتظار می رود ، جدول ایجاد شده در پارچه هنوز در پایگاه داده قابل مشاهده نیست.
فعال کردن Databricks برای دسترسی به جداول پارچه
برای ایجاد یک جدول خارجی از ویرایشگر Databricks SQL استفاده کنید.
مشخص کردن مسیر پوشه ذخیره سازی توپی (پوشه جدول ایجاد شده در پارچه) در محل میدان
CREATE TABLE <table_name>
USING DELTA
LOCATION 'abfss://@.dfs.core.windows.net/folder_name/'
سپس ، می توانید جداول ایجاد شده در پارچه را از [Catalog]بشر
از [Dashboard] در Databricks ، می توانید یک داشبورد جدید ایجاد کنید و یک جدول خارجی (یعنی یک جدول ایجاد شده در پارچه) را از آن انتخاب کنید [Data] > [Select Table]بشر
بنابراین ، می توان جداول ایجاد شده در پارچه را با استفاده از Databricks تجزیه و تحلیل کرد.
سعی کنید UPDATE
بیانیه (بیانیه DML) از ویرایشگر SQL در Databricks.
UPDATE create_from_fabric_sales
SET Item = 'No.1 Item'
WHERE Item = 'Road-150 Red, 48'
البته می توانید تأیید کنید که تغییرات در سمت Databricks منعکس شده است.
اگرچه این ویرایش از Databricks ساخته شده است ، اما تغییرات با موفقیت در سمت پارچه نیز منعکس شد.
SELECT Item, SUM(Quantity * UnitPrice) AS Revenue
FROM Fabric_Lakehouse.ext.create_from_fabric_sales
GROUP BY Item
ORDER BY Revenue DESC;
بنابراین ، می توان جداول ایجاد شده در پارچه را با استفاده از Databricks (بیانیه های DML) ویرایش کرد.
از بالا ، ما آن را تأیید کرده ایم
“جداول ایجاد شده در پارچه می تواند در پایگاه داده ها استفاده شود.”
پس از تنظیم ذخیره توپی ، دستیابی به قابلیت همکاری بین پارچه و پایگاه داده نسبتاً آسان است.
در مقاله بعدی پرونده معکوس را معرفی خواهیم کرد:
“با استفاده از جداول ایجاد شده در Databricks در پارچه.”
▽ مقاله بعدی
article مقاله قبلی