برنامه نویسی

چگونه در Dataproc خوشه ایجاد کنیم و Jupyter را نصب کنیم؟


🔗مطالب مرتبط

می توانید مخزن مربوطه را در موارد زیر بیابید:

🐱‍🏍گیت هاب

می توانید با من در ارتباط باشید:

🧬لینکداین


رزومه 🧾

همه این وبلاگ از پوسته استفاده می کند.

ما یک خوشه در Dataproc راه اندازی خواهیم کرد که در آن ابتدا باید Google SDK را داشته باشیم و یک سطل را در Cloud Storage نمونه برداری کنیم.

برای اطلاعات بیشتر و پتانسیل این موضوع اینجا را کلیک کنید.


پیش شرط ها:

  • باید SDK را نصب کرده باشید. شما می توانید این کار را در مراحل بعدی انجام دهید توجه: من نام مستعار را برای استفاده از SDK مانند msdk تنظیم کردم.
  • شما باید یک سطل نمونه داشته باشید. شما می توانید این کار را در مراحل بعدی انجام دهید توجه: من یک سطل به نام xlmriosx_bucket تنظیم کردم.

1- یک نام را برای خوشه تنظیم کنید ✍️

ما به متغیری نامی که خوشه خواهد داشت اختصاص می دهیم.

من از دستور زیر استفاده می کنم:

CLUSTER_NAME="xlmriosx_cluster"
وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید


2- ایجاد سطل 💠

با استفاده از SDK نصب شده با نام مستعار مانند msdk، از دستور زیر برای ایجاد یک کلاستر استفاده می کنم:

msdk gcloud beta dataproc clusters create $CLUSTER_NAME \
    --optional-components=ANACONDA,JUPYTER \
    --image-version=$IMAGE_VERSION \
    --enable-component-gateway \
    --region=$REGION \
    --num-workers=$NUM_WORKERS \
    --master-machine-type=$MASTER_MACHINE_TYPE \
    --worker-machine-type=$WORKER_MACHINE_TYPE \
    --bucket=$BUCKET_NAME \
    --tags=$TAGS
وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

جایی که:
$CLUSTER_NAME -> نامی است که خوشه شما را خواهد داشت. در این مورد xlmriosx_cluster.

$IMAGE_VERSION -> نسخه ای از تصویر است که از آن استفاده خواهیم کرد. مثال: 1.3

$REGION -> منطقه ای که می خواهید در سطل ذخیره سازی شما باقی بماند. مثال: us-central1

$NUM_WORKERS -> تعداد کارگران یا گره هایی است که داده ها را پردازش می کنند. مثال: 2

$MASTER_MACHINE_TYPE -> نوعی ماشین است که از ماشین اصلی ما استفاده می کند. مثال: n1-standard-1

$WORKER_MACHINE_TYPE -> نوعی ماشین است که از ماشین کارگر ما استفاده می کند. مثال: n1-standard-1

$BUCKET_NAME -> نام خوشه ما است که در آن مانند منبع و مقصد استفاده می شود. مثال: xlmriosx_bucket

$TAGS -> برچسبی است برای دانستن فرآیند ایجاد خوشه. به عنوان مثال: علم داده


3- بررسی کنید که سطل شما ایجاد شده است✅

ما خوشه ها را فهرست می کنیم تا تأیید کنیم که ایجاد شده است:

gcloud beta dataproc clusters list --region=$REGION
وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

خروجی:
| نام | WORKER_COUNT | PREEMPTIBLE_WORKER_COUNT | وضعیت | زون | SCHEDULED_DELETE |
| — | — | — | — | — | — |
| xlmriosx_cluster | 3 | – | – | در حال اجرا | us-central1-c |


چهارم – نوت بوک Jupyter را در مرورگر محلی خود باز کنید

مشاهده و دسترسی به URLهای دروازه مؤلفه را ببینید تا روی پیوندهای دروازه مؤلفه در کنسول Cloud کلیک کنید تا نوت بوک Jupyter و رابط کاربری JupyterLab در حال اجرا بر روی گره اصلی خوشه در مرورگر محلی شما باز شود.

توضیحات تصویر


چهارم – نوت بوک Jupyter را در مرورگر محلی خود باز کنید



5- تشکر کنید، لایک کنید و اگر مفید بود یا جالب بود به اشتراک بگذارید 😁🖖


نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

همچنین ببینید
بستن
دکمه بازگشت به بالا