برنامه نویسی

نحوه ایجاد یک خزنده وب با Puppeteer و Bun

خزیدن وب یک تکنیک قدرتمند است که برای جمع آوری داده ها از وب سایت ها استفاده می شود. چه در حال جمع‌آوری داده‌ها برای تحقیق، نظارت بر قیمت‌ها یا حذف محتوا هستید، ساختن یک خزنده وب می‌تواند فوق‌العاده مفید باشد. در این پست، من شما را از طریق فرآیند ایجاد یک خزنده وب با استفاده از Puppeteer و Bun، دو ابزار محبوب جاوا اسکریپت، راهنمایی خواهم کرد.

مقدمه ای بر عروسک گردان و بان

Puppeteer یک کتابخانه Node.js است که یک API سطح بالا برای کنترل مرورگرهای کروم یا کرومیوم بدون هد ارائه می دهد. این برای خراش دادن وب و خودکار کردن وظایف مرورگر عالی است.

Bun یک زمان اجرا سریع و مدرن جاوا اسکریپت مشابه Node.js است اما برای سرعت و عملکرد بهینه شده است. این برنامه برای کار یکپارچه با کتابخانه های جاوا اسکریپت موجود طراحی شده است.

راهنمای گام به گام ساخت یک خزنده وب

مرحله 1: تنظیم محیط شما
ابتدا مطمئن شوید که Node.js را نصب کرده اید. سپس، Bun را با دنبال کردن دستورالعمل های وب سایت Bun نصب کنید.

بعد، یک فهرست پروژه جدید ایجاد کنید و آن را با Bun مقداردهی کنید:

# Copy code
mkdir web-crawler
cd web-crawler
bun init
وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

گام 2: نصب Puppeteer
Puppeteer را با استفاده از Bun نصب کنید:

# Copy code
bun add puppeteer
bun node_modules/puppeteer/install.js # -> the secret sauce 
وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

مرحله 3: نوشتن اسکریپت خزنده وب
یک فایل جاوا اسکریپت جدید با نام crawler.js ایجاد کنید و با وارد کردن Puppeteer شروع کنید:

// Copy code
const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.goto('https://example.com');

  // Extract data
  const data = await page.evaluate(() => {
    return document.querySelector('h1').innerText;
  });

  console.log(data);

  await browser.close();
})();
وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

در این اسکریپت، ما یک مرورگر بدون هد راه اندازی می کنیم، به یک وب سایت می رویم و متن an را استخراج می کنیم

مرحله 4: اجرای اسکریپت
اسکریپت خود را با استفاده از Bun اجرا کنید:

## Copy code
bun run crawler.js
## You should see data printed in your terminal.
وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

نتیجه

ایجاد یک خزنده وب با Puppeteer و Bun ساده و کارآمد است. Puppeteer اتوماسیون مرورگر را کنترل می کند، در حالی که Bun یک زمان اجرا سریع و مدرن برای کد جاوا اسکریپت شما ارائه می دهد. این ترکیب ابزار قدرتمندی را در جعبه ابزار خراش دادن وب شما ایجاد می کند.

برای موارد استفاده پیشرفته‌تر، می‌توانید اسکریپت خود را برای مدیریت ناوبری، تعامل با عناصر صفحه، و خراش دادن ساختارهای داده پیچیده‌تر گسترش دهید. خزیدن مبارک!

درباره نویسنده

من Ian هستم، یک برنامه نویس کامپیوتر ماهر با علاقه شدید به طراحی وب سایت و اتوماسیون. من به طور گسترده با Web Technologies کار کرده‌ام و همیشه آخرین پیشرفت‌های فناوری را دنبال می‌کنم که به من امکان می‌دهد به دیگران کمک کنم تا برنامه‌های کاربردی مقیاس‌پذیر را ایجاد کنند.

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا