برنامه نویسی

اتوماسیون مرورگر زبان طبیعی با آمازون بستر و نمایشنامه نویس

NOVA-CLICK به شما امکان می دهد مرورگر خود را با دستورات متن ساده کنترل کنید. این کشور با آمازون نوا (از طریق آمازون بستر آمازون) و نمایشنامه نویس ساخته شده است. آن را در GitHub بررسی کنید: NOVA-CLICK.

tl ؛ دکتر

جنبه غذای اصلی
چه کاری می تواند انجام دهد؟ دستورات متن ساده را به اقدامات مرورگر تبدیل کنید.
وابستگی ها؟ فقط BOTO3 و نمایشنامه نویس مورد نیاز است.
مدل؟ آمازون نوا (از طریق بستر آمازون)
کجا امتحان کنیم؟ به منبع GitHub مراجعه کنید: https://github.com/naoki0513/nova-click
برای کیست؟ ایده آل برای توسعه دهندگان و محققان علاقه مند به اتوماسیون مرورگر.

نسخه ی نمایشی

شرح تصویر

سریع: “محبوب ترین بلندگو بلوتوث ضد آب زیر 50 دلار در آمازون را جستجو کنید و آن را به سبد خرید اضافه کنید.

نسخه با کیفیت بالا را در اینجا مشاهده کنید.

شروع سریع

# 1. Clone the repository
git clone https://github.com/Naoki0513/nova-click.git
cd nova-click

# 2. Install dependencies
pip install boto3==1.38.13 playwright==1.40.0
python -m playwright install chromium

# 3. Set up AWS credentials
mkdir credentials
vim credentials/aws_credentials.json   # Save with the format below
حالت تمام صفحه را وارد کنید

از حالت تمام صفحه خارج شوید

{
  "aws_access_key_id": "AKIA…",
  "aws_secret_access_key": "xxxxxxxx",
  "region_name": "us-west-2"
}
حالت تمام صفحه را وارد کنید

از حالت تمام صفحه خارج شوید

# 4. Launch
python main.py
حالت تمام صفحه را وارد کنید

از حالت تمام صفحه خارج شوید

ثابت ها را در main.py برای آزمایش سریع و مدل های مختلف.

انگیزه

“تصور کنید که AI تمام کارهای مرورگر خود را مدیریت می کند – این بازی را تغییر می دهد.”

خودکار کردن وظایف مرورگر تکراری به کاربران اجازه می دهد تا روی خلاقیت و تأثیرگذاری تمرکز کنند-این ایده الهام بخش NOVA است.

چگونه کار می کند ⚙

حلقه های نوا را از طریق سه مرحله حلقه می زند

  • عکس فوری صفحه آریا به عنوان JSON
  • تصمیم آمازون بستر (کلیک یا تایپ)
  • اجرای برنامه نمایشنامه نویس

تکرار کنید تا کار خود کامل شود.

چرا آمازون نوا؟ 💎

آمازون نوا ، که در Bedrock آمازون اجرا می شود ، هزینه های کارآیی ، سرعت و پشتیبانی از زمینه بزرگ را ارائه می دهد. در اینجا نحوه مقایسه آن آورده شده است:

مدل هزینه ورودی (توکن $/متر) هزینه خروجی (توکن $/متر) پنجره متن سرعت
آمازون نوا طرفدار 0.80 3.20 حداکثر 300k نشانه
GPT-4O 2.50 10.00 تا 128 کیلومتری توکن
کلود 3.7 غزل 3.00 15.00 تا 200 کیلومتری توکن*

سؤالات متداول

q1. Nova-Click با قانون نوا چگونه متفاوت است؟

NOVA ACT (https://nova.amazon.com/act) مدل مرورگر اختصاصی آمازون آمازون است ، در حالی که Nova-Click یک چارچوب سبک است که با هر LLM عمومی کار می کند.

Q2 چقدر قابل اعتماد است؟

Nova-Click یک نمونه اولیه تحقیقاتی اولیه است و می تواند پوسته پوسته شود-در صفحات پیچیده اشتباه است ، بنابراین اقدامات آن را در صورت لزوم بررسی و تغییر دهید.

Q3. آیا از Playwright MCP استفاده می کند؟

خیر-بدون کلیک از نمایشنامه نویس ساده در پایتون استفاده می کند ، اگرچه الهام بخش MCP است.

شروع کار

  1. کلون و دویدن python main.pyبشر
  2. گردش کار خود را به زبان انگلیسی ساده توصیف کنید.
  3. ستاره ها ، مسائل و روابط عمومی استقبال می کنند.

در کاوش در اتوماسیون مرورگر LLM محور با NOVA CLICK به ما بپیوندید.

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا