اتوماسیون مرورگر زبان طبیعی با آمازون بستر و نمایشنامه نویس

NOVA-CLICK به شما امکان می دهد مرورگر خود را با دستورات متن ساده کنترل کنید. این کشور با آمازون نوا (از طریق آمازون بستر آمازون) و نمایشنامه نویس ساخته شده است. آن را در GitHub بررسی کنید: NOVA-CLICK.
tl ؛ دکتر
جنبه | غذای اصلی |
---|---|
چه کاری می تواند انجام دهد؟ | دستورات متن ساده را به اقدامات مرورگر تبدیل کنید. |
وابستگی ها؟ | فقط BOTO3 و نمایشنامه نویس مورد نیاز است. |
مدل؟ | آمازون نوا (از طریق بستر آمازون) |
کجا امتحان کنیم؟ | به منبع GitHub مراجعه کنید: https://github.com/naoki0513/nova-click |
برای کیست؟ | ایده آل برای توسعه دهندگان و محققان علاقه مند به اتوماسیون مرورگر. |
نسخه ی نمایشی
سریع: “محبوب ترین بلندگو بلوتوث ضد آب زیر 50 دلار در آمازون را جستجو کنید و آن را به سبد خرید اضافه کنید.
نسخه با کیفیت بالا را در اینجا مشاهده کنید.
شروع سریع
# 1. Clone the repository
git clone https://github.com/Naoki0513/nova-click.git
cd nova-click
# 2. Install dependencies
pip install boto3==1.38.13 playwright==1.40.0
python -m playwright install chromium
# 3. Set up AWS credentials
mkdir credentials
vim credentials/aws_credentials.json # Save with the format below
{
"aws_access_key_id": "AKIA…",
"aws_secret_access_key": "xxxxxxxx",
"region_name": "us-west-2"
}
# 4. Launch
python main.py
ثابت ها را در main.py
برای آزمایش سریع و مدل های مختلف.
انگیزه
“تصور کنید که AI تمام کارهای مرورگر خود را مدیریت می کند – این بازی را تغییر می دهد.”
خودکار کردن وظایف مرورگر تکراری به کاربران اجازه می دهد تا روی خلاقیت و تأثیرگذاری تمرکز کنند-این ایده الهام بخش NOVA است.
چگونه کار می کند ⚙
حلقه های نوا را از طریق سه مرحله حلقه می زند
- عکس فوری صفحه آریا به عنوان JSON
- تصمیم آمازون بستر (کلیک یا تایپ)
- اجرای برنامه نمایشنامه نویس
تکرار کنید تا کار خود کامل شود.
چرا آمازون نوا؟ 💎
آمازون نوا ، که در Bedrock آمازون اجرا می شود ، هزینه های کارآیی ، سرعت و پشتیبانی از زمینه بزرگ را ارائه می دهد. در اینجا نحوه مقایسه آن آورده شده است:
مدل | هزینه ورودی (توکن $/متر) | هزینه خروجی (توکن $/متر) | پنجره متن | سرعت |
---|---|---|---|---|
آمازون نوا طرفدار | 0.80 | 3.20 | حداکثر 300k نشانه | ◎ |
GPT-4O | 2.50 | 10.00 | تا 128 کیلومتری توکن | ○ |
کلود 3.7 غزل | 3.00 | 15.00 | تا 200 کیلومتری توکن* | △ |
سؤالات متداول
q1. Nova-Click با قانون نوا چگونه متفاوت است؟
NOVA ACT (https://nova.amazon.com/act) مدل مرورگر اختصاصی آمازون آمازون است ، در حالی که Nova-Click یک چارچوب سبک است که با هر LLM عمومی کار می کند.
Q2 چقدر قابل اعتماد است؟
Nova-Click یک نمونه اولیه تحقیقاتی اولیه است و می تواند پوسته پوسته شود-در صفحات پیچیده اشتباه است ، بنابراین اقدامات آن را در صورت لزوم بررسی و تغییر دهید.
Q3. آیا از Playwright MCP استفاده می کند؟
خیر-بدون کلیک از نمایشنامه نویس ساده در پایتون استفاده می کند ، اگرچه الهام بخش MCP است.
شروع کار
- کلون و دویدن
python main.py
بشر - گردش کار خود را به زبان انگلیسی ساده توصیف کنید.
- ستاره ها ، مسائل و روابط عمومی استقبال می کنند.
در کاوش در اتوماسیون مرورگر LLM محور با NOVA CLICK به ما بپیوندید.