برنامه نویسی

پروتکل متن مدل بدون ساختار هکاتون

این وبلاگ بخشی از MCP Hackathon بدون ساختار است. این جزئیات را در مورد جزئیات پروژه توضیح می دهد و یک آموزش بعدی را برای درک بهتر ارائه می دهد.

شرکت در Hackathon مجازی مجازی MCP بدون ساختار فرصتی هیجان انگیز برای کشف پروتکل زمینه مدل (MCP) و کمک به ابزاری بود که استخراج داده های ساختار یافته از مقالات تحقیقاتی را ساده می کند.

آشنایی با هکاتون مجازی مجازی MCP بدون ساختار

Hackathon مجازی مجازی MCP ، که در وبلاگ Unductured اعلام شد ، از توسعه دهندگان دعوت کرد تا سرورهای MCP را با استفاده از API بدون ساختار ایجاد کنند. این چالش با هدف نشان دادن چگونگی پردازش API بدون ساختار داده های بدون ساختار برای حل مشکلات دنیای واقعی انجام شد. شرکت کنندگان به ایجاد راه حل هایی که به نفع جامعه توسعه دهنده و به اشتراک گذاشتن پیاده سازی های آنها باشد ، تشویق شدند.

MCP چیست؟

MCP یک پروتکل باز است که نحوه ارائه برنامه های کاربردی برای مدل های بزرگ زبان (LLMS) را استاندارد می کند. برای برنامه های هوش مصنوعی به MCP مانند درگاه USB-C فکر کنید. درست همانطور که USB-C یک روش استاندارد برای اتصال دستگاه های شما به لوازم جانبی و لوازم جانبی مختلف ارائه می دهد ، MCP روشی استاندارد برای اتصال مدل های AI به منابع و ابزارهای مختلف داده را فراهم می کند. اطلاعات بیشتر در مورد آن را در اینجا بخوانید.

معماری MCP

اجزای MCP:

  • میزبان MCP: برنامه هایی مانند Claude Desktop ، محیط های توسعه یکپارچه (IDE) یا ابزارهای AI که می خواهند از طریق MCP به داده ها دسترسی پیدا کنند.
  • مشتریان MCP: مشتری های پروتکل که اتصالات یک به یک را با سرورها حفظ می کنند.
  • سرورهای MCP: برنامه های سبک وزن که قابلیت های خاص را از طریق پروتکل زمینه استاندارد مدل در معرض نمایش قرار می دهند.
  • منابع داده محلی: پرونده ها ، پایگاه داده ها و خدماتی که سرورهای MCP می توانند به طور ایمن به آن دسترسی پیدا کنند.
  • خدمات از راه دور: سیستم های خارجی موجود از طریق اینترنت (به عنوان مثال ، از طریق API) که سرورهای MCP می توانند به آن متصل شوند. (در پروژه ما بدون ساختار سرویس از راه دور است که ما از آنها استفاده خواهیم کرد.)

معرفی پروژه Hackathon سرور MCP

در پاسخ به چالش Hackathon ، من یک سرور MCP با هدف استخراج داده های ساختاری از PDF های مقاله تحقیق ایجاد کردم. سرور با استفاده از API بدون ساختار ، اسناد PDF را برای استخراج عناصری مانند عناوین ، خلاصه ها ، بخش ها ، ارقام ، جداول و منابع پردازش می کند. از این داده های ساختاری می توان برای اهداف مختلف استفاده کرد ، از جمله مدلهای زبان تنظیم دقیق برای کمک به محققان در انجام بررسی های کارآمد ادبیات.

معماری سرور MCP

معماری MCP Hackathon


دنبال کنید: ساختن سرور MCP

برای تکثیر یا ساخت این پروژه ، مراحل ذکر شده در زیر را دنبال کنید:

پیش نیازها:

  • محیط پایتون: اطمینان حاصل کنید که Python 3.7 یا بالاتر نصب شده است.
  • کلید API بدون ساختار: برای دسترسی به خدمات پردازش اسناد ، یک کلید API را از بدون ساختار بدست آورید.
  • حساب سرویس Google Cloud: یک پروژه Google Cloud را تنظیم کرده و یک حساب کاربری با مجوزهای مناسب برای دسترسی به Google Drive برای خواندن PDF ایجاد کنید. پرونده اعتبار JSON را بارگیری کنید. (اطمینان حاصل کنید که حداقل یک مقاله تحقیق PDF در Google Drive وجود دارد.)
  • پایگاه داده MongoDB: یک خوشه MongoDB با حداقل یک پایگاه داده و یک مجموعه برای ذخیره داده های PDF ساختاری (با فرمت JSON) تنظیم کنید.
  • دسک تاپ کلود: برای دسترسی به سرور MCP و اجرای گردش کار بیش از حد بدون ساختار با استفاده از API آن.

تنظیم و نصب:

1. کلون مخزن:

   git clone https://github.com/HeetVekariya/MCPHackathon.git
   cd MCPHackathon
حالت تمام صفحه را وارد کنید

از حالت تمام صفحه خارج شوید

2. UV را نصب کنید:

  • uv یک بسته و مدیر پروژه بسیار سریع و مدیر پروژه است که در Rust نوشته شده است. آن را از اینجا بارگیری کنید.

3. وابستگی ها را نصب کنید:

uv add "mcp[cli]"
uv pip install --upgrade unstructured-client python-dotenv
حالت تمام صفحه را وارد کنید

از حالت تمام صفحه خارج شوید

uv sync
حالت تمام صفحه را وارد کنید

از حالت تمام صفحه خارج شوید

4. تنظیم متغیرهای محیط:

  • کپی کردن .env.template پرونده و ایجاد یک پرونده جدید به نام .envبشر مقادیر لازم را برای کلیدها تنظیم کنید.

مثال:

UNSTRUCTURED_API_KEY=""
MONGO_DB_CONNECTION_STRING=""
GOOGLEDRIVE_SERVICE_ACCOUNT_KEY=""
حالت تمام صفحه را وارد کنید

از حالت تمام صفحه خارج شوید

5. گردش کار بیش از ساختار را توسعه دهید:

  • پس از تنظیم اتصالات منبع و مقصد ، گردش کار را مطابق شکل زیر توسعه دهید:

گردش کار بدون فشار

6. پیکربندی دسک تاپ کلود را پیکربندی کنید

  • با اجرای دستور مناسب برای سیستم عامل خود ، پرونده پیکربندی دسک تاپ Claude را باز کنید:
# For macOS or Linux:
code ~/Library/Application\ Support/Claude/claude_desktop_config.json

# For Windows:
code $env:AppData\Claude\claude_desktop_config.json
حالت تمام صفحه را وارد کنید

از حالت تمام صفحه خارج شوید

  • در آن پرونده ، مسیرهای نگهدارنده مکان را با مسیرهای واقعی اضافه و جایگزین کنید و پرونده را ذخیره کنید:
{
    "mcpServers":
    {
        "UNS_MCP":
        {
            "command": "ABSOLUTE/PATH/TO/.local/bin/uv",
            "args":
            [
                "--directory",
                "ABSOLUTE/PATH/TO/YOUR-UNS-MCP-REPO/uns_mcp",
                "run",
                "server.py"
            ],
            "env":
            [
            "UNSTRUCTURED_API_KEY":""
            ],
            "disabled": false
        }
    }
}
حالت تمام صفحه را وارد کنید

از حالت تمام صفحه خارج شوید

7 مرحله آخر
Claude را برای پیوند با سرور MCP ، اطمینان از عملکرد گردش کار ، مجدداً راه اندازی کنید و برای استفاده از بدون ساختار ، پرس و جو با Claude را شروع کنید.

نتایج و نتایج

  • سرور MCP با موفقیت PDF های مقاله تحقیق را پردازش می کند ، و داده های ساختاری را که می تواند برای اهداف مختلف تحلیلی استفاده شود ، استخراج می کند. سرور با ادغام API بدون ساختار ، روند استخراج را ساده تر می کند و آن را به ابزاری ارزشمند برای محققان و توسعه دهندگان که با ادبیات دانشگاهی کار می کنند ، تبدیل می کند.

لیست های کاری بدون ساختار را لیست کنید

گردش کار بدون ساختار را اجرا کنید

  • به بستر بدون ساختار وارد شوید و به برگه Jobs بروید تا آخرین کار برنامه ریزی شده توسط پرس و جو مورد نظر را که در بالا اجرا کردیم ، بررسی کنید. شما می توانید جزئیاتی مانند تصویر زیر را مشاهده کنید:

جزئیات شغلی بدون ساختار


منابع:

  • مخزن GitHub: به پایگاه کد کامل و مستندات اینجا دسترسی پیدا کنید.
  • مخزن MCP بدون ساختار: UNS-MCP
  • مستندات API بدون ساختار: برای اطلاعات دقیق در مورد استفاده و ویژگی های API در اینجا به مستندات رسمی مراجعه کنید.
  • در مورد آنچه بدون ساختار است گیج شده است؟ معرفی دقیق من در مورد بدون ساختار را در اینجا بررسی کنید.

پایان

شرکت در هکاتون مجازی مجازی MCP بدون ساختار ، یک تجربه پاداش دهنده بود که منجر به توسعه ابزاری شد که نیاز به نیاز به دنیای واقعی در تحقیقات دانشگاهی داشت. سرور MCP نه تنها قابلیت های API بدون ساختار را به نمایش می گذارد بلکه با ارائه راه حلی برای پردازش داده های کارآمد مقاله ، به جامعه وسیع نیز کمک می کند.

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا