پروتکل متن مدل بدون ساختار هکاتون

این وبلاگ بخشی از MCP Hackathon بدون ساختار است. این جزئیات را در مورد جزئیات پروژه توضیح می دهد و یک آموزش بعدی را برای درک بهتر ارائه می دهد.
شرکت در Hackathon مجازی مجازی MCP بدون ساختار فرصتی هیجان انگیز برای کشف پروتکل زمینه مدل (MCP) و کمک به ابزاری بود که استخراج داده های ساختار یافته از مقالات تحقیقاتی را ساده می کند.
آشنایی با هکاتون مجازی مجازی MCP بدون ساختار
Hackathon مجازی مجازی MCP ، که در وبلاگ Unductured اعلام شد ، از توسعه دهندگان دعوت کرد تا سرورهای MCP را با استفاده از API بدون ساختار ایجاد کنند. این چالش با هدف نشان دادن چگونگی پردازش API بدون ساختار داده های بدون ساختار برای حل مشکلات دنیای واقعی انجام شد. شرکت کنندگان به ایجاد راه حل هایی که به نفع جامعه توسعه دهنده و به اشتراک گذاشتن پیاده سازی های آنها باشد ، تشویق شدند.
MCP چیست؟
MCP یک پروتکل باز است که نحوه ارائه برنامه های کاربردی برای مدل های بزرگ زبان (LLMS) را استاندارد می کند. برای برنامه های هوش مصنوعی به MCP مانند درگاه USB-C فکر کنید. درست همانطور که USB-C یک روش استاندارد برای اتصال دستگاه های شما به لوازم جانبی و لوازم جانبی مختلف ارائه می دهد ، MCP روشی استاندارد برای اتصال مدل های AI به منابع و ابزارهای مختلف داده را فراهم می کند. اطلاعات بیشتر در مورد آن را در اینجا بخوانید.
اجزای MCP:
- میزبان MCP: برنامه هایی مانند Claude Desktop ، محیط های توسعه یکپارچه (IDE) یا ابزارهای AI که می خواهند از طریق MCP به داده ها دسترسی پیدا کنند.
- مشتریان MCP: مشتری های پروتکل که اتصالات یک به یک را با سرورها حفظ می کنند.
- سرورهای MCP: برنامه های سبک وزن که قابلیت های خاص را از طریق پروتکل زمینه استاندارد مدل در معرض نمایش قرار می دهند.
- منابع داده محلی: پرونده ها ، پایگاه داده ها و خدماتی که سرورهای MCP می توانند به طور ایمن به آن دسترسی پیدا کنند.
- خدمات از راه دور: سیستم های خارجی موجود از طریق اینترنت (به عنوان مثال ، از طریق API) که سرورهای MCP می توانند به آن متصل شوند. (در پروژه ما بدون ساختار سرویس از راه دور است که ما از آنها استفاده خواهیم کرد.)
معرفی پروژه Hackathon سرور MCP
در پاسخ به چالش Hackathon ، من یک سرور MCP با هدف استخراج داده های ساختاری از PDF های مقاله تحقیق ایجاد کردم. سرور با استفاده از API بدون ساختار ، اسناد PDF را برای استخراج عناصری مانند عناوین ، خلاصه ها ، بخش ها ، ارقام ، جداول و منابع پردازش می کند. از این داده های ساختاری می توان برای اهداف مختلف استفاده کرد ، از جمله مدلهای زبان تنظیم دقیق برای کمک به محققان در انجام بررسی های کارآمد ادبیات.
معماری سرور MCP
دنبال کنید: ساختن سرور MCP
برای تکثیر یا ساخت این پروژه ، مراحل ذکر شده در زیر را دنبال کنید:
پیش نیازها:
- محیط پایتون: اطمینان حاصل کنید که Python 3.7 یا بالاتر نصب شده است.
- کلید API بدون ساختار: برای دسترسی به خدمات پردازش اسناد ، یک کلید API را از بدون ساختار بدست آورید.
- حساب سرویس Google Cloud: یک پروژه Google Cloud را تنظیم کرده و یک حساب کاربری با مجوزهای مناسب برای دسترسی به Google Drive برای خواندن PDF ایجاد کنید. پرونده اعتبار JSON را بارگیری کنید. (اطمینان حاصل کنید که حداقل یک مقاله تحقیق PDF در Google Drive وجود دارد.)
- پایگاه داده MongoDB: یک خوشه MongoDB با حداقل یک پایگاه داده و یک مجموعه برای ذخیره داده های PDF ساختاری (با فرمت JSON) تنظیم کنید.
- دسک تاپ کلود: برای دسترسی به سرور MCP و اجرای گردش کار بیش از حد بدون ساختار با استفاده از API آن.
تنظیم و نصب:
1. کلون مخزن:
git clone https://github.com/HeetVekariya/MCPHackathon.git
cd MCPHackathon
2. UV را نصب کنید:
-
uv
یک بسته و مدیر پروژه بسیار سریع و مدیر پروژه است که در Rust نوشته شده است. آن را از اینجا بارگیری کنید.
3. وابستگی ها را نصب کنید:
uv add "mcp[cli]"
uv pip install --upgrade unstructured-client python-dotenv
uv sync
4. تنظیم متغیرهای محیط:
- کپی کردن
.env.template
پرونده و ایجاد یک پرونده جدید به نام.env
بشر مقادیر لازم را برای کلیدها تنظیم کنید.
مثال:
UNSTRUCTURED_API_KEY=""
MONGO_DB_CONNECTION_STRING=""
GOOGLEDRIVE_SERVICE_ACCOUNT_KEY=""
5. گردش کار بیش از ساختار را توسعه دهید:
- پس از تنظیم اتصالات منبع و مقصد ، گردش کار را مطابق شکل زیر توسعه دهید:
6. پیکربندی دسک تاپ کلود را پیکربندی کنید
- با اجرای دستور مناسب برای سیستم عامل خود ، پرونده پیکربندی دسک تاپ Claude را باز کنید:
# For macOS or Linux:
code ~/Library/Application\ Support/Claude/claude_desktop_config.json
# For Windows:
code $env:AppData\Claude\claude_desktop_config.json
- در آن پرونده ، مسیرهای نگهدارنده مکان را با مسیرهای واقعی اضافه و جایگزین کنید و پرونده را ذخیره کنید:
{
"mcpServers":
{
"UNS_MCP":
{
"command": "ABSOLUTE/PATH/TO/.local/bin/uv",
"args":
[
"--directory",
"ABSOLUTE/PATH/TO/YOUR-UNS-MCP-REPO/uns_mcp",
"run",
"server.py"
],
"env":
[
"UNSTRUCTURED_API_KEY":""
],
"disabled": false
}
}
}
7 مرحله آخر
Claude را برای پیوند با سرور MCP ، اطمینان از عملکرد گردش کار ، مجدداً راه اندازی کنید و برای استفاده از بدون ساختار ، پرس و جو با Claude را شروع کنید.
نتایج و نتایج
- سرور MCP با موفقیت PDF های مقاله تحقیق را پردازش می کند ، و داده های ساختاری را که می تواند برای اهداف مختلف تحلیلی استفاده شود ، استخراج می کند. سرور با ادغام API بدون ساختار ، روند استخراج را ساده تر می کند و آن را به ابزاری ارزشمند برای محققان و توسعه دهندگان که با ادبیات دانشگاهی کار می کنند ، تبدیل می کند.
- به بستر بدون ساختار وارد شوید و به برگه Jobs بروید تا آخرین کار برنامه ریزی شده توسط پرس و جو مورد نظر را که در بالا اجرا کردیم ، بررسی کنید. شما می توانید جزئیاتی مانند تصویر زیر را مشاهده کنید:
منابع:
- مخزن GitHub: به پایگاه کد کامل و مستندات اینجا دسترسی پیدا کنید.
- مخزن MCP بدون ساختار: UNS-MCP
- مستندات API بدون ساختار: برای اطلاعات دقیق در مورد استفاده و ویژگی های API در اینجا به مستندات رسمی مراجعه کنید.
- در مورد آنچه بدون ساختار است گیج شده است؟ معرفی دقیق من در مورد بدون ساختار را در اینجا بررسی کنید.
پایان
شرکت در هکاتون مجازی مجازی MCP بدون ساختار ، یک تجربه پاداش دهنده بود که منجر به توسعه ابزاری شد که نیاز به نیاز به دنیای واقعی در تحقیقات دانشگاهی داشت. سرور MCP نه تنها قابلیت های API بدون ساختار را به نمایش می گذارد بلکه با ارائه راه حلی برای پردازش داده های کارآمد مقاله ، به جامعه وسیع نیز کمک می کند.