برنامه نویسی

A2A در مقابل MCP: اتصال عوامل و ابزارهای AI

اکوسیستم هوش مصنوعی با استانداردهای جدید برای چگونگی اتصال مدل ها ، ابزارها و عوامل در حال وزوز است. دو تازه وارد بزرگ پروتکل A2A (عامل به عامل) Google و MCP Anthropic (پروتکل زمینه مدل) هستند. در سطح بالایی ، A2A تعیین می کند که چگونه مأمورین AI کامل صحبت و همکاری می کنند ، در حالی که MCP استاندارد می کند که چگونه یک مدل زبان به ابزارها و منابع داده متصل می شود.

در عمل ، این دو دارای اهداف و معماری های متفاوتی هستند اما در واقع می توانند یکدیگر را در سیستم های مبتنی بر نمایندگی سازنده (و حتی با هم همپوشانی) تکمیل کنند. بیایید به آنچه هر پروتکل ، نحوه طراحی آنها و چرا هر دو برای آینده محصولات هوش مصنوعی اهمیت می دهند ، شیرجه بزنیم.

A2A (عامل به عامل) چیست؟

شرح تصویر

A2A مشخصات باز Google برای نمایندگان برای گفتگو با یکدیگر است. در این دیدگاه ، هر نماینده یک سرویس هوش مصنوعی خود است (یک LLM به علاوه هر ابزار یا عملکردی که از آن استفاده می کند) ، و A2A یک چارچوب ارتباطی استاندارد را برای آن نمایندگان تعریف می کند. در عمل ، A2A از یک معماری سبک مشتری و مشتری استفاده می کند که در آن یک عامل می تواند با پیشرفت کار ، پیام ها و “مصنوعات” را تبادل و “مصنوعات” کند.

هر نماینده کارت عامل را منتشر می کند (یک پروفایل JSON که توانایی ها و نقاط پایانی آن را ذکر می کند) تا دیگران بتوانند آن را پیدا کنند. در زیر HOOD A2A از HTTP/HTTPS با درخواست JSON-RPC برای درخواست های ساختاری و رویدادهای سرور (یا وب سایت) برای پخش پاسخ ، همه بسته بندی شده در JSON استفاده می کند.

به طور خلاصه ، A2A به نمایندگان AI اجازه می دهد (مثلاً ، یک ربات “برنامه ریز سفر”) با سایر مأمورین تخصصی (به عنوان مثال “عامل رزرو پرواز” ، “نماینده هتل”) به روشی مداوم صحبت کنند. این پروتکل حتی به کار خود ادامه می دهد ، به روزرسانی های پیشرفت ، رسیدگی به خطا و سؤالات پیگیری. به قول مستندات گوگل ، “A2A یک چارچوب ارتباطی استاندارد است که عوامل AI را قادر می سازد با روشی سازگار و قابل پیش بینی با یکدیگر ارتباط برقرار کنند”

مؤلفه های اصلی A2A شامل موارد زیر است:

شرح تصویر
کارتهای عامل: JSON Profiles تبلیغاتی را که یک عامل می تواند انجام دهد (نام ، ارائه دهنده ، نقطه پایانی و قابلیت ها)

وظایف و پیام ها: “کار” شغلی است که به یک نماینده منتقل می شود. این حالت دارای حالت های چرخه حیات (ارسال شده ، در حال اجرا ، ورودی ، درخواست شده ، تکمیل شده و غیره) است و پاکت نامه ها و مصنوعات پیام را حمل می کند

مدل مشتری و مشتری: نمایندگان به صورت پویا به عنوان مشتری یا سرورها عمل می کنند. یک عامل (مشتری) ممکن است وظایف دیگری را به دیگری (سرور) اختصاص دهد ، اما با همکاری نمایندگان می تواند نقش ها را تغییر دهد

الگوهای پشتیبانی شده: A2A وظایف ناهمزمان یا طولانی مدت (جریان نتایج جزئی) ، بارهای چندمودال ، توضیحات و قالب های خطای استاندارد را انجام می دهد

به طور خلاصه ، A2A در مورد همکاری عامل به عامل است. این به سؤالاتی مانند “عامل Agent A نماینده B می رسد و از آن می خواهد از طرف من کاری انجام دهد؟” به عنوان مثال ، وبلاگ خود Google یک گردش کار را نشان می دهد که در آن یک دستیار منابع انسانی نمایندگان منبع و برنامه ریزی نامزد را پیدا می کند ، سؤالات شفاف را می پرسد و نتایج را در یک راه حل برای کاربر ادغام می کند

این امر با استفاده مجدد از عوامل تخصصی به عنوان بلوک های ساختمانی ، راه حل های پیچیده و چند عامل (مانند برنامه ریزی یک سفر چند شهری یا خودکار سازی یک گردش کار مالی) را ایجاد می کند.

MCP (پروتکل زمینه مدل) چیست؟

شرح تصویر

در مقابل ، MCP (پروتکل زمینه مدل) برای اتصال یک برنامه مبتنی بر LLM به داده ها ، API ها و ابزارها به روشی استاندارد طراحی شده است. از MCP به عنوان “درگاه USB-C” برای هوش مصنوعی فکر کنید: دقیقاً همانطور که USB-C یک افزونه مشترک برای بسیاری از دستگاه ها فراهم می کند ، MCP یک رابط مشترک برای LLM ها برای دسترسی به دانش و عملکرد خارجی فراهم می کند

در MCP ، میزبان MCP یا مشتری (مانند برنامه چت یا IDE که دارای دستیار هوش مصنوعی است) و سرورهای MCP (خدمات کوچک که منابع داده خاص یا API را در معرض نمایش قرار می دهند) وجود دارد. یک تنظیم معمولی: یک میزبان AI (به عنوان مثال یک چت بابات با استفاده از Claude یا GPT) دارای یک یا چند مؤلفه مشتری MCP است که هر یک اتصال 1: 1 را به سرور MCP حفظ می کنند. این سرورها هر یک از مدل دسترسی به یک منبع خاص را اعطا می کنند. به عنوان مثال ، یک سرور MCP ممکن است Google Drive ، History Slack ، یک پایگاه داده یا API وب را بپیچد. هنگامی که مدل AI به متن نیاز دارد (به عنوان مثال “پنج ایمیل آخر من را به من نشان دهید)) ، میزبان از مشتری MCP مربوطه سؤال می کند ، که درخواست JSON-RPC را به سرور ارسال می کند.

سرور داده ها را برمی گرداند ، که AI می تواند در استدلال یا پاسخ خود از آن استفاده کند. Anthropic MCP را به عنوان “یک استاندارد باز توصیف می کند که توسعه دهندگان را قادر می سازد اتصالات امن و دو طرفه بین منابع داده خود و ابزارهای دارای هوش مصنوعی ایجاد کنند”

معماری MCP ساده است: برنامه هایی که می خواهند داده ها به عنوان مشتری MCP عمل کنند ، در حالی که هر منبع داده یک سرور MCP را پیاده سازی می کند. این پروتکل برای همه تماس ها از پیام های JSON-RPC 2.0 استفاده می کند.

عناصر کلیدی عبارتند از:

شرح تصویر

مشتریان/میزبان MCP: اینها در داخل برنامه AI زندگی می کنند (به عنوان مثال کلود دسک تاپ ، یک چت بابات یا پسوند IDE). آنها اتصالات را آغاز می کنند و درخواست داده ها یا اقدامات را از طریق MCP ارسال می کنند.

سرورهای MCP: سرورهای سبک وزن (اغلب منبع باز) که توانایی یا مجموعه داده خاصی را در معرض دید خود قرار می دهند. هر سرور یک طرح را اعلام می کند: آنچه از آن استفاده می کند یا از آن پشتیبانی می کند. در حال حاضر سرورهای MCP برای مواردی مانند Google Drive ، Slack ، GitHub ، پایگاه داده ، حتی کد سفارشی از طریق Puppeteer اجرا می شود

منابع محلی در مقابل از راه دور: سرورهای MCP می توانند به صورت ایمن به منابع محلی (پرونده های شما ، بانک اطلاعاتی ، خدمات محلی) و همچنین API های از راه دور از طریق اینترنت دسترسی پیدا کنند

مذاکره قابلیت: در اتصال ، ابرداده مشتری و سرور. سرور به مشتری می گوید چه مواردی ، اقدامات یا ابزارهایی را که می تواند ارائه دهد (مانند امضای عملکرد)

حالت جلسه: MCP یک جلسه را حفظ می کند تا سرور بتواند مبادلات قبلی را به خاطر بسپارد. این تمرکز بر تبادل زمینه و هماهنگی بین مشتری و سرور است


تفاوت های کلیدی

در عمل ، MCP به هر برنامه برنامه AI به راحتی به داده های دلخواه اجازه می دهد. آنتروپیک خاطرنشان می کند که MCP “یک استاندارد جهانی و باز برای اتصال سیستم های AI با منابع داده فراهم می کند ، و جایگزین ادغام های تکه تکه شده با یک پروتکل واحد می شود”

جنبه A2a (عامل به عامل) MCP (پروتکل زمینه مدل)
تمرکز و دامنه با هر سیستم به عنوان یک عامل کامل (LLM + Tools) رفتار می کند. تعریف می کند که چگونه مأمورین یکدیگر را کشف می کنند ، وظایف نمایندگی و همکاری در گردش کار چند عامل را مشخص می کنند. فرض می کند که یک طرف یک برنامه LLM (میزبان) و دیگری ارائه دهنده داده/ابزار (سرور) است. نحوه ارتباط یک مدل با ابزارهای خارجی و منابع داده را استاندارد می کند.
معماری مشتری مش در بین نمایندگان. نمایندگان “کارتهای عامل” (پروفایل های JSON) را منتشر می کنند و از طریق JSON-RPC یا REST با API های یکدیگر تماس می گیرند. بر چرخه عمر کار ، جریان و کشف همسالان تأکید می کند. Hub-and-Spoke: میزبان AI (HUB) به چندین سرور MCP (سخنگو) متصل می شود. بدون کشف همسالان – کلین ها می دانند که بر اساس زمینه با کدام سرور تماس می گیرند. از JSON-RPC 2.0 از HTTP (یا STDIO) استفاده می کند.
جریان داده ها داده ها بین نمایندگان به عنوان بخشی از کارهای تفویض شده حرکت می کند (به عنوان مثال نماینده A از نماینده B می خواهد کار را انجام دهد و نتیجه را برگرداند). داده ها بین یک مدل و یک منبع استاتیک جریان می یابد (به عنوان مثال “این سند را دریافت کنید” یا “پرس و جو آن پایگاه داده”).
استاندارد و فناوری JSON ، HTTP/HTTPS ، JSON-RPC ، رویدادهای سرور-SENT برای پخش ، کارت های عامل ، مصنوعات ، AUTH AUTH در شرکت داخلی (OAUTH ، OIDC ، API Keys). JSON ، HTTP/HTTPS یا STDIO ، JSON-RPC 2.0. نسخه های اولیه از کلیدهای API ساده استفاده می کردند. پیاده سازی های جدید OAUTH 2.0/DCR را برای امنیت قوی تر اتخاذ می کنند.
استفاده در نظر گرفته شده “کشف متقابل” در اینترنت عمومی-سازمانهای سازمانهای مختلفی که با هم کار می کنند (“چه کسی می تواند X را برای من انجام دهد؟”). اتصال قابل اعتماد از برنامه هوش مصنوعی شما به داده های داخلی یا SaaS (“من به داده X نیاز دارم – مرا به سرور که دارای آن است متصل کنید”).
همپوشانی و مکمل ارکستراسیون عامل سطح بالا را کنترل می کند. در عمل ، عوامل A2A اغلب برای دسترسی به ابزار/داده به سرورهای MCP اعتماد می کنند و ممکن است خود را به عنوان “منابع” MCP برای کشف ثبت کنند. سیم کشی مدل به ابزار کم سطح را کنترل می کند. مکمل های A2A توسط عوامل تغذیه زمینه و قابلیت های مورد نیاز در طول کار چند عامل. می تواند در داخل بارهای کار A2A برای ادغام یکپارچه اجرا شود.

این از گردش کار ناهمزمان و نتایج جزئی پشتیبانی می کند ، که برای کارهای طولانی بسیار مهم است. A2A با استاندارد سازی کشف و توانایی ها ، معماری های چند عامل را به شدت ساده می کند-از آن به عنوان یک راه آهن مشترک فکر کنید که عوامل متنوع می توانند به آن ضربه بزنند.

نقاط قوت و چالش

شرح تصویر

نقاط قوت A2A: این شبکه های عامل مدولار را قادر می سازد. نمایندگان فروشندگان مختلف در صورت صحبت A2A می توانند با هم ارتباط برقرار کنند. این ویژگی دارای ویژگی های درجه یک از جعبه (OAUTH/OIDC AUTH ، جریان ، معناشناسی خطا) برای ساختن برنامه های واقعی است

این از گردش کار ناهمزمان و نتایج جزئی پشتیبانی می کند ، که برای کارهای طولانی بسیار مهم است. A2A با استاندارد سازی کشف و توانایی ها ، معماری های چند عامل را به شدت ساده می کند-از آن به عنوان یک راه آهن مشترک فکر کنید که عوامل متنوع می توانند به آن ضربه بزنند.

چالش های A2A: این جدید است و هنوز در حال تحول است. هر نماینده باید پروتکل را به درستی پیاده سازی کند (انتشار کارت ، انتقال پیام و غیره) و امنیت شبکه بین نمایندگان اهمیت پیدا می کند. کشف در مقیاس می تواند مشکل باشد (به عنوان مثال در مقابل دایرکتوری های عامل خصوصی). همچنین سؤالات باز در مورد حاکمیت وجود دارد: چه کسی شاخص نمایندگان را اجرا می کند ، که آنها را تأیید می کند ، و غیره.

نقاط قوت MCP: این یک شکاف بزرگ را پر می کند: برنامه های AI به طور معمول نیاز به صحبت با داده ها دارند و MCP این مسئله را قابل اتصال می کند. با تهیه اتصالات از پیش ساخته ، تکثیر را کاهش می دهد. پس از رشد اکوسیستم سرورها ، هر مدل می تواند منابع داده را بدون بازنویسی ارسال کند. همچنین به طور بومی به اشتراک گذاری وضعیت مکالمه و زمینه می پردازد ، بنابراین درخواست های داده می توانند در تعامل مداوم پایه گذاری شوند

چالش های MCP: در اوایل ، MCP پیش فرض های امنیتی ضعیف (کلیدهای ساده API ، دامنه های گسترده Oauth) داشت و نگرانی هایی را در مورد تزریق سریع و دسترسی بیش از حد به بیش از حد ایجاد کرد.

انسان شناسی و دیگران به این موارد (OAUTH ، نشانه های ریز دانه و غیره) می پردازند ، اما این منطقه مورد بررسی قرار می گیرد. MCP همچنین برای Discovery Agent یا Orchestration ساخته نشده است – نحوه پیدا کردن یک عامل ، دقیقاً نحوه واکشی داده ها را حل نمی کند. برخی از فروشندگان خاطرنشان می کنند که MCP به خودی خود جریان کار طولانی مدت چند عامل یا داوری کارها را انجام نمی دهد

فرزندخواندگی و “جنگهای پروتکل”

من با علاقه زیادی به ظهور A2A و ​​MCP نگاه کرده ام. احساس می کنم در روزهای ابتدایی وب ، وقتی همه در حال بحث و گفتگو در HTTP در مقابل FTP بودند ، کمی احساس می کنم. از طرف A2A ، گوگل یک پیروزی بزرگ از دروازه به ثمر رساند: بیش از 50 شریک فناوری . تصور کردن یک شرکت در آن قدرتمند است که در آن هر یک از Microservice HR ، مالی ، تجزیه و تحلیل فقط “A2A” را از جعبه برای اتوماسیون کار خارج می کند.

در همین حال ، MCP خیلی عقب نیست. من واقعاً اعتقاد دارم MCP آینده ای روشن دارد، قول آن برای وصل کردن هر LLM به هر منبع داده (Slack ، Google Drive ، Postgres) با یک تماس JSON-RPC تنها مقاومت ناپذیر است. پشتیبانی استودیوی Copilot Microsoft یک سیگنال قوی است که صنعت آن اتصالات استاندارد را می خواهد.

اما اینها تنها بازیکنان نیستند. IBM و پروژه Beeai قهرمان هستند ACP (پروتکل ارتباطات عامل)، با تمرکز بر پیام رسانی آرام و مجوزهای ریز دانه. با وجود A2A ، MCP ، ACP و احتمالاً بیشتر در افق ، طبیعی است که تعجب کنیم که آیا ما به “جنگ پروتکل” رفته ایم. آیا یک استاندارد برنده خواهد شد ، یا ما در دنیای ترکیبی مستقر خواهیم شد؟ من شخصاً شرط بندی می کنم مکمل: هر پروتکل در لایه خاص خود می درخشد و تیم های هوشمند به جای انتخاب فقط یک نفر ، آنها را با هم می بافتند.


آینده: همگرایی یا همزیستی؟

با نگاه به جلو ، من دو مسیر به همان اندازه هیجان انگیز را می بینم:

  1. همگرایی

    تصور کنید که عوامل A2A مهارت های خود را به عنوان سرورهای MCP در معرض دید خود قرار می دهند ، و MCP به معنای معناشناسی کار غنی تر از A2A (یا ACP) وام گرفته شده است. ما با یک پارچه “عامل + ابزار” یکپارچه می شویم که در آن کشف ، نمایندگی و دسترسی به داده ها همه از طریق یک سطح API آزمایش شده توسط نبرد اتفاق می افتد.

  2. همزیستی و تخصص

    در کوتاه مدت به احتمال زیاد: MCP به سیم کشی مدل به ابزار تبدیل می شود ، در حالی که A2A (و ACP) بر ارکستر عامل حاکم است. محصول AI بعدی شما خواه یک دستیار تیم سازی باشد یا یک ربات گزارشگری مالی احتمالاً پیاده سازی خواهد کرد MCP داخلی برای ضربه زدن به اسناد و بانکهای اطلاعاتی ، و A2a خارجی همکاری با سایر عوامل.

برای هرکسی که امروز AI را بسازد ، این غذای من است: هر دو را بیاموزیدبشر تسلط بر MCP به این معنی است که مدل شما می تواند فوراً به یک اکوسیستم غنی از داده ها و ابزارها وصل شود. در آغوش گرفتن A2A تضمین می کند که نمایندگان شما می توانند در مرزهای سازمانی کشف ، تفویض و مقیاس را کشف کنند. با هم ، آنها به همان اندازه که REST و GRPC در مورد امروز هستند ، برای پشته های هوش مصنوعی فردا اساسی خواهند بود.

اگر عاشق کاوش در جدیدترین فناوری و منبع آزاد به اندازه من هستید ، بیایید به من سلام کنید ، nomadev ، در توییتر. بیایید ایده ها را مبادله کنیم ، بینش های خود را به اشتراک بگذاریم و روح شلوغی را زنده نگه داریم! 🚀

من همچنین بخشی از Camel-AI هستم ، و ما سخت کار کرده ایم که برخی از ویژگی های MCP واقعاً قاتل را در سکوی خود ادغام کرده ایم. 🤖 با ما همراه باشید ، ما هفته آینده رسماً آنها را اعلام خواهیم کرد. برنامه نویسی مبارک!

شرح تصویر

با NomadeV در X گیر بیاورید!

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا