بنیانگذاران SaaS: ساتیا نادلا در مورد عوامل هوش مصنوعی اشتباه می کند!؟

Summarize this content to 400 words in Persian Lang
من برای ساتیا نادلا احترام و قدردانی زیادی قائلم. او احتمالاً یکی از بهترین مدیران اجرایی مدرن در حال حاضر روی کره زمین است، زیرا او چگونه مایکروسافت را از یک شرکت مبتنی بر سازمانی/ویندوز به غول نرمافزاری تبدیل کرد.
در مصاحبه اخیر، او اشاره کرد که عوامل هوش مصنوعی مشاغل SaaS را از بین خواهند برد. در حالی که من زمینه و آنچه او واقعاً میگوید را درک میکنم، در مورد آنچه که او واقعاً میگوید، سوء تعبیر یا اغراق وجود دارد.
در اینجا برداشت من از کل انقلاب عامل هوش مصنوعی است:
به هر حال عامل هوش مصنوعی چیست؟
یک نماینده، به عبارت ساده شده، مانند یک رهبر ارکستر عمل می کند. درست همانطور که یک رهبر ارکستر نوازندگان را برای هماهنگ کردن اجراهایشان راهنمایی می کند، یک نماینده نیز ورودی ها و خروجی های یک مدل را برای ایجاد یک نتیجه ظریف تر و پیچیده تر هدایت می کند.
برای مثال، ممکن است برنامهای داشته باشید که برای رزرو قرار، تماسهای صوتی را دریافت میکند. یک LLM معمولی نمیتواند به تقویم شما دسترسی داشته باشد (مگر اینکه از طریق RAG) یا یک تماس API برای بررسی اینکه آیا تاریخ موجود است یا خیر.
از سوی دیگر، یک Agent می تواند پاسخ مدل را در طول تماس تجزیه و تحلیل کند، اگر کاربر تاریخ یا ساعتی را ذکر کند، Agent می تواند آن اطلاعات را استخراج کرده و یک API خارجی را پرس و جو کند.
می تواند یک درخواست POST ایجاد کند و سپس پاسخ API را به بازخورد به مدل تفسیر کند.
در طول این فرآیند، Agent چندین تماس با LLM، API و ابزارها برقرار می کند تا اطلاعات مورد نیاز خود را دریافت کند و اقداماتی را انجام دهد که باید اتفاق بیفتد.
Agent ها قدرتمند هستند اما به هیچ وجه به توانایی های یک توسعه دهنده نزدیک نیستند
ممکن است وسوسه شوید که فکر کنید یک Agent اساساً جای کار یک توسعه دهنده را می گیرد. از آنجایی که میتواند تماسهای API، مدلهای سریع و توابع فراخوانی ایجاد کند، منطقی است که به جای طراحی این برنامه پیچیده با منطق «کد سخت»، فقط تمام قوانین تجاری را به Agent ارائه دهد، سپس Agent میتواند به صورت پویا گردش کار خود را بر اساس آن بسازد. درخواست کاربر ورودی
این از نظر تئوری خوب به نظر می رسد، اما یک مشکل اساسی وجود دارد! LLM ها به طور کلی توهم دارند، حتی با RAG هنوز درصدی از پرس و جو وجود دارد که نتایج نامعتبر را ایجاد می کند.
آیا می توانید تصور کنید که به مشتری بگویید: “ما می توانیم فقط با استفاده از هوش مصنوعی کل برنامه وب شما را خودکار کرده و از شر آن خلاص شویم، به جز برای یک مشکل، ما فقط می توانیم دقت 80٪ را تضمین کنیم!”
بسته به نوع کسب و کار، نرخ شکست 20٪ می تواند منجر به از دست رفتن هزاران دلار به دلیل نارضایتی مشتری یا شکست در فرآیند سفارش شود.
کدام تجارت آنقدر دیوانه است که این را بپذیرد؟ حتی اگر آنها در هزینه های توسعه و شاید هزینه های میزبانی صرفه جویی کنند، آیا ارزش ضرر 20٪ را دارد؟
خواندن برای معنا
توهم ممکن است یک مشکل بزرگ باشد، اما این تنها مشکل نیست. برای مثال کلود سونت را در نظر بگیرید، پنجره زمینه مدل 200k است.
این به اندازه کافی بزرگ است که یک رمان کامل را در خود جای دهد. با این حال، متوجه خواهید شد که وقتی داده های بیشتری را در پنجره زمینه قرار می دهید، دقت شروع به کاهش می کند.
به مدل لیستی از مثلاً 30 قانون بدهید و در اغلب موارد متوجه خواهید شد که قوانین را نادیده می گیرد، قوانین را نادیده می گیرد یا کاملاً برعکس عمل می کند. چرا؟
مدل هیچ «جهانبینی» یا درکی از دادههای زمینه ندارد. در حالی که این ممکن است سادهسازی بیش از حد نسل فعلی مدلها باشد، این مدل اساساً به یک الگوریتم تطبیق الگوی پیشرفته برای تولید پاسخ خود متکی است.
هیچ تفکر یا درک درستی از داده های زمینه وجود ندارد، بنابراین یک مدل پیشرفته مانند Sonnet می تواند یک قانون ساده را که حتی یک کودک هفت ساله می تواند درک کند، از دست بدهد.
در دنیای واقعی، ما از فرم ها برای کنترل ورودی کاربر استفاده می کنیم. تنها راه های زیادی برای پر کردن یک فرم وجود دارد، اما زبان طبیعی ساختاری ندارد، بنابراین تغییراتی که می توان وارد کرد بی نهایت است.
سپس مدیریت این تنوع دشوار می شود و سطح دقت به طور قابل توجهی کاهش می یابد.
در اینجا یک مثال عملی است:
You are a service agent helping the user with their lunch order, you, must adhere to these rules:
1) When retrieving menu items, you must only retrieve items from the context data provided below and nowhere else.
2) Ask the user whether they prefer to collect from the canteen or would like delivery to their room. If they want delivery, ask for their room number.
3) Menus can have sauce options, such as tomato sauce, white sauce, mustard sauce, etc… You must ask them which sauce they prefer if not mentioned.
…
وارد حالت تمام صفحه شوید
از حالت تمام صفحه خارج شوید
یک مشتری ممکن است بگوید: می توانم برگر مرغ را بخورم، حتما گوجه فرنگی، پیاز و کاهو اضافه کنید؟
پاسخ هوش مصنوعی:”مطمئنا، من 1 X برگر مرغ با سس گوجه فرنگی، پیاز و کاهو ضبط کرده ام.”
یک شخص واقعی آن را به “یک برش گوجه فرنگی” تعبیر می کند که با “سس گوجه فرنگی” یکی نیست.
همانطور که اعلانهای پیچیدهتری میسازید، بیشتر و بیشتر متوجه این موضوع میشوید، این مدل زمانی که مراحل زیادی برای دنبال کردن دارد، برای درک حتی دستورالعملهای اساسی تلاش میکند.
عوامل، با استفاده از یک زنجیره فکری و RAG، میتوانند دقت مدلها را تا حد زیادی بهبود بخشند، اما باز هم همیشه در 20% یا حتی 5% موارد شکست میخورد.
در دنیای واقعی
یکی از دلایلی که مشتریان ارائهدهندگان SaaS را در مقابل شرکتهای بزرگی مانند مایکروسافت ترجیح میدهند، ویژگیهای شخصیسازی شده محصول و پشتیبانی اختصاصی آنها است.
در حالی که یک ربات چت مفید است و داشتن یک ربات کمکی برای درخواست گزارش و کمک در مورد صفحات گسترده عالی است، اکثر مشتریان هیچ سرنخی ندارند که چگونه از چت ربات برای دستیابی به نتایج مورد نیاز خود درخواست کنند.
حالا من نمی گویم آنها “احمق” یا “بی کفایت” هستند، می گویم مردم نقاط قوت و علایق متفاوتی دارند.
برای شما مثالی می زنم: من کمی در مورد لوله کشی می دانم و احتمالاً می توانم بفهمم چگونه یک آبفشان را جایگزین کنم، اما آیا واقعاً دفعه بعد که ترکید این کار را انجام خواهم داد؟
قطعا، نه! زیرا:
الف) ترجیح می دهم این کار را به حرفه ای ها بسپارم که می دانند چه کار می کنند. ب) انجام این کار زمان زیادی از من خواهد برد زیرا احتمالاً باید در گوگل جستجو کنم و یوتیوب را تماشا کنم.ج) من هیچ علاقه ای به تعمیر آبفشان ندارم.د) با وقتم کارهای بهتری دارم.
اکثر صاحبان کسب و کار نمی خواهند با چیزهای فنی کمانچه بپردازند و زمان کافی نیز ندارند. مهم نیست که نمایندگان چقدر قدرتمند هستند، همیشه یک شرکت SaaS وجود خواهد داشت که وارد می شود و کارها را برای غیر فنی ساده تر می کند و آنها خوشحال خواهند شد که 20 تا 30 دلار در ماه برای راحتی پرداخت کنند.
مهندسی سیستم
اغلب در یک SaaS با اندازه مناسب، چیزی بیش از CRUD پیدا خواهید کرد. معمولاً ترکیبی از سیستمهای پیچیده و ساده وجود دارد که در دریایی از زیرساختهای مختلف به هم متصل شدهاند. بدون سرور، خطوط لوله، کانتینرهای داکر، سرورهای اختصاصی، برنامههای تک صفحهای، و تکصفحههای چند صفحهای را در همه جا مستقر کنید، به غیر از آن پشته قدیمی قدیمی که هیچکس نمیخواهد آن را لمس کند!
همه اینها به دلیل تقاضای مشتری و نیاز به ارائه یک پیشنهاد متنوع با ویژگی های عمیق برای دور کردن رقبا به وجود آمدند.
در حالی که Agents می تواند یک برنامه واکنش کامل بسازد یا یک صفحه فرود ایجاد کند، این در انزوا است. من هنوز ندیده ام که یک تیم توسعه دهنده به مرخصی برود و کلیدها را به یک نماینده بیاندازد تا مسئولیت را بر عهده بگیرد 🙂
در بهترین حالت، می توانید یک خط لوله از انواعی مانند Zapier برای زیرساخت و کد ایجاد کنید. سپس Agent می تواند کد را بررسی کند، یک باگ را برطرف کند و در سرور PR و توسعه دهنده مستقر شود.
نتیجه گیری
پس نه ساتیا نادلا! فقط نه! Agentها برنامههای SaaS را از بین نمیبرند، در واقع، Agentها به بنیانگذاران فناوری بیشتر قدرت میدهند تا با سرعت بیشتری نوآوری کنند، بنابراین ممکن است تعداد برنامههای SaaS در بازار افزایش یابد.
منصفانه بگویم، من فکر میکنم ساتیا بیشتر به ابزارهای اداری کمتحمل مانند صفحات گسترده یا ابزارهای گزارشدهی تجاری اشاره میکرد که اساساً فقط به صورت پویا SQL را میسازند.
مطمئناً، در آن نمونه، مطمئناً، Agents یک تغییر دهنده بازی خواهد بود.
من دوست دارم نظرات شما را بشنوم، نظر شما در مورد عوامل هوش مصنوعی و نقش آنها در آینده برنامه های SaaS چیست؟
من برای ساتیا نادلا احترام و قدردانی زیادی قائلم. او احتمالاً یکی از بهترین مدیران اجرایی مدرن در حال حاضر روی کره زمین است، زیرا او چگونه مایکروسافت را از یک شرکت مبتنی بر سازمانی/ویندوز به غول نرمافزاری تبدیل کرد.
در مصاحبه اخیر، او اشاره کرد که عوامل هوش مصنوعی مشاغل SaaS را از بین خواهند برد. در حالی که من زمینه و آنچه او واقعاً میگوید را درک میکنم، در مورد آنچه که او واقعاً میگوید، سوء تعبیر یا اغراق وجود دارد.
https://www.youtube.com/watch?v=9NtsnzRFJ_o
در اینجا برداشت من از کل انقلاب عامل هوش مصنوعی است:
به هر حال عامل هوش مصنوعی چیست؟
یک نماینده، به عبارت ساده شده، مانند یک رهبر ارکستر عمل می کند. درست همانطور که یک رهبر ارکستر نوازندگان را برای هماهنگ کردن اجراهایشان راهنمایی می کند، یک نماینده نیز ورودی ها و خروجی های یک مدل را برای ایجاد یک نتیجه ظریف تر و پیچیده تر هدایت می کند.
برای مثال، ممکن است برنامهای داشته باشید که برای رزرو قرار، تماسهای صوتی را دریافت میکند. یک LLM معمولی نمیتواند به تقویم شما دسترسی داشته باشد (مگر اینکه از طریق RAG) یا یک تماس API برای بررسی اینکه آیا تاریخ موجود است یا خیر.
از سوی دیگر، یک Agent می تواند پاسخ مدل را در طول تماس تجزیه و تحلیل کند، اگر کاربر تاریخ یا ساعتی را ذکر کند، Agent می تواند آن اطلاعات را استخراج کرده و یک API خارجی را پرس و جو کند.
می تواند یک درخواست POST ایجاد کند و سپس پاسخ API را به بازخورد به مدل تفسیر کند.
در طول این فرآیند، Agent چندین تماس با LLM، API و ابزارها برقرار می کند تا اطلاعات مورد نیاز خود را دریافت کند و اقداماتی را انجام دهد که باید اتفاق بیفتد.
Agent ها قدرتمند هستند اما به هیچ وجه به توانایی های یک توسعه دهنده نزدیک نیستند
ممکن است وسوسه شوید که فکر کنید یک Agent اساساً جای کار یک توسعه دهنده را می گیرد. از آنجایی که میتواند تماسهای API، مدلهای سریع و توابع فراخوانی ایجاد کند، منطقی است که به جای طراحی این برنامه پیچیده با منطق «کد سخت»، فقط تمام قوانین تجاری را به Agent ارائه دهد، سپس Agent میتواند به صورت پویا گردش کار خود را بر اساس آن بسازد. درخواست کاربر ورودی
این از نظر تئوری خوب به نظر می رسد، اما یک مشکل اساسی وجود دارد! LLM ها به طور کلی توهم دارند، حتی با RAG هنوز درصدی از پرس و جو وجود دارد که نتایج نامعتبر را ایجاد می کند.
آیا می توانید تصور کنید که به مشتری بگویید: “ما می توانیم فقط با استفاده از هوش مصنوعی کل برنامه وب شما را خودکار کرده و از شر آن خلاص شویم، به جز برای یک مشکل، ما فقط می توانیم دقت 80٪ را تضمین کنیم!”
بسته به نوع کسب و کار، نرخ شکست 20٪ می تواند منجر به از دست رفتن هزاران دلار به دلیل نارضایتی مشتری یا شکست در فرآیند سفارش شود.
کدام تجارت آنقدر دیوانه است که این را بپذیرد؟ حتی اگر آنها در هزینه های توسعه و شاید هزینه های میزبانی صرفه جویی کنند، آیا ارزش ضرر 20٪ را دارد؟
خواندن برای معنا
توهم ممکن است یک مشکل بزرگ باشد، اما این تنها مشکل نیست. برای مثال کلود سونت را در نظر بگیرید، پنجره زمینه مدل 200k است.
این به اندازه کافی بزرگ است که یک رمان کامل را در خود جای دهد. با این حال، متوجه خواهید شد که وقتی داده های بیشتری را در پنجره زمینه قرار می دهید، دقت شروع به کاهش می کند.
به مدل لیستی از مثلاً 30 قانون بدهید و در اغلب موارد متوجه خواهید شد که قوانین را نادیده می گیرد، قوانین را نادیده می گیرد یا کاملاً برعکس عمل می کند. چرا؟
مدل هیچ «جهانبینی» یا درکی از دادههای زمینه ندارد. در حالی که این ممکن است سادهسازی بیش از حد نسل فعلی مدلها باشد، این مدل اساساً به یک الگوریتم تطبیق الگوی پیشرفته برای تولید پاسخ خود متکی است.
هیچ تفکر یا درک درستی از داده های زمینه وجود ندارد، بنابراین یک مدل پیشرفته مانند Sonnet می تواند یک قانون ساده را که حتی یک کودک هفت ساله می تواند درک کند، از دست بدهد.
در دنیای واقعی، ما از فرم ها برای کنترل ورودی کاربر استفاده می کنیم. تنها راه های زیادی برای پر کردن یک فرم وجود دارد، اما زبان طبیعی ساختاری ندارد، بنابراین تغییراتی که می توان وارد کرد بی نهایت است.
سپس مدیریت این تنوع دشوار می شود و سطح دقت به طور قابل توجهی کاهش می یابد.
در اینجا یک مثال عملی است:
You are a service agent helping the user with their lunch order, you, must adhere to these rules:
1) When retrieving menu items, you must only retrieve items from the context data provided below and nowhere else.
2) Ask the user whether they prefer to collect from the canteen or would like delivery to their room. If they want delivery, ask for their room number.
3) Menus can have sauce options, such as tomato sauce, white sauce, mustard sauce, etc... You must ask them which sauce they prefer if not mentioned.
...
یک مشتری ممکن است بگوید:
می توانم برگر مرغ را بخورم، حتما گوجه فرنگی، پیاز و کاهو اضافه کنید؟
پاسخ هوش مصنوعی:
“مطمئنا، من 1 X برگر مرغ با سس گوجه فرنگی، پیاز و کاهو ضبط کرده ام.”
یک شخص واقعی آن را به “یک برش گوجه فرنگی” تعبیر می کند که با “سس گوجه فرنگی” یکی نیست.
همانطور که اعلانهای پیچیدهتری میسازید، بیشتر و بیشتر متوجه این موضوع میشوید، این مدل زمانی که مراحل زیادی برای دنبال کردن دارد، برای درک حتی دستورالعملهای اساسی تلاش میکند.
عوامل، با استفاده از یک زنجیره فکری و RAG، میتوانند دقت مدلها را تا حد زیادی بهبود بخشند، اما باز هم همیشه در 20% یا حتی 5% موارد شکست میخورد.
در دنیای واقعی
یکی از دلایلی که مشتریان ارائهدهندگان SaaS را در مقابل شرکتهای بزرگی مانند مایکروسافت ترجیح میدهند، ویژگیهای شخصیسازی شده محصول و پشتیبانی اختصاصی آنها است.
در حالی که یک ربات چت مفید است و داشتن یک ربات کمکی برای درخواست گزارش و کمک در مورد صفحات گسترده عالی است، اکثر مشتریان هیچ سرنخی ندارند که چگونه از چت ربات برای دستیابی به نتایج مورد نیاز خود درخواست کنند.
حالا من نمی گویم آنها “احمق” یا “بی کفایت” هستند، می گویم مردم نقاط قوت و علایق متفاوتی دارند.
برای شما مثالی می زنم: من کمی در مورد لوله کشی می دانم و احتمالاً می توانم بفهمم چگونه یک آبفشان را جایگزین کنم، اما آیا واقعاً دفعه بعد که ترکید این کار را انجام خواهم داد؟
قطعا، نه! زیرا:
الف) ترجیح می دهم این کار را به حرفه ای ها بسپارم که می دانند چه کار می کنند.
ب) انجام این کار زمان زیادی از من خواهد برد زیرا احتمالاً باید در گوگل جستجو کنم و یوتیوب را تماشا کنم.
ج) من هیچ علاقه ای به تعمیر آبفشان ندارم.
د) با وقتم کارهای بهتری دارم.
اکثر صاحبان کسب و کار نمی خواهند با چیزهای فنی کمانچه بپردازند و زمان کافی نیز ندارند. مهم نیست که نمایندگان چقدر قدرتمند هستند، همیشه یک شرکت SaaS وجود خواهد داشت که وارد می شود و کارها را برای غیر فنی ساده تر می کند و آنها خوشحال خواهند شد که 20 تا 30 دلار در ماه برای راحتی پرداخت کنند.
مهندسی سیستم
اغلب در یک SaaS با اندازه مناسب، چیزی بیش از CRUD پیدا خواهید کرد. معمولاً ترکیبی از سیستمهای پیچیده و ساده وجود دارد که در دریایی از زیرساختهای مختلف به هم متصل شدهاند. بدون سرور، خطوط لوله، کانتینرهای داکر، سرورهای اختصاصی، برنامههای تک صفحهای، و تکصفحههای چند صفحهای را در همه جا مستقر کنید، به غیر از آن پشته قدیمی قدیمی که هیچکس نمیخواهد آن را لمس کند!
همه اینها به دلیل تقاضای مشتری و نیاز به ارائه یک پیشنهاد متنوع با ویژگی های عمیق برای دور کردن رقبا به وجود آمدند.
در حالی که Agents می تواند یک برنامه واکنش کامل بسازد یا یک صفحه فرود ایجاد کند، این در انزوا است. من هنوز ندیده ام که یک تیم توسعه دهنده به مرخصی برود و کلیدها را به یک نماینده بیاندازد تا مسئولیت را بر عهده بگیرد 🙂
در بهترین حالت، می توانید یک خط لوله از انواعی مانند Zapier برای زیرساخت و کد ایجاد کنید. سپس Agent می تواند کد را بررسی کند، یک باگ را برطرف کند و در سرور PR و توسعه دهنده مستقر شود.
نتیجه گیری
پس نه ساتیا نادلا! فقط نه! Agentها برنامههای SaaS را از بین نمیبرند، در واقع، Agentها به بنیانگذاران فناوری بیشتر قدرت میدهند تا با سرعت بیشتری نوآوری کنند، بنابراین ممکن است تعداد برنامههای SaaS در بازار افزایش یابد.
منصفانه بگویم، من فکر میکنم ساتیا بیشتر به ابزارهای اداری کمتحمل مانند صفحات گسترده یا ابزارهای گزارشدهی تجاری اشاره میکرد که اساساً فقط به صورت پویا SQL را میسازند.
مطمئناً، در آن نمونه، مطمئناً، Agents یک تغییر دهنده بازی خواهد بود.
من دوست دارم نظرات شما را بشنوم، نظر شما در مورد عوامل هوش مصنوعی و نقش آنها در آینده برنامه های SaaS چیست؟