برنامه نویسی

بنیانگذاران SaaS: ساتیا نادلا در مورد عوامل هوش مصنوعی اشتباه می کند!؟

Summarize this content to 400 words in Persian Lang
من برای ساتیا نادلا احترام و قدردانی زیادی قائلم. او احتمالاً یکی از بهترین مدیران اجرایی مدرن در حال حاضر روی کره زمین است، زیرا او چگونه مایکروسافت را از یک شرکت مبتنی بر سازمانی/ویندوز به غول نرم‌افزاری تبدیل کرد.

در مصاحبه اخیر، او اشاره کرد که عوامل هوش مصنوعی مشاغل SaaS را از بین خواهند برد. در حالی که من زمینه و آنچه او واقعاً می‌گوید را درک می‌کنم، در مورد آنچه که او واقعاً می‌گوید، سوء تعبیر یا اغراق وجود دارد.

در اینجا برداشت من از کل انقلاب عامل هوش مصنوعی است:

به هر حال عامل هوش مصنوعی چیست؟

یک نماینده، به عبارت ساده شده، مانند یک رهبر ارکستر عمل می کند. درست همانطور که یک رهبر ارکستر نوازندگان را برای هماهنگ کردن اجراهایشان راهنمایی می کند، یک نماینده نیز ورودی ها و خروجی های یک مدل را برای ایجاد یک نتیجه ظریف تر و پیچیده تر هدایت می کند.

برای مثال، ممکن است برنامه‌ای داشته باشید که برای رزرو قرار، تماس‌های صوتی را دریافت می‌کند. یک LLM معمولی نمی‌تواند به تقویم شما دسترسی داشته باشد (مگر اینکه از طریق RAG) یا یک تماس API برای بررسی اینکه آیا تاریخ موجود است یا خیر.

از سوی دیگر، یک Agent می تواند پاسخ مدل را در طول تماس تجزیه و تحلیل کند، اگر کاربر تاریخ یا ساعتی را ذکر کند، Agent می تواند آن اطلاعات را استخراج کرده و یک API خارجی را پرس و جو کند.

می تواند یک درخواست POST ایجاد کند و سپس پاسخ API را به بازخورد به مدل تفسیر کند.

در طول این فرآیند، Agent چندین تماس با LLM، API و ابزارها برقرار می کند تا اطلاعات مورد نیاز خود را دریافت کند و اقداماتی را انجام دهد که باید اتفاق بیفتد.

Agent ها قدرتمند هستند اما به هیچ وجه به توانایی های یک توسعه دهنده نزدیک نیستند

ممکن است وسوسه شوید که فکر کنید یک Agent اساساً جای کار یک توسعه دهنده را می گیرد. از آنجایی که می‌تواند تماس‌های API، مدل‌های سریع و توابع فراخوانی ایجاد کند، منطقی است که به جای طراحی این برنامه پیچیده با منطق «کد سخت»، فقط تمام قوانین تجاری را به Agent ارائه دهد، سپس Agent می‌تواند به صورت پویا گردش کار خود را بر اساس آن بسازد. درخواست کاربر ورودی

این از نظر تئوری خوب به نظر می رسد، اما یک مشکل اساسی وجود دارد! LLM ها به طور کلی توهم دارند، حتی با RAG هنوز درصدی از پرس و جو وجود دارد که نتایج نامعتبر را ایجاد می کند.

آیا می توانید تصور کنید که به مشتری بگویید: “ما می توانیم فقط با استفاده از هوش مصنوعی کل برنامه وب شما را خودکار کرده و از شر آن خلاص شویم، به جز برای یک مشکل، ما فقط می توانیم دقت 80٪ را تضمین کنیم!”

بسته به نوع کسب و کار، نرخ شکست 20٪ می تواند منجر به از دست رفتن هزاران دلار به دلیل نارضایتی مشتری یا شکست در فرآیند سفارش شود.

کدام تجارت آنقدر دیوانه است که این را بپذیرد؟ حتی اگر آنها در هزینه های توسعه و شاید هزینه های میزبانی صرفه جویی کنند، آیا ارزش ضرر 20٪ را دارد؟

خواندن برای معنا

توهم ممکن است یک مشکل بزرگ باشد، اما این تنها مشکل نیست. برای مثال کلود سونت را در نظر بگیرید، پنجره زمینه مدل 200k است.

این به اندازه کافی بزرگ است که یک رمان کامل را در خود جای دهد. با این حال، متوجه خواهید شد که وقتی داده های بیشتری را در پنجره زمینه قرار می دهید، دقت شروع به کاهش می کند.

به مدل لیستی از مثلاً 30 قانون بدهید و در اغلب موارد متوجه خواهید شد که قوانین را نادیده می گیرد، قوانین را نادیده می گیرد یا کاملاً برعکس عمل می کند. چرا؟

مدل هیچ «جهان‌بینی» یا درکی از داده‌های زمینه ندارد. در حالی که این ممکن است ساده‌سازی بیش از حد نسل فعلی مدل‌ها باشد، این مدل اساساً به یک الگوریتم تطبیق الگوی پیشرفته برای تولید پاسخ خود متکی است.

هیچ تفکر یا درک درستی از داده های زمینه وجود ندارد، بنابراین یک مدل پیشرفته مانند Sonnet می تواند یک قانون ساده را که حتی یک کودک هفت ساله می تواند درک کند، از دست بدهد.

در دنیای واقعی، ما از فرم ها برای کنترل ورودی کاربر استفاده می کنیم. تنها راه های زیادی برای پر کردن یک فرم وجود دارد، اما زبان طبیعی ساختاری ندارد، بنابراین تغییراتی که می توان وارد کرد بی نهایت است.

سپس مدیریت این تنوع دشوار می شود و سطح دقت به طور قابل توجهی کاهش می یابد.

در اینجا یک مثال عملی است:

You are a service agent helping the user with their lunch order, you, must adhere to these rules:

1) When retrieving menu items, you must only retrieve items from the context data provided below and nowhere else.
2) Ask the user whether they prefer to collect from the canteen or would like delivery to their room. If they want delivery, ask for their room number.
3) Menus can have sauce options, such as tomato sauce, white sauce, mustard sauce, etc… You must ask them which sauce they prefer if not mentioned.

وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

یک مشتری ممکن است بگوید: می توانم برگر مرغ را بخورم، حتما گوجه فرنگی، پیاز و کاهو اضافه کنید؟

پاسخ هوش مصنوعی:”مطمئنا، من 1 X برگر مرغ با سس گوجه فرنگی، پیاز و کاهو ضبط کرده ام.”

یک شخص واقعی آن را به “یک برش گوجه فرنگی” تعبیر می کند که با “سس گوجه فرنگی” یکی نیست.

همانطور که اعلان‌های پیچیده‌تری می‌سازید، بیشتر و بیشتر متوجه این موضوع می‌شوید، این مدل زمانی که مراحل زیادی برای دنبال کردن دارد، برای درک حتی دستورالعمل‌های اساسی تلاش می‌کند.

عوامل، با استفاده از یک زنجیره فکری و RAG، می‌توانند دقت مدل‌ها را تا حد زیادی بهبود بخشند، اما باز هم همیشه در 20% یا حتی 5% موارد شکست می‌خورد.

در دنیای واقعی

یکی از دلایلی که مشتریان ارائه‌دهندگان SaaS را در مقابل شرکت‌های بزرگی مانند مایکروسافت ترجیح می‌دهند، ویژگی‌های شخصی‌سازی شده محصول و پشتیبانی اختصاصی آن‌ها است.

در حالی که یک ربات چت مفید است و داشتن یک ربات کمکی برای درخواست گزارش و کمک در مورد صفحات گسترده عالی است، اکثر مشتریان هیچ سرنخی ندارند که چگونه از چت ربات برای دستیابی به نتایج مورد نیاز خود درخواست کنند.

حالا من نمی گویم آنها “احمق” یا “بی کفایت” هستند، می گویم مردم نقاط قوت و علایق متفاوتی دارند.

برای شما مثالی می زنم: من کمی در مورد لوله کشی می دانم و احتمالاً می توانم بفهمم چگونه یک آبفشان را جایگزین کنم، اما آیا واقعاً دفعه بعد که ترکید این کار را انجام خواهم داد؟

قطعا، نه! زیرا:

الف) ترجیح می دهم این کار را به حرفه ای ها بسپارم که می دانند چه کار می کنند. ب) انجام این کار زمان زیادی از من خواهد برد زیرا احتمالاً باید در گوگل جستجو کنم و یوتیوب را تماشا کنم.ج) من هیچ علاقه ای به تعمیر آبفشان ندارم.د) با وقتم کارهای بهتری دارم.

اکثر صاحبان کسب و کار نمی خواهند با چیزهای فنی کمانچه بپردازند و زمان کافی نیز ندارند. مهم نیست که نمایندگان چقدر قدرتمند هستند، همیشه یک شرکت SaaS وجود خواهد داشت که وارد می شود و کارها را برای غیر فنی ساده تر می کند و آنها خوشحال خواهند شد که 20 تا 30 دلار در ماه برای راحتی پرداخت کنند.

مهندسی سیستم

اغلب در یک SaaS با اندازه مناسب، چیزی بیش از CRUD پیدا خواهید کرد. معمولاً ترکیبی از سیستم‌های پیچیده و ساده وجود دارد که در دریایی از زیرساخت‌های مختلف به هم متصل شده‌اند. بدون سرور، خطوط لوله، کانتینرهای داکر، سرورهای اختصاصی، برنامه‌های تک صفحه‌ای، و تک‌صفحه‌های چند صفحه‌ای را در همه جا مستقر کنید، به غیر از آن پشته قدیمی قدیمی که هیچ‌کس نمی‌خواهد آن را لمس کند!

همه اینها به دلیل تقاضای مشتری و نیاز به ارائه یک پیشنهاد متنوع با ویژگی های عمیق برای دور کردن رقبا به وجود آمدند.

در حالی که Agents می تواند یک برنامه واکنش کامل بسازد یا یک صفحه فرود ایجاد کند، این در انزوا است. من هنوز ندیده ام که یک تیم توسعه دهنده به مرخصی برود و کلیدها را به یک نماینده بیاندازد تا مسئولیت را بر عهده بگیرد 🙂

در بهترین حالت، می توانید یک خط لوله از انواعی مانند Zapier برای زیرساخت و کد ایجاد کنید. سپس Agent می تواند کد را بررسی کند، یک باگ را برطرف کند و در سرور PR و توسعه دهنده مستقر شود.

نتیجه گیری

پس نه ساتیا نادلا! فقط نه! Agentها برنامه‌های SaaS را از بین نمی‌برند، در واقع، Agentها به بنیان‌گذاران فناوری بیشتر قدرت می‌دهند تا با سرعت بیشتری نوآوری کنند، بنابراین ممکن است تعداد برنامه‌های SaaS در بازار افزایش یابد.

منصفانه بگویم، من فکر می‌کنم ساتیا بیشتر به ابزارهای اداری کم‌تحمل مانند صفحات گسترده یا ابزارهای گزارش‌دهی تجاری اشاره می‌کرد که اساساً فقط به صورت پویا SQL را می‌سازند.

مطمئناً، در آن نمونه، مطمئناً، Agents یک تغییر دهنده بازی خواهد بود.

من دوست دارم نظرات شما را بشنوم، نظر شما در مورد عوامل هوش مصنوعی و نقش آنها در آینده برنامه های SaaS چیست؟

من برای ساتیا نادلا احترام و قدردانی زیادی قائلم. او احتمالاً یکی از بهترین مدیران اجرایی مدرن در حال حاضر روی کره زمین است، زیرا او چگونه مایکروسافت را از یک شرکت مبتنی بر سازمانی/ویندوز به غول نرم‌افزاری تبدیل کرد.

در مصاحبه اخیر، او اشاره کرد که عوامل هوش مصنوعی مشاغل SaaS را از بین خواهند برد. در حالی که من زمینه و آنچه او واقعاً می‌گوید را درک می‌کنم، در مورد آنچه که او واقعاً می‌گوید، سوء تعبیر یا اغراق وجود دارد.

https://www.youtube.com/watch?v=9NtsnzRFJ_o

در اینجا برداشت من از کل انقلاب عامل هوش مصنوعی است:

به هر حال عامل هوش مصنوعی چیست؟

عامل هوش مصنوعی چیست؟

یک نماینده، به عبارت ساده شده، مانند یک رهبر ارکستر عمل می کند. درست همانطور که یک رهبر ارکستر نوازندگان را برای هماهنگ کردن اجراهایشان راهنمایی می کند، یک نماینده نیز ورودی ها و خروجی های یک مدل را برای ایجاد یک نتیجه ظریف تر و پیچیده تر هدایت می کند.

برای مثال، ممکن است برنامه‌ای داشته باشید که برای رزرو قرار، تماس‌های صوتی را دریافت می‌کند. یک LLM معمولی نمی‌تواند به تقویم شما دسترسی داشته باشد (مگر اینکه از طریق RAG) یا یک تماس API برای بررسی اینکه آیا تاریخ موجود است یا خیر.

از سوی دیگر، یک Agent می تواند پاسخ مدل را در طول تماس تجزیه و تحلیل کند، اگر کاربر تاریخ یا ساعتی را ذکر کند، Agent می تواند آن اطلاعات را استخراج کرده و یک API خارجی را پرس و جو کند.

می تواند یک درخواست POST ایجاد کند و سپس پاسخ API را به بازخورد به مدل تفسیر کند.

در طول این فرآیند، Agent چندین تماس با LLM، API و ابزارها برقرار می کند تا اطلاعات مورد نیاز خود را دریافت کند و اقداماتی را انجام دهد که باید اتفاق بیفتد.

Agent ها قدرتمند هستند اما به هیچ وجه به توانایی های یک توسعه دهنده نزدیک نیستند

هوش مصنوعی در مقابل انسان
ممکن است وسوسه شوید که فکر کنید یک Agent اساساً جای کار یک توسعه دهنده را می گیرد. از آنجایی که می‌تواند تماس‌های API، مدل‌های سریع و توابع فراخوانی ایجاد کند، منطقی است که به جای طراحی این برنامه پیچیده با منطق «کد سخت»، فقط تمام قوانین تجاری را به Agent ارائه دهد، سپس Agent می‌تواند به صورت پویا گردش کار خود را بر اساس آن بسازد. درخواست کاربر ورودی

این از نظر تئوری خوب به نظر می رسد، اما یک مشکل اساسی وجود دارد! LLM ها به طور کلی توهم دارند، حتی با RAG هنوز درصدی از پرس و جو وجود دارد که نتایج نامعتبر را ایجاد می کند.

آیا می توانید تصور کنید که به مشتری بگویید: “ما می توانیم فقط با استفاده از هوش مصنوعی کل برنامه وب شما را خودکار کرده و از شر آن خلاص شویم، به جز برای یک مشکل، ما فقط می توانیم دقت 80٪ را تضمین کنیم!”

بسته به نوع کسب و کار، نرخ شکست 20٪ می تواند منجر به از دست رفتن هزاران دلار به دلیل نارضایتی مشتری یا شکست در فرآیند سفارش شود.

کدام تجارت آنقدر دیوانه است که این را بپذیرد؟ حتی اگر آنها در هزینه های توسعه و شاید هزینه های میزبانی صرفه جویی کنند، آیا ارزش ضرر 20٪ را دارد؟

خواندن برای معنا

ربات گیج
توهم ممکن است یک مشکل بزرگ باشد، اما این تنها مشکل نیست. برای مثال کلود سونت را در نظر بگیرید، پنجره زمینه مدل 200k است.

این به اندازه کافی بزرگ است که یک رمان کامل را در خود جای دهد. با این حال، متوجه خواهید شد که وقتی داده های بیشتری را در پنجره زمینه قرار می دهید، دقت شروع به کاهش می کند.

به مدل لیستی از مثلاً 30 قانون بدهید و در اغلب موارد متوجه خواهید شد که قوانین را نادیده می گیرد، قوانین را نادیده می گیرد یا کاملاً برعکس عمل می کند. چرا؟

مدل هیچ «جهان‌بینی» یا درکی از داده‌های زمینه ندارد. در حالی که این ممکن است ساده‌سازی بیش از حد نسل فعلی مدل‌ها باشد، این مدل اساساً به یک الگوریتم تطبیق الگوی پیشرفته برای تولید پاسخ خود متکی است.

هیچ تفکر یا درک درستی از داده های زمینه وجود ندارد، بنابراین یک مدل پیشرفته مانند Sonnet می تواند یک قانون ساده را که حتی یک کودک هفت ساله می تواند درک کند، از دست بدهد.

در دنیای واقعی، ما از فرم ها برای کنترل ورودی کاربر استفاده می کنیم. تنها راه های زیادی برای پر کردن یک فرم وجود دارد، اما زبان طبیعی ساختاری ندارد، بنابراین تغییراتی که می توان وارد کرد بی نهایت است.

سپس مدیریت این تنوع دشوار می شود و سطح دقت به طور قابل توجهی کاهش می یابد.

در اینجا یک مثال عملی است:

You are a service agent helping the user with their lunch order, you, must adhere to these rules:

1) When retrieving menu items, you must only retrieve items from the context data provided below and nowhere else.
2) Ask the user whether they prefer to collect from the canteen or would like delivery to their room. If they want delivery, ask for their room number.
3) Menus can have sauce options, such as tomato sauce, white sauce, mustard sauce, etc... You must ask them which sauce they prefer if not mentioned.
...
وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

یک مشتری ممکن است بگوید:
می توانم برگر مرغ را بخورم، حتما گوجه فرنگی، پیاز و کاهو اضافه کنید؟

پاسخ هوش مصنوعی:
“مطمئنا، من 1 X برگر مرغ با سس گوجه فرنگی، پیاز و کاهو ضبط کرده ام.”

یک شخص واقعی آن را به “یک برش گوجه فرنگی” تعبیر می کند که با “سس گوجه فرنگی” یکی نیست.

همانطور که اعلان‌های پیچیده‌تری می‌سازید، بیشتر و بیشتر متوجه این موضوع می‌شوید، این مدل زمانی که مراحل زیادی برای دنبال کردن دارد، برای درک حتی دستورالعمل‌های اساسی تلاش می‌کند.

عوامل، با استفاده از یک زنجیره فکری و RAG، می‌توانند دقت مدل‌ها را تا حد زیادی بهبود بخشند، اما باز هم همیشه در 20% یا حتی 5% موارد شکست می‌خورد.

در دنیای واقعی

پرواز هوش مصنوعی در دنیای واقعی
یکی از دلایلی که مشتریان ارائه‌دهندگان SaaS را در مقابل شرکت‌های بزرگی مانند مایکروسافت ترجیح می‌دهند، ویژگی‌های شخصی‌سازی شده محصول و پشتیبانی اختصاصی آن‌ها است.

در حالی که یک ربات چت مفید است و داشتن یک ربات کمکی برای درخواست گزارش و کمک در مورد صفحات گسترده عالی است، اکثر مشتریان هیچ سرنخی ندارند که چگونه از چت ربات برای دستیابی به نتایج مورد نیاز خود درخواست کنند.

حالا من نمی گویم آنها “احمق” یا “بی کفایت” هستند، می گویم مردم نقاط قوت و علایق متفاوتی دارند.

برای شما مثالی می زنم: من کمی در مورد لوله کشی می دانم و احتمالاً می توانم بفهمم چگونه یک آبفشان را جایگزین کنم، اما آیا واقعاً دفعه بعد که ترکید این کار را انجام خواهم داد؟

قطعا، نه! زیرا:

الف) ترجیح می دهم این کار را به حرفه ای ها بسپارم که می دانند چه کار می کنند.
ب) انجام این کار زمان زیادی از من خواهد برد زیرا احتمالاً باید در گوگل جستجو کنم و یوتیوب را تماشا کنم.
ج) من هیچ علاقه ای به تعمیر آبفشان ندارم.
د) با وقتم کارهای بهتری دارم.

اکثر صاحبان کسب و کار نمی خواهند با چیزهای فنی کمانچه بپردازند و زمان کافی نیز ندارند. مهم نیست که نمایندگان چقدر قدرتمند هستند، همیشه یک شرکت SaaS وجود خواهد داشت که وارد می شود و کارها را برای غیر فنی ساده تر می کند و آنها خوشحال خواهند شد که 20 تا 30 دلار در ماه برای راحتی پرداخت کنند.

مهندسی سیستم

هوش مصنوعی تحت تأثیر سیستم ها قرار گرفته است
اغلب در یک SaaS با اندازه مناسب، چیزی بیش از CRUD پیدا خواهید کرد. معمولاً ترکیبی از سیستم‌های پیچیده و ساده وجود دارد که در دریایی از زیرساخت‌های مختلف به هم متصل شده‌اند. بدون سرور، خطوط لوله، کانتینرهای داکر، سرورهای اختصاصی، برنامه‌های تک صفحه‌ای، و تک‌صفحه‌های چند صفحه‌ای را در همه جا مستقر کنید، به غیر از آن پشته قدیمی قدیمی که هیچ‌کس نمی‌خواهد آن را لمس کند!

همه اینها به دلیل تقاضای مشتری و نیاز به ارائه یک پیشنهاد متنوع با ویژگی های عمیق برای دور کردن رقبا به وجود آمدند.

در حالی که Agents می تواند یک برنامه واکنش کامل بسازد یا یک صفحه فرود ایجاد کند، این در انزوا است. من هنوز ندیده ام که یک تیم توسعه دهنده به مرخصی برود و کلیدها را به یک نماینده بیاندازد تا مسئولیت را بر عهده بگیرد 🙂

در بهترین حالت، می توانید یک خط لوله از انواعی مانند Zapier برای زیرساخت و کد ایجاد کنید. سپس Agent می تواند کد را بررسی کند، یک باگ را برطرف کند و در سرور PR و توسعه دهنده مستقر شود.

نتیجه گیری

پس نه ساتیا نادلا! فقط نه! Agentها برنامه‌های SaaS را از بین نمی‌برند، در واقع، Agentها به بنیان‌گذاران فناوری بیشتر قدرت می‌دهند تا با سرعت بیشتری نوآوری کنند، بنابراین ممکن است تعداد برنامه‌های SaaS در بازار افزایش یابد.

منصفانه بگویم، من فکر می‌کنم ساتیا بیشتر به ابزارهای اداری کم‌تحمل مانند صفحات گسترده یا ابزارهای گزارش‌دهی تجاری اشاره می‌کرد که اساساً فقط به صورت پویا SQL را می‌سازند.

مطمئناً، در آن نمونه، مطمئناً، Agents یک تغییر دهنده بازی خواهد بود.

من دوست دارم نظرات شما را بشنوم، نظر شما در مورد عوامل هوش مصنوعی و نقش آنها در آینده برنامه های SaaS چیست؟

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا