استارتآپ محاسباتی هوش مصنوعی Cerebras مدلهای متنباز ChatGPT را منتشر میکند


راه اندازی تراشه هوش مصنوعی سیستم های مغزی گفت که مدلهای متنباز مانند ChatGPT را برای جامعه تحقیقاتی و تجاری منتشر کرده است تا در تلاش برای تقویت همکاریهای بیشتر، به صورت رایگان از آن استفاده کنند.
مستقر در سیلیکون ولی مغزها هفت مدل را منتشر کرد که همگی بر روی ابررایانه هوش مصنوعی خود به نام آندرومدا آموزش دیده بودند، از جمله مدلهای زبانی کوچکتر با 111 میلیون پارامتر تا یک مدل بزرگتر با 13 میلیارد پارامتر.
گفت: “جنبش بزرگی برای بستن آنچه که در هوش مصنوعی منبع باز بوده است وجود دارد… جای تعجب نیست زیرا اکنون پول هنگفتی در آن وجود دارد.” اندرو فلدمن، بنیانگذار و مدیر عامل Cerebras. “هیجان در جامعه، پیشرفتی که ما داشته ایم، تا حد زیادی به این دلیل بوده است که بسیار باز بوده است.”
مدل هایی با پارامترهای بیشتر قادر به انجام توابع مولد پیچیده تری هستند.
به عنوان مثال، چت ربات OpenAI ChatGPT که اواخر سال گذشته راه اندازی شد، دارای 175 میلیارد پارامتر است و می تواند شعر و تحقیق تولید کند، که به جلب علاقه و بودجه زیادی به هوش مصنوعی کمک کرده است.
سربراس گفت که مدلهای کوچکتر را میتوان بر روی تلفنها یا بلندگوهای هوشمند مستقر کرد در حالی که مدلهای بزرگتر روی رایانههای شخصی یا سرورها اجرا میشوند، اگرچه کارهای پیچیدهای مانند خلاصهسازی قسمتهای بزرگ نیازمند مدلهای بزرگتر است.
با این حال، کارل فروندمشاور تراشه در هوش مصنوعی کامبرین گفت که بزرگتر همیشه بهتر نیست.
فروند گفت: “مقالات جالبی منتشر شده است که نشان می دهد (مدل کوچکتر) می تواند دقیق باشد اگر آن را بیشتر آموزش دهید.” بنابراین یک معامله بین بزرگتر و آموزش دیده تر وجود دارد.
فلدمن گفت بزرگترین مدل او کمی بیش از یک هفته طول کشید تا آموزش ببیند، کاری که معمولاً چندین ماه طول میکشد، به لطف معماری سیستم Cerebras، که شامل تراشهای به اندازه یک بشقاب غذا است که برای آموزش هوش مصنوعی ساخته شده است.
اکثر مدلهای هوش مصنوعی امروزی بر روی تراشههای Nvidia Corp آموزش میبینند، اما استارتآپهای بیشتری مانند Cerebras تلاش میکنند تا در این بازار سهم بگیرند.
به گفته فلدمن، مدلهای آموزشدیده بر روی ماشینهای Cerebras نیز میتوانند در سیستمهای Nvidia برای آموزش بیشتر یا سفارشیسازی استفاده شوند.

فیس بوکتوییترلینکدین