سلاح جدید گوگل در نبرد مدلهای هوش مصنوعی
مدل جدید هوش مصنوعی گوگل ۷۰۰ برابر قویتر از مدل پیشرو اوپن اِیآی است.
به گزارش خبرگزاری علم و فناوری آنا به نقل از اینترستینگ اینجینیرینگ، گوگل ادعا کرده است که جمنای ۱.۵ (Gemini 1.5) میتواند تا یک میلیون کلمه رمزی (توکن)، برابر با چهار میلیون کاراکتر یا ۸۰۰ هزار واژه را مدیریت کند.
موضوع رقابت در عرصه هوش مصنوعی برای گوگل جدی است. تنها یک هفته پس از عرضه قدرتمندترین مدل خود، جمنای ۱.۰ اولترا (Gemini 1.0 Ultra)، این غول فناوری از نسخه جدیدتر، جمنای ۱.۵ رونمایی کرد. این نسل جدید از مدلهای هوش مصنوعی سریعتر، هوشمندتر و همهکارهتر از قبل است.
جمنای ۱.۵
جمنای ۱.۵ نتیجه نوآوری بیوقفه گوگل در پردازش زبان طبیعی است؛ شاخهای از هوش مصنوعی که با درک و تولید زبان انسان سروکار دارد. گوگل ادعا کرده است که جمنای ۱.۵ میتواند تا یک میلیون کلمه رمزی (توکن)، برابر با چهار میلیون کاراکتر یا ۸۰۰ هزار واژه را مدیریت کند. این ۷۰۰ برابر بیشتر از رکورد قبلی چت جیپیتی ۴ – اُپن اِی آی است که تنها میتواند ۱۲۸ هزار کلمه رمزی را پردازش کند.
این بدان معناست که جمنای ۱.۵ میتواند متنهای طولانیتر و پیچیدهتر مانند رمان، مقاله یا سخنرانی را با حفظ انسجام و کیفیت، درک و تولید کند. همچنین نشان میدهد که جمنای ۱.۵ میتواند ورودیهای چندوجهی مانند متن، تصویر، صدا و ویدیو را مدیریت کند و خروجیهایی را در هر یک از این فرمتها به دست دهد. به عنوان مثال، جمنای ۱.۵ میتواند به سوالات مطرحشده در یک کلیپ ویدیویی پاسخ دهد یا بر اساس یک دستور متنی آهنگ بسازد.
ترکیبی از کارشناسان
جمنای ۱.۵ تنها یک مدل نیست، بلکه خانوادهای از مدلها است که نیازها و کاربردهای مختلفی را برآورده میکند. مدل جمنای ۱.۵ پرو (Pro) که از هر نظر همهکاره است از نظر عملکرد با جمنای ۱.۰ اولترا برابری میکند، اما توان محاسباتی بسیار کمتری را به کار میگیرد که آن را برای استفاده در دنیای واقعی کارآمدتر و مقیاسپذیرتر میکند. جمنای ۱.۵ پرو همچنین اولین مدلی است که از تکنیک جدیدی به نام «ترکیبی از کارشناسان (MoE)» استفاده میکند که به آن امکان میدهد هر بار به جای اجرای کل مدل از مرتبطترین بخشها برای جستجو استفاده کند.
دِمیس حسابیس (Demis Hassabis) مدیرعامل بخش دیپمایند (DeepMind) گوگل که بازوی تحقیقاتی جمنای است میگوید: «تکنیک «ترکیبی از کارشناسان» به جمنای ۱.۵ پرو امکان میدهد تا به جای ترکیب کردن دادهها در آینده، آنها را از همان ابتدا ادغام کند. به این ترتیب جمنای ۱.۵ پرو میتواند متن، تصاویر و صدا را بهطور همزمان یاد بگیرد و از هم افزایی بین آنها استفاده کند.»
آزمایش زبانی
جمنای ۱.۵ پرو از تواناییهای مهم «یادگیری درون متنی» برخوردار است، به این معنی که میتواند با پردازش اطلاعات در یک زمان طولانی بدون نیاز به تنظیمات بیشتر، مهارت جدیدی کسب کند. برای آزمایش این توانایی، گوگل از معیار ترجمه ماشینی کتاب (MTOB) استفاده کرد که توانایی یادگیری این مدل از دادههای ناآشنا را ارزیابی میکند. آنها این مدل را با یک راهنمای دستور زبان از کالامَنگ (زبانی با کمتر از ۲۰۰ گویشور در جهان) محک زدند که توانست ترجمه انگلیسی به کالامنگ را در سطحی قابل مقایسه با یک انسان که این زبان را یاد گرفته است ارائه دهد.
افزایش تواناییهای قبلی
گوگل با جمنای ۱.۵ بار دیگر سطح تحقیق و توسعه هوش مصنوعی را افزایش داد. بنا بر اعلام گوگل، جمنای ۱.۵ بسیاری از محصولات و خدمات مانند دستیار گوگل، گوگل ترنسلیت و گوگل فوتوز (Google Photos) را قدرتمندتر میکند. جمنای اَدوَنسد (Gemini Advanced) پلتفرم مکالمه هوش مصنوعی را تواناتر و رقابتیتر میکند و آن را به رقیبی قدرتمند برای چت جیپیتی پلاس اُپناِیآی تبدیل خواهد کرد و برخلاف چت جیپیتی پلاس که فقط متنمحور بود، جمنای ادونسد میتواند ورودیها و خروجیهای چندوجهی را مدیریت کند و ویژگیها و عملکردهای بیشتری را در اختیار کاربر قرار دهد.
گوگل تنها بازیکن در زمین مسابقه هوش مصنوعی نیست. شرکتهای دیگری مانند مایکروسافت، فیسبوک و آنتروپیک نیز در حال کار توسعه مدلهای هوش مصنوعی خود هستند که ممکن است به زودی سلطه گوگل را به چالش بکشد. جنگ هوش مصنوعی در حال داغ شدن است و جمنای ۱.۵ جدیدترین سلاح گوگل است.