کمتر از ۲۴ ساعت پیش OpenAI از هوش مصنوعی GPT-4o رونمایی کرد. این هوش مصنوعی مالتیمودال میتواند با دیدن اطراف از طریق دوربین گوشی به آن واکنش نشان دهد. حالا پروژه استرا گوگل هم به سرعت برای رقابت با GPT-4o از راه رسیده است. گوگل یک ویدئو حیرتانگیز از قابلیتهای این دستیار منتشر کرد که همگان را شگفتزده کرده است.
پروژه استرا گوگل چیست؟
در حال حاضر دستیار گوگل یکی از قویترین، باهوشترین و سریعترین دستیارهای دیجیتال است. این دستیار به لطف دسترسی به بخشهای مختلف اندروید و همچنین هوش مصنوعی Gemini قابلیتهای بسیار خوبی دارد. با اینحال تاکنون دستیار گوگل تنها ورودی متن، صوت یا تصویر را قبول میکرد. حالا پروژه استرا قصد دارد ورودی ویدئویی را هم بهصورت زنده اضافه کند. پروژه استرا در واقع یک دستیار هوش مصنوعی مالتیمودال زنده (real-time) محسوب میشود.
همانطور که در ویدئو میبینید، هوش مصنوعی گوگل بهصورت زنده و مداوم درحال آنالیز دنیا از پنجره دوربین گوشی است و میتواند به هر پرسشی در اینباره پاسخ دهد. در این ویدئو کاربر میگوید تمام چیزهایی که در تصویر صدا تولید میکنند را نام ببرد و پروژه استرا به اسپیکر اشاره میکند. کاربر سپس بخشی از اسپیکر را مشخص کرده و درباره نام و قابلیت آن بخش خاص سوال میپرسد.
در بخش دیگری از ویدئو، دوربین گوشی روی بخشی از مانیتور با یک کد خاص برنامهنویسی قرار میگیرد و گوگل به کاربر توضیح میدهد که این بخش از کد چه کاربردی دارد. پروژه استرا همچنین موقعیت کاربر را نیز براساس محیط بیرونی تشخیص میدهد و حتی میتواند به خاطر بیاورد عینک شما که در تصویر لحظهای مشخص شده، کجا بوده است.
بخش دوم این ویدئو حتی هیجانانگیزتر است. به لطف عینکهای هوشمند، دیگر نیازی به استفاده از گوشی هم ندارید. تنها کافیست عینک را به چشمتان بزنید تا استرا همان چیزی را ببیند که شما میبینید. سپس میتوانید از او درباره هر چیزی مقابل دوربین سوال بپرسید و یا از آن بخواهید با خلاقیت خود برای حیوان خانگی یا عروسکتان نام انتخاب کند.
نکته مهم اینکه گوگل میگوید این ویدئو بهصورت زنده و بدون تقطیع ضبط شده و به این ترتیب پروژه استرا همانقدر سریع و شگفتانگیز است که در ویدئو میبینید. این هوش مصنوعی برپایه مدل زبانی Gemini 1.5 Pro توسعه داده شده و در آینده به گوشیها و گجتها خواهد آمد. با اینحال گوگل هنوز زمان تقریبی برای عرضه پروژه استرا اعلام نکرده است.