مدل زبانی GPT-4 معرفی شد؛ هوشمندتر با قابلیت ورودی متن و تصویر

شرکت OpenAI ساعاتی پیش از GPT-4 رونمایی کرد. این مدل زبانی هوش مصنوعی می‌تواند حالا به‌جز متن، تصویر را نیز به عنوان ورودی بپذیرد.

از علی ارغوان منتشر شده در ۲۳:۰۹ سه شنبه, ۲۳ اسفند , ۱۴۰۱

این روزها دیگر همه با ChatGPT تا حدودی آشنایی دارند؛ چت‌بات هوش مصنوعی که بر مبنای مدل زبانی GPT-3.5 توسعه داده شده است. اما حالا OpenAI از نسل جدید این مدل زبانی با نام GPT-4 رونمایی کرد که می‌تواند انقلابی در زمینه هوش مصنوعی باشد. برخلاف نسل قبلی، GPT-4 حالا می‌تواند علاوه بر متن، تصویر را نیز به عنوان ورودی قبول کند. به گفته OpenAI با این‌که GPT-4 هنوز در بسیاری موارد از انسان توانایی‌های کمتری دارد، اما در بسیاری از بنچمارک‌های حرفه‌ای و آکادمیک می‌تواند عملکردی در سطح انسان داشته باشد.

شرکت OpenAI با همکاری مایکروسافت ۶ ماه گذشته را با توجه به بازخوردهای ChatGPT صرف بهینه‌سازی GPT-4 کرده است. این مدل زبانی می‌تواند آزمون‌های مهمی را مثل Uniform Bar، LSAT و GRE با امتیازی در حدود ۱۰ درصد بهترین نمرات انسان‌ها پشت سر بگذارد. این در حالی است که GPT-3.5 امتیازی در سطح ۱۰ درصد پایینی قبول‌شدگان داشت. به گفته OpenAI این مدل جدید در زمینه‌های «واقعیت، قابلیت هدایت و جلوگیری از خروج از گاردریل‌های تعیین شده» رکوردشکنی کرده است.

مدل زبانی GPT-4 به ChatGPT خواهد آمد

به گفته Open AI این مدل زبانی قرار است هم به ChatGPT و هم به APIها بیاید. با این‌حال برای دسترسی به آن بایستی عضو اشتراکی ChatGPT Plus باشید که هزینه آن ۲۰ دلار در ماه است. علاوه بر این در ابتدا محدودیت‌هایی هم برای تعامل با این مدل وجود دارد. علاقمندان به API نیز بایستی در لیست انتظار ثبت نام کنند. به گفته تیم توسعه‌دهنده «GPT-4 قابل اتکاتر و خلاق‌تر بوده و می‌تواند دستورالعمل‌های با ظرافت بیشتری را نسبت به GPT-3.5 اجرا کند.

ورودی و خروجی‌های چندوجهی

قابلیت جدید ورودی چندوجهی GPT-4 را قادر می‌سازد انواع مختلف متون ورودی چه زبان طبیعی و چه کد برنامه‌نیوسی را درک کند. علاوه بر این امکان ارسال ورودی تصویر نیز وجود دارد. در واقع با GPT-4 می‌توانید نمودارهای مربوط به فروش، بازاریابی و گراف‌های مختلف و حتی کتاب‌های متنی و راهنماهای استفاده و اسکرین‌شات‌ها را آنالیز کنید. ChatGPT می‌تواند به سرعت این محتواها را اسکن کرده و آن‌ها را برایتان خلاصه کند. تیم OpenAI می‌گوید ChatGPT کلاسیک شخصیت، سبک و استایل ثابتی دارد اما در نسل جدید امکان تغییر آن‌ها به دلخواه کاربر وجود دارد.

در تصویر بالا از GPT-4 خواسته شده بگوید چه چیزی غیرعادی است. این مدل پاسخ داده این‌که مردی در حال اتو کردن با میز اتو به سقف یک تاکسی درحال حرکت متصل شده غیرمعمول است.

خطای کمتر در GPT-4

یکی از مشکلات GPT-3.5 خیالبافی یا Hallucination نام دارد. در واقع گاهی ChatGPT مواردی را به عنوان حقیقت بیان می‌کند که واقعیت ندارند و به کتب و اشخاصی استناد می‌کند که وجود خارجی ندارند! به گفته OpenAI در نسل جدید این مشکل تا ۴۰ درصد کاهش یافته است. همچنین احتمال این‌که مدل جدید به محتوای غیرقانونی پاسخ دهد ۸۲ درصد کاهی یافته است.

این شرکت از ۵۰ متخصص در زمینه‌های مختلفی از امنیت سایبری گرفته تا ایمنی و امنیت بین‌الملل خواسته تا مدل زبانی جدید را بررسی کرده و مشکلات احتمالی آن را مشخص کنند. به این ترتیب با این‌که ۴۰ درصد اشتباه کمتر کماکان بی‌نقص نیست، اما مزیت بزرگی نسبت به نسل پیش محسوب می‌شود.

مایکروسافت تأیید کرده که هوش مصنوعی موتور جستجوی بینگ این شرکت نیز به GPT-4 مجهز می‌شود. به این ترتیب اگر نمی‌خواهید هزینه اشتراک ماهانه ChatGPT Plus را بپردازید، باید از بینگ استفاده کنید.

منبع engadget theverge

هوش مصنوعی