گوگل به قدری روی رقیب GPT-4 خودش، جمینی حساب میکند که بخشهایی از یک ویدیوی آزمایشی اخیر را روی صحنه برد. بلومبرگ در یک مقاله نظری میگوید که گوگل اعتراف میکند که برای ویدیوی خود با عنوان «Hands-on with Gemini: Interacting with Multimodal AI» نه تنها برای سرعت بخشیدن به خروجیها (که در توضیحات ویدیو اعلام شده بود) ویرایش شده است، بلکه به طور ضمنی ویرایش شده است. تعامل صوتی بین کاربر انسانی و هوش مصنوعی در واقع وجود نداشت.
در عوض، نسخه ی نمایشی واقعی با «استفاده از فریم های عکس ثابت از فیلم، و درخواست از طریق متن» ساخته شد، به جای اینکه Gemini به یک طراحی یا تغییر اشیاء روی میز در زمان واقعی پاسخ دهد – یا حتی پیش بینی کند. این بسیار کمتر از آن چیزی است که ویدیو میخواهد ما را به اشتباه بیندازد، و بدتر از آن، عدم سلب مسئولیت در مورد روش ورودی واقعی، آمادگی جمینی را تا حدی مشکوک میکند.
جای تعجب نیست که گوگل هر گونه تخلفی را در اینجا انکار می کند، زیرا The Verge را به یک پست X نوشته شده توسط رهبر جمینی، Oriol Vinyals، ارجاع می دهد که می گوید “همه درخواست ها و خروجی های کاربر در ویدیو واقعی هستند” و اینکه او تیم این ویدیو را “برای الهام بخشیدن به توسعه دهندگان” ساخته است. با توجه به توجه اخیر صنعت و مقامات به هوش مصنوعی، شاید غول فناوری باید نسبت به ارائه های خود در این زمینه حساس تر باشد.
واقعاً خوشحالم که علاقهمندیها را در مورد ویدیوی ما با نام «Hands-on with Gemini» میبینیم. دیروز در وبلاگ توسعه دهنده خود، نحوه استفاده از Gemini برای ایجاد آن را توضیح دادیم. https://t.co/50gjMkaVc0
ما توالیهای Gemini را با روشهای مختلف – تصویر و متن در این مورد – دادیم و از او خواستیم پاسخ دهد… pic.twitter.com/Beba5M5dHP