در کنفرانس سالانه توسعهدهندگان Google I/O 2025، گوگل بار دیگر با معرفی مجموعهای از فناوریهای پیشرفته و جذاب، چشمانداز آینده هوش مصنوعی، واقعیت افزوده و تجربههای دیجیتال را ترسیم کرد. این مقاله نگاهی دارد به مهمترین رونماییها و نوآوریهایی که در این رویداد به نمایش گذاشته شد، ازجمله پیشرفت در مدلهای هوش مصنوعی Gemini، پلتفرم ارتباط ویدیویی سهبعدی Google Beam، امکانات جدید در Google Meet، پروژههای تحقیقاتی مانند Project Mariner و معرفی Android XR و دستگاههای پوشیدنی جدید سامسونگ، ارائه میدهد.
Gemini: هوش مصنوعی در سطحی فراتر از تصور
یکی از جذابترین بخشهای این رویداد، معرفی پیشرفتهای چشمگیر در سری مدلهای هوش مصنوعی Gemini بود. Gemini 2.5 Pro، جدیدترین و هوشمندترین مدل گوگل بهشمار میرود و بهبودهای قابلتوجهی در زمینه استدلال، کدنویسی و پردازش متنهای بلند داشته است. نسخه بهروزرسانی شده 2.5 Flash نیز که در اوایل ژوئن در دسترس قرار میگیرد، در تمامی معیارهای کلیدی عملکرد بهتر شده است.
گوگل در این نسل از مدلها، سمت ساخت مدلهای چندرسانهای (Multimodal) حرکت کرده که قادر به درک و تولید محتوا در قالبهای مختلف مانند متن، تصویر و صدا هستند. همچنین Gemini درحال تبدیل به یک «مدل جهانی» است؛ مدلی که میتواند برنامهریزی کرده و تجربههای جدید را با شبیهسازی جنبههای مختلف جهان همانند مغز انسان، تصور کند.
Personal Context: هوش مصنوعی با درک شخصیسازی شده
گوگل مفهوم «زمینه شخصی» (Personal Context) را معرفی کرده است که به مدلهای Gemini اجازه میدهد با اجازه کاربر، از دادههای مرتبط در اپلیکیشنهای گوگل مانند جیمیل استفاده کنند. این قابلیت، ضمن حفظ حریم خصوصی و شفافیت کامل، پاسخهای هوشمند را کاملا شخصیسازیشده ارائه میدهد. بهعنوانمثال، در جیمیل میتوانید پاسخهای هوشمند را بهگونهای تنظیم کنید که صدایتان را شبیهسازی کرده و حس طبیعیتری به مکالمات بدهند.
کدنویسی هوشمند با Gemini 2.5 Pro
یکی از قابلیتهای برجسته Gemini 2.5 Pro، توانایی آن در تولید کد و توسعه اپلیکیشنها است. این مدل خیلی راحت میتواند با دریافت یک درخواست ساده، اپلیکیشنهای وب را بسازد و توسعهدهندگان را در محیطهایی مانند Google AI Studio، Android Studio، Firebase Studio و دیگر پلتفرمها یاری کند. همچنین ابزارهای جانبی مانند «Jules» بهعنوان Agent یا عامل کدنویسی، امکان انجام وظایف پیچیده در کدهای بزرگ را فراهم میکنند که پیشتر، ساعتها زمان میبرد.
Google Beam: تجربه ویدیویی سهبعدی پیشرفته
گوگل Beam یک پلتفرم جدید ارتباط ویدیویی است که با استفاده از مدلهای ویدیویی پیشرفته، تصاویر دوبعدی را به یک تجربه واقعی سهبعدی تبدیل میکند. این فناوری با کمک شش دوربین که از زاویههای مختلف تصویر شما را ثبت میکنند و ترکیب آن تصاویر با هوش مصنوعی، باعث میشود تصویرتان بهصورت سهبعدی روی نمایشگرهای مخصوص نمایش داده شود، بهطوریکه بهنظر میرسد تصویر در هوا معلق است و به نور پسزمینه نیازی ندارد.
در همکاری با شرکت HP، اولین دستگاههای Google Beam تا پایان سال جاری برای مشتریان اولیه عرضه خواهند شد. این فناوری، انقلابی در نحوه برقراری ارتباط ویدیویی است که حس حضور واقعیتر و تعامل طبیعیتر را به کاربران میدهد.
ترجمه همزمان در Google Meet و پروژه Mariner
یک بهروزرسانی مهم دیگر در Google Meet، ارائه ترجمه همزمان گفتار بین زبانهای انگلیسی و اسپانیایی است که برای مشترکین این سرویس فعال شده و در آینده زبانهای بیشتری اضافه خواهند شد. این قابلیت به بهبود ارتباطات بینالمللی و جلسات چندزبانه کمک شایانی میکند.
پروژه تحقیقاتی Mariner بهعنوان یک عامل هوشمند، قادر است بهصورت خودکار در وب جستجو کند و کارهای پیچیده را انجام دهد. برای مثال، اگر بخواهید آپارتمانی در آستین با مشخصات خاصی پیدا کنید، Mariner میتواند با استفاده از اپلیکیشن Gemini و منابعی مانند Zillow، آگهیهای مرتبط را پیدا و فیلترهای دقیق موردنظر را اعمال کند. نسخه آزمایشی این ابزار، بهزودی برای مشترکین در دسترس خواهد بود.
حالت AI Mode و جستجوی هوشمند
گوگل حالت جدیدی به نام AI Mode را معرفی کرده که به کاربران امکان میدهد تجربه جستجو کاملا هوشمند، تعاملی و شخصیسازی شده را داشته باشند. این حالت درحالحاضر برای همه کاربران آمریکایی فعال شده و از مدل Gemini 2.5 استفاده میکند.
در AI Mode، کاربران میتوانند هر سوالی که دارند بپرسند و موتور جستجو پاسخهای جامع و مفصل همراه با منابع، لینکها و پیشنهادات شخصیسازیشده ارائه میدهد. این حالت میتواند با اتصال به دیگر اپلیکیشنهای گوگل مانند جیمیل، زمینه شخصی شما را نیز وارد پاسخها کند و اطلاعات دقیقتر و مرتبطتری فراهم آورد.
Search Live: جستجو با دید دوربین
AI Mode قابلیت جدیدی به نام Search Live دارد که به کمک دوربین دستگاه، میتواند آنچه شما میبینید را تشخیص داده و در لحظه اطلاعات مفید و مرتبط ارائه دهد. این ویژگی بهویژه در خرید آنلاین و جستجو محصولات، بسیار کاربردی است.
تجربه خرید هوشمند و Try On مجازی
با AI Mode، گوگل امکانات جدیدی برای خرید آنلاین معرفی کرده است که شامل قابلیت Try On مجازی لباسها است. کاربران میتوانند با آپلود عکس خود، لباسها را بهصورت مجازی امتحان کنند و بهتر تصمیم بگیرند چه سبک و اندازهای برای آنها مناسبتر است. این قابلیت با استفاده از مدلهای ویژهای که برای تولید تصاویر در حوزه مد آموزش دیدهاند، لباسها را بهشکلی دقیق و واقعی روی عکس کاربر نمایش میدهد.
Gemini Live و قابلیتهای چندزبانه
Gemini Live یکی دیگر از فناوریهای برجسته است که مکالمات بسیار طبیعی و تعاملی را در بیش از ۴۵ زبان و در بیش از ۱۵۰ کشور ممکن میسازد. این سرویس اکنون شامل اشتراکگذاری دوربین و صفحه نمایش نیز هست و بهصورت رایگان در اپلیکیشن Gemini برای سیستمهای اندروید و iOS عرضه شده است.
Deep Research و Canvas: جستجو و خلق محتوا در یک فضای تعاملی
Deep Research به کاربران اجازه میدهد فایلهای خود را بارگذاری کنند تا عامل پژوهشی هوش مصنوعی بتواند با استفاده از آنها تحقیقات دقیقتری انجام دهد. بهزودی امکان جستجو در گوگل درایو و جیمیل نیز افزوده خواهد شد.
Canvas فضای تعاملی Gemini برای همکاری و خلق محتوا است که میتواند گزارشهای تحقیقاتی را به صفحات وب پویا، اینفوگرافیکها، آزمونهای تعاملی و حتی پادکستهای سفارشی در ۴۵ زبان تبدیل کند.
Gemini در مرورگر کروم و مدل تصویرسازی Imagine 4
گوگل Gemini را به مرورگر کروم آورده تا بهعنوان دستیار هوش مصنوعی در مرور وب به کاربران کمک کند. این دستیار هوشمند، بهطور خودکار زمینه صفحه وب را درک میکرده و پاسخهای مرتبط و مفید ارائه میدهد.
همچنین مدل تصویرسازی جدید Imagine 4 معرفی شد که یک جهش بزرگ در تولید تصاویر است. این مدل نهتنها متن و املای صحیح را درک میکند؛ بلکه انتخابهای خلاقانهای مانند استفاده از استخوانهای دایناسور در فونت و تنظیم دقیق فاصله و اندازه حروف را انجام میدهد. این فناوری امکان خلق پوسترها و تصاویر باکیفیت حرفهای را بسیار سادهتر میکند.
Veo 3 و Lyria 2: نسل جدید تولید ویدیو و موسیقی با هوش مصنوعی
Veo 3 مدل جدیدی برای تولید ویدیوهای هوش مصنوعی است که میتواند کاراکترها، صحنهها و سبکها را حفظ کند و فیلمهایی با کنترل دقیق دوربین بسازد. این ابزار که در قالب یک پلتفرم به نام Flow ارائه شده، به سازندگان فیلم امکان میدهد با وارد کردن تصاویر یا تولید آنها بهصورت لحظهای، ویدیوهای باکیفیت و خلاقانه بسازند.
در حوزه موسیقی، Lyria 2 بهعنوان یک مولد موسیقی با کیفیت بالا و صدای حرفهای معرفی شده است که قادر به تولید موسیقیهای ملودیک همراه با آوازهای تکخوان و گروهی است. این فناوری از همین امروز برای شرکتها، سازندگان محتوا و موسیقیدانان در دسترس است.
Android XR و دستگاههای پوشیدنی جدید سامسونگ
گوگل با همکاری سامسونگ و کوالکام، پلتفرم Android XR را معرفی کرده است که تجربههای واقعیت افزوده و واقعیت ترکیبی را در دستگاههای مختلف با امکانات متنوع فراهم میکند. اولین دستگاه مبتنی بر این پلتفرم، Project Muhan سامسونگ است که قرار است سال جاری عرضه شود.
این عینکهای هوشمند دارای دوربین و میکروفون برای شنیدن و دیدن محیط اطراف، اسپیکر برای پخش صدا و تماس و نمایشگر داخلی برای ارائه اطلاعات بهصورت خصوصی هستند. این دستگاهها با گوشیهای هوشمند سازگار بوده و کاربر میتواند بدون استفاده از دست، به اپلیکیشنها دسترسی داشته باشد.
دموی جذاب Android XR
در یک دمو زنده، امکان دیدن محیط اطراف و متون از طریق لنز عینکهای Android XR نمایش داده شده است. همچنین دستورات صوتی به Gemini داده شده تا پیامها ارسال و اعلانها کنترل شوند. این نمونه عملی، نمایانگر قابلیت بالای این پلتفرم برای تعامل طبیعی و هوشمند با دنیای اطراف است.
چشماندازی نو از هوش مصنوعی
گوگل I/O در کنفرانس سال 2025 مجموعهای از فناوریهای نوآورانه معرفی کرد که نشاندهنده تعهد گوگل به پیشرفتهای هوش مصنوعی، واقعیت افزوده و تجربههای دیجیتال است. از مدلهای هوشمند Gemini گرفته تا پلتفرمهای ویدیویی سهبعدی و دستگاههای پوشیدنی Android XR، نمایانگر آیندهای هستند که هوش مصنوعی بهشکلی طبیعیتر و کاربردیتر در زندگی روزمره حضور خواهد داشت.
اگر دنبال فناوریهای روز و تحولات بزرگ در دنیای دیجیتال هستید، این نوآوریها چشماندازی هیجانانگیز و الهامبخش فراهم میکنند که در ماهها و سالهای آینده وارد زندگی خواهند شد.