کنفرانس Google I/O 2025: نگاهی به نوآوری‌های جدید گوگل

در کنفرانس سالانه توسعه‌دهندگان Google I/O 2025، گوگل بار دیگر با معرفی مجموعه‌ای از فناوری‌های پیشرفته و جذاب، چشم‌انداز آینده هوش مصنوعی، واقعیت افزوده و تجربه‌های دیجیتال را ترسیم کرد. این مقاله نگاهی دارد به مهم‌ترین رونمایی‌ها و نوآوری‌هایی که در این رویداد به نمایش گذاشته شد، ازجمله پیشرفت در مدل‌های هوش مصنوعی Gemini، پلتفرم ارتباط ویدیویی سه‌بعدی Google Beam، امکانات جدید در Google Meet، پروژه‌های تحقیقاتی مانند Project Mariner و معرفی Android XR و دستگاه‌های پوشیدنی جدید سامسونگ، ارائه می‌دهد.

Gemini: هوش مصنوعی در سطحی فراتر از تصور

یکی از جذاب‌ترین بخش‌های این رویداد، معرفی پیشرفت‌های چشمگیر در سری مدل‌های هوش مصنوعی Gemini بود. Gemini 2.5 Pro، جدیدترین و هوشمندترین مدل گوگل به‌شمار می‌رود و بهبودهای قابل‌توجهی در زمینه استدلال، کدنویسی و پردازش متن‌های بلند داشته است. نسخه به‌روزرسانی شده 2.5 Flash نیز که در اوایل ژوئن در دسترس قرار می‌گیرد، در تمامی معیارهای کلیدی عملکرد بهتر شده است.

گوگل در این نسل از مدل‌ها، سمت ساخت مدل‌های چندرسانه‌ای (Multimodal) حرکت کرده که قادر به درک و تولید محتوا در قالب‌های مختلف مانند متن، تصویر و صدا هستند. همچنین Gemini درحال تبدیل به یک «مدل جهانی» است؛ مدلی که می‌تواند برنامه‌ریزی کرده و تجربه‌های جدید را با شبیه‌سازی جنبه‌های مختلف جهان همانند مغز انسان، تصور کند.

Personal Context: هوش مصنوعی با درک شخصی‌سازی شده

گوگل مفهوم «زمینه شخصی» (Personal Context) را معرفی کرده است که به مدل‌های Gemini اجازه می‌دهد با اجازه کاربر، از داده‌های مرتبط در اپلیکیشن‌های گوگل مانند جیمیل استفاده کنند. این قابلیت، ضمن حفظ حریم خصوصی و شفافیت کامل، پاسخ‌های هوشمند را کاملا شخصی‌سازی‌شده ارائه می‌دهد. به‌عنوان‌مثال، در جیمیل می‌توانید پاسخ‌های هوشمند را به‌گونه‌ای تنظیم کنید که صدایتان را شبیه‌سازی کرده و حس طبیعی‌تری به مکالمات بدهند.

کدنویسی هوشمند با Gemini 2.5 Pro

یکی از قابلیت‌های برجسته Gemini 2.5 Pro، توانایی آن در تولید کد و توسعه اپلیکیشن‌ها است. این مدل خیلی راحت می‌تواند با دریافت یک درخواست ساده، اپلیکیشن‌های وب را بسازد و توسعه‌دهندگان را در محیط‌هایی مانند Google AI Studio، Android Studio، Firebase Studio و دیگر پلتفرم‌ها یاری کند. همچنین ابزارهای جانبی مانند «Jules» به‌عنوان Agent یا عامل کدنویسی، امکان انجام وظایف پیچیده در کدهای بزرگ را فراهم می‌کنند که پیش‌تر، ساعت‌ها زمان می‌برد.

Google Beam: تجربه ویدیویی سه‌بعدی پیشرفته

گوگل Beam یک پلتفرم جدید ارتباط ویدیویی است که با استفاده از مدل‌های ویدیویی پیشرفته، تصاویر دوبعدی را به یک تجربه واقعی سه‌بعدی تبدیل می‌کند. این فناوری با کمک شش دوربین که از زاویه‌های مختلف تصویر شما را ثبت می‌کنند و ترکیب آن تصاویر با هوش مصنوعی، باعث می‌شود تصویرتان به‌صورت سه‌بعدی روی نمایشگرهای مخصوص نمایش داده شود، به‌طوری‌که به‌نظر می‌رسد تصویر در هوا معلق است و به نور پس‌زمینه نیازی ندارد.

در همکاری با شرکت HP، اولین دستگاه‌های Google Beam تا پایان سال جاری برای مشتریان اولیه عرضه خواهند شد. این فناوری، انقلابی در نحوه برقراری ارتباط ویدیویی است که حس حضور واقعی‌تر و تعامل طبیعی‌تر را به کاربران می‌دهد.

ترجمه همزمان در Google Meet و پروژه Mariner

یک به‌روزرسانی مهم دیگر در Google Meet، ارائه ترجمه همزمان گفتار بین زبان‌های انگلیسی و اسپانیایی است که برای مشترکین این سرویس فعال شده و در آینده زبان‌های بیشتری اضافه خواهند شد. این قابلیت به بهبود ارتباطات بین‌المللی و جلسات چندزبانه کمک شایانی می‌کند.

پروژه تحقیقاتی Mariner به‌عنوان یک عامل هوشمند، قادر است به‌صورت خودکار در وب جستجو کند و کارهای پیچیده را انجام دهد. برای مثال، اگر بخواهید آپارتمانی در آستین با مشخصات خاصی پیدا کنید، Mariner می‌تواند با استفاده از اپلیکیشن Gemini و منابعی مانند Zillow، آگهی‌های مرتبط را پیدا و فیلترهای دقیق مورد‌نظر را اعمال کند. نسخه آزمایشی این ابزار، به‌زودی برای مشترکین در دسترس خواهد بود.

حالت AI Mode و جستجوی هوشمند

گوگل حالت جدیدی به نام AI Mode را معرفی کرده که به کاربران امکان می‌دهد تجربه جستجو کاملا هوشمند، تعاملی و شخصی‌سازی شده را داشته باشند. این حالت درحال‌حاضر برای همه کاربران آمریکایی فعال شده و از مدل Gemini 2.5 استفاده می‌کند.

در AI Mode، کاربران می‌توانند هر سوالی که دارند بپرسند و موتور جستجو پاسخ‌های جامع و مفصل همراه با منابع، لینک‌ها و پیشنهادات شخصی‌سازی‌شده ارائه می‌دهد. این حالت می‌تواند با اتصال به دیگر اپلیکیشن‌های گوگل مانند جیمیل، زمینه شخصی شما را نیز وارد پاسخ‌ها کند و اطلاعات دقیق‌تر و مرتبط‌تری فراهم آورد.

Search Live: جستجو با دید دوربین

AI Mode قابلیت جدیدی به نام Search Live دارد که به کمک دوربین دستگاه، می‌تواند آنچه شما می‌بینید را تشخیص داده و در لحظه اطلاعات مفید و مرتبط ارائه دهد. این ویژگی به‌ویژه در خرید آنلاین و جستجو محصولات، بسیار کاربردی است.

تجربه خرید هوشمند و Try On مجازی

با AI Mode، گوگل امکانات جدیدی برای خرید آنلاین معرفی کرده است که شامل قابلیت Try On مجازی لباس‌ها است. کاربران می‌توانند با آپلود عکس خود، لباس‌ها را به‌صورت مجازی امتحان کنند و بهتر تصمیم بگیرند چه سبک و اندازه‌ای برای آن‌ها مناسب‌تر است. این قابلیت با استفاده از مدل‌های ویژه‌ای که برای تولید تصاویر در حوزه مد آموزش دیده‌اند، لباس‌ها را به‌شکلی دقیق و واقعی روی عکس کاربر نمایش می‌دهد.

Gemini Live و قابلیت‌های چندزبانه

Gemini Live یکی دیگر از فناوری‌های برجسته است که مکالمات بسیار طبیعی و تعاملی را در بیش از ۴۵ زبان و در بیش از ۱۵۰ کشور ممکن می‌سازد. این سرویس اکنون شامل اشتراک‌گذاری دوربین و صفحه نمایش نیز هست و به‌صورت رایگان در اپلیکیشن Gemini برای سیستم‌های اندروید و iOS عرضه شده است.

Deep Research و Canvas: جستجو و خلق محتوا در یک فضای تعاملی

Deep Research به کاربران اجازه می‌دهد فایل‌های خود را بارگذاری کنند تا عامل پژوهشی هوش مصنوعی بتواند با استفاده از آن‌ها تحقیقات دقیق‌تری انجام دهد. به‌زودی امکان جستجو در گوگل درایو و جیمیل نیز افزوده خواهد شد.

Canvas فضای تعاملی Gemini برای همکاری و خلق محتوا است که می‌تواند گزارش‌های تحقیقاتی را به صفحات وب پویا، اینفوگرافیک‌ها، آزمون‌های تعاملی و حتی پادکست‌های سفارشی در ۴۵ زبان تبدیل کند.

Gemini در مرورگر کروم و مدل تصویرسازی Imagine 4

گوگل Gemini را به مرورگر کروم آورده تا به‌عنوان دستیار هوش مصنوعی در مرور وب به کاربران کمک کند. این دستیار هوشمند، به‌طور خودکار زمینه صفحه وب را درک می‌کرده و پاسخ‌های مرتبط و مفید ارائه می‌دهد.

همچنین مدل تصویرسازی جدید Imagine 4 معرفی شد که یک جهش بزرگ در تولید تصاویر است. این مدل نه‌تنها متن و املای صحیح را درک می‌کند؛ بلکه انتخاب‌های خلاقانه‌ای مانند استفاده از استخوان‌های دایناسور در فونت و تنظیم دقیق فاصله و اندازه حروف را انجام می‌دهد. این فناوری امکان خلق پوسترها و تصاویر باکیفیت حرفه‌ای را بسیار ساده‌تر می‌کند.

Veo 3 و Lyria 2: نسل جدید تولید ویدیو و موسیقی با هوش مصنوعی

Veo 3 مدل جدیدی برای تولید ویدیوهای هوش مصنوعی است که می‌تواند کاراکترها، صحنه‌ها و سبک‌ها را حفظ کند و فیلم‌هایی با کنترل دقیق دوربین بسازد. این ابزار که در قالب یک پلتفرم به نام Flow ارائه شده، به سازندگان فیلم امکان می‌دهد با وارد کردن تصاویر یا تولید آن‌ها به‌صورت لحظه‌ای، ویدیوهای باکیفیت و خلاقانه بسازند.

در حوزه موسیقی، Lyria 2 به‌عنوان یک مولد موسیقی با کیفیت بالا و صدای حرفه‌ای معرفی شده است که قادر به تولید موسیقی‌های ملودیک همراه با آوازهای تک‌خوان و گروهی است. این فناوری از همین امروز برای شرکت‌ها، سازندگان محتوا و موسیقیدانان در دسترس است.

Android XR و دستگاه‌های پوشیدنی جدید سامسونگ

گوگل با همکاری سامسونگ و کوالکام، پلتفرم Android XR را معرفی کرده است که تجربه‌های واقعیت افزوده و واقعیت ترکیبی را در دستگاه‌های مختلف با امکانات متنوع فراهم می‌کند. اولین دستگاه مبتنی بر این پلتفرم، Project Muhan سامسونگ است که قرار است سال جاری عرضه شود.

این عینک‌های هوشمند دارای دوربین و میکروفون برای شنیدن و دیدن محیط اطراف، اسپیکر برای پخش صدا و تماس و نمایشگر داخلی برای ارائه اطلاعات به‌صورت خصوصی هستند. این دستگاه‌ها با گوشی‌های هوشمند سازگار بوده و کاربر می‌تواند بدون استفاده از دست، به اپلیکیشن‌ها دسترسی داشته باشد.

دموی جذاب Android XR

در یک دمو زنده، امکان دیدن محیط اطراف و متون از طریق لنز عینک‌های Android XR نمایش داده شده است. همچنین دستورات صوتی به Gemini داده شده تا پیام‌ها ارسال و اعلان‌ها کنترل شوند. این نمونه عملی، نمایانگر قابلیت بالای این پلتفرم برای تعامل طبیعی و هوشمند با دنیای اطراف است.

چشم‌اندازی نو از هوش مصنوعی

گوگل I/O در کنفرانس سال 2025 مجموعه‌ای از فناوری‌های نوآورانه معرفی کرد که نشان‌دهنده تعهد گوگل به پیشرفت‌های هوش مصنوعی، واقعیت افزوده و تجربه‌های دیجیتال است. از مدل‌های هوشمند Gemini گرفته تا پلتفرم‌های ویدیویی سه‌بعدی و دستگاه‌های پوشیدنی Android XR، نمایانگر آینده‌ای هستند که هوش مصنوعی به‌شکلی طبیعی‌تر و کاربردی‌تر در زندگی روزمره حضور خواهد داشت.

اگر دنبال فناوری‌های روز و تحولات بزرگ در دنیای دیجیتال هستید، این نوآوری‌ها چشم‌اندازی هیجان‌انگیز و الهام‌بخش فراهم می‌کنند که در ماه‌ها و سال‌های آینده وارد زندگی خواهند شد.

کنفرانس Google I/O 2025: نگاهی به نوآوری‌های جدید گوگل

Gemini: هوش مصنوعی در سطحی فراتر از تصور

Personal Context: هوش مصنوعی با درک شخصی‌سازی شده

کدنویسی هوشمند با Gemini 2.5 Pro

Google Beam: تجربه ویدیویی سه‌بعدی پیشرفته

ترجمه همزمان در Google Meet و پروژه Mariner

حالت AI Mode و جستجوی هوشمند

Search Live: جستجو با دید دوربین

تجربه خرید هوشمند و Try On مجازی

Gemini Live و قابلیت‌های چندزبانه

Deep Research و Canvas: جستجو و خلق محتوا در یک فضای تعاملی

Gemini در مرورگر کروم و مدل تصویرسازی Imagine 4

Veo 3 و Lyria 2: نسل جدید تولید ویدیو و موسیقی با هوش مصنوعی

Android XR و دستگاه‌های پوشیدنی جدید سامسونگ

دموی جذاب Android XR

چشم‌اندازی نو از هوش مصنوعی

مدیر سایت

دیدگاهتان را بنویسید لغو پاسخ

Press ESC to close

Gemini: هوش مصنوعی در سطحی فراتر از تصور

Personal Context: هوش مصنوعی با درک شخصی‌سازی شده

کدنویسی هوشمند با Gemini 2.5 Pro

Google Beam: تجربه ویدیویی سه‌بعدی پیشرفته

ترجمه همزمان در Google Meet و پروژه Mariner

حالت AI Mode و جستجوی هوشمند

Search Live: جستجو با دید دوربین

تجربه خرید هوشمند و Try On مجازی

Gemini Live و قابلیت‌های چندزبانه

Deep Research و Canvas: جستجو و خلق محتوا در یک فضای تعاملی

Gemini در مرورگر کروم و مدل تصویرسازی Imagine 4

Veo 3 و Lyria 2: نسل جدید تولید ویدیو و موسیقی با هوش مصنوعی

Android XR و دستگاه‌های پوشیدنی جدید سامسونگ

دموی جذاب Android XR

چشم‌اندازی نو از هوش مصنوعی

اگر محتوا مورد پسند تان بود سپاسگزار می شویم که آن را اشتراک گذاری کنید

مدیر سایت

خلاصه کتاب: وقت آزاد | مدیر سبز

کنفرانس Google I/O 2025: نگاهی به نوآوری‌های جدید گوگل

دیدگاهتان را بنویسید لغو پاسخ