Jakarta – Google I/O 2024 resmi digelar pada Rabu dini hari WIB (15/5/2024). Dalam sesi keynote raksasa pencarian internet itu mengumumkan sejumlah inovasi dan proyek yang akan membentuk masa depan teknologi. Berbeda dari tahun sebelumnya, Google I/O 2024 fokus membahas teknologi kecerdasan buatan (AI) yang dikembangkan perusahaan. Salah satu topik yang paling di-highlight adalah Gemini. Sundar Pichai, SEO Google dan Alphabet saat membuka sesi keynote Google I/O 2024 yang digelar secara hybrid. Sejak diumumkan pada Google I/O 2023, Gemini terus mengalami perkembangan. Dua bulan lalu Google memperkenalkan Gemini 1.5 Pro yang dapat menjalankan 1 juta token dalam satu kueri. Perusahaan yang bermarkas di Mountain View ini berupaya agar Gemini terus dimanfaatkan lebih banyak pengguna. Saat ini lebih dari 1,5 juta pengembang menggunakan model Gemini dalam membangun aplikasi AI generasi berikutnya. Google mengumumkan Gemini 1.5 Flash menawarkan kecepatan tinggi dan efisiensi biaya sebagai alternatif dari Gemini 1.5 Pro, sambil tetap memiliki kemampuan yang tinggi. Sementara Gemini 1.5 Pro turut ditingkatkan guna memberikan respons yang lebih berkualitas dalam berbagai area seperti terjemahan, penalaran, pemrograman, dan lainnya.
Google mengumumkan jendela konteks sebesar 1 juta untuk Gemini Advanced, memungkinkan konsumen mendapatkan bantuan AI untuk dokumen besar seperti PDF yang panjangnya mencapai 1.500 halaman atau 100 email. Saat ini Google mengaku tengah mempratinjau jendela konteks sebesar dua juta untuk Gemini 1.5 Pro dan Gemini 1.5 Flash kepada pengembang melalui daftar tunggu di Google AI Studio. Tak kalah menariknya Google mengumumkan Gemini Nano dengan Multimodalitas. Model ini dirancang untuk berjalan di smartphone dan telah diperluas untuk memahami gambar, teks dan bahasa lisan. Bicara Gemma, keluarga model Gemini ini turut mendapatkan peningkatan besar dengan peluncuran Gemma 2 yang dioptimalkan untuk TPUs dan GPUs dengan 27B parameter. Tak hanya itu Google mengumumkan PaliGemma yang ditambahkan ke keluarga model Gemma. Google DeepMind mengungkapkan Project Astra, yang diharapkan dapat mengubah masa depan asisten AI dengan kemampuan pemahaman video. Project Astra bertujuan untuk mengembangkan agen AI universal yang dapat membantu dalam kehidupan sehari-hari. Saat demonstrasi, model penelitian ini menunjukkan kemampuannya dengan mengidentifikasi objek yang menghasilkan suara, memberikan aliterasi kreatif, menjelaskan kode pada monitor, dan menemukan barang yang terlupa.
Project Astra juga menunjukkan potensinya dalam perangkat wearable, seperti kacamata pintar, di mana ia dapat menganalisis diagram, menyarankan perbaikan, dan menghasilkan respons yang cerdas terhadap rangsangan visual. Kedepannya Gemini menggunakan kemampuan pemahaman video dari Project Astra untuk membentuk masa depan asisten AI. AI akan terintegrasi hampir di semua produk Google, mulai dari Search yang telah lama ada hingga Android 15. Khusus pengguna AS, kini bisa menggunakan Ikhtisar AI dalam hasil pencarian, tak terbatas pada Search Labs. Pengguna juga bakal bisa dapat menyesuaikan Ikhtisar AI Anda dengan opsi untuk menyederhanakan bahasa atau mengelompokkannya secara lebih detail. Ini bisa sangat berguna jika pengguna baru mengenal suatu topik, atau jika mencoba menyederhanakan sesuatu untuk memuaskan keingintahuan anak. Google menjanjikan Ikhtisar AI bakal membantu menjawab pertanyaan yang semakin kompleks. Misalnya, mungkin kamu sedang mencari studio yoga atau pilates baru, dan kamu menginginkan studio yang populer di kalangan penduduk setempat, berlokasi strategis untuk perjalanan Anda, dan juga menawarkan diskon untuk anggota baru.
Model ini menghasilkan gambar dengan kualitas terbaik, dengan lebih banyak detail dan lebih sedikit artefak dalam gambar untuk membantu menciptakan gambar yang lebih realistis. Imagen 3 telah meningkatkan kemampuan bahasa alami untuk lebih memahami perintah pengguna dan maksud di baliknya. Model ini dapat mengatasi salah satu tantangan terbesar bagi generator gambar AI, yaitu teks, dan Google mengklaim Imagen 3 adalah yang terbaik untuk merendernya. Hanya saja Imagen 3 belum tersedia secara luas, tersedia dalam pratinjau pribadi di dalam Image FX untuk pembuat tertentu. Model ini akan segera tersedia di Vertex AI, dan masyarakat dapat mendaftar untuk bergabung dalam daftar tunggu . Veo dapat menghasilkan video resolusi 1080p berkualitas tinggi dengan durasi lebih dari satu menit. Model tersebut dapat lebih memahami bahasa alami untuk menghasilkan video yang lebih mewakili visi pengguna, menurut Google. Veo juga memahami istilah sinematik seperti “timelapse” untuk menghasilkan video dalam berbagai gaya dan memberi pengguna kontrol lebih besar atas hasil akhir. Di era AI generatif, kita melihat banyak perusahaan fokus pada multimodalitas model AI.
Here’s more info in regards to PDF ke ZIP review our web-site.