Tavus baru saja memperkenalkan terobosan teknologi yang memungkinkan gambar wajah statis berubah menjadi replika digital yang mampu berkomunikasi secara nyata.
Mulai dari maskot merek yang sudah ada selama puluhan tahun hingga tokoh sejarah, kini semuanya bisa diajak berinteraksi melalui percapaian yang terasa hidup hanya dari satu foto saja.
Inovasi ini membuka peluang baru dalam menciptakan pengalaman visual yang lebih personal dan interaktif bagi pengguna di berbagai platform digital. Berikut adalah beberapa hal menarik mengenai teknologi ini:
Krea baru saja memperkenalkan Krea 2, model fondasi pertama mereka yang dibangun sepenuhnya dari awal untuk memberikan kendali penuh terhadap gaya dan keragaman estetika.
Teknologi ini dirancang untuk para kreator yang membutuhkan akurasi visual tinggi serta kemampuan untuk menyesuaikan hasil karya dengan gaya artistik yang sangat spesifik melalui kontrol gaya yang lebih intuitif.
Model ini membuka peluang bagi pengguna untuk bereksperimen dengan berbagai aliran seni secara lebih fleksibel dan presisi. Berikut adalah beberapa hal menarik yang ditawarkan oleh Krea 2:
Meta resmi meluncurkan Meta AI Voice Conversations yang ditenagai oleh Muse Spark, memungkinkan pengguna berbicara secara alami dengan kecerdasan buatan layaknya manusia.
Fitur canggih ini mendukung interaksi yang dinamis di mana pengguna bisa memotong pembicaraan, berganti topik secara mendadak, hingga beralih bahasa di tengah percakapan, sambil Meta AI secara instan menghasilkan gambar atau memberikan rekomendasi visual melalui Reels dan peta.
Selain percakapan suara, Meta juga menghadirkan kemampuan AI langsung ke dalam kamera aplikasi untuk memahami lingkungan sekitar secara nyata. Berikut adalah beberapa fitur unggulan yang tersedia:
Google secara resmi memperkenalkan Gemini Intelligence, sebuah terobosan yang membawa kemampuan terbaik Gemini ke dalam jajaran perangkat paling canggih mereka.
Inovasi ini menyatukan perangkat keras premium dengan perangkat lunak mutakhir untuk membantu pengguna tetap selangkah lebih maju serta mampu bekerja secara proaktif dalam berbagai aktivitas harian.
Sistem cerdas ini dirancang untuk mengubah cara manusia berinteraksi dengan teknologi melalui integrasi yang lebih dalam dan responsif. Beberapa keunggulan yang ditawarkan oleh teknologi ini meliputi:
Google resmi membuka draft spesifikasi DESIGN.md sebagai open-source agar bisa digunakan di berbagai tools dan platform.
Format ini membantu developer dan AI memahami aturan desain secara lebih jelas, mulai dari fungsi warna, komponen UI, hingga validasi aksesibilitas seperti standar WCAG, sehingga desain tidak lagi bergantung pada tebakan AI semata.
Dengan DESIGN.md, pengguna dapat mengekspor dan mengimpor aturan desain antar proyek dengan lebih mudah, membuat workflow desain jadi lebih konsisten untuk tim maupun agen AI.
Google juga menambahkan kemampuan baru agar sistem bisa membaca maksud visual dengan lebih akurat, terutama saat membangun antarmuka lintas produk dan platform.
Design / DevOpenAI memperkenalkan ChatGPT Images 2.0, model gambar terbaru yang mampu menangani tugas visual kompleks dengan hasil lebih presisi dan siap pakai.
Pembaruan ini membawa editing yang lebih tajam, layout yang lebih rapi, serta kemampuan “thinking” yang membuat AI bisa merencanakan dan menyempurnakan hasil sebelum gambar dibuat.
Model ini juga jauh lebih baik dalam merender teks, poster, hingga desain dengan banyak elemen detail.
Menariknya, Images 2.0 mendukung berbagai rasio gambar, hingga resolusi 2K, serta mampu membuat beberapa gambar sekaligus dari satu prompt.
OpenAI juga menyebut model ini cocok untuk kebutuhan profesional seperti iklan, mockup, UI design, hingga presentasi visual. Fitur standar tersedia untuk semua pengguna ChatGPT, sementara mode thinking hadir untuk pengguna paket berbayar.
Mistral AI resmi memperkenalkan Voxtral TTS, model open-weight terbaru untuk text-to-speech yang menonjolkan suara natural, ekspresif, dan latensi sangat rendah.
Model ini dirancang untuk menghasilkan audio yang lebih realistis dengan emosi yang terasa hidup, sekaligus menjaga waktu respons tetap cepat sejak karakter pertama diproses.
Yang membuatnya menarik, Voxtral TTS mendukung 9 bahasa dan mampu menangkap variasi dialek dengan akurat, sehingga cocok untuk aplikasi global. Sorotan utamanya:
Claude menghadirkan kemampuan baru yang memungkinkan pengguna membuat chart dan diagram interaktif langsung di dalam percakapan.
Fitur ini membuat proses analisis data menjadi lebih praktis karena visualisasi dapat dibuat dan diperbarui tanpa perlu menggunakan aplikasi tambahan.
Fitur tersebut sudah tersedia dalam versi beta untuk semua paket, termasuk pengguna gratis. Beberapa hal menarik dari pembaruan ini antara lain:
Design / Dev
Graphics
Internet
GraphicsFigma baru saja memperkenalkan fitur revolusioner bernama Make Kits dan Make Attachments yang memungkinkan desainer bekerja dengan data asli secara langsung di dalam kanvas.
Dengan kemampuan untuk menyematkan lebih dari 30 jenis format file, tim kini dapat beralih dari sekadar menggunakan teks placeholder menuju desain yang benar-benar ditenagai oleh input nyata, mulai dari dokumen, media, hingga baris kode aktual.
Integrasi ini dirancang untuk memangkas jarak antara tahap perancangan dan pengembangan produk, sehingga visualisasi yang dihasilkan jauh lebih akurat terhadap kondisi aplikasi nantinya. Berikut adalah beberapa hal menarik yang ditawarkan dalam pembaruan ini:
Platform diagram populer draw.io kini secara resmi meluncurkan integrasi melalui protokol MCP yang memungkinkan kecerdasan buatan menyusun visualisasi teknis secara otomatis.
Dengan teknologi ini, pengguna cukup memberikan perintah teks kepada AI untuk memilih ikon yang tepat dan menyambungkan garis antar komponen, menghasilkan diagram profesional yang tetap bisa disunting secara bebas dalam hitungan detik.
Langkah ini membuka akses gratis bagi siapa saja untuk membangun arsitektur kompleks tanpa harus menyusun setiap elemen secara manual dari awal. Beberapa detail menarik yang ditawarkan dalam pembaruan ini meliputi:
Google resmi menghadirkan Lyria 3 Pro dan Lyria 3 Clip, dua model musik AI baru yang mendukung pembuatan lagu penuh serta klip musik 30 detik.
Mulai hari ini, keduanya tersedia melalui Gemini API dan pengalaman musik terbaru di Google AI Studio, membuka peluang baru bagi developer dan kreator untuk membangun workflow audio yang lebih cepat.
Yang menarik, pemisahan model full song dan short clip membuat proses produksi jadi lebih fleksibel untuk kebutuhan demo, jingle, soundtrack, hingga konten sosial. Beberapa sorotan penting:
CapCut memperkenalkan CapCut Video Studio di web sebagai workspace produksi berbasis canvas tanpa timeline tradisional.
Pendekatan ini membuat proses pembuatan video terasa lebih bebas, mulai dari ide cerita, storyboard, generasi scene, hingga editing akhir dalam satu kanvas tanpa batas.
Yang membuatnya menonjol adalah integrasi AI agent untuk membantu menulis alur cerita, fitur storyboard bawaan, serta dukungan model Dreamina Seedance 2.0 untuk generasi visual yang lebih sinematik. Hal menarik lainnya:
Photoshop
Graphics
Graphics
Graphics
GraphicsSuno memperkenalkan Suno v5.5 dengan fokus pada ekspresi yang lebih kaya dan hasil musik yang terasa semakin personal.
Versi terbaru ini memungkinkan pengguna memanfaatkan suara, karakter audio, dan selera musik mereka sendiri agar lagu yang dihasilkan punya identitas yang lebih kuat.
Update ini membuat proses kreasi terasa lebih dekat dengan gaya asli pembuatnya, bukan sekadar template AI biasa. Hal menarik yang menonjol:
Gamma memperkenalkan fitur baru bernama Gamma Imagine yang memungkinkan pengguna membuat visual secara langsung tanpa perlu tools tambahan.
Dengan format grafis baru ini, pengguna bisa menghasilkan logo, diagram, hingga infografis yang langsung terintegrasi ke dalam presentasi.
Menariknya, semua desain otomatis menyesuaikan tema dan masih bisa diedit menggunakan Gamma Agent untuk hasil yang lebih fleksibel. Fitur ini tersedia gratis untuk seluruh pengguna dalam waktu terbatas. Poin pentingnya:
Tim Sora mengumumkan bahwa mereka akan menghentikan aplikasi Sora, sekaligus menyampaikan apresiasi kepada para pengguna yang telah berkreasi dan membangun komunitas di dalamnya.
Kabar ini tentu mengecewakan bagi banyak kreator yang selama ini aktif menggunakan platform tersebut.
Pihak tim memastikan informasi lanjutan akan segera dibagikan, termasuk timeline penghentian aplikasi dan API serta cara untuk menyimpan karya pengguna. Beberapa poin penting:
Google mengumumkan pembaruan besar untuk Google Maps yang disebut sebagai peningkatan terbesar dalam lebih dari sepuluh tahun.
Dengan integrasi model AI Gemini dan pemahaman data dunia yang lebih mendalam, Maps kini menghadirkan cara baru bagi pengguna untuk menavigasi dan menjelajahi berbagai tempat.
Pembaruan ini membuka berbagai kemungkinan baru dalam pengalaman navigasi yang lebih cerdas dan interaktif. Beberapa fitur menarik dari update tersebut antara lain:
Graphics
Design / Dev
Design / Dev
Design / Dev
Design / DevPlatform pengembangan Anything memperkenalkan pendekatan baru yang disebut design-first vibe coding, memungkinkan developer langsung mengimpor desain dari Figma dan mengubahnya menjadi proses pembangunan aplikasi tanpa langkah konversi yang rumit.
Pendekatan ini mencoba mempercepat alur kerja antara desain dan development.
Fitur ini membuat proses dari desain ke kode menjadi jauh lebih cepat dan praktis. Beberapa hal menarik dari fitur baru ini antara lain:
Google menghadirkan pembaruan Nano Banana 2 di aplikasi Gemini dengan peningkatan kemampuan pada model generasi gambar.
Pembaruan ini meningkatkan pemahaman AI terhadap objek dunia nyata sekaligus membuat hasil gambar menjadi lebih akurat dan konsisten.
Model ini juga membawa sejumlah fitur baru seperti kontrol aspect ratio, template pembuatan gambar, serta peningkatan rendering teks dalam gambar.
Selain itu, Nano Banana 2 kini lebih baik dalam menjaga konsistensi karakter saat membuat beberapa gambar dengan subjek yang sama.
Google memperkenalkan Gemini Embedding 2, model embedding terbaru yang dibangun di atas arsitektur Gemini dan dirancang untuk memahami berbagai jenis data sekaligus.
Model ini kini tersedia dalam tahap preview melalui Gemini API dan Vertex AI, membuka peluang baru bagi developer untuk membangun aplikasi berbasis pencarian semantik, rekomendasi, hingga analisis konten lintas format.
Yang membuatnya menarik, Gemini Embedding 2 mampu memahami lebih dari 100 bahasa dan menggabungkan berbagai jenis media dalam satu ruang vektor yang sama. Artinya, teks, gambar, video, audio, hingga dokumen seperti PDF dapat dianalisis secara bersamaan dengan konteks yang saling terhubung.
Beberapa hal menarik dari model ini:
BytePlus secara resmi merilis Seed 2.0 Lite di platform ModelArk guna membantu perusahaan mengolah data visual skala besar yang selama ini sulit diproses secara manual.
Model ini dirancang khusus untuk menangani ribuan dokumen, gambar produk, hingga rekaman video dengan latensi rendah dan biaya yang jauh lebih ekonomis.
Dengan kemampuan multimodal yang sangat cepat, perusahaan kini dapat mengekstrak informasi dari faktur, kontrak, maupun siaran langsung secara otomatis tanpa perlu mengorbankan anggaran operasional yang besar.
Keunggulan utama dari Seed 2.0 Lite terletak pada kemampuannya untuk menjalankan alur kerja produksi dengan konkurensi tinggi, yang berarti model ini bisa memproses banyak tugas berat secara bersamaan dalam waktu singkat.
Hal ini sangat menarik bagi industri ritel dan e-commerce karena AI ini mampu melakukan inspeksi rak toko serta penandaan produk secara otomatis dengan tingkat presisi yang sangat tinggi. Selain itu, integrasi API-nya yang fleksibel memungkinkan otomatisasi layanan pelanggan dan riset pasar mendalam dilakukan dalam berbagai bahasa global secara instan.
Beberapa kapabilitas utama yang ditawarkan oleh Seed 2.0 Lite meliputi:
Design / Dev
Design / Dev
Design / Dev
Design / Dev
Computers