Gemini aplikacija dobija novu opciju: Snimak pretvara u transkript za jednu sekundu

10.09.2025. | 11:53

Google je ponovo unaprijedio svoju Gemini aplikaciju i omogućio korisnicima da pošalju audio fajlove, koje AI zatim pretvara u transkript za svega jednu sekundu. Ova funkcija posebno je korisna za vođenje bilješki sa sastanaka ili predavanja, jer eliminiše potrebu za ponovnim preslušavanjem snimaka.

Nova opcija dostupna je i u mobilnoj i u web verziji aplikacije. Dovoljno je da korisnik u Gemini dijalogu klikne na znak „+” i izabere opciju „Pošalji fajl”. Podržani formati uključuju MP3, M4A i WAV, što pokriva najčešće korišćene tipove audio zapisa, prenosi Benchmark.

Prema prvim testiranjima, Gemini ne samo da može da napravi kompletan transkript, već i da doda vremenske oznake i prepozna različite govornike. To znači da zapis postaje formatiran i pregledan, što olakšava kasnije analiziranje sadržaja.

Josh Woodward, potpredsjednik Google Labs i Gemini odjeljenja, istakao je da je upravo „podrška za audio fajlove” bila najčešći zahtjev korisnika. Sada je ta opcija dostupna svima, ali uz ograničenje, moguće je poslati maksimalno deset fajlova po jednoj instrukciji, prenosi LTN.

Ovim potezom Google dodatno širi mogućnosti Gemini aplikacije, pretvarajući je u moćan alat za produktivnost koji se može koristiti u poslovne, obrazovne i lične svrhe. Jasno je da je cilj da Gemini postane centralna tačka za rad sa različitim tipovima datoteka, uključujući tekst, slike i sada, zvuk.