Spotify ve OpenAI arasında dev ses klonlama ortaklığı

Bir zamanların en büyük hayalleri sadece geçtiğimiz yılın kasım ayındaChatGPT’nin piyasaya çıkmasıyla birer birer gerçeğe dönüşüyor. Dünya üzerinde 7.000’i aşkın yaşayan dili kapsayan 142 farklı dil ailesi bulunuyor. Örneğin Türkçe konuşan yaklaşık 300 milyon kişi var ancak bu sayı dünya nüfusunun sadece yüzde 3’ünü oluşturuyor. Peki geri kalan insanlara derdinizi nasıl anlatacaksınız veya nasıl ulaşacaksınız? Spotify ve ChatGPT yaratıcısı OpenAI arasında yapılan ortaklık, sesinizi daha önce ulaşma şansınız olmayan insanlara duyurma olanağı tanıyor.

Spotify’da ses klonlama dönemi

Yukarıdaki senaryo için henüz gidilmesi gereken biraz daha yol var ancak adımlar atılmaya başlandı. OpenAI ile Spotify arasında yapılan ortaklık ile artık podcast yayıncıları kendi seslerini kullanarak diğer dillerdeki versiyonlarını yeniden üretmeye başlayacak.

Spotify, yeni aracıyla İngilizce bölümlerini İspanyolcaya çevirmek için bir avuç podcast yayıncısıyla ortaklık kurdu ve önümüzdeki haftalarda Fransızca ve Almanca çevirileri de kullanıma sunmayı planlıyor. Eğer ilgileniyorsanız, ilk bölümler Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons ve Steven Bartlett gibi büyük isimlerden gelecek.

Çeviri özelliğinin bel kemiği, hem İngilizce konuşmayı yazıya dökebilen hem de diğer dilleri İngilizceye çevirebilen OpenAI’ın ses dönüştürme aracı Whisper. Ancak Spotify’ın aracı, konuşmadan metne çevirinin ötesine geçerek bir podcast’i farklı bir dile çevirecek ve podcast yayıncısının kendi sesinin sentezlenmiş bir versiyonunda yeniden üretecek.

Spotify’ın kişiselleştirmeden sorumlu başkan yardımcısı Ziad Sultan yaptığı açıklamada, “Yaratıcının kendi sesiyle eşleşen Sesli Çeviri, dünyanın dört bir yanındaki dinleyicilere yeni podcast yayıncılarını daha önce hiç olmadığı kadar özgün bir şekilde keşfetme ve onlardan ilham alma gücü veriyor” dedi.

Bu yeni özelliğin ses kopyalama kısmının arkasında da muhtemelen OpenAI bulunuyor. Zira, detaylarına hemen üstteki bağlantıdan ulaşabileceğiniz bir duyuruda OpenAI, sadece metin ve birkaç saniyelik örnek konuşmadan insan benzeri ses oluşturabilen bir aracın lansmanı yaptı. Ancak OpenAI, bu ses klonlama modelini herkesin kullanımına açmayı en azından şimdilik -bariz sebeplerden dolayı- düşünmüyor.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

xxx