SSML (Speech Synthesis Markup Language) adalah lapisan kontrol yang digunakan untuk menyempurnakan cara suara sintetis disampaikan. SSML tidak menghasilkan suara, melainkan mengatur bagaimana suara tersebut berperilaku, seperti tempo, penekanan, jeda, dan ritme.
Di Indera.Digital, SSML tidak dibahas sebagai bahasa markup yang perlu dipelajari atau diimplementasikan. SSML diperlakukan sebagai keputusan pengendalian konten, yaitu penentuan kapan output audio membutuhkan tingkat presisi yang lebih tinggi dibandingkan TTS standar.
SSML menjadi relevan ketika audio perlu menyampaikan struktur, timing emosional, atau penekanan naratif yang tidak dapat dicapai hanya dengan teks biasa. Contohnya mencakup narasi sinematik, dialog terstruktur, atau rangkaian audio yang harus selaras dengan tempo visual.
Tanpa perencanaan yang jelas, penggunaan kontrol yang berlebihan justru dapat menghasilkan audio yang terasa tidak alami. SSML paling efektif ketika diterapkan secara selektif, berdasarkan niat konten, bukan sekadar kemampuan teknis.
Bagian ini menjelaskan kapan SSML dibutuhkan, masalah apa yang diselesaikannya dalam struktur konten, dan bagaimana posisinya dalam workflow berbasis perencanaan, tanpa membahas sintaks, tag, atau detail implementasi.

