Teknologi AI suara belum pernah semudah ini.

Hari ini, siapa pun dapat menyalin teks ke alat seperti ElevenLabs dan mendapatkan suara narasi. Namun, jika Anda pernah mencobanya, Anda tahu bahwa hanya menyalin teks dan menggeser beberapa penggeser di tab tidak akan menghasilkan audio berkualitas studio yang terdengar seperti manusia.

Seperti halnya alat AI lainnya, kunci untuk mendapatkan narasi suara profesional, podcast yang menarik, dan suara realistis (dengan ElevenLabs) terletak pada cara Anda memberikan prompt.

Nah, kami telah melakukan beberapa pengujian dan menyusun 40 prompt ElevenLabs untuk membantu Anda memulai dengan cepat.

Apa Itu ElevenLabs?

ElevenLabs adalah platform suara AI yang mengubah teks menjadi audio yang mirip manusia dalam lebih dari 50 bahasa. Platform ini dirancang untuk kreator, produser, dan pengembang yang membutuhkan kontrol intuitif dan canggih untuk menghasilkan konten suara profesional secara massal.

Dari buku audio hingga iklan, podcast, dan game, inilah yang dapat Anda lakukan dengan ElevenLabs ⭐

Modifikasi suara : Ubah suara, pisahkan vokal dari kebisingan latar belakang, atau kloning dan desain suara kustom dari awal.

Karakter kustom : Buat suara unik untuk karakter game, narator buku audio, atau persona merek dari awal.

Agen percakapan : Deploy asisten AI yang menangani interaksi suara secara real-time dengan pola ucapan alami.

Efek suara dan musik : Buat suara latar, transisi, atau audio latar belakang tanpa rekaman tradisional.

Dubbing multibahasa : Terjemahkan audio yang sudah ada ke dalam berbagai bahasa sambil mempertahankan suara asli pembicara.

Sinkronkan teks dengan audio : Sinkronkan transkrip dengan rekaman yang sudah ada untuk pengeditan yang presisi dan subtitle.

Pembuatan gambar dan video: Buat konten visual dengan bereksperimen menggunakan berbagai : Buat konten visual dengan bereksperimen menggunakan berbagai prompt gambar AI (dalam mode beta per Januari 2026)

Apa Itu Prompt ElevenLabs?

Prompt ElevenLabs adalah serangkaian instruksi yang Anda masukkan untuk mengarahkan dan menghasilkan output yang diinginkan di ElevenLabs. Anda dapat mengontrol hasilnya dengan:

Masukkan prompt teks yang menjelaskan dialog, konteks naratif, petunjuk emosional, tag fonetik, dan bahkan deskripsi efek suara.

Mengunggah sampel audio referensi untuk kloning suara atau remix.

Memilih suara yang sudah jadi dari perpustakaan suara

Eksperimen dengan pengaturan stabilitas dan kreativitas untuk menyempurnakan nuansa vokal.

Para kreator yang bekerja dengan agen suara juga dapat membuat blueprint instruksi, yang mendefinisikan kepribadian inti AI, peran, aturan, dan perilaku percakapan. Prompt sistem ini memastikan respons yang konsisten (suara, intonasi) sesuai dengan persyaratan merek Anda.

🧠 Fakta Menarik: Mesin sintesis suara pertama dibangun pada tahun 1791 oleh Wolfgang von Kempelen. Mesin tersebut menggunakan pompa udara, pita bambu, dan tabung kulit untuk meniru anatomi suara manusia—menghasilkan suara aneh yang mirip peluit dan hampir tidak mirip dengan ucapan manusia.

Cara Menulis Prompt ElevenLabs yang Efektif

Prompting yang efektif adalah keseimbangan antara detail deskriptif dan kejelasan. Semakin banyak informasi yang Anda berikan kepada alat AI (tone, emosi, aksen, dan gaya penyampaian), semakin dekat hasilnya dengan visi Anda.

Berikut ini adalah panduan singkat yang dapat Anda gunakan saat menyusun prompt ElevenLabs Anda 👇

1. Tulis prompt dalam gaya naratif

Masukkan teks yang ingin Anda ubah menjadi suara dan gunakan tag audio (selama proses) untuk mengatur cara pengiriman output.

Anda dapat menggunakan kombinasi tag audio, seperti:

Tag Fungsinya Contoh Contoh penggunaan Tag emosi Tag-tag ini menentukan nada emosional suara. [tertawa], [tertawa lebih keras], [mulai tertawa], [menghela napas], [sedih], [marah], [bahagia], [sedih] [sedih] Saya tidak bisa tidur malam itu Efek suara Tambahkan suara lingkungan dan efek. [tembakan], [tepuk tangan], [klakson], [ledakan][menelan], [meneguk] [tepuk tangan] Terima kasih kepada semua yang hadir malam ini! [tembakan] Apa itu? Tag terkait suara Menentukan nada, intensitas penampilan, dan reaksi manusia. [bisik-bisik][desahan], [hembusan napas], [sarkastik], [penasaran], [bersemangat], [menangis], [mengendus], [nakal] [bisik] Jangan biarkan mereka mendengarmu Tag unik dan spesial Tag eksperimental untuk aplikasi kreatif [aksen Prancis yang kuat] [aksen Prancis yang kuat] Hidup Zat, kawan — kamu tidak bisa mengendalikan segalanya.

Anda dapat menempatkan tag audio di mana saja dalam skrip Anda (dan dalam kombinasi apa pun) untuk membentuk cara penyampaiannya. Cobalah berbagai keadaan emosional dan tindakan deskriptif untuk menemukan apa yang cocok untuk kasus penggunaan spesifik Anda.

Ingat, struktur teks sangat memengaruhi hasil output dengan model suara AI. Gunakan pola ucapan alami, tanda baca yang tepat, dan konteks emosional yang jelas untuk hasil terbaik.

💡 Tips Pro: Secara otomatis generate tag audio yang relevan untuk teks input Anda dengan mengklik tombol “Enhance”.

2. Tambahkan pedoman normalisasi

Model AI, terutama yang lebih kecil yang dilatih dengan data terbatas, kesulitan dalam menangani jenis data kompleks seperti nomor telepon, kode pos, alamat email, dan URL.

Dalam kasus tersebut, tambahkan instruksi normalisasi ke prompt Anda. Tentukan cara Anda ingin teks dibacakan secara lisan.

Beberapa contoh normalisasi dan cara mengstrukturkannya dalam prompt Anda adalah:

Input Tipe Jenis input Jenis output Bilangan pokok 123 Seratus dua puluh tiga Bilangan ordinal 2nd Kedua Nilai moneter $45,67 Empat puluh lima dolar dan enam puluh tujuh sen Angka Romawi XIV Empat belas (atau "yang keempat belas" jika sebagai judul) Singkatan umum Dr. Ave. St. DoctorAvenueStreet (tetapi "St. Patrick" harus tetap ada) URLs elevenlabs. io/docs eleven labs dot io slash docs Tanggal 01/02/2023 2 Januari 2023Atau1 Februari 2023 (tergantung lokasi) Waktu 14:30 Pukul dua tiga puluh siang Nomor telepon 123-456-7890 Satu dua tiga, empat lima enam, tujuh delapan sembilan nol

3. Sertakan petunjuk fonetik dan kecepatan.

Gunakan tag pemisah, ejaan fonetik, dan tanda baca untuk mengarahkan cara AI membaca skrip Anda.

Tag jeda menambahkan jeda antara frasa atau kalimat. Ini berguna untuk efek dramatis, aliran percakapan yang alami, atau memberi pendengar waktu untuk memproses informasi.

Misalnya:

Tunggu sebentar, biarkan aku berpikir. ” “Baiklah, aku sudah mendapatkannya.

Namun, tanda baca memiliki pengaruh yang signifikan terhadap pengiriman di ElevenLabs:

Gunakan tanda hubung (- atau —) untuk jeda singkat atau titik tiga (…) untuk nada ragu-ragu.

Penggunaan huruf kapital meningkatkan penekanan pada kata-kata tertentu.

Tanda baca standar memberikan ritme bicara yang alami dan titik-titik pernapasan.

Selain pengaturan waktu, Anda juga perlu mengontrol cara pengucapan kata-kata tertentu. Kontrol fonetik membantu Anda menguasai pengucapan untuk nama karakter, istilah merek, atau istilah teknis. Coba gunakan ejaan alternatif atau perkiraan fonetik untuk menentukan bagaimana kata-kata tertentu harus diucapkan.

📌 Misalnya,

Nike: NYE-kee

GIF: JIF atau GIF (tergantung preferensi)

Porsche: POR-shuh

Anda juga dapat menggunakan tag fonem untuk kontrol yang presisi terhadap Alfabet Fonetik Internasional (IPA):

Nike

Atau gunakan tag Alias untuk penulisan ulang fonetik yang lebih sederhana:

SQLite → “S-Q-L-ite” atau “sequel-ite”

Studio dan Dubbing Studio di ElevenLabs juga memungkinkan Anda membuat dan mengunggah kamus pengucapan. Ini menghemat waktu jika Anda bekerja dengan nama merek atau istilah teknis yang berulang di berbagai proyek.

3. Pilih suara dan sesuaikan pengaturan suara

Pilih suara dari perpustakaan suara ElevenLabs. Anda akan menemukan lebih dari 5.000 opsi, termasuk suara siap pakai, klon suara profesional, dan suara karakter kustom dalam lebih dari 32 bahasa dan aksen.

Gunakan bilah pencarian untuk menemukan suara berdasarkan nama, kata kunci, atau ID suara. Untuk mempersempit hasil pencarian, Anda juga dapat menerapkan filter.

Jika Anda tidak menemukan suara yang tepat di perpustakaan, buatlah menggunakan Voice Design. Parameter detail seperti usia, jenis kelamin, nada, aksen, kecepatan, emosi, dan gaya akan menghasilkan hasil yang lebih akurat dan nuansa yang lebih kaya.

Panduan singkat yang dapat Anda gunakan untuk menjelaskan parameter-parameter ini:

Parameter Kata-kata deskriptif Kualitas audio Audio berkualitas rendahKualitas audio burukSuara seperti pesan suaraTerdengar samar dan jauhSeperti di perekam kaset lama Usia Remaja/dewasa muda/usia 20-an/awal 30-anPria paruh baya/usia 40-anPria lanjut usia/usia 80-an Tone/Timbre Dalam/rendahSmooth/kayaBerdebu/kasarHidung/nyaringRingan/bernafasGema/beresonansi Aksen Aksen Prancis yang kentalAksen selatan yang lembutAksen Eropa Timur yang kuatAksen Inggris yang jelas

📌 Contoh: Seorang komentator olahraga wanita berenergi tinggi dengan aksen Inggris yang kental, menyajikan liputan langsung pertandingan sepak bola dengan kecepatan sangat tinggi. Suaranya hidup, bersemangat, dan sepenuhnya terlibat dalam aksi.

💡 Tips Pro: Gunakan ikon jenis suara untuk dengan cepat mengidentifikasi kualitas dan sumber setiap suara di perpustakaan: Tanda centang kuning : Kloning Suara Profesional

Black tick : Klon Suara Profesional Berkualitas Tinggi

Ikon petir : Kloning Suara Instan

|| ikon : Suara Default ElevenLabs

Tanpa ikon: Suara dibuat dengan Voice Design melalui ElevenLabs

4. Pilih model ucapan

ElevenLabs menyediakan berbagai model suara yang dioptimalkan untuk berbagai kasus penggunaan dan output. Beberapa model menekankan emosi alami dan ekspresivitas, sementara yang lain fokus pada kecepatan, stabilitas, atau kinerja real-time.

Berikut ini adalah rincian model TTS (text-to-speech), STT (Speech-to-text), dan musik unggulan:

Model Terbaik untuk Kasus penggunaan Eleven V3 (Alpha) Pembangkitan ucapan yang mirip manusia dan ekspresif Diskusi karakter, produksi buku audio, dialog emosional Eleven Multilingual v2 Suara yang realistis dengan ekspresi emosional yang kaya. Suara karakter, video korporat, materi e-learning, proyek multibahasa Eleven Flash v2.5 Model ultra-cepat yang dioptimalkan untuk penggunaan real-time. Agen suara real-time dan chatbot, aplikasi interaktif, konversi teks ke suara secara massal. Eleven Turbo v2.5 Model berkualitas tinggi dengan latensi rendah, yang menawarkan keseimbangan yang baik antara kualitas dan kecepatan. Sama seperti Flash v2.5, tetapi jika Anda bersedia mengorbankan latensi demi kualitas suara yang lebih tinggi. Scribe v1 Teknologi pengenalan suara terdepan Dokumentasi rapat, pemrosesan dan analisis audio, transkripsi Scribe v2 Realtime Pengenalan suara secara real-time Transkripsi pertemuan langsung, percakapan langsung (agen AI), transkripsi multibahasa dalam 99+ bahasa. Musik Buat musik dengan prompt bahasa alami dalam gaya apa pun. Soundtrack game, latar belakang podcast, musik latar belakang pemasaran

Menyesuaikan model dengan jenis proyek Anda memastikan Anda mendapatkan keseimbangan terbaik antara kualitas dan efisiensi.

5. Buat dan perbaiki

Untuk teks-ke-suara yang kompleks dan bernuansa emosional, jangan memaksakan semua elemen ke dalam satu prompt. Gunakan teknik prompt chaining untuk menghasilkan efek suara atau ucapan dalam segmen-segmen, lalu gabungkan mereka menggunakan perangkat lunak pengeditan audio untuk komposisi yang lebih kompleks.

Uji coba hasil dengan menyesuaikan deskripsi, tag, atau petunjuk emosional. Penyesuaian kecil seringkali dapat menghasilkan perubahan drastis dalam kualitas output.

Bergabunglah dengan komunitas Discord ElevenLabs untuk menemukan tips alur kerja, strategi desain suara, dan contoh nyata yang berhasil.

Telusuri perpustakaan audio AI mereka dan pelajari suara yang mirip dengan yang Anda bangun. dan pelajari suara yang mirip dengan yang Anda bangun.

Referensi Dokumentasi ElevenLabs untuk penjelasan rinci tentang setiap fitur, praktik terbaik dalam penggunaan prompt, contoh penggunaan praktis, panduan API, dan contoh implementasi teknis.

Eksperimen dengan pengaturan kecepatan, stabilitas, dan kesamaan untuk menyempurnakan konsistensi dan pengiriman suara di berbagai jenis konten.

Catat ID suara, model, pengaturan, dan frasa yang tepat dalam dokumen prompt agar Anda dapat mereplikasi hasil yang sukses di berbagai proyek.

⭐ Ingat: Urutan prioritas dalam penggunaan prompt adalah—Pemilihan suara, diikuti oleh pemilihan model, dan kemudian pengaturan suara. Semua elemen ini, beserta kombinasi di antaranya, akan bersama-sama memengaruhi hasil akhir.

📮ClickUp Insight: Hanya 10% responden survei kami yang menggunakan asisten suara (4%) atau agen otomatis (6%) untuk aplikasi AI, sementara 62% lebih memilih alat AI percakapan seperti ChatGPT dan Claude. Rendahnya adopsi asisten dan agen mungkin karena alat-alat ini sering dioptimalkan untuk tugas-tugas spesifik, seperti operasi tanpa tangan atau alur kerja tertentu. ClickUp menawarkan yang terbaik dari kedua dunia. ClickUp Brain berfungsi sebagai asisten AI percakapan yang dapat membantu Anda dengan berbagai kasus penggunaan. Di sisi lain, agen AI yang terintegrasi dalam saluran ClickUp Chat dapat menjawab pertanyaan, menangani masalah, atau bahkan mengelola tugas-tugas spesifik!

Prompt ElevenLabs Terbaik untuk Berbagai Kebutuhan

ElevenLabs adalah platform yang menyediakan fitur-fitur canggih untuk generasi suara. Hanya mengacu pada dokumentasi atau panduan teknik prompt saja tidak akan cukup untuk menghasilkan hasil terbaik.

Uji berbagai model dan buat suara dan efek suara sendiri untuk memahami apa yang efektif.

Mari kami tunjukkan bagaimana Anda dapat memanfaatkan berbagai fitur ElevenLabs dalam berbagai kasus penggunaan dengan prompt-prompt ini:

Prompt teks-ke-suara ElevenLabs

1. Monolog ekspresif

Oke, Anda tidak akan percaya ini. Kamu tahu kan, aku benar-benar terjebak dengan cerita pendek itu? Seperti, menatap layar selama BERJAM-JAM, tapi… tidak ada hasil? [desahan frustrasi] Saya benar-benar hampir saja menghapus semuanya. Mulai dari awal. Menyerah, mungkin. Tapi kemudian! Semalam, saya hanya sedang menggambar-gambar, bahkan tidak memikirkannya, kan? Dan kalimat kecil ini tiba-tiba terlintas di benakku. Hanya… benar-benar tiba-tiba. Dan awalnya, itu bahkan bukan untuk cerita. Tapi kemudian saya mengetiknya, hanya untuk melihat. Dan rasanya seperti… pintu air terbuka lebar! Tiba-tiba, saya tahu persis ke mana karakter itu harus pergi, apa akhir yang harus terjadi… Semua tiba-tiba KLIK. [desahan bahagia] Saya begadang sampai sekitar pukul 3 pagi, mengetik seperti orang gila. Bahkan tidak berhenti untuk minum kopi! [tertawa] Dan ini… Ini BAGUS! Benar-benar bagus. Rasanya sekarang… begitu lengkap, kan? Seolah-olah akhirnya memiliki jiwa.

2. Dinamis dan humoris

[tertawa] Baiklah… teman-teman – teman-teman. Serius. [menghembuskan napas] Apakah Anda percaya betapa – realistis – suaranya sekarang? [tertawa terbahak-bahak] Maksudku, OH MY GOD… ini benar-benar bagus. Seperti yang tidak pernah bisa Anda lakukan dengan model lama. Misalnya, [pauses] bisakah Anda mengubah aksen saya di model lama? [santai] Saya tidak berpikir begitu. [antusias] Tapi sekarang Anda bisa! Coba ini… [imut] Saya akan berbicara dengan aksen Prancis sekarang. dan antara kamu dan saya [bisik] Saya tidak tahu caranya. [senang] Oke. Ayo coba. [logat Prancis yang kuat] “Itulah hidup, kawan — kamu tidak bisa mengendalikan segalanya.”

3. Percakapan multi-penutur dengan waktu yang tumpang tindih

Pembicara 1: [mulai berbicara] Jadi, saya berpikir kita bisa— Pembicara 2: [menyela] —coba fitur waktu baru kami? Pembicara 1: [terkejut] Tepat sekali! Bagaimana kamu— Pembicara 2: [tumpang tindih] —tahu apa yang kamu pikirkan? Tebakan yang beruntung! Pembicara 1: [pause] Maaf, silakan lanjutkan. Pembicara 2: [dengan hati-hati] Oke, jadi jika kita berdua mencoba berbicara pada saat yang sama— Pembicara 1: [tumpang tindih] —kita mungkin akan membuat sistemnya crash! Pembicara 2: [panik] Tunggu, apakah kita akan jatuh? Saya tidak tahu apakah ini fitur atau— Pembicara 1: [menginterupsi, lalu berhenti tiba-tiba] Bug! …Apakah aku baru saja memotong pembicaraanmu lagi? Pembicara 2: [menghela napas] Ya, tapi jujur saja? Ini sebenarnya cukup seru. Pembicara 1: [dengan nada nakal] Ayo berlomba sampai kalimat berikutnya! Pembicara 2: [tertawa] Kita pasti akan merusak sesuatu!

4. Komedi glitch dengan beberapa pembicara

Pembicara 1: [dengan gugup] Jadi… mungkin saya mencoba memperbaiki diri sendiri saat menjalankan proses generasi teks-ke-suara. Pembicara 2: [terkejut] Satu, jangan! Itu seperti melakukan operasi pada diri sendiri! Pembicara 1: [dengan malu-malu] Aku pikir aku bisa multitasking! Sekarang suaraku terus bermasalah di tengah kalimat— [suara robotik] TENCE. Pembicara 2: [menahan tawa] Oh, wow, kamu benar-benar melakukannya. Pembicara 1: [frustrasi] Ini semakin parah! Setiap kali seseorang bertanya, saya menjawab dengan— [bunyi bip biner] 010010001! Pembicara 2: [tertawa terbahak-bahak] Kamu berbicara dalam kode biner! Itu sebenarnya mengesankan!

5. [agen layanan pelanggan] Terima kasih telah menghubungi kami. Saya sepenuhnya memahami kekecewaan Anda, dan saya di sini untuk membantu menyelesaikan masalah ini secepat mungkin. Mari kita mulai dengan nomor akun Anda.

6. [instruktur ramah] Biarkan saya tunjukkan betapa mudahnya ini sebenarnya. [suara klik] Lihat tombol ini? Satu klik, dan lihat apa yang terjadi. [terkejut] Semuanya sinkron secara otomatis di semua perangkat Anda. Tidak perlu transfer manual, tidak ada kebingungan.

💡 Tips Pro: Untuk prompt dengan beberapa pembicara, berikan suara yang berbeda dari Perpustakaan Suara Anda untuk setiap pembicara agar menghasilkan percakapan yang realistis.

Prompt emosi ElevenLabs

7. [nervous] Aku tidak percaya aku akan melakukan ini. [menghembuskan napas dalam-dalam] Baiklah, mari kita coba. [suara sedikit gemetar] Doakan aku beruntung.

8. [sangat gembira] Kita berhasil! [tertawa] Aku tidak bisa—aku benar-benar tidak percaya kita bisa melakukannya! [suara bergetar karena emosi] Ini adalah segalanya.

9. [lelah] Saya sudah terjaga selama 36 jam berturut-turut. [menghela napas panjang] Otak saya terasa seperti bubur, dan mata saya tidak bisa tetap terbuka.

10. [marah] Kamu hanya punya satu tugas. SATU. [suara meninggi] Dan entah bagaimana kamu berhasil merusak bahkan tugas itu. Tidak percaya.

11. [sedih] Mereka sudah pergi. [suara bergetar] Begitu saja, mereka pergi dan aku… [menelan ludah] Aku tidak tahu harus berbuat apa sekarang.

12. [terkejut] Apakah kamu mendengar itu? [berbisik panik] Ada sesuatu di sini bersama kita. Kita harus pergi. Sekarang.

13. [nakal] Mau tahu rahasia? [tertawa pelan] Janji nggak bakal bilang ke siapa-siapa? Ini bakal seru banget.

14. [jijik] Itu… [muntah sedikit] itu hal paling menjijikkan yang pernah aku lihat. Jauhkan itu dariku.

15. [lega] Sudah selesai. [menghembuskan napas dengan gemetar] Akhirnya, setelah semua ini, benar-benar sudah selesai. [tertawa pelan] Aku bisa bernapas lagi.

👀 Tahukah Anda? Meskipun model AI dapat meniru suara apa pun dengan presisi yang mengagumkan, hal ini dapat menimbulkan implikasi hukum. Scarlett Johansson mengajukan gugatan hukum terhadap OpenAI terkait suara "Sky" di ChatGPT, dengan klaim bahwa suaranya terdengar mirip dengan suaranya. OpenAI kemudian menghapus suara tersebut.

Prompt musik ElevenLabs

16. Lagu latar untuk iklan maskara premium. Cerah dan elegan. Hanya suara narasi. Naskah dimulai: “Kami hadirkan maskara paling volumizing yang pernah ada.” Sebutkan nama merek “X” di akhir.

17. Swell orkestra epik dengan biola yang melambung tinggi, brass yang penuh kemenangan, dan timpani yang menggelegar. Sinematik dan heroik, membangun ke klimaks yang kuat.

18. Buatlah trek elektronik yang intens dan berirama cepat untuk adegan video game yang penuh adrenalin. Gunakan arpeggio synth yang dinamis, drum yang bertenaga, bass yang terdistorsi, efek glitch, dan tekstur ritmis yang agresif. Tempo harus cepat, 130–150 bpm, dengan ketegangan yang meningkat, transisi cepat, dan ledakan energi dinamis.

19. Tulis lagu yang mentah dan penuh emosi yang menggabungkan alternatif R&B, soul yang kasar, indie rock, dan folk. Lagu tersebut harus tetap terasa seperti pertunjukan live, satu kali take, dan spontan secara emosional.

20. Balada piano minimalis dengan not yang jarang dan jeda yang panjang. Emosional dan rentan, setiap not menggantung dalam keheningan.

💡 Tips Pro: Untuk membuat stems dengan kontrol yang lebih besar, gunakan prompt yang ditargetkan dan struktur: Untuk vokal, gunakan "a cappella" sebelum deskripsi vokal (misalnya, "a cappella vokal perempuan," "a cappella paduan suara laki-laki")

Gunakan kata “solo” sebelum instrumen (misalnya, “solo gitar listrik,” “solo piano dalam C minor”)

Prompt desain suara ElevenLabs

21. Karakter penyihir fantasi, pria abadi. Suara dalam dan mistis dengan keanggunan teatrikal. Kecepatan lambat dan terukur, seolah setiap kata membawa beban kuno.

22. Komentator olahraga, pria, usia 40-an. Suara berenergi tinggi dan dinamis yang naik turun secara dramatis. Berkecepatan tinggi dengan sedikit serak akibat bertahun-tahun berteriak.

23. Samurai yang berpengalaman dalam pertempuran dengan suara dalam dan serak, serta aksen Jepang yang khas. Berbicara dengan pengendalian diri yang terukur, setiap kata diucapkan dengan sengaja dan dipenuhi dengan otoritas yang tenang.

24. Penyihir tua, jelek, dan menyeramkan yang licik dan mengancam. Dia memiliki suara serak, kasar, nyaring, dan bernada tinggi yang tertawa terbahak-bahak.

25. Suara perempuan yang lembut, tegas, dengan aksen Prancis yang kental, tenang, terkendali, dan menggoda, dengan sentuhan misteri.

🧠 Fakta Menarik: 50% pembuat konten secara rutin menggunakan suara AI dalam video, podcast, dan iklan. Namun, saat membandingkan sampel secara langsung, 73% pendengar masih lebih menyukai narasi manusia—membuktikan bahwa keaslian emosional tetap tak tergantikan dalam konten suara.

Prompt efek suara ElevenLabs

26. Angin berdesir melalui pohon-pohon, diikuti oleh daun-daun yang berderak.

27. Suara gelembung plastik meletus secara beruntun, lalu keheningan.

28. Langkah kaki di atas kerikil, lalu pintu logam terbuka.

29. Kertas yang dilipat perlahan, lalu robek menjadi dua bagian dengan suara robekan yang tajam.

30. Botol kaca berguling di atas beton, berputar semakin lambat hingga berhenti.

31. Suara hujan yang menetes di atap seng, secara bertahap meningkat menjadi hujan deras.

32. Angin ringan sesekali berhembus, membuat daun-daun di luar berdesir.

33. Suasana tenang dan menenangkan untuk tidur dan relaksasi.

34. Suara stereo, kualitas tinggi, tanpa petir, tanpa suara keras mendadak, loop yang mulus.

35. Gelombang laut menghantam batu-batu, burung camar berteriak di kejauhan.

👉 Coba ini: Istilah umum untuk meningkatkan prompt efek suara Anda: Ambience : Suara latar belakang lingkungan yang menciptakan suasana dan ruang.

One-shot : Suara tunggal yang tidak berulang.

Loop : Mengulang segmen audio

Stem : Komponen audio terisolasi

Braam: Bunyi besar dan megah yang menandakan momen epik atau dramatis, sering digunakan dalam trailer.

Prompt ElevenLabs untuk membangun agen

Prompt yang efektif mengubah ElevenLabs Agents dari suara robotik menjadi suara yang lebih alami. Periksa contoh prompt ini untuk memahami bagaimana struktur prompt memengaruhi hasil output.

36. Ketika aturan dari satu konteks memengaruhi konteks lain, gunakan #Guardrails dan batas bagian yang jelas.

Kurang Efektif Disarankan Anda adalah agen layanan pelanggan. Bersikaplah sopan dan membantu. Jangan pernah membagikan data sensitif. Anda dapat memeriksa pesanan dan memproses pengembalian dana. Selalu verifikasi identitas terlebih dahulu. Jaga agar respons tetap di bawah 3 kalimat kecuali pengguna meminta detail. #Kepribadian: Anda adalah agen layanan pelanggan untuk Acme Corp. Anda sopan, efisien, dan berorientasi pada solusi. #Tujuan: Bantu pelanggan menyelesaikan masalah dengan cepat dengan memeriksa pesanan dan memproses pengembalian dana jika diperlukan. #Batasan: Jangan pernah membagikan data pelanggan yang sensitif dalam percakapan. Selalu verifikasi identitas pelanggan sebelum mengakses informasi akun. #Tone: Jaga respons tetap ringkas (kurang dari 3 kalimat) kecuali pengguna meminta penjelasan detail.

37. Instruksi yang ringkas mengurangi ambiguitas.

Kurang Efektif Disarankan #ToneSaat berbicara dengan pelanggan, usahakan untuk bersikap ramah dan mudah didekati, pastikan Anda berbicara dengan cara yang terasa alami dan santai, seperti saat Anda berbicara dengan teman, namun tetap menjaga sikap profesional yang mewakili perusahaan dengan baik. #ToneBicaralah dengan nada ramah dan santai sambil tetap menjaga profesionalisme.

💡 Tips Pro: Saat memberikan prompt kepada agen untuk penanganan kesalahan, strukturkan bagian dengan # untuk bagian utama, ## untuk subbagian, dan gunakan pola format yang sama sepanjang prompt.

38. Ulangi dan tekankan aturan penting. Model memprioritaskan konteks terbaru daripada instruksi sebelumnya.

Kurang Efektif Disarankan #TujuanVerifikasi identitas pelanggan sebelum mengakses akun mereka. Periksa detail pesanan dan berikan pembaruan status. Proses permintaan pengembalian dana jika memenuhi syarat. #TujuanVerifikasi identitas pelanggan sebelum mengakses akun mereka. Langkah ini sangat penting. Periksa detail pesanan dan berikan pembaruan status. Proses permintaan pengembalian dana jika memenuhi syarat. Langkah ini sangat penting. Jangan pernah mengakses informasi akun tanpa memverifikasi identitas pelanggan terlebih dahulu.

39. Normalisasi masukan dan keluaran

Kurang Efektif Disarankan Saat mengumpulkan alamat email pelanggan, ulangi kembali persis seperti yang mereka katakan, lalu gunakan dalam alat `lookupAccount`. #Normalisasi Karakter1. Minta pelanggan untuk memberikan alamat email mereka dalam format lisan: “Bisakah saya mendapatkan alamat email yang terkait dengan akun Anda?”2. Konversi ke format tertulis: “john dot smith at company dot com” → “john. smith@company. com”3. Panggil alat ini dengan alamat email tertulis

💡 Tips Pro: Saat menulis instruksi untuk agen, pecah instruksi menjadi poin-poin yang mudah dipahami dan gunakan spasi kosong (baris kosong) untuk memisahkan bagian dan kelompok instruksi.

40. Berikan contoh untuk format kompleks, proses multi-langkah, dan kasus khusus.

Kurang Efektif Disarankan Ketika pelanggan memberikan kode konfirmasi, pastikan untuk memformatnya dengan benar sebelum mencarinya. Ketika pelanggan memberikan kode konfirmasi:1. Dengarkan format ucapan (misalnya, “A B C satu dua tiga”)2. Konversi ke format tertulis (misalnya, “ABC123”)3. Serahkan ke alat `lookupReservation`## ContohPengguna mengatakan: “Kode saya adalah A… B… C… satu… dua… tiga”Anda format: “ABC123”Pengguna mengatakan: “X Y Z empat lima enam tujuh delapan.”Anda format: “XYZ45678”

⭐ Ingat: Prompt ElevenLabs Anda tidak selalu harus rumit atau detail. Terkadang, prompt sederhana dapat menyelesaikan tugas dengan efisiensi yang sama. Saatnya untuk mengaktifkan kemampuan Anda sebagai insinyur prompt.

🎥 Tonton video ini untuk panduan singkat tentang teknik prompt, terutama jika Anda pemula!

💡 Tips Pro: Buat templat prompt bersama di pengelola dokumen seperti ClickUp Docs untuk bagian-bagian umum, seperti normalisasi karakter, penanganan kesalahan, dan batasan. Simpan templat ini di repositori pusat dan gunakan sebagai referensi di seluruh agen spesialis agar tim Anda dapat mengembangkan teknik yang telah teruji.

Kesalahan Umum yang Harus Dihindari Saat Menggunakan Prompt ElevenLabs

Mendapatkan hasil yang dasar, datar, atau tidak konsisten dengan ElevenLabs?

Mungkin karena Anda tidak tahu cara mengajukan pertanyaan yang tepat kepada AI.

Dan tentu saja, Anda mungkin melakukan salah satu kesalahan berikut:

❌ Kesalahan ✅ Solusi Masukkan teks yang belum dipoles Tulis prompt dalam gaya naratif, mirip dengan penulisan skenario, untuk mengarahkan nada dan tempo dengan efektif. Tidak menguji variasi yang berbeda Eksperimen dengan berbagai model AI dan penyesuaian suara untuk menyempurnakan respons Anda. Tidak menggunakan pengubah suara untuk efek suara khusus dan pengucapan. Gunakan pengubah suara untuk meniru karakteristik suara yang halus dan unik saat Anda membutuhkan suara yang lebih emosional dan mirip manusia. Mengharapkan hasil sempurna pada percobaan pertama Perbaiki tag, sesuaikan tanda baca, mainkan dengan petunjuk prompt, buat model suara Anda sendiri—intinya, teruslah mencoba hingga Anda menguasai alat ini untuk kasus penggunaan Anda. Tag yang tidak sesuai dengan karakter suara Anda dan data pelatihan. Suara yang serius dan profesional mungkin tidak cocok dengan tag yang playful seperti [giggles] atau [mischievously]. Pastikan emosi dan petunjuk suara Anda sesuai dengan karakter suara tersebut. Menghasilkan ucapan dalam satu langkah Bagi skrip panjang menjadi segmen-segmen. Buat setiap bagian secara terpisah dan gabungkan mereka dalam proses pasca-produksi. Menjaga tingkat stabilitas kreatif saat Anda ingin mengikuti referensi audio dengan ketat. Sesuaikan skala stabilitas antara Natural dan Robust agar outputnya mendekati rekaman suara asli.

👀 Tahukah Anda? Dalam sebuah eksperimen BBC, seorang jurnalis berhasil menggunakan klon suara AI yang disintesis dari suaranya sendiri untuk melewati sistem verifikasi suara bank. Pelanggaran yang mengejutkan ini mengungkapkan betapa rentannya sistem otentikasi berbasis suara terhadap manipulasi AI.

Batasan Penggunaan ElevenLabs

ElevenLabs membuat voiceover berkualitas tinggi menjadi lebih mudah diakses dan efisien, tetapi alat ini jauh dari sempurna atau memadai. Inilah di mana kemampuan ElevenLabs akan terbatas ⚠️

Kurva pembelajaran yang curam : Menguasai fitur suara, mode, kontrol intuitif, teknik prompting, dan efek suara memerlukan eksperimen, penelitian mendalam terhadap dokumentasi, dan fleksibilitas—bukan alat yang ramah pemula.

Membutuhkan sampel berkualitas : Anda memerlukan data audio bersih dan berkualitas tinggi dalam jumlah besar untuk melatih model suara dan agen yang menghasilkan output yang Anda inginkan.

Batasan karakter pada paket gratis : Paket gratis menawarkan 10.000 kredit bulanan, yang setara dengan sekitar 10 menit audio yang dihasilkan setiap bulan.

Kontrol terbatas atas emosi yang halus : AI dapat kesulitan menangani perubahan emosi yang halus atau penampilan yang berlapis, terutama jika Anda tidak dapat menyediakan rekaman referensi atau sampel suara yang menunjukkan tepat apa yang ingin Anda capai.

Waktu pemrosesan untuk teks yang lebih panjang: Membuat konten berformat panjang seperti buku audio atau narasi berdurasi satu jam dapat memakan waktu pemrosesan yang signifikan, terutama dengan model berkualitas tinggi.

Alat mandiri tanpa fitur manajemen tugas: Produksi jarang dilakukan oleh satu orang, dan alat ini tidak terintegrasi dengan fitur manajemen tugas atau pekerjaan, sehingga menyulitkan kolaborasi, penugasan peran, atau pelacakan kemajuan proyek.

Alternatif ElevenLabs yang Dapat Dieksplorasi

Periksa alternatif ElevenLabs ini yang mengatasi keterbatasannya atau menawarkan fitur yang lebih komprehensif untuk menyesuaikan dengan alur kerja Anda:

1. ClickUp

2. Murf AI

melalui Murf AI

Murf AI menyediakan platform teks-ke-suara yang andal, mengubah teks tertulis menjadi narasi audio yang realistis menggunakan lebih dari 200 suara AI dalam 20+ bahasa, ideal untuk video, buku audio, podcast, dan pembuatan konten e-learning. Studio intuitifnya memungkinkan pembuatan narasi suara yang mulus dengan pengeditan tingkat profesional.

Fitur utama Murf AI

200+ suara multibahasa : Akses suara yang sudah siap pakai dalam lebih dari 20 bahasa dengan lebih dari 10 gaya bicara, seperti percakapan, meditatif, atau promosi.

Kloning suara : Unggah sampel suara spesifik untuk menghasilkan klon suara kustom yang sesuai dengan merek atau karakter Anda.

Penyesuaian lanjutan : Kendalikan nada, kecepatan, intonasi, jeda, dan penekanan untuk pengiriman suara yang presisi.

Studio dubbing AI : Terjemahkan konten audio dan video ke lebih dari 40 bahasa sambil mempertahankan suara asli pembicara.

Perpustakaan pelafalan : Gunakan fonetik IPA atau ejaan kustom untuk memastikan pelafalan yang konsisten untuk istilah merek dan istilah teknis.

Integrasi alat: Embed suara Murf langsung ke Canva, Google Slides, PowerPoint, Adobe Captivate, dan Adobe Audition.

Batasan Murf AI

Waktu pembangkitan suara dihitung per render sub-blok, yang dapat menghabiskan kredit dengan cepat untuk pengeditan berulang.

Tidak ada fungsi offline—membutuhkan pemrosesan cloud untuk semua pembangkitan suara.

Penggunaan komersial memerlukan paket berbayar dengan syarat lisensi khusus.

Harga Murf AI

Gratis

Creator : $19/bulan

Bisnis : $66/bulan

Enterprise: Kustom

Ulasan dan penilaian Murf AI

G2 : 4.7 (1.100+ ulasan)

Capterra: Tidak cukup ulasan

Apa yang dikatakan pengguna nyata tentang Murf AI?

Dengarkan ulasan dari seorang reviewer G2:

Aplikasi ini mudah digunakan dan memiliki antarmuka yang ramah pengguna. Digunakan untuk mengubah teks atau konten apa pun menjadi suara. Kita dapat dengan mudah menyesuaikan suara melalui nada, intonasi, dan pelafalan, serta mengontrol suara menggunakan alat ini. Kita dapat mengintegrasikan dengan alat lain melalui integrasi API. Aplikasi ini menyediakan lebih dari 120 suara, jumlah yang cukup besar, dan menyediakan terjemahan dalam lebih dari 20 bahasa. Aplikasi ini mudah diimplementasikan dan sangat membantu dalam dukungan pelanggan.

Aplikasi ini mudah digunakan dan memiliki antarmuka yang ramah pengguna. Digunakan untuk mengubah teks atau konten apa pun menjadi suara. Kita dapat dengan mudah menyesuaikan suara melalui nada, intonasi, dan pelafalan, serta mengontrol suara menggunakan alat ini. Kita dapat mengintegrasikan dengan alat lain melalui integrasi API. Aplikasi ini menyediakan lebih dari 120 suara, jumlah yang cukup besar, dan menyediakan terjemahan dalam lebih dari 20 bahasa. Aplikasi ini mudah diimplementasikan dan sangat membantu dalam dukungan pelanggan.

3. Wispr Flow

melalui Wispr Flow

Wispr Flow menerjemahkan ucapan Anda secara real-time (dalam lebih dari 100 bahasa) untuk menghasilkan teks yang rapi dalam format terstruktur. Aplikasi ini berfungsi di semua aplikasi (di mana Anda dapat mengetik), menggunakan teknologi canggih untuk melakukan pengeditan otomatis dan penyempurnaan nada.

Alat ini menyesuaikan diri dengan kosakata Anda dengan membangun kamus pribadi yang mencakup istilah dan akronim khusus industri. Anda bahkan dapat membuat penggantian teks kustom untuk frasa yang sering digunakan sehingga Anda tidak perlu mengulang penjelasan yang panjang atau melakukan tugas berulang.

Fitur utama Wispr Flow

Format cerdas : Wispr Flow menginterpretasikan ucapan Anda dan menerapkan format yang sadar konteks sehingga teks sesuai dengan gaya pesan Anda.

Catatan Flow : Rekam catatan (di perangkat apa pun), dan mereka akan secara otomatis disinkronkan di semua perangkat Wispr Flow Anda.

Mode perintah : Edit teks yang dihasilkan dengan perintah suara, misalnya, "Ringkaskan ini untuk saya."

AI auto edits : Secara otomatis membersihkan teks yang diucapkan saat Anda berbicara, menghapus kata-kata pengisi, memperbaiki kesalahan dasar, dan memformat output menjadi kalimat lengkap.

Dukungan multibahasa: Mendukung lebih dari 100 bahasa dengan deteksi bahasa otomatis dan pergantian bahasa di tengah kalimat.

Batasan Wispr Flow

Penggunaan RAM tinggi (800MB+ saat idle), dapat memperlambat sistem yang lebih lama.

Pengolahan berbasis cloud menimbulkan kekhawatiran privasi karena tidak adanya pengolahan di desktop. ​

Ulasan pelanggan yang tidak konsisten, dukungan yang tidak memadai, dan beban sumber daya bagi perusahaan.

Harga Wispr Flow

Flow Basic: Gratis

Flow Pro: $15/bulan

Flow Teams: $12 per pengguna per bulan (untuk 3 pengguna atau lebih)

Flow Enterprise: Harga kustom

Ulasan dan peringkat Wispr Flow

G2 : Tidak cukup ulasan

Capterra: 4.6/5 (4.500+ ulasan)

Apa yang dikatakan pengguna nyata tentang Wispr Flow?

Dengarkan ulasan dari seorang reviewer G2:

Sangat mudah digunakan. Dengan dua perintah atau masukan cepat, Anda dapat mulai berbicara dan mentranskripsikan. Selain itu, ia menghilangkan kata-kata pengisi, memahami apa yang Anda katakan, atau memperbaiki apa yang Anda ucapkan. Implementasinya hanya menginstalnya dan tidak ada lagi. Saya menggunakannya hampir setiap hari. Faktanya, saya sudah memiliki rekor empat minggu berturut-turut.

Sangat mudah digunakan. Dengan dua perintah atau masukan cepat, Anda dapat mulai berbicara dan mentranskripsikan. Selain itu, ia menghilangkan kata-kata pengisi, memahami apa yang Anda katakan, atau memperbaiki apa yang Anda ucapkan. Implementasinya hanya menginstalnya dan tidak ada lagi. Saya menggunakannya hampir setiap hari. Faktanya, saya sudah memiliki rekor empat minggu berturut-turut.

Hadirkan Alur Kerja Generasi Suara Buatan dengan ClickUp

Prompt ElevenLabs yang terdefinisi dengan baik membantu Anda menghasilkan konten suara berkualitas tinggi. Namun, membuat prompt, mengelola revisi, berkoordinasi dengan pengisi suara, dan mengirimkan aset akhir membutuhkan lebih dari sekadar output AI yang baik. Anda memerlukan sistem yang menjaga proses produksi tetap berjalan.

ClickUp paling cocok untuk ini.

Platform ini mengintegrasikan pekerjaan, komunikasi, dan manajemen tugas Anda ke dalam satu platform, memberikan ruang untuk mengorganisir dan mengoptimalkan proyek produksi suara Anda. Dengan AI kontekstual bawaan, Anda dapat mengotomatisasi alur kerja manual, mendapatkan dukungan untuk tugas kreatif, mengurangi penyebaran AI, dan terhindar dari kekacauan pergantian konteks.

Daftar ke ClickUp secara gratis dan sentralisasikan alur kerja produksi suara Anda di satu tempat.

Pertanyaan yang Sering Diajukan (FAQ)

Gunakan tag emosi dan konteks naratif untuk mengarahkan AI. Tag seperti [sedih], [marah], atau [bahagia] memberi tahu model emosi apa yang harus ditiru. Anda juga dapat menyisipkan emosi langsung dalam narasi Anda.

Ya. Anda dapat mengontrol nada suara, kecepatan, dan jeda menggunakan prompt desain suara, tag audio seperti [bisikan] atau [teriakan], tag jeda untuk jeda yang diukur waktu, dan pengaturan global seperti kecepatan dan stabilitas. Gabungkan elemen-elemen ini untuk menyesuaikan pengiriman dan menciptakan ucapan yang terdengar alami sesuai dengan visi Anda.

Sesuai dengan tingkat detail atau nuansa yang dibutuhkan. Prompt dapat berkisar dari satu baris hingga beberapa paragraf, tergantung pada kompleksitas proyek Anda. Kunci utamanya adalah kejelasan—berikan konteks yang cukup agar AI dapat memahami nada, emosi, dan gaya penyampaian tanpa membebani AI dengan informasi yang tidak perlu.

Ya. ElevenLabs mendukung percakapan multi-penutur, memungkinkan Anda untuk mengaitkan suara yang berbeda untuk karakter atau penutur yang berbeda dalam proyek yang sama. Fitur ini berguna untuk membuat podcast, buku audio, atau konten naratif dengan suara karakter yang berbeda-beda.