Balabolka  Dienstprogramm für die Online-Text-zu-Sprache-Nutzung
The command line application allows to use online text-to-speech services: text files or subtitles can be converted to audio files. The utility can be used for testing purposes: it will help you to choose a cloud computing service that satisfies your needs. The separate application for Yandex SpeechKit is available for downloading, because Yandex is the Russian IT company with close government ties.
 |
Online-Dienste mit Sprachtechnologien:
- Google Cloud Text-to-Speech;
- Amazon Polly;
- Baidu Text-to-Speech;
- IBM Watson Text-to-Speech;
- Microsoft Azure;
- Naver Text-to-Speech;
- Youdao Text-to-Speech;
- Yandex SpeechKit.
|
Datei Download (Online-TTS-Dienstprogramm)
Größe: MB
| |
Version: Changelog |
|
Lizenzart: Freeware
| |
Plattformen:
|
Command Line Utility for Yandex SpeechKit Using: Download ( MB)
The program converts text or subtitles to audio files by using of the Yandex service.
To perform operations via the Yandex API, it is necessary to authenticate using an API-key.
Befehlszeilen-Anwendung
Die Konsolenanwendung verwaltet verschiedene Befehlszeilenparameter, um zu ermöglichen, einen Text laut vorzulesen oder als Audio-Datei zu speichern. Die Befehlszeilen-Optionen verwenden die Syntax "bal4web [Optionen ...]", alle Parameter müssen durch ein Leerzeichen getrennt werden. Die Optionen können in beliebiger Reihenfolge in der Befehlszeile aufgeführt werden, solange sie mit ihren zugehörigen Parametern verbunden sind. Verwenden Sie die "bal4web -?" Befehlszeile, um Hilfe bezüglich Syntax und Parameter der Kommandozeile zu erhalten.
- -s Dienstname
- Legt den Namen des Online-TTS-Dienstes fest ("google" oder "g", "amazon" oder "a", "baidu" oder "b", "ibm" oder "i", "microsoft" oder "m", "naver" oder "n", "youdao" oder "y"). Die Voreinstellung ist "google".
- -l Sprache
- Legt den Sprachnamen für den Online-TTS-Dienst fest. Der Name ist eine Kombination aus einem aus zwei Buchstaben bestehenden ISO 639-Kulturcode in Kleinbuchstaben, der einer Sprache zugeordnet ist, und einem aus zwei Buchstaben bestehenden ISO 3166-Subkulturcode in Großbuchstaben, der einem Land oder einer Region zugeordnet ist.
Zum Beispiel: "de-DE". Die Standardeinstellung ist "en-US".
- -g Geschlecht
- Legt das Geschlecht für den Online-TTS-Dienst fest (falls unterstützt). Die verfügbaren Werte: "female" oder "f" (weiblich), "male" oder "m" (männlich). Der Standardwert ist nicht definiert. Dieser Parameter wird von den Diensten Google TTS, Amazon Polly, IBM Watson, Microsoft Azure unterstützt.
- -n Sprecher
- Legt den Sprachnamen für den Online-TTS-Dienst fest (falls unterstützt). Der Standardwert ist nicht definiert. Dieser Parameter wird von den Diensten Amazon Polly, IBM Watson, Microsoft Azure unterstützt.
- -r Sprechgeschwindigkeit
- Legt die Rate der synthetisierten Sprache fest (falls unterstützt). Der Standardwert ist "1.0" (durchschnittliche menschliche Sprechgeschwindigkeit).
Für Google TTS und Microsoft Azure reichen die Ratenwerte von "0.1" bis "3.0". Für Naver TTS reichen die Ratenwerte von "0.5" bis "1.5".
- -v Zahl
- Bestimmt das Volumen in einem Bereich von 0 bis 200 (der Standardwert ist 100).
- -m
- Druckt die Liste der unterstützten Sprachen (Geschlechter und Stimmnamen, falls verfügbar) für den Online-TTS-Dienst.
- -f Dateiname
- Bestimmt den Namen der Eingabe-Textdatei.
- -fl Dateiname
- Bestimmt den Namen der Textdatei mit der Liste der Eingabedateien (ein Dateiname pro Zeile).
- -w Dateiname
- Bestimmt den Namen der Ausgabe-Datei im WAV-Format. Wenn diese Option angegeben ist, wird eine Audio-Datei erstellt. Sonst wird der Text laut vorgelesen.
- -c
- Verwendet die Texteingabe aus der Zwischenablage.
- -t Textzeile
- Die Texteingabe kann von der Befehlszeile verwendet werden.
- -i
- Verwendet die Texteingabe von STDIN.
- -o
- Schreibt Tondaten auf STDOUT. Wenn diese Option gewählt ist, wird die Option -w ignoriert.
- --encoding Kodierung oder -enc Kodierung
- Bestimmt die Kodierung für die Texteingabe ("ansi", "utf8" oder "unicode"). Die Standardeinstellung ist "ansi".
- -ln Zahl
- Wählt eine Zeile aus einer Textdatei mit Hilfe einer Zeilennummer. Die Zeilennummerierung beginnt bei "1". Ein Intervall von Zahlen kann verwendet werden, um mehr als eine Zeile auszuwählen (beispielsweise "26-34"). Die Befehlszeile kann ein paar Optionen enthalten -ln.
- -e Zahl
- Legt die Länge der Pausen zwischen Sätzen fest (in Millisekunden). Der Wert sollte kleiner als 5000 sein. Wenn die Option nicht angegeben ist, verwendet der Dienst die Standardpausen zwischen den Sätzen. Dieser Parameter wird nur von Microsoft Azure unterstützt.
- -d Dateiname
- Verwendet das Wörterbuch für die Aussprache-Korrektur (*.BXD, *.REX oder *.DIC). Die Befehlszeile kann ein paar Optionen enthalten -d.
- -lrc
- Creates the LRC file. Lyrics will be synchronized with the speech in the output audio file.
- -srt
- Creates the SRT file. Subtitles will be synchronized with the speech in the output audio file.
- -sub
- Text wird als Untertitel verarbeitet. Diese Option kann nützlich sein, wenn die Optionen -i oder -c festgelegt wurden.
- -host Hostname
- Sets the hostname of the proxy server.
- -port Zahl
- Sets the port number of the proxy server.
- -dp
- Display progress information in a console window.
- --ignore-square-brackets oder -isb
- Text in [eckigen Klammern] ignorieren.
- --ignore-curly-brackets oder -icb
- Text in {geschweiften Klammern} ignorieren.
- --ignore-angle-brackets oder -iab
- Text in <Winkelklammern> ignorieren.
- --ignore-round-brackets oder -irb
- Text in (runden Klammern) ignorieren.
- --ignore-comments oder -ic
- Kommentare im Text ignorieren. Einzeilige Kommentare beginnen mit // und werden bis zum Ende der Zeile fortgesetzt. Mehrzeilige Kommentare beginnen mit /* und enden mit */.
- -h
- Druckt die Liste der verfügbaren Befehlszeilen-Optionen.
- --lrc-length Zahl
- Bestimmt die maximale Länge der Textzeilen für die LRC-Datei (in Zeichen).
- --lrc-fname Dateiname
- Bestimmt den Namen der LRC-Datei. Die Option kann nützlich sein, wenn die Option -o angegeben ist.
- --lrc-enc Kodierung
- Bestimmt die Kodierung für die LRC-Datei ("ansi", "utf8" oder "unicode"). Die Standardeinstellung ist "ansi".
- --lrc-offset Zahl
- Bestimmt die Zeitverschiebung für die LRC-Datei (in Millisekunden).
- --lrc-artist Textzeile
- Bestimmt den ID-Tag für die LRC-Datei: Künstler.
- --lrc-album Textzeile
- Bestimmt den ID-Tag für die LRC-Datei: Album.
- --lrc-title Textzeile
- Bestimmt den ID-Tag für die LRC-Datei: Titel.
- --lrc-author Textzeile
- Bestimmt den ID-Tag für die LRC-Datei: Autor.
- --lrc-creator Textzeile
- Bestimmt den ID-Tag für die LRC-Datei: Ersteller der LRC-Datei.
- --srt-length Zahl
- Bestimmt die maximale Länge der Textzeilen für die SRT-Datei (in Zeichen).
- --srt-fname Dateiname
- Bestimmt den Namen der SRT-Datei. Die Option kann nützlich sein, wenn die Option -o angegeben ist.
- --srt-enc Kodierung
- Bestimmt die Kodierung für die SRT-Datei ("ansi", "utf8" oder "unicode"). Die Standardeinstellung ist "ansi".
- --raw
- Der Ausgang ist RAW-Format PCM; die Audiodaten enthalten nicht den WAV-Header. Diese Option wird zusammen mit der Option -o verwendet.
- --ignore-length oder -il
- Ignoriert die Länge der Daten im WAV-Header. Diese Option wird zusammen mit der Option -o verwendet.
- --sub-format Textzeile
- Legt das Format der Untertitel fest ("srt", "lrc", "ssa", "ass", "smi" oder "vtt"). Wenn diese Option nicht angegeben ist, wird das Format anhand der Dateiendung bestimmt.
- --sub-fit oder -sf
- Erhöht automatisch die Sprechgeschwindigkeit, um sie an Zeitintervalle anzupassen (wenn das Programm Untertitel in eine Audiodatei konvertiert). Dieser Parameter wird von den Diensten Google TTS und Naver TTS unterstützt.
Befehlszeilen-Beispiele
Create the text file SPRACHEN.TXT with the list of all supported languages and genders for the Google TTS service:
bal4web -s Google -m > Sprachen.txt
Convert text from BOOK.TXT to speech and save as BOOK.WAV:
bal4web -f "d:\Text\book.txt" -w "d:\Sound\book.wav" -s Google -l en-US -g female
Convert subtitles to speech and save as MOVIE.WAV:
bal4web -f "d:\Subtitles\movie.srt" -w "d:\Sound\movie.wav" -s m -l de-DE -n Conrad -r 1.1
Beispiel für die Verwendung zusammen mit LAME.EXE:
bal4web -f d:\book.txt -s Baidu -l en-US -o --raw | lame -r -s 16 -m m -h - d:\book.mp3
Beispiel für die Verwendung zusammen mit OGGENC2.EXE:
bal4web -f d:\book.txt -s Baidu -l en-US -o -il | oggenc2 --ignorelength - -o d:\book.ogg
Konfigurationsdatei
Die Befehlszeilen-Optionen können als Konfigurationsdatei "bal4web.cfg" im Ordner der Konsolen-Anwendung gespeichert werden.
Beispiel für eine Konfigurationsdatei:
-f d:\Text\book.txt
-w d:\Sound\book.wav
-s Google
-l de-DE
-g female
-d d:\Dict\rules.bxd
-lrc
--lrc-length 75
--lrc-enc utf8
|
Das Programm kann Optionen von der Konfigurationsdatei und der Kommandozeile kombinieren.
Lizenzart
Sie können Software für nichtkommerzielle Zwecke verwenden und vertreiben. Für die kommerzielle Nutzung oder den Vertrieb benötigen Sie die Genehmigung des Urheberrechtsinhabers.
|