RSS
Дарение

WMZ: Z087754155981 (USD)
WME: E110509803261 (EUR)

WebMoney

Balabolka Инструмент за командния ред за онлайн използване на текст в реч

The command line application allows to use online text-to-speech services: text files or subtitles can be converted to audio files. The utility can be used for testing purposes: it will help you to choose a cloud computing service that satisfies your needs. The separate application for Yandex SpeechKit is available for downloading, because Yandex is the Russian IT company with close government ties.

Utility for Online Text-To-Speech Using

Online services with speech technologies:

  • Google Cloud Text-to-Speech;
  • Amazon Polly;
  • Baidu Text-to-Speech;
  • CereVoice Cloud;
  • IBM Watson Text-to-Speech;
  • Microsoft Azure;
  • Naver Text-to-Speech;
  • Youdao Text-to-Speech;
  • Yandex SpeechKit.

Изтегляне на Balabolka (инструмент за онлайн синтез на реч)


Размер: MB
 
Версия: Списък с промени
 
Лиценз: Безплатен (Freeware)
 
Операционни системи:
Инструмент за командния ред за използване на Yandex SpeechKit: Изтегляне
Програмата преобразува текст или субтитри в аудио файлове с помощта на услугите на Yandex. За извършване на операции чрез ППИ на Yandex трябва да се направи удостоверяване с ППИ ключ.



Команден ред

The utility handles various command line parameters to be able to read text aloud or save as an audio file. The command line options use the syntax "bal4web [options ...]", all parameters must be separated by a space. Options can appear in any order on the command line so long as they are paired with their related parameters. Use the "bal4web -?" command line to get help on the command line syntax and parameters.


-s име_на_услуга
Sets the name of the online TTS service ("google" or "g", "amazon" or "a", "baidu" or "b", "cerevoice" or "c", "ibm" or "i", "microsoft" or "m", "naver" or "n", "youdao" or "y"). По подразбиране е "google".
-l име_на_език
Sets the language name for the online TTS service. The name is a combination of an ISO 639 two-letter lowercase culture code associated with a language and an ISO 3166 two-letter uppercase subculture code associated with a country or region.
Например: bg-BG, de-DE, ru-RU. По подразбиране е "en-US".
-g пол
Sets the gender for the online TTS service (if supported). The available values: "female" or "f", "male" or "m". The default value is not defined. This parameter is supported by services: Amazon Polly, CereProc TTS, Google TTS, IBM Watson TTS, Microsoft Azure, Naver TTS.
-n име_на_гласа
Sets the voice name for the online TTS service (if supported). The default value is not defined. This parameter is supported by services Amazon Polly, CereProc TTS, Google Cloud TTS, IBM Watson TTS, Microsoft Azure, Naver TTS.
-r скорост_на_речта
Sets the rate of the synthesized speech (if supported). По подразбиране е "1.0" (средна скорост на говорене).
For Amazon Polly the rate values range from "0.2" to "2.0".
For CereProc TTS the rate values range from "0.3" to "4.0".
For Google TTS and Microsoft Azure the rate values range from "0.1" to "3.0".
For IBM Watson TTS the rate values range from "0.3" to "3.0".
For Naver TTS the rate values range from "0.5" to "1.5".
-p целочислена_стойност
Sets the speaking pitch in a range of -20 to 20 (if supported). По подразбиране е 0.
This option is supported by Amazon Polly, CereProc TTS, Google Cloud TTS, IBM Watson, Microsoft Azure.
-v целочислена_стойност
Задава силата на звука в обхват от 0 до 200 (по подразбиране е 100).
-m
Prints the list of supported languages (genders and voices' names, if available) for the online TTS service.
-f име_на_файл
Задава името на входния текстов файл. Командния ред може да съдържа повече от една -f опция.
-fl име_на_файл
Задава името на текстовия файл със списъка от входни файлове (по едно име на файл на ред).
-w име_на_файл
Задава името на изходния файл в WAV формат.
-c
За вход се използва текста от клипборда.
-t текст
За вход може да се използва текст от командния ред. Командния ред може да съдържа повече от една -t опция.
-i
За вход се използва текста от STDIN.
-o
Записва звуковите данни в STDOUT. Ако е зададена тази опция, опцията -w бива игнорирана.
--encoding кодиране или -enc кодиране
Задава кодирането на входния текст ("ansi", "utf8" или "unicode"). Кодирането по подразбиране е "ansi".
--silence-begin целочислена_стойност или -sb целочислена_стойност
Задава времетраенето на тишината в началото на аудио файла (в милисекунди). По подразбиране е 0.
--silence-end целочислена_стойност или -se целочислена_стойност
Задава времетраенето на тишината в края на аудио файла (в милисекунди). По подразбиране е 0.
-ln целочислена_стойност
Selects a line from the text file by using of a line number. The line numbering starts at "1". The interval of numbers can be used for selecting of more than one line (например, "26-34"). The command line may contain few options -ln.
-e целочислена_стойност
Sets the length of pauses between sentences (in milliseconds). The value should be set less than 5000. If the option is not specified, the service will use the default pauses between sentences. This parameter is supported by Microsoft Azure only.
-d име_на_файл
Applies a dictionary for pronunciation correction (*.BXD, *.DIC or *.REX). The command line may contain few options -d.
-lrc
Creates the LRC file. Lyrics will be synchronized with the speech in the output audio file.
-srt
Creates the SRT file. Subtitles will be synchronized with the speech in the output audio file.
-sub
Input text will be processed as subtitles. The option may be useful, when the options -i or -c are specified.
-host хост
Sets the hostname of the proxy server.
-port целочислена_стойност
Sets the port number of the proxy server.
-fr целочислена_стойност
Sets the output audio sampling frequency in kHz (8, 11, 16, 22, 24, 32, 44, 48). If the option is not specified, the default value for the selected serice will be used.
--ignore-square-brackets или -isb
Ignore text in [square brackets].
--ignore-curly-brackets или -icb
Ignore text in {curly brackets}.
--ignore-angle-brackets или -iab
Ignore text in <angle brackets>.
--ignore-round-brackets или -irb
Ignore text in (round brackets).
--ignore-url или -iu
Ignore URLs.
--ignore-comments или -ic
Ignore comments in text. Single-line comments start with // and continue until the end of the line. Multiline comments start with /* and end with */.
-dp
Показване на информация за напредъка в конзолен прозорец.
-cfg име_на_файл
Sets the name of the configuration file with the command line options (a text file where each line contains one option). If the option is not specified, the file bal4web.cfg in the same folder as the utility will be used.
-h
Prints the list of available command line options.
--lrc-length целочислена_стойност
Sets the maximal length of text lines for the LRC file (in characters).
--lrc-fname име_на_файл
Sets the name of the LRC file. The option may be useful, when the option -o is specified.
--lrc-enc кодиране
Sets the encoding for the LRC file ("ansi", "utf8" or "unicode"). По подразбиране е "ansi".
--lrc-offset целочислена_стойност
Sets the time shift for the LRC file (in milliseconds).
--lrc-artist текст
Sets the ID tag for the LRC file: artist.
--lrc-album текст
Sets the ID tag for the LRC file: album.
--lrc-title текст
Sets the ID tag for the LRC file: title.
--lrc-author текст
Sets the ID tag for the LRC file: author.
--lrc-creator текст
Sets the ID tag for the LRC file: creator of the LRC file.
--lrc-sent
Inserts blank lines after sentences when creating the LRC file.
--lrc-para
Inserts blank lines after paragraphs when creating the LRC file.
--srt-length целочислена_стойност
Sets the maximal length of text lines for the SRT file (in characters).
--srt-fname име_на_файл
Sets the name of the SRT file. The option may be useful, when the option -o is specified.
--srt-enc кодиране
Sets the encoding for the SRT file ("ansi", "utf8" or "unicode"). По подразбиране е "ansi".
--raw
Изходният аудио файл е в суров PCM формат; аудио данните не съдържат WAV заглавката. Този параметър се използва в комбинация с параметъра -o.
--ignore-length или -il
Пропуска определената дължина от данни в WAV заглавката. Този параметър се използва в комбинация с параметъра -o.
--wss
Use the WebSocket protocol for Microsoft Azure. It allows to improve sound quality of audio files (24 KHz instead of 16 KHz). The option is ignored if the subscription key for the Microsoft Azure Cognitive Services is defined. Use the option -m to check if a voice supports the WebSocket protocol or not.
--sub-format текст
Задава формата на субтитрите ("srt", "lrc", "ssa", "ass", "smi" или "vtt"). Ако параметърът не е зададен, форматът ще бъде определен чрез файловото разширение.
--sub-fit или -sf
Автоматично увеличава скоростта, за да съвпадне с времевите интервали на субтитрите (когато програмата конвертира субтитри в аудио файл). This parameter is supported by services Amazon Polly, CereProc TTS, Google TTS, Microsoft Azure and Naver TTS.
 

--aws-keyid текст или -ak текст
Sets AWS access key ID for the Amazon Polly. It is recommended to apply such key if you have it.
--aws-secret текст или -as текст
Sets AWS secret access key for the Amazon Polly.
--aws-region текст или -ar текст
Sets AWS region for the Amazon Polly.
--crv-email текст или -ce текст
Sets the email address used when registering on the CereProc website. This information is necessary for CereVoice Cloud API authorization. It is recommended to apply such email if you have it.
--crv-pwd текст или -cp текст
Sets the password used when registering on the CereProc website. This information is necessary for CereVoice Cloud API authorization. It is recommended to apply such password if you have it.
--gc-apikey текст или -gk текст
Sets API key ID for the Google Cloud. It is recommended to apply such key if you have it.
--ms-apikey текст или -mk текст
Sets the subscription key for the Microsoft Azure Cognitive Services. It is recommended to apply such key if you have it.
--ms-region текст или -mr текст
Sets the subscription region for the Microsoft Azure Cognitive Services.


Примери за команден ред

Create the text file LANGUAGE.TXT with the list of all supported languages and genders for the Google TTS service:

bal4web -s Google -m > language.txt



Convert text from BOOK.TXT to speech and save as BOOK.WAV:

bal4web -f "d:\Text\book.txt" -w "d:\Sound\book.wav" -s Google -l en-US -g female



Convert subtitles to speech and save as MOVIE.WAV:

bal4web -f "d:\Subtitles\movie.srt" -w "d:\Sound\movie.wav" -s m -l de-DE -n Conrad -r 1.1



The example of use together with LAME.EXE:

bal4web -f d:\book.txt -s Baidu -l en-US -o --raw | lame -r -s 16 -m m -h - d:\book.mp3



The example of use together with OGGENC2.EXE:

bal4web -f d:\book.txt -s Baidu -l en-US -o -il | oggenc2 --ignorelength - -o d:\book.ogg




Конфигурационен файл

Опциите за командния ред могат да бъдат съхранени в конфигурационен файл "bal4web.cfg" в същата папка, в която е и програмата.

Пример за конфигурационен файл:

-f d:\Text\book.txt
-w d:\Sound\book.wav
-s Google
-l de-DE
-g female
-d d:\Dict\rules.bxd
-lrc
--lrc-length 75
--lrc-enc utf8

Програмата може да използва комбинация от опции от конфигурационния файл и от командния ред.




Лиценз

You are free to use and distribute software for noncommercial purposes. For commercial use or distribution, you need to get permission from the copyright holder.