|
Darowizna
Jeśli chcesz pomóc Balabolka, kup moją aplikację Cross+A. Tak długo jak ludzie będą płacić za Cross+A, Balabolka pozostanie darmowy. Dziękuję!
|
Synteza mowy
 |
SAPI – co to jest? |
 |
Speech Application Programming Interface lub SAPI – to pakiet oprogramowania, opracowany przez Microsoft dlatego, żeby programy mogły wykorzystywać komputerową syntezę mowy. Istnieją dwie podstawowe wersje SAPI (SAPI 4 i SAPI 5), które są niekompatybilne. System operacyjny Windows 2000 zawierał SAPI 4, Windows XP i wszystkie późniejsze wersje - SAPI 5. Można pobrać i zainstalować obie wersje SAPI na jeden komputer; to pozwoli wykorzystywać wszystkie istniejące silniki rozpoznawania mowy (stare i nowe). Więcej informacji na temat aktualnej wersji SAPI można znaleźć na stronę Microsoft. |
| |
 |
Gdzie ja mogę znałeżć SAPI 4? |
 |
Dla tego, aby wykorzystać głosy SAPI 4, trzeba pobrać i zainstalować Microsoft Speech API 4.0. Także, można pobrać i zainstalować Microsoft Speech Control Panel; po tym w panelu sterowania pojawi się ikonka "Mowa". |
| |
 |
Gdzie ja mogę znałeżć SAPI 5? |
 |
Windows XP (i późniejsze wersje) zawiera SAPI 5. |
| |
 |
Czy istnieje ograniczenie długości tekstu dla syntezy mowy? |
 |
Rozmiar tekstu do konwersji jest ograniczony formatem WAV: Balabolka wykorzystuje tymczasowy plik WAV do przetwarzania tekstu na mowę. Format WAV ma ograniczenie rozmiaru do nieco poniżej 4 GB. Maksymalny czas trwania plików audio zależy od częstotliwości próbkowania, głębi bitowej i liczby kanałów. Zaleca się podzielenie dużego dokumentu i przekonwertowanie każdej części tekstu na plik audio. |
| |
Syntezatory mowy
 |
Jak dowiedzieć się, jakie głosy są zainstalowane na moim komputerze? |
 |
Listę głosów można sprawdzić tutaj: Control Panel (Panel sterowania)
=>
Speech (Mowa)
=>
Speech Properties (Właściwości Głosu)
=>
Text To Speech (Tekst na mowę)
=>
Voice selection (Wybór głosu). |
| |
 |
Windows 11 introduces more natural voices, such as Microsoft Jenny and Microsoft Aria. How can I access them with SAPI 5? |
 |
This problem can be fixed with the NaturalVoiceSAPIAdapter utility. It will add new speech engines to the SAPI 5 voice list; it can also add the voices available in the Microsoft Edge browser to this list. More information can be found here. Since Balabolka is a 32-bit application, you should install the 32-bit and 64-bit versions of the utility (see "Installation Status" in the utility's window). You can download the latest release of the utility.
Windows allows to add voices for other languages: select Start
=>
Settings
=>
Time & language
=>
Language & region, go to Preferred languages, select Add a language. Choose and install the optional feature Text-to-speech.
The SAPI Unifier utility allows to make Microsoft OneCore voices and Microsoft Speech Server voices available via SAPI 5. |
| |
 |
Mam 64-bitową wersję systemu Windows. Zainstalowałem 64-bitowy moduł Runtime do Microsoft Speech Platform, a także polski głos. Ale liśta dostępnych głosów w programie Balabolka jest pusta. W czym jest problem? |
 |
Program Balabolka jest 32-bitową aplikacją. Więc trzeba zainstalować 32-bitny moduł Runtime do Microsoft Speech Platform. |
| |
 |
Co to jest Google Text-To-Speech? |
 |
Przy wykorzystaniu usługi tłumaczeń Google obok przetłumaczonego tekstu jest przycisk "Listen" ("Słuchać"). Wystarczy kliknąć ikonkę a przeglądarka sciągnie z strony Google plik dźwiękowy MP3 z udźwiękowionym tłumaczeniem. Dostępne są 30 języków. Długosć tekstu nie może przekraczać 100 symboli. Z programem Balabolka można zapomnieć o tym ograniczeniu: duże teksty dzielą się na drobne części, dla każdej części tekstu pobiera się plik dźwiękowy, wszystkie pliki łączą się w jeden audioplik. |
| |
Tagi SAPI
 |
How do I change a voice during reading aloud? |
 |
Use the XML tags. It is recommended to write the opening and closing tags inside the same paragraph. For example:
<voice required="Name=Microsoft Zira Desktop">Hello, how are you?</voice>
<voice required="Name=IVONA 2 Amy">I am good.</voice>
In addition, Balabolka supports its own tags to modify the speech synthesis.
{{Voice=Jenny}} This text will be read by the voice 'Microsoft Jenny'. {{Voice=}} This text will be spoken by the default voice in Balabolka. |
| |
 |
I'm getting the error message "OLE error 80045042". What does that mean? |
 |
This error means: "The XML parser failed due to bad syntax." You must verify the syntax of the XML tags inside the text. Or, some part of the text looks like the start of an XML tag, and it is confusing SAPI. If you don't want to use XML tags, remove the symbols "<" and ">" from the text (or replace them by words "less than" and "greater than"). |
| |
 |
When using new (natural, online) Microsoft voices, the SAPI 5 tag <silence> does not work. How can I insert silence into the spoken text? |
 |
The new Microsoft voices were not developed to work with SAPI 5, so they support SSML tags instead of SAPI 5 tags. To insert silence, use the "universal" tag: it is described in the application's help file. For example:
The silence will last three seconds. {{Pause=3000}} Then reading will resume. |
| |
Instalacja oprogramowania
 |
Jak wykonać "cichą" instalację programu? |
 |
Instalacja automatyczna programu bez demonstracji dialogów ("cicha" instalacja) możliwa przy podaniu klucza -silent w wierszu poleceń. |
| |
 |
Jak zainstalować i uruchomić program Balabolka z głosami w systemie operacyjnym Linux? |
 |
Proszę zapoznać się z instrukcjami opublikowanymi tutaj lub
tutaj.
Pakiet Microsoft Speech SDK można pobrać z oficjalnej strony internetowej (SpeechSDK51.exe, 68 MB). |
| |
Konfiguracja oprogramowania
 |
W moim komputerze zainstalowane dwie karty dźwiękowe. Jak wybrać prawidłowe potrzebne urządzenie audio do odtwarzania mowy? |
 |
Można wybrać urządzenie audio w panelu sterowania Windows; na przykład, w kategorii "Dźwięk, mowa i urządzenia audio", przycisk "Wyjście audio" ("Audio Output"). Kartę dźwiękową można także wybrać w programie Balabolka (punkt głównego menu programu "Opcje | Wyjście audio"). |
| |
Wykorzystanie oprogramowania
 |
Otwieram w programie plik w formacie DjVu, ale tekst jest nieobecny. W czym jest problem? |
 |
Format DjVu został opracowany dla przechowywania skanowanych dokumentów. To znaczy, w plikach DjVu są przechowywane skompresowane graficzne obrazy stron książek, pism itp. Format DjVu przewiduje obecność warstwy tekstowej (OCR), co zawiera tekst strony. Pliki z warstwą tekstową czasem oznaczają jak DjVu+OCR.
Program Balabolka umie wyciągać dane tylko z warstwy tekstowej. W przypadku, jeśli warstwa tekstowa jest niedostępna, jedyną metodą otrzymywania tekstu jest optyczne rozpoznawanie, na przykład, w FineReader. |
| |
 |
How can I remove dashes in the beginning of paragraphs? |
 |
You should use the main menu item "Edit | Replace". Type ^p— in the Find what box and ^p in the Replace with box. The program allows to use most of special codes from Microsoft Word:
- ^p
- Paragraph mark
- ^t
- Tab character
- ^nnn
- ASCII character (where nnn is the character code)
- ^0nnn
- ANSI character (where 0 is zero and nnn is the character code)
- ^Unnnnn
- Unicode character (where nnnnn is the character code)
- ^+
- Em dash ( — )
- ^=
- En dash ( – )
- ^^
- Caret character
- ^s
- Nonbreaking space
- ^?
- Any character (in the Find what box only)
- ^#
- Any digit (in the Find what box only)
- ^$
- Any letter (in the Find what box only)
- ^c
- Microsoft Windows Clipboard contents (in the Replace with box only)
- ^&
- Contents of the Find what box (in the Replace with box only)
|
| |
 |
I am not satisfied, how Balabolka extracts text from PDF files. Can I use the other way for processing of PDF? |
 |
The process of text extracting from PDF files is complicated enough, because PDF files do not contain plain text. You may use an external command-line utility for text extracting: for example, the program pdftotext.exe from the Xpdf project. Copy pdftotext.exe to the subfolder "utils" in the folder of Balabolka, choose the main menu item "Options | Text Import", the tab "Custom Text Import", and click the Add button. Define the command for using of pdftotext.exe:
%BFolder%\utils\pdftotext.exe -q -nopgbrk -enc UTF-8 %Input% %Output%
Define the name of the converter (for example, "Xpdf Converter"), file extension ("PDF") and output encoding ("UTF-8"). After activating of the option Use instead of default extracting method for this file type the program will be able to use the external utility for text extracting from PDF files. |
| |
 |
Otwieram w programie e-book, ale nie ma w oknie tekstu. W czym problem? |
 |
Może być kilka wyjaśnień. Po pierwsze, plik może wyglądać jak zestaw zeskanowanych obrazów stron książki papierowej. Po drugie, e-book może być chroniony przez DRM. Program nie ma możliwości wyodrębnić tekst z książki pod taką ochroną (to byłoby niezgodne z prawem). |
| |
Pliki audio
 |
How can every line of a text file be converted to a separate audio file? |
 |
You may add two empty lines after every line with text in the document. Open the file in Balabolka, choose the main menu item "Edit | Replace", type ^p in the Find what box and ^p^p^p in the Replace with box, click the Replace all button. Choose the main menu item "File | Split and Convert to Audio Files"; choose the split method "by two empty lines in succession" and click the Split and Convert button. |
| |
 |
Can I use the first line of text as the name of the audio file (for example, "01 Chapter One.mp3", "02 Chapter Two.mp3")? |
 |
Type %FirstLine% in the "Base Output Filename" box in the window "Split and Convert to Audio Files". The application will replace this variable by the first line of each text part. To change the position of the sequence number inside the filename, use the %Number% variable. |
| |
 |
I create audio files and upload to the podcast service. The service allows to extract chapter markers from an audio file and import them into its database. Does the program allow to add chapter markers into audio files? |
 |
Yes, Balabolka allows to generate audio files with chapters; such function is available for MP3 and MPEG-4 (MP4, M4A) formats. Use the main menu item "Bookmark | Insert Named Bookmark" to create a list of named bookmarks. Names of bookmarks will be used as chapters' names. Choose the main menu item "File | Split and Convert to Audio Files". Use the variant "named bookmarks" as the split method. Choose the setting "Use optional pattern" for audio file names, the pattern must be defined as %Header%. Activate the option "Create an audiobook file with chapters" and click the button "Split and Convert to Audio Files". The application will split text, convert each part to an audio file and then unite audio data to one audio file. |
| |
Ogólne pytania dotyczące aplikacji
 |
What is Spritz-Reader? |
 |
Spritz is a a new speed-reading technology. It allows to speed reading rates anywhere from 100 to 1000 words per minute. The time consuming part of usual reading lies mainly in the actual eye movements from word to word and sentence to sentence. Spritz positions words in a spot on a display where you can recognize the word, without moving your eyes. |
| |
 |
Can I use media files generated with Balabolka in YouTube videos? |
 |
Balabolka is freeware, so you may create audio files for free. But if you use commercial voices, you need to contact developers of the voice and purchase a license for commercial use/audio broadcast. The audio distribution license will allow you to use speech in YouTube videos.
For example, read the information from the Cepstral web-site: "Cepstral Personal voices are for personal use only and are NOT licensed for audio distribution. This means the audio you create is for your use only and cannot be shared with others or used in videos, presentations, or webpages. If you are interested in an audio distribution license, please contact sales." |
| |
 |
I want to upload an audio file with a speech to YouTube, but this platform only allows video files to be published. To upload an audio file, I need to combine it with a static image (e.g., black rectangle) and upload as MP4. Please, tell me a simple way to get a video file from an audio file. |
 |
Download the FFmpeg utility and run the command:
ffmpeg -f lavfi -i color=c=black:s=720x480 -i input.wav -tune stillimage -shortest -y output.mp4
The source file INPUT.WAV will be converted to the video file OUTPUT.MP4, where the image will be a black rectangle with dimensions 720x480. The resulting file can be uploaded to video hosting platforms. |
|