Wybierz język
RSS
Darowizna
Jeśli chcesz pomóc Balabolka, kup moją aplikację Cross+A.

Tak długo jak ludzie będą płacić za Cross+A, Balabolka pozostanie darmowy. Dziękuję!

Balabolka Często zadawane pytania

Pytanie SAPI – co to jest?
Odpowiedź Speech Application Programming Interface lub SAPI – to pakiet oprogramowania, opracowany przez Microsoft dlatego, żeby programy mogły wykorzystywać komputerową syntezę mowy. Istnieją dwie podstawowe wersje SAPI (SAPI 4 i SAPI 5), które są niekompatybilne. System operacyjny Windows 2000 zawierał SAPI 4, Windows XP i wszystkie późniejsze wersje - SAPI 5. Można pobrać i zainstalować obie wersje SAPI na jeden komputer; to pozwoli wykorzystywać wszystkie istniejące silniki rozpoznawania mowy (stare i nowe). Więcej informacji na temat aktualnej wersji SAPI można znaleźć na stronę Microsoft.
 
Pytanie Gdzie ja mogę znałeżć SAPI 4?
Odpowiedź Dla tego, aby wykorzystać głosy SAPI 4, trzeba pobrać i zainstalować Microsoft Speech API 4.0. Także, można pobrać i zainstalować Microsoft Speech Control Panel; po tym w panelu sterowania pojawi się ikonka "Mowa".
 
Pytanie Gdzie ja mogę znałeżć SAPI 5?
Odpowiedź Windows XP (i późniejsze wersje) zawiera SAPI 5.
 
Pytanie Jak dowiedzieć się, jakie głosy są zainstalowane na moim komputerze?
Odpowiedź Listę głosów można sprawdzić tutaj: Control Panel (Panel sterowania) => Speech (Mowa) => Speech Properties (Właściwości Głosu) => Text To Speech (Tekst na mowę) => Voice selection (Wybór głosu).
 
Pytanie Jak wykonać "cichą" instalację programu?
Odpowiedź Instalacja automatyczna programu bez demonstracji dialogów ("cicha" instalacja) możliwa przy podaniu klucza -silent w wierszu poleceń.
 
Pytanie W moim komputerze zainstalowane dwie karty dźwiękowe. Jak wybrać prawidłowe potrzebne urządzenie audio do odtwarzania mowy?
Odpowiedź Można wybrać urządzenie audio w panelu sterowania Windows; na przykład, w kategorii "Dźwięk, mowa i urządzenia audio", przycisk "Wyjście audio" ("Audio Output"). Kartę dźwiękową można także wybrać w programie Balabolka (punkt głównego menu programu "Opcje | Wyjście audio").
 
Pytanie Otwieram w programie plik w formacie DjVu, ale tekst jest nieobecny. W czym jest problem?
Odpowiedź Format DjVu został opracowany dla przechowywania skanowanych dokumentów. To znaczy, w plikach DjVu są przechowywane skompresowane graficzne obrazy stron książek, pism itp. Format DjVu przewiduje obecność warstwy tekstowej (OCR), co zawiera tekst strony. Pliki z warstwą tekstową czasem oznaczają jak DjVu+OCR.

Program Balabolka umie wyciągać dane tylko z warstwy tekstowej. W przypadku, jeśli warstwa tekstowa jest niedostępna, jedyną metodą otrzymywania tekstu jest optyczne rozpoznawanie, na przykład, w FineReader.
 
Pytanie Mam 64-bitową wersję systemu Windows. Zainstalowałem 64-bitowy moduł Runtime do Microsoft Speech Platform, a także polski głos. Ale liśta dostępnych głosów w programie Balabolka jest pusta. W czym jest problem?
Odpowiedź Program Balabolka jest 32-bitową aplikacją. Więc trzeba zainstalować 32-bitny moduł Runtime do Microsoft Speech Platform.
 
Pytanie Co to jest Google Text-To-Speech?
Odpowiedź Przy wykorzystaniu usługi tłumaczeń Google obok przetłumaczonego tekstu jest przycisk "Listen" ("Słuchać"). Wystarczy kliknąć ikonkę a przeglądarka sciągnie z strony Google plik dźwiękowy MP3 z udźwiękowionym tłumaczeniem. Dostępne są 30 języków. Długosć tekstu nie może przekraczać 100 symboli. Z programem Balabolka można zapomnieć o tym ograniczeniu: duże teksty dzielą się na drobne części, dla każdej części tekstu pobiera się plik dźwiękowy, wszystkie pliki łączą się w jeden audioplik.
 
Pytanie Otwieram w programie e-book, ale nie ma w oknie tekstu. W czym problem?
Odpowiedź Może być kilka wyjaśnień. Po pierwsze, plik może wyglądać jak zestaw zeskanowanych obrazów stron książki papierowej. Po drugie, e-book może być chroniony przez DRM. Program nie ma możliwości wyodrębnić tekst z książki pod taką ochroną (to byłoby niezgodne z prawem).
 
Pytanie Windows 11 introduces more natural voices, such as Microsoft Jenny and Microsoft Aria. How can I access them with SAPI 5?
Odpowiedź This problem can be fixed with the NaturalVoiceSAPIAdapter utility. It will add new speech engines to the SAPI 5 voice list; it can also add the voices available in the Microsoft Edge browser to this list. More information can be found here. Since Balabolka is a 32-bit application, you should install the 32-bit and 64-bit versions of the utility (see "Installation Status" in the utility's window). You can download the latest release of the utility.

Windows allows to add voices for other languages: select Start => Settings => Time & language => Language & region, go to Preferred languages, select Add a language. Choose and install the optional feature Text-to-speech.

The SAPI Unifier utility allows to make Microsoft OneCore voices and Microsoft Speech Server voices available via SAPI 5.
 
Pytanie How do I change a voice during reading aloud?
Odpowiedź Use the XML tags. It is recommended to write the opening and closing tags inside the same paragraph. For example:

<voice required="Name=Microsoft Zira Desktop">Hello, how are you?</voice>
<voice required="Name=IVONA 2 Amy">I am good.</voice>


In addition, Balabolka supports its own tags to modify the speech synthesis.

{{Voice=Jenny}} This text will be read by the voice 'Microsoft Jenny'.
{{Voice=}} This text will be spoken by the default voice in Balabolka.
 
Pytanie When using new (natural, online) Microsoft voices, the SAPI 5 tag <silence> does not work. How can I insert silence into the spoken text?
Odpowiedź The new Microsoft voices were not developed to work with SAPI 5, so they support SSML tags instead of SAPI 5 tags. To insert silence, use the "universal" tag: it is described in the application's help file. For example:

The silence will last three seconds. {{Pause=3000}} Then reading will resume.
 
Pytanie How to install and run Balabolka with voices on the Linux operating system?
Odpowiedź Please refer to the instructions published here or here. Microsoft Speech SDK can be downloaded from the official website (SpeechSDK51.exe, 68 MB).
 
Pytanie I want to upload an audio file with a speech to YouTube, but this platform only allows video files to be published. To upload an audio file, I need to combine it with a static image (e.g., black rectangle) and upload as MP4. Please, tell me a simple way to get a video file from an audio file.
Odpowiedź Download the FFmpeg utility and run the command:

ffmpeg -f lavfi -i color=c=black:s=720x480 -i input.wav -tune stillimage -shortest -y output.mp4

The source file INPUT.WAV will be converted to the video file OUTPUT.MP4, where the image will be a black rectangle with dimensions 720x480. The resulting file can be uploaded to video hosting platforms.