Serwisy partnerskie:
Close icon
Serwisy partnerskie

Przetwarzanie mowy z użyciem modułu ESP32: zamiana tekstu na mowę

Article Image
Elmax
Możliwości wykorzystania mowy w technice sprowadzają się do dwóch przypadków: zamiany tekstu na mowę (TTS) i zamiany mowy na tekst (STT). Opisywane urządzenie realizuje wariant TTS. W modelu użyty został wzmacniacz typu MAX98357A, połączony z płytką ewaluacyjną typu MCU ESP32, a interfejs API Google służy do konwersji tekstu na mowę.

W układzie użyty został monofoniczny wzmacniacz MAX98357A z interfejsem I²S. Pomimo, że dostępne są wzmacniacze stereofoniczne, takie jak UDA1334A. Jednak dla uproszczenia wybrano wersję monofoniczną. Interfejs I²S wykorzystuje trzy piny GPIO modułu ESP32, które mogą być dowolnie wybrane (za wyjątkiem pinów wejściowych 34 i 35). Do wyjścia wzmacniacza podłączony jest 4-omowy głośnik, dlatego ważne jest zapoznanie się z opisem płytki i prawidłowe podłączenie zacisków „+” i „–” aby uniknąć zniekształceń. Autorski prototyp pokazano na fotografii, a wszystkie niezbędne komponenty wymieniono w zestawieniu materiałów.

Schemat połączeń

System do konwersji tekstu na mowę jest zbudowany w oparciu o moduł ESP32 Node MCU, ponadto zawiera wzmacniacz klasy D typu MAX98357A z interfejsem I²S, trzywatowy głośnik i kilka innych komponentów.

Układ łączy się z Internetem za pomocą interfejsu Wi-Fi, z wykorzystaniem wcześniej wprowadzonych danych uwierzytelniających. Następnie układ wysyła ciąg znaków do witryny Google TTS, aby przetworzyć go na mowę.

Aby przeczytać ten artykuł kup e-wydanie
Kup teraz
Wideo
Firma:
AUTOR
Źródło
Elektronika dla Wszystkich styczeń 2026
Udostępnij
Zobacz wszystkie quizy
Quiz weekendowy
Poziomy logiczne
1/10 Jakie rodziny układów logicznych są najczęściej stosowane współcześnie?
UK Logo
Elektronika dla Wszystkich
Zapisując się na nasz newsletter możesz otrzymać GRATIS
najnowsze e-wydanie magazynu "Elektronika dla Wszystkich"