Serwisy partnerskie:
Close icon
Serwisy partnerskie

VoiceGPT z obsługą wielu języków

Article Image
Elmax
Kiedyś korzystaliśmy z pakietu ChatGPT, później przekształciliśmy go w VoiceGPT, czyniąc go zaawansowanym asystentem głosowym, który potrafi rozmawiać. Zakończyliśmy projekt z obietnicą opracowania bardziej zaawansowanych funkcji i wydania kolejnej wersji. Obecnie nasz VoiceGPT potrafi już mówić w wielu językach.

Do urządzenia z pakietem ChatGPT można mówić w swoim własnym języku, ponieważ obsługuje on ponad sto różnych języków. Jest to duża zmiana w stosunku do aplikacji Alexy. Teraz można korzystać z inteligentnego asystenta, który komunikuje się z użytkownikiem w wielu językach. Na fotografii przedstawiona jest konfiguracja stosowana przez autora do testowania projektu. Zestawienie podzespołów systemu przedstawiono w ramce. Wystarczy zebrać wszystkie te elementy i połączyć z wykorzystaniem istniejących gniazd, bez konieczności odwoływania się do schematu połączeń.

Konfiguracja sterowania głosowego ChatGPT

Aby rozpocząć pracę, należy założyć konto na portalu OpenAI i uzyskać klucz API dla aplikacji OpenAI. Po skonfigurowaniu konta AI można dodać funkcję tworzenia raportów, w oparciu o własne wymagania i sposób wykorzystania aplikacji. Po wykonaniu tych czynności można już zająć się kodem.

Opracowaliśmy wersję do ręcznego wprowadzania kodu asystenta głosowego VoiceGPT, oraz wersję automatyczną, która sama wykrywa używany język i wprowadza kod. Przejdźmy do kodowania.

Kod do rozmowy z użyciem ChatGPT

Najpierw należy zaimportować niezbędne biblioteki do rozpoznawania mowy, takie jak NLP lub GTTS. Alternatywnie można użyć OpenAI Whisper. Następnie należy wybrać model ChatGPT, który będzie używany. Z uwagi na potrzebę obsługi wielu języków, zastosujemy model „text-davinci-003”. Na koniec należy skonfigurować API OpenAI.

Stworzyliśmy funkcję ChatGPT, w której definiujemy zapytanie do modelu, wybieramy model, ustawiamy temperaturę oraz inne istotne parametry. Można modyfikować te wartości zgodnie z własnymi wymaganiami.

Następnie w kodzie tworzona jest pętla analizująca sygnał z mikrofonu i przechwytująca ludzki głos, z jednoczesną filtracją szumów z tła. Kluczowym krokiem jest ustawienie w kodzie języka, co pozwala NLP rozpoznać mowę w wybranym języku i przekazać ją do ChatGPT, aby odpowiedź została wygenerowana w tym samym języku. Następnie NLP przetwarza odpowiedź i konwertuje ją na mowę, dzięki czemu możesz usłyszeć wynik w preferowanym języku.

W tej wersji kodu sami definiujemy język wymagany przez użytkownika. Na przykład, jeśli rozmowa ma się odbyć w języku hindi należy ustawić kod języka jako „hi”. W ten sposób aplikacja NLP rozpozna wszystko, co zostanie wypowiedziane w tym języku a ChatGPT też w nim odpowie. Aplikacja NLP przetworzy odpowiedź na komunikat głosowy w języku hindi.

Teraz, gdy kod jest gotowy do użycia, można go uruchomić i mówić w języku hindi lub innym, który został wybrany. Moduł VoiceGPT rozpoznaje mowę i odpowiada z użyciem ChatGPT.

Aby przeczytać ten artykuł kup e-wydanie
Kup teraz
Firma:
AUTOR
Źródło
Elektronika dla Wszystkich marzec 2025
Udostępnij
Zobacz wszystkie quizy
Quiz weekendowy
Generatory wysokiego napięcia
1/10 Dlaczego nie powinno się pracować z generatorami wysokiego napięcia w pobliżu sprzętu pomiarowego?
UK Logo
Elektronika dla Wszystkich
Zapisując się na nasz newsletter możesz otrzymać GRATIS
najnowsze e-wydanie magazynu "Elektronika dla Wszystkich"