Do urządzenia z pakietem ChatGPT można mówić w swoim własnym języku, ponieważ obsługuje on ponad sto różnych języków. Jest to duża zmiana w stosunku do aplikacji Alexy. Teraz można korzystać z inteligentnego asystenta, który komunikuje się z użytkownikiem w wielu językach. Na fotografii przedstawiona jest konfiguracja stosowana przez autora do testowania projektu. Zestawienie podzespołów systemu przedstawiono w ramce. Wystarczy zebrać wszystkie te elementy i połączyć z wykorzystaniem istniejących gniazd, bez konieczności odwoływania się do schematu połączeń.
Konfiguracja sterowania głosowego ChatGPT
Aby rozpocząć pracę, należy założyć konto na portalu OpenAI i uzyskać klucz API dla aplikacji OpenAI. Po skonfigurowaniu konta AI można dodać funkcję tworzenia raportów, w oparciu o własne wymagania i sposób wykorzystania aplikacji. Po wykonaniu tych czynności można już zająć się kodem.
Opracowaliśmy wersję do ręcznego wprowadzania kodu asystenta głosowego VoiceGPT, oraz wersję automatyczną, która sama wykrywa używany język i wprowadza kod. Przejdźmy do kodowania.
Kod do rozmowy z użyciem ChatGPT
Najpierw należy zaimportować niezbędne biblioteki do rozpoznawania mowy, takie jak NLP lub GTTS. Alternatywnie można użyć OpenAI Whisper. Następnie należy wybrać model ChatGPT, który będzie używany. Z uwagi na potrzebę obsługi wielu języków, zastosujemy model „text-davinci-003”. Na koniec należy skonfigurować API OpenAI.
Stworzyliśmy funkcję ChatGPT, w której definiujemy zapytanie do modelu, wybieramy model, ustawiamy temperaturę oraz inne istotne parametry. Można modyfikować te wartości zgodnie z własnymi wymaganiami.
Następnie w kodzie tworzona jest pętla analizująca sygnał z mikrofonu i przechwytująca ludzki głos, z jednoczesną filtracją szumów z tła. Kluczowym krokiem jest ustawienie w kodzie języka, co pozwala NLP rozpoznać mowę w wybranym języku i przekazać ją do ChatGPT, aby odpowiedź została wygenerowana w tym samym języku. Następnie NLP przetwarza odpowiedź i konwertuje ją na mowę, dzięki czemu możesz usłyszeć wynik w preferowanym języku.
W tej wersji kodu sami definiujemy język wymagany przez użytkownika. Na przykład, jeśli rozmowa ma się odbyć w języku hindi należy ustawić kod języka jako „hi”. W ten sposób aplikacja NLP rozpozna wszystko, co zostanie wypowiedziane w tym języku a ChatGPT też w nim odpowie. Aplikacja NLP przetworzy odpowiedź na komunikat głosowy w języku hindi.
Teraz, gdy kod jest gotowy do użycia, można go uruchomić i mówić w języku hindi lub innym, który został wybrany. Moduł VoiceGPT rozpoznaje mowę i odpowiada z użyciem ChatGPT.