Jak przekształcić ChatGPT w pełnowartościowego asystenta głosowego

Ashwini Kumar Sinha

4 maja 2023

1330

ChatGPT jest już na tyle rozpowszechniony, że nie wymaga większych wyjaśnień. Zadajesz mu pytanie i uzyskujesz natychmiastową odpowiedź. Ale ta odpowiedź jest w formie tekstowej. Co zrobić, jeśli chciałbyś prowadzić normalną rozmowę? Czy jest możliwe przekształcenie lub rozbudowa ChatGPT tak, aby odpowiadał na zadane pytania jak asystent głosowy sztucznej inteligencji, np. Siri?

Sztuczna inteligencja staje się rzeczywistością i wchodzi do "naszego świata" szerokimi drzwiami. Nie jest tajemnicą, iż wielką zasługę w tym zakresie ma oprogramowanie ChatGPT. W świecie AI (Sztucznej Inteligencji) wyróżnia się tym, że potrafi rozpoznać kontekst konwersacji i udzielać sensownych odpowiedzi. Osoba prowadząca rozmowę z "maszyną" odnosi wrażenie, jakby po drugiej stronie był "żywy człowiek".

To jednak nie jest żywa inteligencja, a "Chatbot", który rozumie słowo pisane i udziela pisemnych odpowiedzi. Taka konwersacja jest mniej ekscytująca aniżeli prosta rozmowa. Chcąc pójść w tym kierunku, spróbujemy zaprogramować ChatGPT tak, aby stał się asystentem głosowym, który nazwiemy VoiceGPT. Pierwszą czynnością, którą musimy wykonać jest przekształcenie ludzkiego głosu do postaci pisemnej. Wykorzystamy istniejące oprogramowanie NLP (Natural Language Processisng), które potrafi rozpoznać słowo mówione. "Słowo" to stanowi dane wejściowe dla ChatGPT. W procesie konstruowania zapytania dla ChatGPT wykorzystamy darmowy i powszechnie dostępny interfejs programowania aplikacji API. Gdy ChatGPT udzieli inteligentnej odpowiedzi, ponownie wykorzystamy NLP w celu konwersji odpowiedzi pisemnej na słowną. Będą zatem potrzebne programy wysokiego poziomu. Wykorzystamy Whisper, który należy do kategorii OpenAI oraz sprawne narzędzie działające na NLP. Jako interfejs aplikacji wykorzystałem oprogramowanie Google-a Natural Language API.

Przewodnik jak krok po kroku uzyskać VoiceGPT

Musimy rozpocząć od serwisu NLP w celu pozyskania tekstowej postaci zapytania skierowanego dla ChatGPT. Ze strony sprzętowej potrzebujemy maszyny zdolnej pracować pod kontrolą interfejsu aplikacji Open API. To oprogramowanie kieruje zapytanie skierowane do ChatGPT, jak i przekształci tekstową odpowiedź z wykorzystaniem syntetyzatora ludzkiej mowy (wykorzystując pakiety NLP). Z tym softwarem powinien poradzić sobie każdy laptop, ja jednak użyłem Raspberry Pi. Ale jak wprowadzić informację głosową do postaci rozumianej przez maszynę?

Aby przeczytać ten artykuł kup e-wydanie

Kup teraz

Firma:

Tagi: AI-Sztuczna Inteligencja

Tematyka materiału: Przewodnik jak krok po kroku uzyskać VoiceGPT

AUTOR

Ashwini Kumar Sinha

NAPISZ DO AUTORA

Ashwini Kumar Sinha jest hobbystą elektroniki i dziennikarzem technicznym w EFYi.

ZOBACZ WIĘCEJ ARTYKUŁÓW AUTORA

Źródło

Elektronika dla Wszystkich maj 2023

Udostępnij

Facebook

Twitter

Oceń najnowsze wydanie EdW

Wypełnij ankietę i odbierz prezent

Czytelnia kategorie

Felietony AI-Sztuczna Inteligencja Aparatura Arduino Artykuły Audio Automatyka Ciekawostki CNC DIY Druk 3d Elektromechanika Fotowoltaika FPGA-CPLD-SPLD GPS IC-układy scalone Interfejsy IoT Konkursy

Książki

Lasery LED/LCD/OLED

Mechatronika

Mikrokontrolery (MCV,μC) Moc Moduły Narzędzia Optoelektronika PCB/Montaż Podstawy elektroniki Podzespoły bierne Półprzewodniki Pomiary i testy Porady Projektowanie Raspberry Pi Retro Komunikacja, RF Robotyka SBC-SIP-SoC-CoM Sensory Silniki i serwo Software Sterowanie Transformatory Tranzystory Wyświetlacze

Wywiady

Wzmacniacze Zasilanie Felietony

W tym numerze znajdziesz źródłową wersję artykułu publikowanego obok

Elektronika dla Wszystkich

maj 2023