Inteligentne szkło, które potrafi czytać książki

Ashwini Kumar Sinha

Projekty

Raspberry Pi

6 września 2021

1443

Widzieliśmy już wiele inteligentnych okularów, które wykrywały odległość między obiektami lub pomagały osobom niedowidzącym rozpoznawać twarze. Spróbujemy wspiąć się na kolejny poziom wykorzystując mechanizm optycznego rozpoznawania znaków (OCR).

W tym artykule opisywany jest projekt, który może czytać tekst przy użyciu OCR i wizji komputerowej. Kamera zamontowana z przodu szkła do OCR i wizji komputerowej pozwoli czytać osobom niedowidzącym. W tej wersji potrzebna będzie również para gogli.

Przygotowanie

Po pierwsze, musimy zainstalować niektóre z wymaganych modułów i bibliotek dla projektu. Ponieważ inteligentne szkło jest oparte na przetwarzaniu wideo w czasie rzeczywistym, za pomocą OCR możemy wyodrębnić tekst ze stron, które mogą zawierać obrazy. Tutaj potrzebny jest moduł, który może przechwytywać obrazy z kamery. Używając modułu syntezy mowy, tekst w tych przechwyconych obrazach może być przekształcony na mowę.

Po pierwsze, musimy zainstalować następujące biblioteki:

OpenCV
PyTesseract
eSpeak

Aby je zainstalować, użyj poniższych poleceń:

sudo apt-get install espeak
sudo apt-get install espeak python-espeak
sudo pip3 install opencv2

Kodowanie

Zaimportuj wymagane biblioteki do kodu źródłowego, a następnie ustaw ścieżkę, w której mają być zapisywane klatki wideo do ekstrakcji tekstu.

Rysunek 1. Fragment kodu importujący moduły Pythona

Rysunek 2. Fragment kodu do przechwytywania wideo i przetwarzania go na potrzeby OCR

Rysunek 3. Kod testowy

W kodzie utwórz pętlę while, która będzie przechwytywać obraz z kamery w czasie rzeczywistym. Używając cv2, przekonwertuj obraz do RGB i zapisz go we wcześniej ustawionej ścieżce. Następnie wywołaj PyTesseract, który otworzy zapisaną ramkę wideo w celu przetworzenia obrazu i wyodrębnienia z niego tekstu. Używając eSpeak, syntezator mowy przekonwertuje cały tekst na dźwięk i odczyta go.

Uwaga: Aby uzyskać wyraźny głos, który nie brzmi jak robot, można skorzystać z płatnych lub innych usług text-to-speech, takich jak gtts, watson speech itp.

Testowanie

Zamocuj kamerę na okularach i uruchom kod. Po położeniu książki przed kamerą i odczekaniu kilku minut bez żadnego ruchu, rozpocznie się automatyczne czytanie książki. Aby ją usłyszeć, podłącz słuchawki do gniazda słuchawkowego TRRS w Raspberry Pi lub dowolny głośnik ze wzmacniaczem. Można też podłączyć dowolne słuchawki Bluetooth.

Fotografia 4. Testowanie urządzenia przez autora

Wykaz elementów

Ilość

Symbol

Nazwa/opis/gdzie kupić

–

Rasperry Pi 4

–

Moduł kamery Raspberry Pi

–

Wzmacniacz mocy

–

Zasilacz 5V

–

Głośnik

Do pobrania

Inteligentne szkło, które potrafi czytać książki - kod źródłowy

Firma:

Tagi: AI-Sztuczna Inteligencja Raspberry Pi

AUTOR

Ashwini Kumar Sinha

NAPISZ DO AUTORA

Ashwini Kumar Sinha jest hobbystą elektroniki i dziennikarzem technicznym w EFYi.

ZOBACZ WIĘCEJ ARTYKUŁÓW AUTORA

Źródło

www.electronicsforu.com

Udostępnij

Facebook

Twitter

Zobacz wszystkie quizy

Quiz weekendowy

cykl Silniki krokowe w praktyce

Oceń najnowsze wydanie EdW

Wypełnij ankietę i odbierz prezent

Projekty kategorie

Alarmy, systemy kontroli Aplikacje sensorowe Arduino Audio, Wideo CNC Dla domu i ogrodu Dla pojazdów Edukacja Fotowoltaika Gry Hobby Inne Komunikacja, RF Moduły Ozdoby świąteczne Pracownia elektronika Raspberry Pi Regulatory mocy, sterowniki Robotyka Sterowniki (kontrolery) Sterowniki silników Światło Technika μP, μC, PLD Termometry i termostaty Zasilanie/Moc Zdalne sterowanie Zegary, timery