LEKsykon - Polski system przeczyta osobom niedowidzącym napisy z otoczenia

12:01 17 STY 2019

Polski system przeczyta osobom niedowidzącym napisy z otoczenia

System Toucan Eye, który rozpozna w otoczeniu napisy czy symbole i przeczyta je osobom niedowidzącym, opracowują polscy innowatorzy. Do dyspozycji użytkownika będzie kamerka umieszczona w urządzeniu przypominającym słuchawkę bluetooth.

"W Polsce jest ok. 500 tys. osób niedowidzących. To osoby, które widzą kontury obiektów, ale nie widzą szczegółów" - mówi w rozmowie z PAP Radosław Zdunek z polskiej firmy Toucan Systems. Opowiada, że takie osoby zdane były dotąd na pomoc innych osób np. na przystanku, kiedy trzeba było rozpoznać numer zbliżającego się autobusu. Albo np. w urzędzie, kiedy szukały odpowiedniego okienka. Albo w restauracji czy sklepie, kiedy nie były w stanie samodzielnie zapoznać się z menu czy z ceną produktu. Nie mówiąc już o znalezieniu toalety.

Tymczasem nowe technologie dają takim osobom możliwość bycia niezależnymi od przypadkowych przechodniów. Firma Toucan Systems przy wsparciu z Narodowego Centrum Badań i Rozwoju pracuje nad systemem Toucan Eye. Pierwsze urządzenia polskiej firmy pojawić się mają na rynku pod koniec 2019 roku.

"Użytkownik naszego urządzenia nie będzie się wyróżniać w tłumie" - opowiada Radosław Zdunek. Wyjaśnia, że urządzenie wyglądać będzie jak zwykła słuchawka bluetooth zakładana na ucho. Słuchawka ta jednak wyposażona będzie w niewidoczną na pierwszy rzut oka kamerkę. Połączona będzie bezprzewodowo z mobilnym komputerem wielkości smartfonu, który zmieści się w kieszeni czy torebce.

Tam algorytmy sztucznej inteligencji (AI) przeczesywać będą obraz z kamery w poszukiwaniu napisów i symboli, a odczytany napis przetworzą na ludzką mowę i prześlą informacje do słuchawki. Użytkownik będzie też mógł zawęzić obszar poszukiwań i wskazać gestem ręki obszar, w którym znajduje się interesujący go napis.

"Na początku wydawało nam się, że nasze urządzenie przyda się bardziej osobom niewidomym. Z konsultacji w Polskim Związku Niewidomych wynikło jednak, że bardziej naszym rozwiązaniem zainteresowane byłyby osoby niedowidzące, które - w porównaniu z osobami niewidomymi - znacznie rzadziej poruszają się w towarzystwie przewodnika" - opowiada Radosław Zdunek.

Toucan AI pracować będzie offline - wszystkie obliczenia będą wykonywane w przenośnym urządzeniu. Użytkownik nie będzie się więc musiał zastanawiać czy w miejscu, do którego idzie jest zasięg sieci komórkowej. A przy wyjeździe za granicę nie będzie musiał się martwić o wysokość rachunku za korzystanie z internetu. "Zależało nam na tym, by użytkownik mógł zawsze i wszędzie na Toucan AI polegać. Tak jak i na innych urządzeniach dla osób z dysfunkcjami" - mówi.

Radosław Zdunek wyjaśnia, że największym wyzwaniem w pracy nad urządzeniem jest opracowanie algorytmu, który napisy i symbole - np. oznaczenie toalety - rozpoznawać będzie w przeróżnych warunkach. "Problemem jest to, że w przestrzeni publicznej funkcjonuje wiele różnego rodzaju czcionek. Jedne są ozdobne, inne pochylone w lewo czy w prawo. Czasem litery ustawione w pionie - jedna pod drugą - inne pod skosem... W dodatku kamera widzieć je będzie pod różnym kątem i w różnych warunkach oświetleniowych. A w zapisie pojawiać się będzie szum. Odczytywanie takich napisów to złożony problem" - opowiada.

Początkowo urządzenie rozpoznawać ma napisy w języku polskim. Z czasem firma chce też wprowadzić wersję dla języka angielskiego.

"Dotąd tylko jedna firma na świecie opracowała podobny system. Będziemy z nią konkurowali w aspekcie skuteczności" - zapewnia Zdunek. Zapowiada, że polski produkt ma być tańszy i skuteczniejszy w rozpoznawaniu obiektów niż produkt dostępny już na rynku.

Twórcy Toucan Eye szacują, że jedno ładowanie powinno wystarczyć na osiem godzin ciągłej pracy ich urządzenia. Radosław Zdunek jednak zwraca uwagę: "Kiedy idziemy ulicą, nie interesują nas przecież wszystkie napisy, które mijamy. Użytkownik będzie więc włączał system w określonych miejscach" - opowiada innowator. Wciskając guziki na komputerku użytkownik przekaże więc urządzeniu, że potrzebuje pomocy i określi, w jakim typie scenerii się znajduje. Inny tryb pracy urządzenia będzie bowiem potrzebny w kawiarni, a inny - na przystanku autobusowym.

Dopiero kolejne wersje urządzenia będą w stanie same - analizując obraz - ustalić kontekst - czy to wnętrze (gdzie należy szukać małych literek w niedużej odległości od kamery), czy może otwarta przestrzeń (gdzie napisów szuka się daleko).