Ezen a weboldalon sütiket (cookie) használunk annak érdekében, hogy javíthassuk a felhasználói élményt és jobb szolgáltatást nyújthassunk.
Menü

Mesterséges intelligencia a fogyatékossággal élők szolgálatában

Olvasási idő: 20 perc
2023. 03. 14. 10:55:53
Mesterséges intelligencia a fogyatékossággal élők szolgálatában

A mesterséges intelligencia már ma is része az életüknek, okostelefont használunk, internetezünk vagy navigáció segítségével közlekedünk. A fogyatékossággal élők számára a mesterséges intelligencia az ép embertársaikhoz hasonló esélyeket teremthet. Ebben a cikkben azt vizsgáljuk meg, hogy hogyan használható a mesterséges intelligencia a fogyatékossággal élők, különösen a vakok és a hallássérültek életének megsegítésére. Tovább olvasom

 

Írta: Kiss Anita

„A mesterséges intelligencia alapvetően változtatta meg az emberi létezés feltételeit.” /Gerard Quinn, a fogyatékossággal élők jogainak ENSZ különmegbízottja/

A mesterséges intelligencia (AI vagy MI) nagyban megkönnyítette mindennapi tevékenységeinket, legyen szó akár a munkánkról vagy akár egyszerűbb, hétköznapi dolgokról.  

A tipikusan emberi intelligenciát igénylő feladatok – például beszéd- és hangfelismerés, vizuális érzékelés, prediktív szövegfunkció, döntéshozatal és számos egyéb feladat végrehajtása – automatizálásával az AI jelentős változást hozva segíthet a fogyatékossággal élők számára is: megkönnyítheti a közlekedésüket és a mindennapi tevékenységekben való részvételüket.

 

Nézzük meg a mesterséges intelligencia néhány hasznos alkalmazását ezen a területen és azt, hogy hogyan lehet használni ezt a forradalmi technológiát a fogyatékossággal élők életének javítására.

 

Az embernek 5 érzékszerve van: a tapintás, a látás, a hallás, a szaglás és az ízlelés. Ezek az érzékszervek lehetővé teszik számunkra, hogy érzékeljük a minket körülvevő környezetet. Lábaink segítségével kényelmesen mozoghatunk és sétálgathatunk. Azonban nem mindenki ilyen szerencsés. Nagyon sok fogyatékossággal élő ember van, aki nem lát, nem hall és van, akinek hiányzik valamelyik végtagja. Az ilyen emberek mindennapi életvitelük során sok nehézséggel szembesülnek. Vajon a technológiai megoldások, például a mesterséges intelligencia javíthatják-e az életminőségüket?

 

Az 5 érzékszerv

 

Mi a mesterséges intelligencia?

 

A mesterséges intelligencia a tudományos-fantasztikus irodalomban és a filmekben már évtizedek óta jelen van.

A mesterséges intelligencia egy olyan módszer, amellyel egy számítógépet, egy számítógép által vezérelt robotot vagy egy szoftvert arra utasítanak, hogy az emberi elméhez hasonlóan gondolkodjon (érveljen, tanuljon, tervezen és akár kreatív problémamegoldó legyen).

Tulajdonképpen azért hozták létre, hogy ugyanúgy vagy hasonló módon dolgozzon, mint az ember, csak gyorsabban, jobban, megbízhatóbban és elméletileg emberi elfogultság nélkül.

 

A mesterséges intelligencia története

 

1955 – Először bukkan fel a "mesterséges intelligencia" (artificial intelligence, AI) kifejezés, mely John McCarthy (1927-2011) amerikai informatikus és matematikus nevéhez fűződik. McCarthy rendezte az első mesterséges intelligencia témájú konferenciát is.

1969 - Shakey volt az első mozgó robot, amelyet mesterséges intelligencia ellenőrzött. Fel volt szerelve érzékelőkkel és egy problémamegoldó programmal, amely segítségével tájékozódni tudott. Volt rajta továbbá TV kamera, lézer távolságmérő, ütközés- és térérzékelő. A komputer rádiójelekkel küldte vissza a parancsokat Shakey-nek. A robot 2 métert tett meg óránként.

1997 - Megtervezték a "Deep Blue" nevű szuperszámítógépet. Ez volt a gépek első győzelme az ember fölött. A gép 1997. május 11-én legyőzte Garri Kaszparov sakkvilágbajnokot. Hatalmas mérföldkő volt ez az IBM cég életében és a mesterséges intelligencia fejlesztésének történetében.

2002 - Létrejött az első kereskedelmi forgalomban sikeres robotporszívó. A robotporszívó kamerákkal, ikerkamerákkal van felszerelve, így fel tudja térképezni a lakást és ezáltal tökéletesen elvégzi a takarítási feladatokat. Nemcsak felismeri a környezetet, de a mesterséges intelligencia segítségével tökéletesen ki is takarít.

2005 - 2019 – Számtalan innováció készült ezen időszak alatt: beszédfelismerés, robotizált folyamatautomatizálás (RPA), táncoló robot, intelligens otthonok és egyebek.

2009-ben a modern mélytanulás korszakának kezdetén a stanfordi Fei-Fei Li létrehozta az ImageNet-et.

A 2010-es éveket a mesterséges intelligencia határozta meg, amelynek középpontjában a mélytanulás állt. Ekkor már több ezer AI startup foglalkozott a mélytanulással és az Amazontól az Intelig minden nagy technológiai vállalat teljesen beleásta magát a jövőbe.

Aztán 2014-ben az Apple munkatársa, Ian Goodfellow (akkor még a Google-nél) feltalálta a generatív adverzális hálózatot (GAN).

Azért hívjuk őket „generatívnak”, mert miután egy adathalmazon betanították őket, képesek olyan új példákat generálni, amelyek hasonlítanak a látottakhoz.

 „Adverzálisnak” pedig azért nevezik őket, mert ezek a rendszerek párban dolgoznak és voltaképpen egymás ellenségei. Az egyik AI-rendszer megpróbál lemásolni például egy képet, a másik pedig kritikusan, a hibákra koncentrálva értékeli az első próbálkozásait.

Mutatok erre egy példát:

Az AI tervezők összegyűjtik Picasso összes festményét. Az egyik AI megpróbálja lemásolni Piccasso-t, míg a másik értékeli az első próbálkozást. Az utánzó AI arra használja a tudását, hogy egy új képet készítsen ebben a stílusban, míg a másik megítéli és értékeli azt, hogy mennyire hasonlít ez a létrejött alkotás az eredeti műre. A nem meggyőzőt aztán visszaküldi. Több millió oda-visszaküldés után, az utánzó AI egyre jobb képet készít Picasso stílusában.

 

AI kép generátor

Forrás: www.aut.bme.hu

 

A mesterséges intelligencia fejlődésének következő szakaszát jelentik a "transzformátor" nyelvi modellek (lásd lejjebb), amelyeket először a Google 2017-es publikációjában mutattak be (Attention is All you Need)

A Stanford kutatói egy 2021. augusztusi tanulmányukban a transzformátorokat "alapmodelleknek" nevezték el, mivel szerintük ezek a nyelvi modellek paradigmaváltást hoznak a mesterséges intelligenciában.

Az elmúlt néhány évben az "alapmodellek puszta léptéke és terjedelme szétfeszítette a képzeletünket arról, hogy mi lehetséges" - írták.

 

Mire képesek a "transzformátorok"?

 

A transzformátor nyelvi modellek megjelenése előtt a felhasználóknak a neurális hálózatokat nagy, címkézett adathalmazokkal kellett betanítaniuk, amelyek előállítása költséges és időigényes volt.

A nyelvi modellek (Large Language Models, LLM), az olyan gépi tanulási algoritmusok, melyek képesek felismerni, előrejelezni, generálni és imitálni főként az emberi nyelveket nagyon nagy szövegalapú adathalmazok alapján. 

 

  • A "transzformátorok" szinte valós időben fordítják a szöveget és a beszédet.
  • Segítenek a kutatóknak megérteni a DNS-ben lévő génláncokat és a fehérjékben lévő aminosavakat, ezáltal felgyorsíthatják a gyógyszertervezést.
  • Felismerhetik a trendeket és az anomáliákat: megelőzhető a csalás, racionalizálható a gyártás, online ajánlások készíthetőek, javítható az egészségügyi ellátás. 
  • Ráadásul a "transzformátorok" által használt matematika alkalmas a párhuzamos feldolgozásra, így ezek a modellek gyorsan futtathatók.

 

Az egyik legnagyobb port kavart transzformátor nyelvi modell 2022 őszén indult útjára az OpenAI startup vezényletével: ez a ChatGPT.

 

A generatív előképzett transzformátorok családja

A „transzformátor" nyelvi modellek családja és egymáshoz való viszonya

Forrás: https://amatriain.net/

 

Mesterséges intelligencia : a transformátorok megjelenési dátuma

A "transzformátor" nyelvi modellek megjelenési dátuma

Forrás: https://amatriain.net/

 

2020 - 2021 februárjában a kínai Baidu vállalat - a kínai nyelvű internetes szolgáltatások egyik legnagyobb szolgáltatója és ma már a világ egyik vezető mesterséges intelligencia-innovátora is - megnyitotta LinearFold AI algoritmusát a COVID-19 elleni küzdelemben dolgozó tudományos és orvosi csoportok előtt.

A COVID-19 járvány kitörése során a vállalat a mesterséges intelligencia területén szerzett szakértelmét a világjárvány megelőzésére és a járvány ellenőrzésére irányuló erőfeszítések támogatására használta.

Létrehozott egy mesterséges intelligencia rendszert, amely infravörös technológiát használt az utasok hőmérsékletének előrejelzésére a pekingi Qinghe vasútállomáson. Intelligens tanácsadó asszisztense szintén leleményesnek bizonyult az orvosok gyors diagnózisának felállításában és a kezelés online elindításában.

A LinearFold megjósolta a vírus ribonukleinsav (RNS) szekvenciájának másodlagos szerkezetét és ezt mindössze 27 másodperc alatt tette meg, 120-szor gyorsabban, mint más módszerek.

 

A mesterséges intelligencia fő típusai

 

Szoftveralapú: virtuális asszisztensek, képelemző szoftverek, keresők, beszéd- és arcfelismerő rendszerek

Fizikai: robotok, önvezető autók, drónok

 

Mesterséges intelligencia (MI) a fogyatékossággal élők életében – pro és kontra

 

A mesterséges intelligenciát támogató számítógépes rendszerek jelentős mértékben javítják a fogyatékossággal élők életét. Gondoljunk csak a vakok mobilitását javító segédtechnológiákra vagy a fogyatékossággal élő diákok speciális igényeihez igazított, személyre szabott tanulási élményt nyújtó platformokra.

Továbbá a mesterséges intelligenciával működő robotok és más eszközök otthoni ápolást vagy egyéb segítséget nyújtanak, lehetővé téve így a fogyatékossággal élők számára az önálló életet.

A mesterséges intelligenciát azonban a gépi tanulás folyamata teszi "intelligensé", amely egy sor adattól vagy algoritmustól függ és amely gyakran olyan adatokat tartalmaz, amelyeket korábbi emberi döntések és értékítéletek alakítottak, így számos okból kifolyólag hibásak lehetnek.

Az AI-eszközök még mindig hordozhatnak emberi előítéleteket és ennek következtében kirekesztőek lehetnek a fogyatékossággal élőkkel szemben. Az egyik példa erre a foglalkoztatás, ahol a munkaerő-felvételi folyamatoknál egyre inkább algoritmusokat használnak a jelöltek kiszűrésére.

 

Most azonban nézzük meg a technológia pozitív oldalát, azt, hogy hogyan könnyíthető meg a MI használatával a fogyatékkossággal élők mindennapi élete.

 

Kommunikáció és emberi kapcsolat

 

A mesterséges intelligenciával és hanggal segített technológiák, mint az Amazon Echo, a Google Home, a Siri , a Cortana és az Alexa új eszközöket teremtettek a fogyatékossággal élők számára.

Mivel a MI fontos szerepet kap a kommunikációban és az interakcióban, e technológia használata lehetővé teszi a fogyatékosággal élők számára, hogy sokkal könnyebben hozzáférjenek az információkhoz, mindezt úgy, hogy egyszerűen csak beszélnek a készülékükhöz.

 

Mesterséges intelligencia: készülékek

Kép forrása: www.medium.com

 

A beszédből szövegbe és szövegből beszédbe technológiákkal kapcsolatos előrelépések a beszédhibával élőket segítik. (pl. cerebrális parézis, a Parkinson-kór vagy stroke).

Az olyan hangrendszerek, mint a Voiceitt idővel képesek megtanulni a beszélők kiejtését, és a felhasználó szavait világos, normalizált beszéddé fordítják le hang- vagy szöveges üzenetek formájában.

Az izraeli cég okosotthon-rendszere sem ért meg mindent, amit a megszokottól eltérő módon beszélő emberektől hall. A szisztémát a felhasználók tanítják meg a saját hangjukkal az olyan, mindennapi kifejezésekre, mint például „kapcsold fel a villanyt!”. A fejlesztés megtanulja az egyes felhasználók sajátos hangképzését is. Az alkalmazás arra is használható, hogy a beszédhibás emberek szemtől-szembe kommunikáljanak egymással.

 

Okosotthon

Kép forrása: www.medium.com

 

A Google Parrotron egy másik hasonló MI eszköz, amelyet kifejezetten a beszédhibás és atipikus beszédmintákkal rendelkező emberek számára fejlesztettek ki.

A Parrotron olyan mesterséges intelligencia rendszert használ, amely arra van kiképezve, hogy a beszédhibás személy beszédét közvetlenül "folyékony", szintetizált beszéddé alakítsa át. A technológia csak a beszédjeleket veszi figyelembe, a vizuális jeleket (például az ajakmozgást) nem.

A technológia lényegében "89 százalékról 25 százalékra csökkenti a siket beszélők szóhibaarányát", de a Google reméli, hogy a folyamatban lévő kutatások még tovább javítják majd az eredményeket.

A holland Evalk nevű start-up cég fejlesztette ki a GnoSys-t, amely egy mesterséges intelligenciával (AI) működő okostelefon-alkalmazás. A "Google fordító siketeknek" néven is emlegetett alkalmazás úgy működik, hogy a felhasználó maga elé helyezi az okostelefont. Az AI-alapú alkalmazás neurális hálózatokat és számítógépes látást használ, és a gesztusokat vagy a jelbeszédet valós időben, azonnal szöveggé és beszéddé fordítja.

Az alkalmazást Hollandiában mutatták be először és számos eszközön használható, beleértve a táblagépeket és a személyi számítógépeket is. Használatához mindössze internetkapcsolatra és egy kamerára van szükség az eszközön, amely a jelelő személy felé néz.

Szájról olvasni nehéz. Sok siket ember képes rá, de vannak helyzetek, amikor ez nehézségekbe ütközhet.

A Google mesterséges intelligenciája, a DeepMind ebben segít és még az embernél is jobb munkát végez. A rendszert úgy képezték ki, hogy több mint 5000 órányi különböző tévéműsort néztek meg és összesen 118.000 mondatot elemeztek ki. A kutatás és fejlesztés eredménye egy olyan rendszer lett, amely képes értelmezni az emberi beszédet, különböző megvilágítású környezetben is.

A CoWriter egy szó ”előrejelző” és szöveget beszéddé alakító szoftver, amely segít a diszlexiával és más tanulási zavarokkal küzdő egyéneknek pontosabban és hatékonyabban írni. Gépi tanulási algoritmusokat használ, így a felhasználó miközben szavakat és kifejezéseket ír, azzal egyidőben javasolatot tesz a kimeneteli szóra és képes a szöveget hangosan felolvasni.

 

Független otthoni életvitel

 

Az okosotthon technológia nagy előnyt jelenthet a mozgásukban korlátozottak számára. Ez a rendszer egyszerű hangutasításokkal lehetővé teszi, hogy a fogyatékossággal élők közöljék, mire van szükségük, és otthonuk szinte minden aspektusát vezérelhetik: be- és kikapcsolhatják a világítást, vezérelhetik a hőmérsékletet, zenét játszhatnak le stb.

Például, a már említett Amazon Alexa egy nagyon hasznos alkalmazás, amely segít a fogyatékossággal élőknek hangos interakcióban, riasztások és emlékeztetők beállításában, zeneszámok lejátszásában, teendőlisták készítésében és valós idejű információszolgáltatásban.

Az intelligens ajtócsengő okoseszköz különösen a mozgássérültek számára lehet hasznos, mert lehetővé teszi számukra, hogy a felügyeleti képernyőn keresztül lássák, ki áll az ajtóban.

Az intelligens világítás segítségével távolról is be- és kikapcsolható a világítás, valamint szabályozható a világítási szint az otthonban.

Az intelligens függöny technológia képes a függönyök automatikus nyitására és zárására a telefonos alkalmazás segítségével.

Az intelligens garázsnyitóval a lakástulajdonosok okostelefonjukon keresztül bárhonnan felügyelhetik garázskapujukat.

Az intelligens termosztátok pedig különféle funkciókkal rendelkeznek, amelyek lehetővé teszik a ház hőmérsékletének távolról történő megváltoztatását és bármikor kényelmesen változtathatóak.

 

Életminőség javítása

 

A MI felhasználható intelligens protézisek fejlesztésére is. Ezeket a mozgáskorlátozott emberek számára megalkotott protéziseket olyan szenzorokkal lehet felszerelni, amelyek képesek érzékelni a felhasználó mozgását és azokat pontosabb és természetesebb mozgásokká alakítani. A mesterséges intelligencia protézisekben való használata lehetővé teszi a nagyobb testreszabhatóságot is, mivel a beállítások és preferenciák jobban igazíthatók az egyes személyek egyéni igényeihez.

A mesterséges intelligencia egyik felhasználási területe az olyan mobilitási segédeszközök fejlesztése, amelyek segíthetik a mozgáskorlátozott embereket. Ezek közé a segédeszközök közé tartozhatnak a mozgást és az egyensúlyt segítő robotikus exoskeletonok, valamint a mobileszközön vagy számítógépen keresztül vezérelhető intelligens kerekesszékek.

A mesterséges intelligencia másik felhasználási területe a prediktív egészség-megfigyelési technológiák fejlesztése, amelyek segíthetnek a fogyatékossággal élő személyeknek abban, hogy figyelemmel kísérjék az egészségi állapotukat. Ezek a technológiák magukban foglalhatnak olyan viselhető eszközöket, amelyek képesek az életjelek monitorozására, az egészségi állapot változásainak észlelésére, és valós idejű riasztásokat adnak az egyénnek vagy gondozójának.

Íme két példa az ezeken a területeken jelenleg használt vagy fejlesztett mesterséges intelligencia szoftverekre és eszközökre:

1. Az AliveCor által kifejlesztett EKG Smartwatch, amely képes észlelni a rendellenes szívritmust és valós idejű figyelmeztetést ad a felhasználónak.

2. Mobilitási segédeszköz, a ReWalk exoskeleton, amely mesterséges intelligenciát és gépi tanulási algoritmusokat használ a járás és az egyensúlyozás segítésére.

 

Gördülékeny munkavégzés

 

A Myo karszalag egy karon viselhető eszköz, amely lehetővé teszi a felhasználók számára, hogy karjuk mozgatásával irányítsák a számítógépüket.

A Click-N-Type egy ingyenes virtuális billentyűzet, amely egérrel vagy más eszközzel használható. Ez a billentyűzet hasznos lehet az olyan mozgássérült személyek számára, akiknek nehézséget okoz a fizikai billentyűzet használata.

Microsoft akadálymentesítési eszközök: a Microsoft ingyenes akadálymentesítési eszközcsomagot kínál, ilyenek többek között a Windows Magnifier, a Narrator és a Speech Recognition. Ezek az eszközök segíthetnek a látás-, hallás- vagy mozgássérülteknek a számítógépes rendszerek elérésében és használatában.

 

Mesterséges intelligencia a munkahelyen

 

Kép forrása: www.medium.com

 

A Free Virtual Keyboard egy ingyenes szoftver, amely egy virtuális billentyűzetet biztosít, amelyet egérrel vagy más eszközzel lehet vezérelni.

A Ghotit egy ingyenes segítő technológiai szoftvereszköz, amely támogatást nyújt a diszlexiás és egyéb olvasási és írási nehézségekkel küzdők számára. Olyan funkciókat tartalmaz, mint a szövegről beszédre váltás, a szavak előrejelzése, valamint a nyelvtani és helyesírási javítás.

A Speechnotes egy ingyenes beszédfelismerő szoftver, amely lehetővé teszi a valós időben történő diktálást és szövegátírást.

A LibreOffice egy ingyenes irodai programcsomag, amely különböző alkalmazásokat tartalmaz, például szövegszerkesztőt, táblázatkezelőt és prezentációs szoftvert. De olyan funkciókkal is rendelkezik, mint a szövegről beszédre váltás és a Braille-kijelzők támogatása, így hasznos eszköz a látássérült személyek számára.

 

AI a látássérültek szolgálatában

 

Íme néhány példa AI-programokra, amely a látássérült személyek számára nyújthat segítséget:

 

Tárgyfelismerés

 

A mesterséges intelligencia felhasználható a környezetben lévő tárgyak azonosítására. A tárgyfelismerés olyan hatékony technológia, amely forradalmasíthatja a vakok és gyengénlátók életét. A mesterséges intelligencia és a számítógépes látás segítségével a tárgyfelismerő szoftverek képesek azonosítani a környezetben lévő tárgyakat és hang- vagy tapintható visszajelzést adni a felhasználónak.

Az egyik ilyen tárgyfelismerő szoftver a Microsoft által kifejlesztett Seeing AI alkalmazás, mely az okostelefon vagy táblagép kameráját használja a környezetben lévő tárgyak, például emberek, szövegek és tárgyak azonosítására és leírására.

Egy másik példa a tárgyfelismerő szoftverre az OrCam MyEye. Ez az eszköz a felhasználó szemüvegéhez csatlakozik és egy kis kamerát használ a környezetről készült képek rögzítésére. Az eszköz ezután MI segítségével azonosítja és leírja a tárgyakat, valamint felolvassa a dokumentumokon és táblákon található szöveget.

Az Envision által kifejlesztett okosszemüveg mesterséges intelligencia használatával nyer képekből információt, majd képes azokat több mint hatvan különböző nyelven tolmácsolni használójának. A 8 megapixeles kamerával ellátott eszköz bármilyen felületről hatékonyan tud digitális és kézzel írt szöveget beolvasni, majd beszéddé alakítani.

Segítségével a vak emberek számos dolgot önállóan is el tudnak végezni, ami a függetlenség új szintjét hozza el.

A tárgyfelismerő technológiát olyan intelligens otthoni eszközökben is használják, mint a cikk elején említett Amazon Echo és a Google Home. Ezek az eszközök az otthonban lévő kamerákhoz csatlakoztathatók és képesek hangos visszajelzést adni a felhasználónak arról, hogy mi történik a környezetben. Például figyelmeztethetik a felhasználót, ha valaki a bejárati ajtónál van, vagy ha megszólal a füstjelző.

 

Szövegből beszéddé alakítás

 

A szöveget beszéddé (TTS) technológia egy olyan szoftver, amely az írott szöveget képes beszéddé alakítani. A TTS-technológia hatékony eszköz a vakok és gyengénlátók számára, mivel lehetővé teszi számukra, hogy olyan írott tartalmakhoz is hozzáférjenek, amelyeket egyébként nem tudnának elolvasni.

Számos különböző TTS-szoftvereszköz áll rendelkezésre, amelyekkel felolvasható a szöveg a számítógépen vagy a mobileszközön.

Az egyik népszerű TTS-szoftvereszköz az olyan operációs rendszerek beépített TTS funkciója, mint a Windows és a macOS. Ez a funkció e-mailek, dokumentumok és webhelyek felolvasására használható, és a beszéd hangjának, sebességének, valamint hangerejének beállításával testre is szabható.

Számos harmadik féltől származó TTS-szoftvereszköz is elérhető, amelyek fejlettebb funkciókat és testreszabási lehetőségeket kínálnak. Ilyen eszköz például a NaturalReader szoftver, amely bármilyen írott szöveget képes természetes hangon felolvasni. A szoftver lehetővé teszi a felhasználók számára a beszéd sebességének, hangerejének és kiejtésének beállítását, valamint a szöveg betűméretének és stílusának testreszabását is.

Egy másik példa a TTS-szoftverekre a mobileszközökre telepíthető Voice Dream Reader nevű alkalmazás. Az alkalmazás számos formátumot, köztük e-könyveket, PDF-et és weboldalakat képes felolvasni, és lehetővé teszi a felhasználók számára a beszéd sebességének, hangmagasságának és hangerejének beállítását. Az alkalmazás számos más akadálymentesítési funkciót is tartalmaz, például diszlexiabarát betűtípusokat és színtémákat.

A JAWS egy képernyőolvasó szoftver, amely hangosan felolvassa a számítógép képernyőjének tartalmát a vak vagy gyengénlátó emberek számára. A program billentyűzetes navigációs és hangfelismerő funkciókat is tartalmaz.

Az Orca egy ingyenes képernyőolvasó Linuxhoz, amely szövegről beszédre váltást és Braille-írás támogatást nyújt a látássérültek számára. Használható a különböző asztali alkalmazásokban való navigálásra és interakcióra.

BELIN, az úgynevezett beszélő Linux, egy a látássérülteknek készült operációs rendszer, amely már a telepítésnél is segít azzal, hogy hangosan mondja a kijelzőn megjelenő információkat.

 

enlightenedTudtad? A NISZ Nemzeti Infokommunikációs Szolgáltató Zrt. 2018-ban indított licenc programja 2024. június 30-ig érhető el. Ez alapján az Informatika a Látássérültekért Alapítványon keresztül, minden Magyarországon élő és határainkon túli, magyar igazolvánnyal rendelkező látássérült állampolgár ingyenesen juthat hozzá a legnépszerűbb képernyőolvasó és képernyőnagyító szoftverek legújabb magyar nyelvű változatához. Ez a lehetőség ma a világon összesen három országban áll a látássérült emberek rendelkezésére: https://infoalap.hu/adomanyozas/orszag_licenc/

 

Navigáció 

 

A navigáció komoly kihívást jelenthet a vak vagy gyengénlátó emberek számára, mivel látás nélkül nehéz egy ismeretlen környezetben eligazodni.

A MI segíthet a vak embereknek a környezetükben való tájékozódásban. Ez történhet intelligens szemüveg vagy más viselhető technológia használatával, amely hangjelzésekkel segíti a személyt a tájékozódásban.

A viselhető navigációs technológia egyik példája az OrCam MyEye eszköz, amelyet korábban már említettünk a tárgyfelismerő szoftverrel kapcsolatban. A tárgyak azonosítása és leírása mellett az eszköz hangjelzésekkel is segíti a felhasználót a környezetében való tájékozódásban. Az eszköz például képes felismerni, ha a felhasználó egy lépcsőhöz közeledik és hangjelzéssel figyelmezteti.

A viselhető technológiák mellett számos olyan navigációs alkalmazás is létezik, amely mesterséges intelligenciát használ a fogyatékossággal élők segítésére. Ilyen például a BlindSquare alkalmazás, amely a GPS és más helyalapú adatok segítségével hangjelzésekkel segíti a felhasználót a tájékozódásban. Az alkalmazás a közeli üzletekről és nevezetességekről is tud információt nyújtani.

A BlindSquare hasonlít egy navigációs szoftverhez, de nem az. Indításakor a GPS és az iránytű alapján beazonosítja, hogy hol állsz. Ekkor tájékoztat a körülötted lévő utcákról, buszmegállókról, éttermekről, intézményekről. Tehát nem csak akkor tájékoztat, ha például be kell fordulnod egy sarkon, hanem folyamatosan információkkal lát el.

Egy másik, mesterséges intelligenciát használó navigációs alkalmazás a Lazarillo. Ez a fejlesztés hangutasításokat és hangjelzéseket használ, hogy segítse a felhasználót a környezetében való tájékozódásban.

 

enlightenedTudtad? A TIER járművek parkolóhelyei Budapesten is bekerültek a vakok és gyengénlátók városi közlekedését segítő Lazarillo alkalmazás adatbázisába. A mobilitási pontok integrációjának köszönhetően a vakok és gyengénlátók részletesebb információt kaphatnak a környezetükről, így kényelmesebbé válhat számukra a közlekedés, később pedig a felhasználók visszajelzései alapján még pontosabbá válhat a helyzetjelzés.” – mondta el René Espinoza, a Lazarillo alapító ügyvezetője.

 

Összességében a navigációs, szöveget beszéddé alakító és a tárgyfelismerő technológia nagyban javíthatja a vak vagy gyengénlátó emberek függetlenségét és életminőségét. A technológia további fejlődésével várhatóan még kifinomultabb és hatékonyabb eszközöket és szoftvereket láthatunk majd, amelyek megkönnyítik a fogyatékossággal élők számára az őket körülvevő világban való tájékozódást.

 

Mesterséges intelligencia a hallássérültek szolgálatában

 

A hallássérült emberek, siketek számára az AI számos előnnyel járhat. Íme néhány példa az AI-programokra, amelyek a hallássérült személyek számára nyújthatnak segítséget:

 

Beszédfelismerés

 

A beszédfelismerő technológia AI technológiát használ a beszélt szavak szöveggé történő átalakításához, mely hihetetlenül hasznos lehet a hallássérült emberek számára.

A beszédfelismerő szoftverek használatával a hallássérültek elolvashatják a beszélgetések, telefonhívások és videókonferenciák során elhangzottakat.

Ilyen beszédfelismerő szoftver például a Dragon NaturallySpeaking. Ez a szoftver személyi számítógépen történő használatra készült, és képes a beszélt szavakat valós időben szöveggé alakítani. A felhasználók egy mikrofonba beszélhetnek és a szoftver átírja a szavaikat a számítógép képernyőjén olvasható szöveggé. A szoftver a számítógép vezérlésére is használható, lehetővé téve a felhasználók számára, hogy hangutasításokkal navigáljanak a menükben és műveleteket hajtsanak végre.

Egy másik példa a beszédfelismerő szoftverre az Otter.ai alkalmazás. Ezt az alkalmazást mobileszközön való használatra tervezték és ugyancsak a szóban elhangzó beszélgetések valós idejű átalakítását végzi el. Az alkalmazás telefonhívások és videókonferenciák során is használható és képes az elhangzott szavakat a készülék képernyőjén olvasható szöveggé átírni. Az alkalmazás azt is lehetővé teszi, hogy a felhasználók a beszélgetés befejezése után szerkesszék a szöveget és még a beszélgetés főbb pontjainak összefoglalását is meg tudja adni. Ennek a szoftvernek van ingyenes csomagja is.

Léteznek olyan beszédből szövegbe átíró szolgáltatások is, amelyek hangfelvételek, például előadások vagy podcastok szövegként való megjelenítésére használhatók. Ilyen szolgáltatás például a Rev.com, mely szintén mesterséges intelligenciára épül. A szolgáltatás hasznos lehet azon hallássérült emberek számára, akik a hanganyagokhoz írott formában szeretnének hozzáférni.

Egy hazai fejlesztésű beszédfelismerő szoftvert is ajánlok. Az Alrite  lényege, hogy a feltöltött hanganyagokat képes írott, szerkeszthető szöveggé alakítani több nyelven (magyar, angol, német, spanyol), illetve a feltöltött videók hangsávja alapján pontosan időzített feliratokat készít, amelyek aztán letölthetők több formátumban, beleértve a népszerű SRT feliratfájlokat is.

 

Mit tud az Alrite?

  • Diktálás: nincs kész hanganyagunk? Semmi gond! Diktálhatunk is az Alrite-nak, amely a diktált szövegből azonnal szerkeszthető leiratot készít.
  • Feltöltés: ha már van hangfelvételünk, egyszerűen feltölthetjük a rendszerbe, s megkezdhetjük a feldolgozását. Továbbá fel lehet tölteni azokat a videó fájlokat is, amelyekhez feliratot szeretnénk készíteni.
  • Youtube: Youtube videóhoz szeretnénk feliratot készíteni annak hangsávja alapján? Csak meg kell adni a linket, a többit pedig már elvégzi az Alrite!
  • Élő közvetítés: akár élő adásokat is nézhetünk röptében készülő felirattal. Ez a funkció azonban egyelőre csak az EuroNews és az M1 híradó esetében érhető el.

 

Feliratozás

 

A feliratozás a beszélt nyelv írott szöveggé alakítása és fontos eszköz lehet a hallássérültek számára. A feliratozási technológia használatával a hallássérültek elérhetőbb és kényelmesebb módon férhetnek hozzá az audio- és videótartalmakhoz.

Többféle feliratozási technológia létezik: élő feliratozás, automatikus feliratozás és a feliratozó szoftver.

Az élő feliratozás során egy ember valós időben írja át az elhangzott szavakat írott szöveggé. Ezt gyakran használják olyan helyzetekben, mint például élő események vagy konferenciák, ahol egy emberi feliratozó hallgatja a beszélőket és írásos átiratot készít a szavaikról. Az élő feliratozás nagyon pontos, de egyben költséges is lehet és nem minden eseményen érhető el.

Az automatikus feliratozás MI segítségével alakítja át valós időben az elhangzott szavakat írott szöveggé. Ez megfizethetőbb és kényelmesebb megoldás lehet, mint az élő feliratozás, de nem biztos, hogy olyan pontos.

Néhány példa az AI-t használó automatikusan feliratozó szoftverekre:

Google Meet: a Google Meet egy videókonferencia-platform, amely automatikus feliratozást tartalmaz a videóhívásokhoz. A feliratozás a Google beszédfelismerő technológiájával működik és több nyelven is képes valós idejű feliratozást biztosítani.

Zoom: a Zoom egy másik videókonferencia-platform, amely szintén valós időben, automatikusan készít feliratozást a videóhívások során.

Microsoft Stream: a Microsoft Stream egy olyan videóplatform, amely a rögzített videókhoz tartalmaz automatikus feliratozást. A feliratozás több nyelven is képes pontos feliratokat biztosítani a videókhoz.

A feliratozó szoftver az előre felvett hang- vagy videótartalmak feliratozásához is használható.

Néhány példa ilyen feliratozó szoftverekre:

Subtitle Workshop: ez egy ingyenes, nyílt forráskódú szoftver, amely videófájlok feliratozására használható. A szoftver számos eszközt tartalmaz a feliratok és a videó szinkronizálásához és a feliratokat több formátumban is képes exportálni.

Kapwing: a Kapwing egy webalapú videószerkesztő, amely automatikus feliratozási eszközöket is tartalmaz. A szoftver képes automatikusan átírni a beszélt szavakat szöveggé, majd hozzáadni a feliratokat a videóhoz. Ingyenes változata is van.

 

enlightenedTudtad?

A tokiói székhelyű DAWN, azaz Diverse Avatar Working Network egy olyan kávézó, ahol a személyzet robotokból áll. A robotokat olyan súlyos testi fogyatékossággal élő emberek működtetnek otthonukból, akik amyotrófiás laterálszklerózisban szenvednek, más néven Lou Gehrig-kórban.

A "pilótáknak" nevezett kezelők otthonról - kerekesszékből vagy ágyból - egérrel, táblagéppel vagy egy "tekintetvezérelt" távirányítóval irányíthatják a robotokat. A kísérleti vállalkozás 2021-ben elnyerte a rangos Good Design Awards nagydíját. 

A kétméteres robotkiszolgálók fogadják a vendégeket, felveszik a rendeléseket, kiszállítják az ételt és letakarítják az asztalokat. A robotok kötényt viselnek és olyan kitűzőket, amelyeken a színfalak mögött őket irányító dolgozók fotói láthatók.

Minden robot beépített kamerával, mikrofonnal és hangszórókkal rendelkezik. Az OriHime-D 14 csuklós motorja lehetővé teszi számukra, hogy olyan funkciókat hajtsanak végre, mint a tálcák hordozása vagy a tányérok és poharak felvétele. 

A kávézókon kívül az Ory Laboratórium robotjai idegenvezetőként és vendégfogadóként is dolgoznak áruházakban, közlekedési állomásokon és vállalati irodákban Japán-szerte, ahol sok munkáltató a robotika és az automatizálás felé fordul a munkaerőhiány áthidalására. A Nemzetközi Valutaalap 2018-ban közzétett jelentése szerint Japán a "robotok sűrűségét tekintve a világ legjobban robotizált gazdaságai közé tartozik": a feldolgozóiparban minden egyes emberi dolgozóra körülbelül három robot jut.

 

Robotok dolgoznak egy japán kávézóban

Forrás: https://qz.com/

 

Hangfelismerés

 

A mesterséges intelligenciára épülő hangfelismerő technológia bizonyos hangok felismerésére szolgál, és elsősorban a halláskárosodott személyek figyelmeztetésére használható. Ez a technológia különösen hasznos lehet azon személyek biztonságának és jólétének javításában, akik esetleg nem hallanak meg olyan fontos hangokat, mint például az ajtócsengők, a riasztók vagy a füstérzékelő jelzése.

A hangfelismerő technológiára számos szoftverajánlás létezik, ezek közül válogattam most ide a legnépszerűbbeket:

A Google Home egy hangvezérelt intelligens hangszóró, amely az olyan hangok felismerésére használható, mint az ajtócsengők vagy a füstérzékelők jelzése. A Google Home emellett emlékeztetők beállítására, listák létrehozására és más intelligens otthoni eszközök vezérlésére is használható.

Az Amazon Echo egy hangvezérelt, intelligens hangszóró, amely az Amazon Alexa hangasszisztensét használja a hangok felismerésére és a hallássérült személyek figyelmeztetésére. Az Echo más intelligens otthoni eszközök vezérlésére, zenelejátszásra és kérdések megválaszolására is használható.

Az Apple HomeKit egy olyan otthoni automatizálási rendszer, amely lehetővé teszi a felhasználók számára, hogy hangutasításokkal vezéreljék az intelligens otthoni eszközöket. A HomeKit egyaránt használható a fontos hangok felismerésére és a hallássérült személyek figyelmeztetésére.

A Ring Video Doorbell Pro 2 ajtócsengő hangfelismerő technológiával rendelkezik, amely a hallássérülteket is figyelmeztetheti az ajtóban álló látogatókra, valamint testreszabható mozgásérzékeléssel és 1080p HD videóval, éjjellátással is rendelkezik.

Emellett a Ring Video Doorbell Pro 2 a Ring alkalmazáson keresztül más intelligens otthoni eszközökhöz, például világításhoz és ajtózárakhoz is csatlakoztatható, így bárhonnan felügyelni és vezérelni lehet az otthon biztonságát.

Összefoglalás

Mesterséges intelligencia a fogyatékossággal élők szolgálatában


Amint a fenti cikkből látható, a MI alapú megoldások valódi változást hoztak el a fogyatékossággal élők számára, mivel hatékonyan és sok esetben az egyéni igényekhez igazítva támogatják a mindennapi tevékenységüket.

A fogyatékossággal élőket segítő AI technológia olyan lehetőségeket nyit meg a hozzáférhetőség, a társadalomba való beilleszkedés és az önálló életvitel terén, amelyeket egyébként enélkül a technológia nélkül nehéz vagy lehetetlen lenne megvalósítani.

A mesterséges intelligencia technológia további fejlődésével valószínűleg még több olyan programmal és alkalmazással fogunk majd találkozni, amelyek segíthetnek a fogyatékossággal élőknek abban, hogy függetlenebb és teljesebb életet éljenek.

Esélyegyenlőségi kisszótár: https://www.odukozpont.hu/sites/default/files/odu_kisszotar_big.pdf

Mesterséges intelligencia film: https://www.mafab.hu/filmek/filmek/1/?keyword=2852

MI koalíció - AI Hungary: https://ai-hungary.com/hu/tartalom/mi-koalició

Mi a mesterséges intelligencia jövője: https://www.youtube.com/watch?v=CxpmA2Bo1_U&t=1s

Mesterséges intelligencia a mindennapokban: https://www.youtube.com/watch?v=jsa6wVJF--0

Támogasd a megváltozott munkaképességűeket foglalkoztató cégeket, légy te is etikus vásárló!

 

 

Tartalomhoz tartozó címkék: Mesterséges intelligencia

Keresés