Hlasoví asistenti jsou nyní integrováni jako součást zážitku v autě a aplikace se rozrůstají a potenciálně nabízejí bezpečný způsob, jak přijímat asistenci, navigovat, komunikovat, bavit se a ovládat funkce auta bez použití rukou. Zajistit, aby hlasová asistence fungovala podle očekávání pro každého řidiče v prostředí automobilu, je náročná, ale odměna za bezpečnost i spokojenost řidiče je obrovská.
Nedávné pokroky v oblasti cloud computingu a technologií AI umožnily nové generaci hlasových asistentů, kteří pomáhají spotřebitelům vybrat si hudbu v domácnosti a ovládat domácí spotřebiče a nástroje. Také mnoho linek podpory první úrovně používá hlasové asistenty k vedení zákazníků a řešení základních otázek zákaznické podpory. V důsledku toho dnešní spotřebitelé, zejména mladší generace, docela pohodlně používají hlasovou technologii.
Do automobilového HMI jsou nyní integrováni pokročilí hlasoví asistenti, kteří mimo jiné řídí funkce vozidla nebo programují cíl do navigačního systému. Hlasové ovládání poskytuje bezpečné a pohodlné řešení pro ovládání komplexních funkcí HMI dostupných v moderních automobilech. To je nanejvýš důležité, protože všechny moderní systémy HMI přecházejí na příslovečný formát tabletu, který obsahuje množství vlastností a funkcí. Někdy se jednoduchý úkol, jako je nastavení teploty v kabině, může stát problémem, když uživatel musí procházet rozhraním HMI. Použití hlasového asistenta pro ‚změnu teploty na 23 stupňů‘ poskytuje pohodlnou a bezpečnou možnost.
Na rozdíl od domova však prostředí v autě představuje jedinečné výzvy, které je třeba řešit. Tento článek zkoumá výhody automatizace testování hlasových asistentů a související výhody.
Prostředí v autě
Prostředí v autě představuje některé jedinečné výzvy pro testování hlasových asistentů. Za prvé, akustické prostředí se může výrazně změnit nastavením systému vytápění a ventilace. Během procesu rychlého odmlžování mívají větrací ventilátory tendenci pracovat na maximální otáčky a generovat značný hluk na pozadí.
Podobně, jak se zvyšuje rychlost vozidla, bude se zvyšovat složka hluku na silnici (včetně podzvukového hluku), což může mít vliv na výkon systému hlasového asistenta. Další faktory, jako je hluk od cestujících, komplikují provozní zvukové spektrum hlasových asistentů ve voze.
Manuální versus automatické testování VR
Během vývoje se ladění systému hlasové asistence provádí v prototypech vozidel s lidskými testovacími subjekty. Tento proces může být nákladný a časově náročný, aby pokryl celou řadu jazyků a souvisejících jízdních podmínek. Aby se ušetřil čas, musí být 2-3 testované osoby ve vozidle ve stejnou dobu, kdy jede po testovací trase. S vypuknutím celosvětové zdravotní nouze Covid-19 nemohly být takové testy jízdy možné kvůli pravidlům sociálního distancování.
I když jsou lidské testovací subjekty ideálním kandidátem na testování systému hlasového asistenta, logistika řízení jejich dostupnosti a zajištění souladu s výslovností každého hlasového příkazu může být náročná.
Úvahy o automatizaci
Abychom zautomatizovali proces testování hlasového asistenta, musíme vzít v úvahu tři faktory;
(1) Knihovna testovacích frází: Jedná se o předem nahrané zvukové soubory řeči shromážděné od lidských subjektů v kontrolovaném zvukovém prostředí. V ideálním případě je nejvhodnější záznam pořízený ve vozidle jedoucím různými rychlostmi. Jakmile jsou soubory kategorizovány, máme základy pro použití systému hlasového asistenta.
(2) Prostředí ve vozidle: Akustické prostředí ve vozidle může být ovlivněno rychlostí vozidla, počtem cestujících, nastavením HVAC a dalšími zdroji zvuku. Použití skutečného vozidla je ideálním prostředím pro automatizované testování. Vozidlo zůstane po celou dobu testu statické.
(3) Hluk ze silnice: Jedná se o významný faktor ve výkonu systémů hlasového ovládání ve vozidle, které spolu s dalšími zdroji, jako je převodovka a vibrace motoru, ovlivní výkon. Vysoce kvalitní záznam ve vozidle může poskytnout dobrou referenci pro simulaci hluku vozidla pomocí reproduktorů umístěných blízko exteriéru vozidla nebo smíchaných s testovacím zvukem.
Typický test nastavený pro automatický testovací systém hlasové asistence ve vozidle je znázorněn na obrázku níže.
Automatizační platforma, jako je řešení ATAM Connect společnosti Nextgen, je zodpovědná za výběr testovacích souborů a kontrolu výstupní odezvy hlasového asistenta systému IVI proti každému vstupnímu příkazu. Automatizační systém bude muset ověřit zvukovou odezvu a určit, zda test prošel nebo selhal. Pro každý testovací cyklus se shromažďují zvukové a obrazové záznamy.
Automatické rozpoznávání hlasu a testování hlasového asistenta
Automatizace umožňuje rychlejší uvedení na trh a výrazně snižuje celkové náklady na testování hlasových asistentů. Testování může pokračovat 24×7 jako součást vývojového programu CI/CD a umožňuje testovacím technikům vyladit testovací program za běhu.
Bylo by skvělé si s vámi promluvit o tom, jak robustní automatizace testování pomáhá zajistit hlasovou funkčnost VR/VA v široké řadě aplikací případů použití, kontaktujte nás ještě dnes.
Tento popis je namístě, protože cvakání a cvakání tradičního inženýrství jsou nahrazovány tichými jedničkami a nulami digitální technologie.
Vývoj automobilu vstoupil do nové éry. Vaše každodenní jízda se promění v chytré zařízení. A stejně jako u jiných chytrých zařízení se technologie rozpoznávání řeči stává každodenní součástí zážitku v autě.
Co přimělo automobilový průmysl k tak velkému využití schopností rozpoznávání řeči v autě? Toto je oblast, kde inovace řídila naprostá potřeba, spíše než jen schopnost uvést na trh nový koncept nebo zařízení pro tech-chtivé spotřebitele.
Podívejme se na minulost, současnost a budoucnost technologie rozpoznávání řeči v autě.
Proč rozpoznávání řeči v autě?
Mnoho pokroků v rozpoznávání řeči bylo řízeno potřebou udržet veřejnost v bezpečí a přitom stále uznávat kulturu závislou na zařízení. To platí zejména, pokud jde o vozidla.
Ať už se jedná o textovou zprávu nebo používání Google Maps, impuls odtrhnout oči od silnice se stal druhou přirozeností. Systémy rozpoznávání řeči v autě se staly téměř standardní součástí všech mnoha nových vozidel na dnešním trhu.
Ale i když chování při bezpečné jízdě (a na mnoha místech zákon) vyžaduje, abychom za volantem ignorovali neustálé telefonní hovory, e-maily a textové zprávy, tento druh odpojení není tak docela realitou.
Systémy rozpoznávání řeči v autě mají za cíl odstranit rozptýlení při pohledu na mobilní telefon při řízení. Místo toho umožňuje head-up displej řidičům sledovat vozovku a myslet na bezpečnost.
Nedávná zpráva zveřejněná britskou Transport Research Laboratory (TRL) ukazuje, že úroveň rozptýlení řidiče je mnohem nižší při používání hlasově aktivovaných systémů ve srovnání s dotykovými obrazovkami.
Studie však doporučuje, aby byl nutný další výzkum, aby se používání mluvených pokynů stalo nejbezpečnější metodou pro budoucí ovládání v autě.
Přesto je to krok správným směrem.
Jak může pomoci rozpoznávání řeči v autě?
Specifika toho, co lze ovládat řečí, závisí na autě.
Typický výběr funkcí ovládaných hlasem je seskupen do tří kategorií: základní, středně pokročilé a pokročilé.
- Projekt základní hlasově aktivované poskytování je soustředěno kolem mediálního a zábavního systému automobilu. Řidiči mohou pomocí hlasu přepínat stanice, upravovat hlasitost, přeskakovat skladby a podobně.
- Střední Systémy umožňují řidiči kromě základních funkcionalit také volat a přijímat telefonní hovory, programovat GPS a nastavovat klimatizaci.
- Moře pokročilý technologie zahrnuje připojení k internetu, které usnadňuje mluvené procházení webu a používání aplikací.
- Projekt poslední formy bude dosaženo s autonomními vozy.
Na pokročilé úrovni se například řidič může zeptat na cestu, zarezervovat si restauraci a najít parkovací místo, aniž by spustil oči ze silnice nebo ruce z volantu.
Pokud je inspiruje, mohou vyvolat aplikaci pro poznámky a diktovat své myšlenky. Poté mohou požádat o aktualizaci počasí a nechat si přečíst své textové zprávy. Nakonec budou moci požádat o pořad na své oblíbené streamovací službě.
Aplikace pro rozpoznávání řeči v autě
Abychom pochopili, proč to vzniklo, zde jsou některé z nejpopulárnějších systémů, které umožňují řidičům najít trasy, posílat e-maily, telefonovat a přehrávat hudbu, a to vše pomocí zvuku jejich hlasu.
Apple CarPlay
CarPlay přináší na dotykový displej vašeho auta oříznutou verzi iOS zaměřenou na bezpečnost. Siri je plně integrována do CarPlay a můžete připojit svůj iPhone a továrně nainstalovaný zábavní systém ve vašem autě je nahrazen známými ikonami společnosti Apple.
Stiskněte hlasové tlačítko na volantu a Siri vám pomůže přepínat mezi seznamy skladeb, navigovat k nejbližší čerpací stanici, posílat textové zprávy a dokonce e-mailovat šéfovi s hvězdnou výmluvou, že jste uvízli za školním autobusem místo na své ranní projektové setkání.
Když například obdržíte textovou zprávu nebo e-mail, na obrazovce infotainmentu CarPlay se zobrazí upozornění. Když na něj klepnete, Siri přečte zprávu nahlas.
Můžete okamžitě odpovědět nadiktováním zprávy, kterou má Siri přepsat, abyste nemuseli spustit oči ze silnice a psát zprávu.
Google Android Auto
Android stále dominuje celosvětovému trhu chytrých telefonů, takže fanoušci Androidu se budou cítit jako doma se spárovanou verzí obrazovek svých telefonů na palubní desce svých vozidel.
Na rozdíl od CarPlay se však Android Auto mohl připojit pouze pomocí kabelu USB a poté se spoléhal na Bluetooth pro hlasové telefonní hovory prostřednictvím vozu. Bezdrátově je podporováno více než 500 modelů a brzy přibudou ještě další.
Stejně jako CarPlay i Android Auto zobrazuje informace, jako je hudba a podcasty, hovory, textové zprávy, mapy GPS a další.
Jakmile je váš telefon připojen k vozidlu, Android Auto aktivuje jedinečnou a důležitou bezpečnostní funkci – váš telefon se tak stane v podstatě nepoužitelným, abyste zajistili, že jej nebudete používat při řízení. Není třeba ho zvedat, dívat se na něj nebo dokonce upravovat hlasitost.
V případě, že vás to zajímá, není velký rozdíl, pokud jde o používání Siri na Carplay nebo Google Assistant na Android Auto, protože oba systémy mají podobnou dobu odezvy a funkce.
Nakonec bude Android Auto nahrazeno režimem Google Assistant Driving Mode, který se má stát dominantním uživatelským rozhraním dostupným v autě.
Po prvním spuštění v USA se režim konečně dostává do dalších částí světa.
Nastavení specifická pro výrobce
Spolu s těmito širšími, univerzálními systémy experimentovali výrobci automobilů s vlastními systémy, které jsou specifické pro značku. Ford’s Sync a GM’s OnStar mají například proprietární palubní digitální systém.
Začleňují telefon a hlas řidiče do navigace, zábavy a dalších omezených funkcí. Bohužel, jak se mnoho výrobců automobilů naučilo, není vždy snadné začlenit kompletní sadu funkcí.
Výsledkem bylo, že rané inkarnace hlasového ovládání v autě skutečně nenaplnily humbuk. Rozpoznáno bylo jen velmi malé množství příkazů a možnost, že budou nepochopeni, byla frustrující vysoká.
Výrobci i řidiči brzy zjistili, že „mluvící auto“ není příliš užitečné, pokud nerozumí jejich jazyku nebo přízvuku nebo funguje pouze v případě, že v pozadí není absolutně žádný hluk.
Nedávnější pokroky v AI však umožnily technologii rozpoznávání hlasu výrazně zlepšit.
Nuance a BMW
Nuance může být méně známým jménem než Apple nebo Android, ale to z nich nedělá menší změnu hry.
Jsou ukázkovým příkladem toho, jak se vývojář AI a výrobce automobilů spojili, aby vytvořili efektivní a inovativní schopnosti rozpoznávání řeči v autě.
BMW Intelligent Personal Assistant, který je k dispozici jako první v BMW řady 3, je „digitálním společníkem poháněným umělou inteligencí, který řidičům umožňuje ovládat svůj vůz a přistupovat k jeho funkcím a informacím jednoduše mluvením“.
Platforma mobilního asistenta s konverzačním systémem AI společnosti Nuance je klíčem k osobnímu asistentovi BMW a pohání řadu funkcí, které jsou základem zážitku z vozu:
- Přizpůsobitelné slovo probuzení – Řidiči mohou použít standardní buzení „Ahoj BMW“ nebo změnit jméno asistenta na jiný, který si sami vyberou, a získat tak personalizovanější zážitek.
- Interakce ovládaná hlasem – Společnost Nuance vyvinula porozumění a generování přirozeného jazyka v roce , což umožňuje řidičům používat svůj přirozený způsob mluvy k ovládání klíčových funkcí ve voze, včetně vyhledávání bodů zájmu, navigace, regulace teploty, ovládání rádia a počasí.
- Chytrý, hlasově ovládaný manuál k autu – Pro začátek je k dispozici v americké angličtině, němčině a mandarínštině, s přibývajícími jazyky budou mít řidiči přístup k celé příručce k vozu pomocí svého hlasu.
- Hlasem spouštěný zážitek a pečující režimy – Řidiči mohou vyjádřit své emocionální a kognitivní stavy pomocí přirozeného jazyka, jako je stres nebo únava. BMW Intelligent Personal Assistant reaguje přepnutím několika systémů vozu na vhodnější pro danou situaci.
Díky nákupu Microsoftem v roce 2021 toho od Nuance určitě přijde víc.
Cesta vpřed pro auta ovládaná hlasem
Nedávný výzkum naznačuje, že 73 % řidičů očekává, že do roku 2022 budou používat hlasové asistenty zabudované v jejich autech pro jeden nebo více účelů. Podle Automotive World bude do roku 2028 hlasové ovládání v autě zabudováno do téměř 90 % nových vozidel prodávaných po celém světě. .
Ať už si tedy řidič chce zahrát ‘Shut Up and Drive’ od Rihanny“ nebo se zeptat: „Kde je nejbližší Starbucks?“, rozpoznávání řeči bude základní funkcí u většiny nových aut, zvláště když se posouváme k autonomním vozům. , díky kterému budou mít řidiči z jízdy zcela bez rukou.
Zpracování přirozeného jazyka mění hru v oblasti hlasového ovládání a jeho účinnost závisí na strojovém učení. Základem jakékoli technologie umělé inteligence jsou data: čím více jich bude, tím chytřejší a personalizovanější bude zážitek.
Výsledkem je, že anotované datové soubory obsahující předem nahrané hlasy mluvící v různých jazycích, s několika přízvuky, s řadou stylů mluvení a s různými zvuky na pozadí (jako je autorádio nebo štěbetání v autě) jsou používány řečí. – výrobci rozpoznávání, aby zajistili, že jejich systémy dokážou porozumět řeči v přirozeném jazyce a reagovat na ni.
Vrátíme-li se zpět k Nuance, potřebovali například podporu se sběrem řečových dat – což znamenalo stovky hodin hlasových dat v různých jazycích, demografických údajích a místech po celém světě.
Potřebovali přesné a komplexní sloučení všech možných termínů, přízvuků, frází, které by se používaly ke komunikaci ve vozidle, a data byla používána k výuce systémů v autě komunikovat s lidmi.
S daty, která jsme shromáždili, byla společnost Nuance schopna vybudovat svou výzkumnou základnu a pokračovat v inovaci v interakci lidí a vozidel. Vše o tom si můžete přečíst zde.
Úplné přijetí technologie rozpoznávání řeči v autě zatím zůstává závislé na standardu schopností odpovídajících očekáváním řidičů.
Pokud řeknete: „Najdi restauraci, ale ne čínskou“, rozdíl mezi získáním správných informací a získáním seznamu čínských restaurací spočívá v kvalitě a množství frází uložených v databázi systému.
Podobně získat užitečnou odpověď na doplňující otázku, například „Bude otevřeno v 5 hodin?“ záleží na úplnosti údajů.
Pomůžeme vám s údaji o rozpoznávání řeči v autě
Společnost Summa Linguae Technologies poskytuje vlastní sběr dat řeči a služby shromažďování obrazových dat a video dat pro trénování umělé inteligence vašeho samořídícího auta nebo technologie rozpoznávání řeči v autě.
Kontaktujte nás ještě dnes a objednejte si konzultaci.
Bezplatné zdroje pro sběr dat
Hledáte další zdroje, které vám pomohou se sběrem dat autonomních vozů? Podívejte se na tyto užitečné soubory ke stažení:
- Ukázková sada Eye Gaze (stáhnout) – Získejte vzorek vysoce kvalitních dat očních pohledů.
- Datový soubor Silnice, auta a lidé (stáhnout) – Školení systému, který vyžaduje obrazová data silnice? Stáhněte si naši ukázkovou datovou sadu.