Hlasoví asistenti jsou nyní integrováni jako součást zážitku v autě a aplikace se rozrůstají a potenciálně nabízejí bezpečný způsob, jak přijímat asistenci, navigovat, komunikovat, bavit se a ovládat funkce auta bez použití rukou. Zajistit, aby hlasová asistence fungovala podle očekávání pro každého řidiče v prostředí automobilu, je náročná, ale odměna za bezpečnost i spokojenost řidiče je obrovská.
Nedávné pokroky v oblasti cloud computingu a technologií AI umožnily nové generaci hlasových asistentů, kteří pomáhají spotřebitelům vybrat si hudbu v domácnosti a ovládat domácí spotřebiče a nástroje. Také mnoho linek podpory první úrovně používá hlasové asistenty k vedení zákazníků a řešení základních otázek zákaznické podpory. V důsledku toho dnešní spotřebitelé, zejména mladší generace, docela pohodlně používají hlasovou technologii.
Do automobilového HMI jsou nyní integrováni pokročilí hlasoví asistenti, kteří mimo jiné řídí funkce vozidla nebo programují cíl do navigačního systému. Hlasové ovládání poskytuje bezpečné a pohodlné řešení pro ovládání komplexních funkcí HMI dostupných v moderních automobilech. To je nanejvýš důležité, protože všechny moderní systémy HMI přecházejí na příslovečný formát tabletu, který obsahuje množství vlastností a funkcí. Někdy se jednoduchý úkol, jako je nastavení teploty v kabině, může stát problémem, když uživatel musí procházet rozhraním HMI. Použití hlasového asistenta pro ‚změnu teploty na 23 stupňů‘ poskytuje pohodlnou a bezpečnou možnost.
Na rozdíl od domova však prostředí v autě představuje jedinečné výzvy, které je třeba řešit. Tento článek zkoumá výhody automatizace testování hlasových asistentů a související výhody.
Prostředí v autě
Prostředí v autě představuje některé jedinečné výzvy pro testování hlasových asistentů. Za prvé, akustické prostředí se může výrazně změnit nastavením systému vytápění a ventilace. Během procesu rychlého odmlžování mívají větrací ventilátory tendenci pracovat na maximální otáčky a generovat značný hluk na pozadí.
Podobně, jak se zvyšuje rychlost vozidla, bude se zvyšovat složka hluku na silnici (včetně podzvukového hluku), což může mít vliv na výkon systému hlasového asistenta. Další faktory, jako je hluk od cestujících, komplikují provozní zvukové spektrum hlasových asistentů ve voze.
Manuální versus automatické testování VR
Během vývoje se ladění systému hlasové asistence provádí v prototypech vozidel s lidskými testovacími subjekty. Tento proces může být nákladný a časově náročný, aby pokryl celou řadu jazyků a souvisejících jízdních podmínek. Aby se ušetřil čas, musí být 2-3 testované osoby ve vozidle ve stejnou dobu, kdy jede po testovací trase. S vypuknutím celosvětové zdravotní nouze Covid-19 nemohly být takové testy jízdy možné kvůli pravidlům sociálního distancování.
I když jsou lidské testovací subjekty ideálním kandidátem na testování systému hlasového asistenta, logistika řízení jejich dostupnosti a zajištění souladu s výslovností každého hlasového příkazu může být náročná.
Úvahy o automatizaci
Abychom zautomatizovali proces testování hlasového asistenta, musíme vzít v úvahu tři faktory;
(1) Knihovna testovacích frází: Jedná se o předem nahrané zvukové soubory řeči shromážděné od lidských subjektů v kontrolovaném zvukovém prostředí. V ideálním případě je nejvhodnější záznam pořízený ve vozidle jedoucím různými rychlostmi. Jakmile jsou soubory kategorizovány, máme základy pro použití systému hlasového asistenta.
(2) Prostředí ve vozidle: Akustické prostředí ve vozidle může být ovlivněno rychlostí vozidla, počtem cestujících, nastavením HVAC a dalšími zdroji zvuku. Použití skutečného vozidla je ideálním prostředím pro automatizované testování. Vozidlo zůstane po celou dobu testu statické.
(3) Hluk ze silnice: Jedná se o významný faktor ve výkonu systémů hlasového ovládání ve vozidle, které spolu s dalšími zdroji, jako je převodovka a vibrace motoru, ovlivní výkon. Vysoce kvalitní záznam ve vozidle může poskytnout dobrou referenci pro simulaci hluku vozidla pomocí reproduktorů umístěných blízko exteriéru vozidla nebo smíchaných s testovacím zvukem.
Typický test nastavený pro automatický testovací systém hlasové asistence ve vozidle je znázorněn na obrázku níže.
Automatizační platforma, jako je řešení ATAM Connect společnosti Nextgen, je zodpovědná za výběr testovacích souborů a kontrolu výstupní odezvy hlasového asistenta systému IVI proti každému vstupnímu příkazu. Automatizační systém bude muset ověřit zvukovou odezvu a určit, zda test prošel nebo selhal. Pro každý testovací cyklus se shromažďují zvukové a obrazové záznamy.
Automatické rozpoznávání hlasu a testování hlasového asistenta
Automatizace umožňuje rychlejší uvedení na trh a výrazně snižuje celkové náklady na testování hlasových asistentů. Testování může pokračovat 24×7 jako součást vývojového programu CI/CD a umožňuje testovacím technikům vyladit testovací program za běhu.
Bylo by skvělé si s vámi promluvit o tom, jak robustní automatizace testování pomáhá zajistit hlasovou funkčnost VR/VA v široké řadě aplikací případů použití, kontaktujte nás ještě dnes.
Špatné zkušenosti v minulosti odrazovaly lidi od hovoru se svými auty.
Jonathan M. Gitlin – 10. února 2023 6:33 UTC
komentáře čtenářů
Za posledních zhruba deset let se z automobilů staly docela komplikované stroje s často složitým uživatelským rozhraním. Odvětví většinou přidalo dotyk na téměř všudypřítomnou obrazovku infotainmentu – díky tomu je výroba jednodušší a levnější a design uživatelského rozhraní flexibilnější, i když existuje spousta důkazů, že rozhraní dotykové obrazovky zvyšuje rozptýlení řidiče.
Ale jak jsem v poslední době zjistil u několika nových aut, možná existuje lepší způsob, jak našim autům říkat, co mají dělat – doslova jim říkat, co mají dělat, nahlas. Po letech, kdy bylo, upřímně řečeno, docela svinstvo, je hlasové ovládání v autech konečně opravdu dobré. Alespoň u některých značek. Představte si to: auto, které rozumí vašemu přízvuku, umožňuje vám přerušit jeho výzvy a ve skutečnosti udělá to, co požadujete, místo toho, aby vyplivlo „Promiň, Dave, to nemůžu“.
Ve skutečnosti si to nemusíte představovat, pokud jste použili nedávné BMW s iDrive 8 nebo Mercedes-Benz s MBUX – je pravda, že jde o poměrně malý vzorek populace. V těchto autech, z nichž některá jsou také docela slušná EV, se opravdu můžete obejít bez šťouchání do dotykové obrazovky pro většinu funkcí během jízdy.
Se svými příkazy můžete být obecní – když autu řeknete „je mi zima“, zvýší se například teplota v kabině. Nebo můžete být konkrétní – říct autu, aby «nastavilo přední teplotu na 75 stupňů» nebo «zapnulo vyhřívání sedadel na stupeň 2», je přinejmenším pro mě mnohem jednodušší, než si pamatovat, který segment dotykové obrazovky jsem. měl šťouchat.
Rozpoznávání hlasu je dokonce dost dobré na to, aby mi rozumělo, když mu řeknu, že mám navigovat na konkrétní adresu, a to do té míry, že ve skutečnosti používám nativní navigační systémy, když řídím moderní BMW nebo Mercedes, než abych se spoléhal na CarPlay jako všichni ostatní. . S cestujícími ve voze také nečiní mnoho problémů – něco, co nelze říci o ovládání BMW gesty, když spolujezdec na předním sedadle mluví rukama.
Část tohoto kreditu by pravděpodobně měla být nasměrována na Cerence, která dodává (mimo jiné) hlasového asistenta BMW i Mercedesu (a také BYD, Renault, VinFast a dalším, řekl Cerence Arsu). Protože velká část softwaru běží na autě, má přístup k funkcím, které auta používající OS Android Automotive od Google nemají. A co víc, kdysi ohlašovaný hlasový asistent Google má pocit, že se za posledních 12 měsíců zhoršilo porozumění řeči, z důvodů, které jsem ještě nepochopil.
Zdá se, že moje nadšení pro rozhovory s auty mě řadí do menšiny. Navzdory generaci nerdů vyrůstajících s dobrodružstvím KITTA a Michaela Knighta se zdá, že nikdo jiný nechce mluvit s jejich auty. Něco z toho je problém s expozicí – jak již bylo zmíněno dříve, dobré systémy hlasového ovládání zatím nejsou široce distribuovány.
Ale i mezi mými kolegy, kteří testují stejná auta pro jiné prodejny, jsem většinou vítán skepticky, když chválím dobrá hlasová rozhraní.
5,000-lb auto není totéž jako smartphone
„Myslím, že součástí toho je jen to, že v jazyce je něco neodmyslitelně sociálního. Po tisíce let se vyvíjel jako inherentně společenský systém. Takže si myslím, že v lidských bytostech je něco, co váhá mluvit s něčím, co není jiná vnímající bytost,“ řekla Betty Birner, profesorka lingvistiky a kognitivních věd na Northern Illinois University.
„Budeme mluvit s našimi psy, ale možná nebudeme chtít mluvit s naším toustovačem. Takže si myslím, že to k tomu patří. Že ke komunikaci používáme jazyk a máme představu o tom, co komunikace znamená, a to znamená jinou mysl. Že jo? Moje mysl v komunikaci s tvou,“ řekla mi.
„Druhá věc, kterou mám na mysli, jasná věc, je, že vaše auto vás může zabít. Váš toustovač – myslím, že by vás mohl zabít, ale musíte na tom opravdu zapracovat. S autem existuje skutečné nebezpečí, takže tamní umělé inteligenci musíte opravdu, opravdu věřit a myslím si, že lidé nechápou, jak daleko se umělá inteligence a zpracování přirozeného jazyka dostaly, a nebudou tomu věřit. jejich život. Což je pochopitelné, řekl Birner.
komentáře čtenářů
Jonathan M. Gitlin Jonathan je Automotive Editor ve společnosti Ars Technica. Má titul BSc a PhD v oboru farmakologie. V roce 2014 se rozhodl dopřát své celoživotní vášni pro auto tím, že opustil National Human Genome Research Institute a zahájil automobilové zpravodajství Ars Technica. Žije ve Washingtonu, DC.