دستیارهای هوشمندی که صدای واقعیتری دارند، کاربران را بیشتر درگیر میکنند، اما همین واقعیبودن یک مشکل غیرمنتظره هم دارد: کاربران از آنها انتظار ادب انسانی دارند و انجام همزمان کارها را بیادبی تلقی میکنند.
بسیاری از پژوهشها روی جنبههای مشاهدهشدنی هوش مصنوعی مانند آواتارها یا رباتها متمرکز شده است، اما همیشه نمیتوان از این فناوریها استفاده کرد؛ برای مثال، عینکهای هوشمند اغلب دوربین و میکروفون دارند اما صفحه نمایش ندارند؛ بنابراین رابطهای مبتنیبر صدا در چنین شرایطی ضروری هستند.
پژوهشگران دانشگاه کارنِگی ملون با همکاری متخصصان روانشناسی، یک رابط صوتی طراحی کردهاند که چتبات را طوری جلوه میدهد که گویی واقعاً در اتاق حضور دارد.
دو راز واقعیتر کردن صدا
پژوهشگران از دو روش استفاده کردند:
۱. پخش صدا از یک جهت مشخص (spatialization): این روش باعث میشود صدای دستیار هوشمند از جای خاصی در اتاق بیاید و این تصور ایجاد شود که حرکت میکند، کتابی را ورق میزند یا در لیوان آب میریزد.
۲. جلوههای صوتی سینمایی (Foley effects): این همان صداهایی است که در فیلمها میشنوید؛ صدای خشخش لباس چرمی، جیرجیر صندلی، یا تایپکردن با صفحه کلید.
دکتر لوری هلر (Laurie Heller)، استاد روانشناسی و متخصص ادراک شنوایی میگوید: وقتی یک بازیگر سینما روی صندلی چرمی مینشیند، انتظار دارید صدای چرم و جیرجیر صندلی را بشنوید. این صداها در زندگی واقعی وجود دارند و اگر در فیلم نباشند، حس واقعیبودن را از بین میبرند.
آزمایش جالب: دستیاری که هم حرف میزند، هم تایپ میکند
در این آزمایش، شرکتکنندگان در اتاقی نشستند و با دستیار هوشمندی صحبت کردند که از ترکیبهای مختلف این جلوههای صوتی استفاده میکرد. دستیار در حین صحبت، صفحههای کتاب را ورق میزد، تایپ میکرد و در لیوان آب میریخت. نتایج شفاف بود: افزودن این جلوههای صوتی تعامل کاربران را به طور چشمگیری افزایش داد و دستیار هوشمند بسیار انساننما به نظر رسید.
دکتر دیوید لیندلبائر (David Lindlbauer)، استاد دانشگاه کارنگی ملون میگوید: نتایج آماری واضحی داریم که نشان میدهد افزودن پخش صدا از یک جهت مشخص و جلوههای صوتی سینمایی درگیری و ارتباط شما را با دستیار افزایش میدهد.
وقتی دستیار هوشمند «بیادب» میشود!
اما همین انساننمایی، یک پیامد غیرمنتظره داشت: کاربران از این دستیار انتظار داشتند مانند یک انسان از هنجارهای اجتماعی پیروی کند. اگر دستیار همزمان با صحبتکردن تایپ میکرد یا کتاب را ورق میزد، شرکتکنندگان احساس میکردند حواس دستیار پرت است و به آنها توجه نمیکند و این رفتار را بیادبانه تلقی میکردند.
دکتر لیندلبائر میگوید: از دید من، این یک توصیف عجیب از یک سامانه رایانهای بود؛ اما احساس شرکتکنندگان واقعی بود.
راه حل چیست؟
یی فی چِنگ (Yi Fei Cheng)، دانشجوی دکتری دانشگاه کارنگی ملون، پیشنهاد میدهد که جلوههای صوتی را متناسب با مکالمه طراحی کنیم؛ یعنی دستیار فقط وقتی کار دیگری را انجام دهد که مزاحم صحبتش نباشد.
آینده دستیارهای صوتی
دکتر لیندلبائر معتقد است که میتوان جلوههای صوتی مستقلی از محیط طراحی کرد که بدون نیاز به دانش خاصی از فضای اطراف، همان تأثیر مثبت را بر درگیرکردن کاربر داشته باشند. جالب اینکه حتی وقتی صداها با آنچه چشم میدید هماهنگ نبود، باز هم تأثیر خود را بر کاربران گذاشت. دکتر هلر میگوید: نتایج نشان داد صداها همان تأثیر حضور یک انسان واقعی را روی افراد داشتند.
این یافتهها در کنفرانس عوامل انسانی در سامانههای محاسباتی (CHI ۲۰۲۶) در بارسلونا ارائه شده است.