آیا گوگل از آزمون تورینگ عبور کرد؟

فکر میکنم این اولین باری است که شنیدن عبارت “Um” باعث شد که احساس کنیم چیز شگفت انگیزی شنیده ام، عبارتی که در مکالمه کاملا طبیعی  یک رایانه و یک انسان واقعی شنیده شد. این راخداد یک مکالمه معمولی نبود بلکه هدف خاصی را دنبال میکرد و آن تعیین یک وقت قبلی برای یک  سالن آرایشگاه بود.

موجودیتی که این مکالمه را انجام میداد دسیار گوگل به نام Duplex بود.گوگل همچنان در حال آزمایش هوش مصنوعی صوتی خود می باشد و اتفاقی که در همایش سالانه توسعه دهندگان امسال روی داد تنها گوشی از قابلیت های آن بود، همایشی که در آن  بیش از هر سال دیگری بر روی آخرین اتفاقات حوزه هوش مصنوعی و یادگیری ماشین تاکید شده بود.

در این همایش ساندار پیچای مدیر عمل گوگل توضیح داد که چیزی که حاضرین جلسه می شنود یک تماس واقعی با یک سالن پیرایش مو است و متصدی سالن از این که با یک کامپیوتر صحب می کند آگاه نیست. او در ادامه نرم افزار Duplex را از طریق دستیار گوگل راه اندازی می نماید و از آن میخواهد تا برای صبح روز سه شنبه وقت قبلی جهت کوتاه کردن موی خود تنظیم نماید. و هوش مصنوعی ادامه کار را انجام میدهد.

Duplex   تماس گرفته و وقتی یک نفر از محل مورد نظر پاسخ تماس را داد هوش مصنوعی صوتی با این عبارت شروع به صحبت کرد:

”سلام. من برای گرفتن یک وقت قبلی کوتاهی موی زنان برای یکی از مشتریانم تماس گرفتم. آم.. یه وقت برای ۳ام می؟“

وقتی مسیول سالن از Duplex می خواهد تا چند ثانیه صبر کند. Duplex در پاسخ می گوید :

”ایمممم-همممم“

این مکالمه ادامه پیدا کرد و نماینده سالن چندین تاریخ و ساعت را اعلام کرد و هوش مصنوعی سوالات دیگری در رابطه با گزینه ها دیگر موجود مطرح کرد, و در نهایت هوش مصنوعی و کارمند سالن یک وقت ملاقات را با هم تنظیم کردند.

چیزی که شنیدم بقدری قانع کننده بود که گفتن تفاوت کارمند سالن و Duplex در حرف زدن بسیار سخت شد. این خیلی شگفت انگیز و در عین حال مبهوت کنندست. دقیقا مشابه حسی که وقتی یک مانکن فروشگاهی به شما لبخند میزنه.

این بدون شکی یکی از تحصین برانگیز ترین مکالماتی بود که از یک سیستم کامپیوتری شنیده ام و نزدیکترین نمونه ای که تست تورینگ را گذرانده که مرزی است که توسط آلن تورینگ (دانشمند کامپیوتر) در سال ۱۹۵۰ برای تشخیص هوش مصنوعی پیشنهاد داده شده است.تورینگ پیشنهاد داده بود که در سال ۲۰۰۰ کامپیوترها قادر خواهند بود حداقل ۳۰٪ از انسان ها را در تشخیص کلام بین انسان و کامپیوتر گمراه کنن.

او حق داشت. در سال ۲۰۱۴ یک ربات چت به نام Eugene Goostman توانست خود را تحت عنوان یک برنامه نویس ۱۴ در قالب یک مکالمه طولانی متنی جا بزند.تورینگ البته لزوما یک سیستم مبتنی بر صدا را مد نظر نداشت, و بنابر دلایل مشخصی در حال حاضر سیستم سخنگویی کامپیوتری توانایی کمتری در گمراه کردن انسان ها را دارند. کافیست خودتان چند دقیقه ای با یکی از دستیار صوتی به انتخاب خودتان صحبت کنید تا محدودیت هایشان را مشاهده کنید.

مکالمه انها اغلب قلنبه سلمبه به نظر آید, تلفظ هایشان عجیب است و سرعت پاسخگویی آنها مقداری کند (به ویژه اگر از نسخه ابری آنها استفاده کنید). اغلب آنهای نمی توانند بیش از دو رشته را به صورت پیاپی درک کنند و نیازمند عباراتی برای شروع کار هستند همانند “Alexa” یا “Hey Siri.”

اما درستیار گوگل در این نمایش به کمک Duplex هیچکدام از این کمبود ها را نشان نداد. بیشتر شبیه صدای دستیار خانومی بود که برای رییس خود وقت قبلی تنظیم می کند. در کنار آهنک متوازن و طبیعی در صحبت, گوگل به آن اختلالات کلامی که در قالب آواهایی هم چون آمم, مممم.. ( “ums,” “uhs,” ,“mm-hmms”) و تعلل هایی که هر انسانی در پاسخگویی دارد را نیز افزوده است. نتیجه کار یکه صدای بی نظیر انسانی است که توسط یک کامپیوتر ایجاد شده است.

تماس دوم Duplex که تحصین برانگیز تر نیز بود, صدای مردی بود که قصد رزو یک میز در رستوران را داشت. مشارکت کننده انسانی این آزمایش دقیقا متوجه درخواست Duplex نشد و به آن گفت که برای آن تعداد مشتری نیازی به رزو نیست. Duplex بدون بروز مشکلی همه این اتفاقات را بدون مشکل متوجه شد.

مدیرعامل گوگل در جریان سخنرانی اصلی خود گفت : ”بخش شگفت انگیز این مکالمات این است که این دستیار تفاوت های جزپی در مکالمات را درک میکند“ . توانایی که با بهره گیری از فناوری شبکه های عصبی و حجم بالایی از یادگیری ماشین امکانپذیر شده است.

حتی با دستاوردهایی که Duplex در گرفتن وقت قبلی یا رزو رستوران داشته است ممکن است در مکالمات انتزاعی و مفهموی تر دچار مشکل شود.در یک پست در بلاگ توسعه دهندگان Duplex یکی از مهندسات این بخش توضیح داد که آنها دایره بادگیری Duplex را به موضوع یا مشخص تری (همچون موارد نمایش داده شده] محدود کرده اند. این به توسعه دهندگان آن امکان را میدهد تا بررسی های گسترده در رابطه با موضع ها نموده . Duplex در جریان یادگیری خود از اوپراتور های با تجربه که میتوانند اشتباهات را پیدا کنند استفاده کرده و با همکاری مهندسان آن را رفع کرده است.

به صورت خلاصه می توان گفت که درست است که Duplex از پس رزرو رستوران و وقت قبلی کوتاهی مو بر آمد, ولی امکان دارد که در رزو سینما و یا مذاکرات مربوط به خرید تلویزون کابلی برای شما با مشکل مواجه شود.

با این حال, Duplex توانست دو نفر را گول بزند. من هیچ تردید و ابهامی در صحبت های آن دو نفر نشنیدم. در مکالمه سالن پیرایش هیچ نشانه ای از انجراف وجود ندارد. متصدی سالن قصد کمک به زن جوان را داشت. چه اتفاقی می افتد وقتی او از این واقعیت اگاه شود که با یک کامپیوتر صحبت کرده است؟

مشخصا, مکالمه های Duplex کوتاه بودند و هر دو آنها کمتر از ۲ دقیقه طول کشیدند که باعث میشوند در ارزیابی تورینگ در رده مکالمات کوتاه قرار بگیرند. اگر این مکالمه مقداری بیشتر توسعه پیدا میکرد قطعه شرایط دلپذیرتر و جالبتر بود.

مطمین هستم در آینده نچندان دور Duplex می توانند مکالمات طولانی تر و متنوع تر را انجام دهد و از آزمون تورینگ با موفقیت کامل عبور کند.از این پس فقط زمان مانعی است برای اینکه Duplex بتواند مکالمات پیچیده تر را انجام دهد, به طور مثال با صدای خود ما با پدر و مادرمان تماس بگیرد. در نهایت ما به زمانی خواهیم رسید که Duplex ها با یدیگر صحیت خواهند کرد و برای ما برنامه هایمان را هماهنگ می نمایند که در نهایت در تقویم گوگلمان ثبت شوند.

اما این آینده است. در حال حاضر, توانای Duplex در سطحی قرار دارد که مدرکی محسوب می شود برای پیشرفت های پیش رو در آینده هوش مصنوعی و کمک هایی که آنها به ما خواهند کرد. این قدم اول و اساسی است در راستای  پیشرفت هوش مصنوعی همانند پیشرفتی که در فیلم Her به تصویر کشیده شد, فیلمی که در آن Joaquin Phoenix عاشق یک صدا مربوط به یک دستیار هوشمند می شود.

در نهایت می توان گفت که نه Duplex هنوز از آزمایش تورینگ عبور نکرده است. ولی جالب بود اگر نظر خود آلن توریگ را در این رابطه میدونستیم.

نویسنده : Lance Ulanoff