ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

تکنولوژی

هوش مصنوعی تازه گوگل که می تواند کلام انسان را به شیوه ای واقعی تقلید کند

این روزها تمایز کلام انسان و برنامه های تبدیل متن به صدا آنقدر هست که بشود آنها را به راحتی از یکدیگر تشخیص داد، با این همه، به لطف هوش مصنوعی تازه گوگل به نام WaveNet که ...

Maryam Mousavi
نوشته شده توسط Maryam Mousavi | ۲۱ شهریور ۱۳۹۵ | ۱۱:۰۰

این روزها تمایز کلام انسان و برنامه های تبدیل متن به صدا آنقدر هست که بشود آنها را به راحتی از یکدیگر تشخیص داد، با این همه، به لطف هوش مصنوعی تازه گوگل به نام WaveNet که اخیرا توسط تیم دیپ مایند آن توسعه یافته، ممکن است عاقبت روزی فرا برسد که تشخیص این امر برایتان دشوار شود.

همانطور که احتمالا در جریان هستید، این تیم در زمینه توسعه شبکه های عصبی برای خود اسم و رسمی دارد و چندی پیش هم با خلق AlphaGo و شکست یکی از بهترین بازیکنان بازی Go، نام خود را در سرخط خبرهای روز قرار داد.

اما در باب برنامه های تبدیل متن به کلام هم باید بگوییم که هم اکنون توسعه دهندگان از دو شیوه مختلف برای این منظور استفاده می کنند؛ در یکی، آنها مجموعه عظیمی از کلمات و اجزای زبانی به کار رونده توسط یک انسان را مورد استفاده قرار می دهند [که البته در این شیوه، دستکاری آهنگ و صداها بسیار دشوار خواهد بود] و در دیگری، واژگان بسته به اینکه قرار است چه صدایی را تولید کنند به صورت الکترونیکی شکل داده می شوند. این پروسه البته دشواری چندانی ندارد اما نتیجه کار معمولا شکلی رباتیک دارد.

حالا تیم دیپ مایند برای تولید هوش مصنوعی تقلید صدا، اشکال مربوط به امواج صوتی خام ضبط شده از متکلمان انسانی را دریافت و در اختیار شبکه عصبی خود قرار داده اند.

اشکال امواج صوتی (Waveform) نیز در اصل معرف های بصری از اشکالی هستند که صداها به خود می گیرند و حتما تا به حال روی نمایشگر برخی دستگاه های پخش موسیقی نمونه شان را دیده اید. با در نظر داشتن آنچه گفته شد، WaveNet با شکل دادن به امواج صوتی صحبت می کند.

حال اگر از این هوش مصنوعی به عنوان یک برنامه تبدیل متن به کلام استفاده شود، متنی که در داخل واج ها و هجاها تایپ می کنید را تغییر داده و سپس نتیجه را ادا می کند. گفتنی است سوژه های مشارکت کننده در این آزمایشان بر این باور بودند که نتایج به دست آمده از WaveNet نسبت به روش های دیگر شکلی انسانی تر داشته اند.

دیپ مایند هم در مطلبی که برای معرفی دستاورد تازه اش منتشر کرد اعلام نمود هوش مصنوعی آن قادر است «اختلاف میان پیشرفته ترین فناوری های ارائه شده برای این منظور و همچنین عملکرد انسانی را تا 50 درصد کاهش دهد».

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی