گوگل - آی تی دان

پیشرفت هوش مصنوعی گوگل در توصیف تصاویر

در این زمان که پیشرفت تکنولوژی به سرعت در حال وقوع هست ، توسعه دهندگان نرم افزار و هوش مصنوعی جایگاه خاصی پیدا کردند . در عوض برخی هم دیگر نیز بیکار می شوند زیرا کارهای آن ها را ماشین ها با هوش مصنوعی که دارند انجام می هند . حال گوگل الگوریتم خود با نام « Show and Tell » برای توسعه دهندگان عرضه کرده است ؛ این الگوریتم را می توان برای شناسایی سوژه های موجود در عکس ها با ۹۳.۹ درصد دقت آموزش داد . این میزان دقت و حساسیت به نسبت دو سال قبل پیشرفت بزرگی محسوب می شود. این الگوریتم در آن زمان قادر بود با دقت ۸۹.۶ درصد عکس ها را طبقه بندی کند .

از توصیف تصاویر در کارهای مختلفی می توان بهره برد از جمله در کمک به تاریخ نویسان یا افراد نابینا و کم بینا یا محققان هوش مصنوعی بهره برد . کد متن باز ریلیز شده ی گوگل از مدل نسل سوم « Inception » و سامانه ی بصری تازه ای بهره می برد که در تشخیص سوژه های جداگانه در یک تصویر عملکرد بهتری دارد. محققان ، این الگوریتم را با هدف بالا بردن دقت، بهینه سازی نیز کرده اند .

در تصویر زیر نمونه ای از عنوان گذاری توسط این الگوریم گوگل را مشاهده می کنید :

هوش مصنوعی گوگل در توصیف تصاویر - آی تی دان

این الگوریم گوگل پس از آموزش دیدن به وسیله عنوان هایی که انسان برای تصاویر نوشته است ، توانسته به شرح تصاویری بپردازد که قبلا مشاهده نکرده است . محققان این الگوریتم در این خصوص اعلام کردند : « جالب اینجاست که مدل ما می تواند در مواجهه با تصاویر کاملاً جدید، توانایی تولید عنوان « کپشن » هایی دقیق و تازه برای آن ها را در خود پدید بیاورد . این موضوع نشان دهنده ی درک عمیق تری از سوژه ها و بافت تصاویر است . »

هوش مصنوعی گوگل در توصیف تصاویر - آی تی دان

برای مثال از عملکرد این الگوریتم به گفته محققان در مورد یادگیری و تولید عنوان جدید، سامانه ی توصیف تصویر گوگل با استفاده از چندین عکس با سوژه ی سگ ها و ساحل ، قادر بوده عنوان جدید و  تازه ای برای یک تصویر مشابه اما اندکی متفاوت ایجاد کند .

شرکت گوگل کد های منبع این الگوریتم را بر روی سامانه TensorFlow خود در گیت هاب « github » در اختیار تمام علاقمندان قرار داده است. البته برای استفاده از آن باید خودتان این الگوریتم را آموزشش بدهید؛ فرایندی که با فرض بهره مندی از یک پردازنده ی گرافیکی NVIDIA Tesla، می تواند چند هفته طول بکشد.

حال به تازگی گوگل دو منبع بزرگ برای یادگیری ارائه کرده است . برای آگاه شدن بیشتر به خبر « google دو منبع عکس و ویدیو را برای یادگیری ماشینی معرفی کرد » در سایت رجوع کرده و مطالعه نمایید .

نظر شما در مورد این الگوریتم و آینده اش چیست ؟ ایده هایی که با استفاده از این الگوریتم می توان انجام داد را با سایت آی تی دان در میان بگذارید .