آیا خبرنگاران چگونه مدیریت بخش کامنت را به دست هوش مصنوعی سپرده است؟
به گزارش مجله هاستفا، به نقل از زومیت؛ خبرنگاران چندی پیش با انتشار خبری خاطرنشان کرد که تأیید و رد کامنت های ثبت شده توسط کاربران را به هوش مصنوعی سپرده است. در این رابطه به گفت وگو با مدیر تیم هوش مصنوعی و محتوای خبرنگاران نشستیم تا از فرایند توسعه این سیستم مطلع شویم.
اواخر آبان ماه امسال خبرنگاران با انتشار خبری گفت که بخش اعظم مدیریت بخش کامنت ها در این فروشگاه به هوش مصنوعی سپرده شده است. برای آگاهی از کم و کیف این سیستم به گفت وگو با مدیران خبرنگاران نشستیم. در این گفت وگو، وحید پولادی، مدیر بخش محتوای خبرنگاران و نوید شهدی، مدیر بخش هوش مصنوعی، به ارائه اطلاعاتی در رابطه با این سیستم پرداختند.
امیرحسن موسوی، مدیر روابط خبرنگاران، در ابتدای گفت وگو گفت که برای توسعه این سیستم دو تیم محتوا و هوش مصنوعی درگیر بوده اند. البته به گفته موسوی، پیش از تشکیل تیم هوش مصنوعی، یکی از استارتاپ های حاضر در دیجی نکست در این فرایند شرکت داشته که در ادامه ماجرا با تشکیل تیم هوش مصنوعی خبرنگاران به مدیریت نوید شهدی، فرایند توسعه به تیم هوش مصنوعی خبرنگاران سپرده شده است.
- کامنت کاربران چه جایگاهی در ساختار محتوای خبرنگاران دارد؟
- وحید پولادی: فرایند مدیریت محتوا در خبرنگاران پس از گذشت 15 سال از تأسیس این فروشگاه اینترنتی، سومین نسل خود را پشت سر می گذارد و با توجه به افزایش تنوع کالاها، دیگر استراتژی فراوری محتوا به صورت متمرکز جوابگو نیست و از این رو کامنت کاربران برای کالاهای مختلف نقش بسیار پررنگ تری به خود گرفته است. با افزایش تنوع کالایی، فراوری محتوا باید با مشارکت کاربران و به وسیله کامنت ها انجام گردد. تغییر استراتژی محتوایی خبرنگاران باعث شد رویه ای برای تشویق کاربران به منظور کامنت گذاشتن در پیش گرفته گردد و در نتیجه تعداد کامنت های ثبت شده افزایش یافت؛ به طوری که در حال حاضر کاربران خبرنگاران به صورت روزانه میانگین بیش از 40 هزار کامنت (رکورد بیش از 60 هزار کامنت در یک روز) در این فروشگاه ثبت می نمایند. با پیاده سازی امکان ضمیمه کردن تصاویر و ویدئو در کامنت، به این نتیجه رسیدیم که مدیریت این بخش وظیفه بسیار سنگینی به تیم محتوا تحمیل می نماید؛ برای مثال تعداد کامنت ها طی یک ماه اخیر بیش از 50 درصد افزایش یافته است. اول با یک استارتاپ که در دیجی نکست فعال بود، در مورد این موضوع وارد مذاکره شدیم؛ اما پس از گذشت مدتی متوجه شدیم راه چاره این استارتاپ قابلیت پیاده سازی در سیستم خبرنگاران ندارد. هم زمان با این ها، نوید شهدی وارد خبرنگاران شد.
- توسعه سیستم هوش مصنوعی چندماه طول کشید و پیشرفت این سیستم چطور بوده است؟
- نوید شهدی: من ابتدای امسال به خبرنگاران اضافه شدم و مدیریت تیم هوش مصنوعی را بر عهده گرفتم. پس از تشکیل تیم هوش مصنوعی، ما با تیم های متعدد فعال در خبرنگاران به صحبت نشستیم تا چالش ها و گلوگاه هایی که می شد با راه چارههای مبتنی بر هوش مصنوعی حل کنیم، شناسایی کنیم. موضوع مدیریت کامنت ها از جمله چیزهایی بود که انرژی زیادی از تیم محتوا می گرفت و توسعه یک الگوریتم مبتنی بر یادگیری ماشین می توانست بار این کار را سبک تر کند.
اوایل سال جاری و پس از توافق برای پیاده سازی این سیستم، یکی دو ماه مذاکره برای معین کردن قوانین صرف کردیم و سه ماه طول کشید تا دیتای لازم جمع آوری گردد. تیم محتوا کار خود را شروع کرد؛ به طوری که تمام داده ها بالغ بر یک میلیون و هشتصدهزار کامنت با لیبل گردآوری شد. اوایل مهرماه 1399 این سیستم تأیید اتوماتیک استفاده شد.
البته پیش از توسعه سیستم جدید، یک الگوریتم دیگر استفاده می شد که فقط قادر بود درباره رد کردن کامنت ها اظهارنظر کند. البته این سیستم تنها قادر به رد کردن 2 درصد کامنت ها بوده است. قطعا افزایش تعداد کامنت ها باعث شد این سیستم عملکرد چندان مثبتی نداشته باشد؛ در حالی که درصد موففیت الگوریتم هوش مصنوعی جدید برای رد، تأیید یا شناسایی به عنوان کامنتی که باید عامل انسانی درباره آن نظر دهد، بیش از 98 درصد است.
توسعه، فرایند یادگیری ماشین و آزمون این سیستم حدود 6 ماه زمان برد و در حال حاضر 75 تا 80 درصد از کامنت های ثبت شده توسط سیستم هوش مصنوعی مدیریت می گردد.
- آیا هوش مصنوعی پیروز شده است برداشت سلیقه ای عامل انسانی در قوانین تأیید یا رد نظرات را رفع کند؟
- نوید شهدی: با توجه به برداشت سلیقه ای عوامل انسانی از قوانین معین شده برای رد یا قبول کردن کامنت ها، این موضوع با اضافه شدن ماشین و هوش مصنوعی از بین رفته است؛ البته این مشکل خیلی محدود بود و تناقض عملکرد در رد یا تأیید کامنت ها چندان پررنگ نبود.
- اغلب چه کامنت هایی منتشر نمی شوند؟
- وحید پولادی: کامنت ها به عنوان بخشی از محتوای خبرنگاران در نظر گرفته می شوند و از این رو بسیار ارزشمند هستند. اما بعضی کامنت ها ارتباطی با آن کالا ندارند و بیشتر به تشریح تجربه خرید می پردازند که از این رو منتشر نمی شوند. برای مثال به کامنت هایی در رابطه با شکایت از دیر رسیدن کالا اشاره نمود که ارتباطی با خود کالا ندارد. البته منتشر نشدن کامنت ها در مورد مسائل این چنینی به منزله نادیده گرفته شدن آن ها نیست؛ این نوع کامنت ها هرچند در صفحه فوق منتشر نمی شوند، اما پیغام کاربر در قالب یک مسأله درون سازمانی برای پیگیری به واحد های مربوط ارسال می گردد. در فاز بعدی هم کوشش بر این است تا تشخیص این کامنت ها توسط هوش مصنوعی انجام گردد.
- پردازش طبیعی زبان ها، دیتای جالبی جز تأیید و رد نظرات در اختیار قرار می دهد؛ آیا برنامه ای برای گسترش استفاده از قابلیت های هوش مصنوعی و اطلاعات استخراج شده وجود دارد؟
- نوید شهدی: تأیید یا رد کامنت ها را باید بخش کوچکی از سیستم هوش مصنوعی مرتبط با کامنت ها مطرح نمود که در دست توسعه داریم. اطلاعاتی که کاربران در قالب کامنت های برای محصولات مختلف ثبت می نمایند، در زمینه های بسیاری قابل استفاده است. برای مثال با استفاده از کامنت ثبت شده برای یک محصول، می توان نقطه قوت و ضعف محصول را استخراج کرد و همچنین توصیه برای خرید یا نخریدن محصول را بر اساس منظور کاربر از کامنت استنباط کرد. اطلاعات برگرفته از کاربران در قالب کامنت ها را که اتفاقا حجم بالایی هم دارند، می توان در انواع سناریوهای مختلف استفاده کرد که از جمله این کاربردها می توان به بخش نظرات، بخش پیشنهاد به کاربران دیگر و رتبه بندی محصولات استفاده کرد.
- وحید پولادی: استفاده از هوش مصنوعی علاوه بر اینکه بار عملیاتی کنترل کامنت ها را کم می نماید، در آینده باعث خواهد شد بتوان معنای کامنت های ثبت شده را استخراج کرد. برای مثال درباره یک گوشی هوشمند، احتمالا کامنت هایی درباره ماژول های مختلف نظیر باتری، دوربین و سایر چیزها با نقد عملکرد هر یک از این ماژول ها شامل موارد نکات مثبت و منفی ثبت شده است. هوش مصنوعی پس از تصمیم گیری درباره انتشار یا رد شدن کامنت، می تواند توصیه برای خریدن یا نخریدن محصول را بر اساس معنای هر یک از کامنت ها به صورت خلاصه به کاربران نمایش دهد. کاربرد دیگری که برای این سیستم در نظر گرفته شده، جلوگیری از انتشار کامنت های غیر واقعی است.
- قیمت بالا و وجود کالاهای غیر اصل از جمله نقدها واردشده به خبرنگاران است؛ آیا برنامه ای برای هوش مصنوعی به منظور شناسایی چنین چیزهایی دارید؟ آیا سیستم گزارش دهی کامنت ها می تواند در این باره یاری کند؟
- وحید پولادی: برای درک اینکه چطور یک کالای غیر اصل در همان ابتدا شناسایی نمی گردد، بهتر است ابتدا نگاهی به فرایند ثبت یک کالا در خبرنگاران داشته باشیم. سیستم خبرنگاران به نوعی طراحی شده است که امکان ثبت کالای مشابه در آن وجود ندارد. برای مثال در صورتی که یک ساعت اورجینال توسط یک فروشنده در حال فروش باشد، خبرنگاران اجازه نمی دهد تأمین نماینده ای دیگر این محصول را با ایجاد یک صفحه محصول جدید عرضه کند. حال فرض کنید که تأمین نماینده دوم، نسخه غیر اصل این کالا را برای فروش قرار داده است و از این رو هر دو کالا به وسیله یک صفحه محصول با تأمین نمایندگان مختلف به فروش می رسند. در این شرایط وقتی کاربری کامنتی درباره غیر اصل (فیک) بودن کالا منتشر می نماید، بلافاصله موضوع به بخش مانیتورینگ مارکت پلیس گزارش می گردد و این بخش از تأمین نماینده درخواست می نماید مدارک خود دال بر اصل بودن کالا را ارسال کند. در صورتی که تأمین نماینده قادر به اثبات ادعای خود مبنی بر اصل بودن کالا نباشد، خبرنگاران کالای این تأمین نماینده را حذف می نماید. پس استفاده از هوش مصنوعی فقط به شناسایی کامنت ها در این رابطه محدود می گردد.
- نوید شهدی: پروژه ای طولانی مدت تعریف شده است که در نظر داریم با استفاده از فاکتورهای مختلفی نظیر قیمت محصولات در بازار آفلاین، ارزش دلار و سایر پارامترهای دخیل، به برآورد قیمت کالاها بپردازیم. کامنت در مقطع فعلی نمی تواند نقش مؤثری برای محاسبه قیمت داشته باشند؛ هرچند می توان با استفاده از کامنت ها فهمید نظر کاربران در رابطه با قیمت چیست.
- با توجه به تغییر استراتژی محتوایی خبرنگاران درباره بخش کامنت، چه برنامه ای هایی برای این بخش دارید؟
- وحید پولادی: ما در نظر داریم فرایند کامنت گذاری را به سمت محتوای ویدیویی سوق دهیم و در جریان این تغییر و تحول، به کاربرانمان هم آموزش دهیم تا بتوانند ویدیوهایی باکیفیت فراوری نمایند. برای مثال کاربران می توانند برای کالاهای مختلف ویدیوی جعبه گشایی فراوری و در صفحه محصول آپلود نمایند و حتی در آینده قادر خواهند بود از این ویدیوها درآمدزایی نمایند.
منبع: دیجیکالا مگ