وقتی یکی از زیر پروژه های جویشگر بومی، گوگل را پشت سر گذاشت؛
گوگل ترنسلیت را فراموش کنید / ترجمه متون را به «ترگمان» بسپارید
هم بنیانگذار ترگمان با اشاره به اینکه تعداد کلمات ترجمه شده در آذرماه به بیش از 45 میلیون کلمه در روز رسید، گفت: ترگمان در حوزه ادبیات، عملکرد بهتری نسبت به گوگل دارد و درقسمت محاوره قابل مقایسه با گوگل نیست و در حوزه خبری نیز برخی قسمت‌های ترگمان عملکرد بهتری از گوگل دارد.
سید محمد محمدزاده ضیابری رییس هیات‌مدیره شرکت پردازش هوشمند ترگمان در گفت وگو با خبرنگار مرکز روابط عمومی و اطلاع رسانی وزارت ارتباطات و فناوری درباره چگونگی راه اندازی ترگمان گفت: برای توسعه موتور ترجمه درسال 89 از سوی پژوهشگاه ارتباطات و فناوری اطلاعات فراخوانی داده شد و ما از طرف دانشگاه امیرکبیر پروپوزالی را به عنوان موتور ترجمه آماری که در آن زمان ترجمه آماری به عنوان سرویس برتر بود، ارایه کردیم و پس از بررسی، طرح مورد قبول واقع و قرارداد منعقد شد که در ابتدا فقط ترجمه از انگلیسی به فارسی بود که بعد از 6 ماه ترجمه فارسی به انگلیسی نیز به پیشنهاد ما و بدون اختصاص بودجه مجزا راه اندازی شد.
وی با اشاره به افتتاح مدل صنعتی موتورترجمه در سال 94، افزود: در آن زمان استقبال خوبی از این طرح صورت گرفت به طوری که عملکرد آن در حوزه ادبیات 65درصد و در حوزه خبر 20درصد بهتر از گوگل ارزیابی شده بود که در راستای پروژه طرح جویشگر بومی در مردادماه سال گذشته، نخستین موتور ترجمه، انگلیسی به فارسی برپایه فناوری نرونی در سطح دنیا بنام «ترگمان» را به وجود آوردیم و در اختیار مردم قرار دادیم.
محمدزاده درباره معنی کلمه ترگمان توضیح داد: ترگمان معادل فارسی کلمه ترجمان است و اصل کلمه ترگمان در فارسی باستان آمده است که در عربی «گ» به «ج» و به ترجمه تبدیل شده است که در لغت نامه دهخدا نیز ترگمان به معنی ترجمه ذکر شده است.
هم‌بنیانگذار ترگمان درباره شاخص‌های بررسی این موتور ترجمه بومی اظهار کرد: در حال حاضر شاخص ها، مورد مناقشه هستند چراکه پس از ظهور ترجمه نورونی، شاخص ها با سیستم پیشرفت نکردند. چراکه نمی توان ارزیابی درستی را از طریق آنها نشان داد. بنابراین ما علاوه بر معیار‌های علمی پذیرفته شده از نظرسنجی کاربران برای ارزیابی نقاط ضعف و قوت خود استفاده کردیم.
 
ترجمه روزانه 16 میلیون کلمه
محمدزاده به معرفی «ترگمان» توسط وزیر ارتباطات در توییتر اشاره کرد و ادامه داد: در فرودین 97 و درست پس از معرفی وزیر ارتباطات، تعداد کلمات ترجمه شده ترگمان از 6 به 12میلیون کلمه در روز رسید و این میزان در اواخر اردیبهشت ماه به 20 میلیون کلمه در روز و در آذرماه تا ۴۵ میلیون‌کلمه در روز افزایش یافت. البته این روزها که فصل ترجمه کم رونق‌تر است، روزانه حدود ۲۰ میلیون کلمه در ترگمان ترجمه می شود.
وی با بیان اینکه در سال 2018، تعداد کلمات ترجمه شده در ترگمان از 4.8میلیارد کلمه فراتر رفت، افزود: امیدواریم با ارتقای کیفیت و کارایی سامانه برای سال 2019 بتوانیم رکورد 10 میلیارد کلمه را بدست بیاوریم.
این متخصص حوزه هوش مصنوعی با اعلام اینکه ترگمان روزانه حدود 6 هزار کاربر دارد و سایر سرویس های ترگمان نیز بین چهار تا پنج هزار کاربر به خود اختصاص می دهند، اظهار کرد: ترگمان درقسمت محاوره قابل مقایسه با گوگل نیست و در حوزه خبری نیز برخی قسمت‌های ترگمان عملکرد بهتری از گوگل دارند. ضمن اینکه در حوزه ادبیات، ترگمان عملکرد بهتری نسبت به گوگل دارد.
بنیانگذار ترگمان درباره نحوه تامین هزینه‌های این موتور ترجمه خاطرنشان کرد: ترگمان یک پروژه حمایتی از سوی دولت به شمار می رود که نسبت به سایر نرم افزارها از هزینه کمتری برخوردار بوده به طوری که از سال 89 تاکنون فقط 1.5 میلیارد تومان در این زمینه هزینه شده که 200 میلیون تومان آن از سرمایه گذاری شخصی و بدون کمک دولت پرداخت شده است. در حالیکه موتور ترجمه اروپا در سال 2010 حدود 20 میلیون یورو سرمایه را به خود اختصاص داد. 
وی با بیان اینکه ترگمان موتور ترجمه کم هزینه ایست، ادامه داد: با توجه به اینکه ترگمان تا سال 94 در دانشگاه امیرکبیر و با ظرفیت دانشجویان اداره می شد، بنابراین به سرمایه زیادی برای فعالیت نیاز نداشت. به طوری که نخستین قرارداد برای ترگمان 260میلیون تومان برای یک سال بود که از این مبلغ 50 میلیون تومان به تولید دادگان تخصیص داده شد که اکنون این دادگان در اختیار عموم قرار گرفته است.
 
ارتقای ترگمان به ترجمه 20 زبان
وی با اشاره به انعقاد تفاهم نامه یک ساله با یک شرکت اروپایی برای ارتقای موتور ترجمه تصریح کرد: در سال 96 زمانی که ترگمان را به فناوری نرونی ارتقا دادیم از این کار استقبال شد و کاربران درخواست کردند تا زبان های دیگری نیز برای ترجمه استفاده کنیم اما اجرای آن هزینه زیادی را می طلبید. بنابراین پس از چهار ماه مذاکره با یک شرکت اروپایی که جزء 10 شرکت برتر دنیا در حوزه ترجمه ماشینی است تفاهم نامه ای را امضا کردیم تا در حوزه 20 زبان دیگر نیز فعالیت داشته باشیم.
محمدزاده با بیان اینکه مطابق این تفاهم‌نامه، زیرساخت ترجمه دو طرفه  انگلیسی - فارسی را در اختیار شرکت روسی PROMT قرار دادیم و آنها نیز زیرساخت های ترجمه انگلیسی به 20 زبان دنیا را برای ما فراهم کردند، اظهار کرد: همچنین طی تفاهمنامه دیگری، زبان ژاپنی را نیز به ترگمان اضافه کردیم و در تلاش هستیم تا محصولات مشترک با این کشورها را توسعه دهیم و دستیار مترجم و ترجمه رومیزی را داشته باشیم.
بنیانگذار ترگمان تصریح کرد: در حال حاضر ترگمان 9زبان را پوشش می دهد اما از نظر ارزیابی ها، شش زبان قابلیت رقابت با سایر مترجم ها را دارد که بتواند به کاربران ایرانی سرویس دهد.
 
مخزن 25 میلیون کلمه ای
وی همچنین درباره دادگان تولید شده که هم اینک در دسترس عمومی قرار گرفته، توضیح داد: برای آموزش ترگمان حدود ۱۳۰ میلیون کلمه‌متن ترجمه‌شده مورد استفاده قرار گرفته که از این میزان حدود ۲۵ میلیون کلمه آن با هزینه دولت و الباقی با هزینه شرکت تهیه شده است. به منظور تسهیل تحقیقات و حمایت از پژوهش‌ها مجموع ۲۵ میلیون کلمه از دادگان مورد استفاده در ترگمان  از طریق سایت parsigan.ir در دسترس عموم قرار گرفته و محققان و شرکت‌ها به راحتی دسترسی دارند.
بنابر این گزارش، محمدجواد آذری جهرمی وزیر ارتباطات و فناوری اطلاعات چندی پیش و در نهمین سمپوزیوم بین المللی مخابرات با اشاره به یکی از دستاوردهای متخصصان ایرانی گفت: «ترگمان» به عنوان یک محصول، کار متخصصان ایرانیست که اخیرا با ارتقای آن و توافقات با کشورهای دیگر توانسته به زبان های روسی و ژاپنی نیز کار ترجمه را انجام دهد که بی تردید امروز قدرت ترگمان در ترجمه زبان فارسی از گوگل بیشتر است.
وی همچنین در جریان معرفی اعضای جدید هیات امنای پژوهشگاه ارتباطات و فناوری اطلاعات با بیان اینکه ترگمان نسبت به ابتدای سال رشد ۱۶ برابری داشته است، اظهار کرد: «ترگمان» با روس ها، ژاپنی ها و گروه های عرب زبان به توافق رسیده است و اکنون نیز ۸ زبان به فارسی و بر عکس ترجمه می کند.
آذری جهرمی با اشاره به اینکه «ترگمان» تلاش می کند تا با زبانهای دیگر نیز ارتباط را برقرار کند، تصریح کرد: اعضای حاضر در «ترگمان» به سراغ استارتاپ ها در کشورهای دیگر رفتند و یک حرکت نرم اما پرشتاب را آغاز کرده‌اند و این جز کارهای خوب در پژوهشگاه محسوب می شود.
منبع