Регистрация
Зарегистрируйся на сайте и получи доступ к полному контенту сайта и подпискам бесплатно!

Переводим Coursera на русский язык

20
0
1 465 0
Аудио Текст
28 марта 2014

Антон Воронов, директор по инновациям ABBYY Language Services, и Юлия Лесникова, директор образовательных программ Digital October, делятся со зрителями телеканала SeoPult.TV подробностями проекта «Переводим Coursera на русский язык». Будущее уже где-то рядом!

Из передачи вы узнаете:
— что представляет собой платформа онлайн-образования Coursera;
— как сочетается метод краудсорсинга с компетенциями ABBYY Language Services;
— чем мотивируются переводчики проекта и как осуществляется их отбор;
— существует ли стандарт качества переводов и насколько в верификации участвуют эксперты или специалисты ABBYY Language Services;
— как устроена система рейтингов переводчиков и на что она влияет;
— какое количество оценок считается достаточным для релевантности рейтингов;
— используются ли в проекте такие ресурсы ABBYY Language Services, как Interpret.Me (бесплатный сервис по подбору устных переводчиков) или Perevedem.ru (профессиональный экспресс-перевод с заказом онлайн);
— какие данные для своих технических разработок в области машинного перевода может получить из проекта ABBYY Language Services;
— и многое другое.

Сергей Иванов: Здравствуйте, уважаемые телезрители! В эфире программа «Точка зрения», и в студии я, Сергей Иванов. Онлайн-образование неспроста называют восходящим трендом 2014 года. И сегодня у нас в гостях люди, которые собираются ускорить этот процесс в России в разы, если не в десятки раз. Это Антон Воронов, директор по инновациям компании ABBYY Language Serices, и Юлия Лесникова, директор образовательных программ Digital October. А поговорим мы с нашими гостями об интересном проекте, который называется «Переводим Coursera на русский язык». Ну что ж, давайте начнем.
Антон Воронов: Давайте.
С. И.: Давайте мы сначала нарисуем некий ландшафт, поймем, что такое Coursera и для чего она нужна, например, а потом будем расставлять всяческие домики, касающиеся нашего проекта. Согласны? Хорошо. Итак, давайте расскажем нашим телезрителям, что же такое Coursera. Платформа онлайн-образования или, как еще называют, провайдер массовых онлайн-образовательных услуг, правильно? Что это такое?
Ю. Л.: Смотрите, вы правильно упомянули, что это сейчас в образовании тренд. Многопользовательские онлайн-курсы, на английском смешно произносится как «мук» (mooc), похоже не корову. Дафна (Дафна Коллер, основательница Coursera. — Прим. ред.) смеется, что ей не нравится, как это звучит, но тем не менее. Да, это действительно тренд. Coursera не единственный проект, который подобным занимается. К моей большой радости, и в России стали появляться такие платформы. И в принципе, я вижу за ними большое будущее, их ждет развитие во многих направлениях. Но вообще сейчас Coursera — проект, который получил, наверное, максимум инвестиций среди себе подобных, включая инвестиции The World Bank и Юрия Мильнера на последнем раунде.
С. И.: А проект edX, который сейчас с Google партнерится активно?
Ю. Л.: Смотрите, edX — это немного другая история. Coursera — это коммерческая компания. Хотя проект и предоставляет доступ к курсам бесплатно, — любой желающий может зайти на сайт Coursera и записаться на любой из курсов, который сейчас действует, совершенно бесплатно, — Coursera пытается экспериментировать на ниве монетизации, пробуя различные модели. Если зрителям интересно, есть много материалов о том, что Coursera делает в этом направлении. Одно из них — возможность бесплатно окончившему курс заплатить 50$ и получить сертификат от Стэнфорда или Гарварда. Для кого-то это важно. Так вот, edX — немного другая история. Это университеты, которые экспериментируют с новыми технологиями, с интернетом и вообще с понятием «многопользовательские онлайн-курсы». И это некоммерческий проект. Помимо всего прочего, они открыли платформу, — по-моему, уже API есть и доступен, — для того чтобы другие образовательные организации пользовались результатами их труда. И это структура, которая развивает рынок, но там немного другая модель и другая организационная форма.
А. В.: В частности, там даже есть важное отличие в политике лицензирования.

Если в Coursera по-прежнему все права на курсы принадлежат университетам и они очень четко за этим следят, то условием участия в консорциуме, front-end которого является edX, является публикация курсов по модели Creative Commons, которая предусматривает в том числе коммерческое переиспользование материалов, например сделанных на основе данных курсов.

Там есть достаточно существенные различия, однако то, что они делают в части своего развития и распространения, достаточно похоже. Они тоже идут по всему миру, тоже переводят курсы, просто делают это по другим моделям и исходя из других побуждений, некоммерческих.
С. И.: Ну что ж, продолжаем разматывать историю сотрудничества. В марте 2013 года официальный сайт Digital October сообщил, цитирую: «Центр новых технологий и технологического предпринимательства Digital October стал официальным партнером в России крупнейшего онлайн-ресурса для дистанционного обучения Coursera.org. О партнерстве было объявлено в рамках глобального партнерского проекта по переводу курсов. Coursera выбрала десять компаний из восьми стран мира, чтобы с их помощью перевести онлайн-курсы на языки тех стран, жители которых больше всего представлены среди ее слушателей». А почему выбор Coursera пал на Digital October и были ли у вас конкуренты? Как все происходило?
Ю. Л.: Исторически так сложилось.
С. И.: Это были давние связи, еще до того? Ведь из кого-то выбирала Coursera или нет, выбора практически не было: вы и только вы?
Ю. Л.: Вы знаете, поскольку эта деятельность и для Digital October является некоммерческой и просветительской, мы просто познакомились с Дафной и поняли, что я и она одинаково смотрим на процесс получения знаний и на те возможности, которые у нас сейчас, у современных педагогов, появились с развитием технологий. И мои коллеги в Digital October, и команда Coursera, вот теперь и ABBYY уверены в том, что если каждая компания будет тратить свои силы и энергию, в том числе на развитие общества и на развитие образование, то все мы окажемся в сингулярности намного быстрее, чем можно сделать, не прилагая тех самых усилий.
С. И.: Насколько я знаю, в самом начале партнерского проекта Digital October пользовался услугами переводческого бюро iTrex, переведено было три-четыре курса, которые, в общем-то, и планировалось. И тут вы отказываетесь от услуг профессионалов и переходите на модель краудсорсинга вместе с ABBYY Language Services.
Ю. Л.: Я немного уточню. Мы перевели один курс.
С. И.: А должны были три-четыре, да?
Ю. Л.: Мы перевели один курс, и перевод поддерживал сам Digital October. Мы хотели дать некий пример и вообще поэкспериментировать, как это будет, сколько будет стоить, сколько ресурсов будет отнимать.
С. И.: Посчитали и поняли, что ваше спасение только краудсорсинг.
Ю. Л.: Вы знаете, да, действительно так, хотя мы были очень довольны сотрудничеством с компанией iTrex. Но мы поняли, что искать инвестиции на такого рода профессиональный перевод мы будем очень долго.
С. И.: А сколько, кстати, это бы стоило, если, предположим, тот объем, который вы запланировали, — и, кстати, интересно, сколько вы запланировали перевести, в какие сроки, — переводить за деньги? Это, кстати, очень впечатлит.
А. В.: Это сотни тысяч рублей на курс.
С. И.: Сотни тысяч рублей на курс?
А. В.: Там очень разные курсы.
С. И.: На количество курсов давайте теперь умножим.
Ю. Л.: Да, очень разные курсы, от четырех недель до двадцати недель. Но если брать совсем средненький курс, это было бы где-то 10$ тыс.
А. В.: Да.
С. И.: 10$ тыс. один курс, а курсов планируется перевести?..
Ю. Л.: Сейчас их больше 600 на Coursera.
С. И.: Больше 600, умножаем на 10$ тыс. и еще смотрим по времени, если это делается усилиями одной компании.
А. В.: Это на самом деле нас логично подводит к ситуации, которая в целом сложилась в отрасли переводов, и к тому, почему вообще краудсорсинг как модель становится очень сейчас интересным. Вообще, в отрасли есть несколько тенденций, которые надо отметить в связи с этим. Это, во-первых, взрывной рост контента. По некоторым оценкам, человечество сейчас удваивает количество контента, которое у него есть, в течение полутора лет или даже года.
С. И.: ...и на пути его стоит такая досадная неприятность, как языковой барьер.
А. В.: Да, естественно. Во-вторых, коммерческие организации, некоммерческие организации — вообще весь мир сильно глобализуется. Люди в странах, которые были раньше достаточно изолированными, начинают быть частью глобального процесса: общаться в социальных сетях, потреблять материалы какие-то. Соответственно, количество языков, на которых хочется работать, активно локализоваться, растет. Ну и появляются новые типы контента, которые теми же социальными сетями и новыми формами общения, новыми формами обмена информацией порождаются.
Ю. Л.: Новыми формами обучения.
А. В.: Да. А количество переводчиков так драматически не изменяется. По некоторым оценкам, это порядка миллиона человек во всем мире. И, соответственно, с таким ростом контента…
С. И.: Да и еще неравномерно распределенным по разным странам.
А. В.: Да, естественно. С таким ростом контента старыми приемами и технологиями справиться невозможно, в связи с чем в 1990-х годах появилась технология Translation Memory, сейчас очень активно растет использование машинного перевода в качестве инструментов для повышения производительности переводчиков. И краудсорсинг является одним из способов локализовать новые типы контента, больше контента, привлекать людей, которые не настолько профессиональны, встраивая их в некоторые сложные процессы. И именно поэтому краудсорсинг сейчас является трендом наравне с машинным переводом, для того чтобы решать сложности в локализации.
С. И.: Тут мы подходим как раз к интриге нашей передачи, ради которой мы собрались. Когда мы говорим о краудсорсинге, мы подразумеваем, что это большое количество в первую очередь исполнителей, но ничего не говорим о качестве исполнения. А в случае с переводом качество у нас выходит на первый план. И в данном случае у нас краудсорсинговый проект, который возглавил ABBYY Language Services. Поэтому мы понимаем, что здесь мы имеем совершенно иной путь краудсорсинга. Я не знаю, сейчас я выскажу догадку — скажу, что это краудсорсинг под руководством экспертов, курируемый экспертами, направляемый экспертами, организуемый ими и т. д. Может быть, вы меня поправите. Давайте начнем с сути самого проекта, с его механики, как он устроен. А потом я буду задавать уточняющие вопросы, потому что мне самому невероятно интересно.
А. В.: Хорошо. На самом деле краудсорсинг, если крупными штрихами описывать, состоит из трех основных компонентов. Во-первых, как вы сказали, сам crowd, то есть люди, которые готовы «контрибьютить», активно что-то переводить.
Ю. Л.: Crowd переводится как «толпа» с английского языка — для тех, кто вдруг…
С. И.: Для тех, кто не смотрел несколько наших передач, как минимум пять, посвященных краудсорсингу. Смотрите наши передачи, и вы будете отлично знать английский язык уже прямо сейчас.
А. В.: Второй компонент, который нам необходим, — это технология, которая позволяет даже маленькому вкладу, даже вкладу не совсем профессиональному встраиваться в процесс. А третий компонент — мотивация. Все, что связано с тем, чтобы люди приходили и выполняли те действия, которые необходимы для успешного развития, мотивируясь различными вещами, чаще всего некоммерческими. Это одно из основных преимуществ краудсорсинга.
Ю. Л.: Нематериальная мотивация.
А. В.: Да, и, соответственно, если говорить теперь о проекте, то тут сошлось очень много важных вещей. Это то, что мы как компания занимаемся как раз развитием технологий, которые направлены на повышение производительности переводчиков, повышение степени автоматизации переводческих процессов. В общем, мы занимаемся всем тем, что решает сложности, о которых я говорил. Однако у нас была возможность — и она уникальна для нашего рынка — действительно собрать из сложных передовых технологий очень простой инструмент, который позволяет любому волонтеру прийти и даже несколько предложений перевести, и это будет полезно. Это очень важный момент. И сейчас мы активно работаем над тем, чтобы у нас была аудитория и те люди, которые должны прийти и переводить. Мы тут сотрудничаем активно с партнерами, с Digital October прежде всего. Сейчас мы как раз активно будем заниматься привлечением тех людей, которые должны участвовать. Этому будет посвящено несколько тематических ивентов, публикаций, специальные активности в рамках проектов группы компаний ABBYY. Это такие проекты, как например «Кубок Lingvo».
Ю. Л.: Потрясающая история.
А. В.: Да, шесть лет оно происходило, и в 2014 году оно будет посвящено переводу Coursera. Это возможность для десятков тысяч студентов, по опыту прошлых лет, прийти и посоревноваться, кто лучше всех переводит. И в нынешнем году это будет сделано на этой платформе. И сейчас студентам можно активно регистрироваться и участвовать.
С. И.: Бета-версия сайта была запущена еще в ноябре прошлого года, и тогда безвозмездно там трудилось 450 энтузиастов. Что-то изменилось с тех пор и какое количество переводчиков-энтузиастов планируется использовать в проекте? Сколько может выдержать система? Где предел и устойчивости, и избегания саморазрушения?
А. В.: Будем надеяться, что не система станет узким местом.
С. И.: А вдруг миллион придет?
А. В.: Да, должны справиться. Всего мы планируем оповестить на начальных этапах проекта порядка, по оптимистичным оценкам, миллиона человек.
С. И..: Как я угадал, миллион.
А. В.: В зависимости от того, как получится стартовать.
С. И.: Все равно нужно рассчитывать на то, что оно доберется до 100%.
А. В.: До 100%?
С. И.: Конечно, конечно.
А. В.: В зависимости от того, как мы сможем это сконвертировать, мы рассчитываем, что активно придет участвовать в проекте несколько десятков тысяч человек. Те, кто придет, зарегистрируется в системе, туда что-то добавит, проголосует. Это то, что касается количества. Сейчас там уже ближе к 700. Мы постепенно расширяем круг тех, кому доступна закрытая бета. Мы приглашаем людей. Тем, кто регистрируется, мы через некоторое время даем доступ. И сейчас после официального анонса это становится доступно всем желающим. Что касается количества курсов, то мы планируем в 2014 году, по различным оценкам, перевести порядка 20-30 курсов.
С. И.: А как планируется мотивировать — как правильно назвать? — участников проекта, краудсорсеров, энтузиастов?
Ю. Л.: Волонтеров.
С. И.: Волонтеров, да.
А. В.: На самом деле мотивация участников — это, конечно, один из самых важных аспектов. Разные люди мотивируются по-разному, но в целом мы считаем, что есть пять-шесть основных мотиваторов, которые тут могут быть рассмотрены. Во-первых, это возможность поучаствовать в активности, которая настолько позитивна, которая делает доступным…
Ю. Л.: Но Coursera любят в России, да?
А. В.: Да.
Ю. Л.: И это потрясающе, что наши соотечественники…

Знаете, я горжусь чем? Есть такое понятие, как Retention Rate. Это процентное отношение количества тех людей, кто дошел до конца, к количеству записавшихся на курс. Вообще, сейчас этот процент не очень большой — 4–6%. У русских он один из самых больших. Наши ребята в 20%-м составе доходят до конца.

И, в принципе, Digital October в том числе — но это тема отдельной передачи — делает тоже очень многое для того, чтобы повышать это соотношение.
С. И.: Но еще какие-то вещи, ачивки какие-то?
А. В.: Конечно, конечно. Второй момент — это экспертиза. Как раз то, что связано с геймификацией. Люди не только переводят, они еще и в рамках процесса, который направлен как раз на то, чтобы там отстраивалось определенное качество того, что мы переводим, голосуют за варианты других пользователей. Таким образом, они накапливают себе рейтинг, достигают некоторых достижений в проекте: первый, кто перевел курс, первый, кто достиг определенного объема, первый, кто перевел все лекции курса.
С. И.: Создаются репутационные составляющие. Человеку, переведшему десять курсов для Coursera с наивысшим рейтингом, открыты все дороги.
А. В.: Да, человек может сравнивать себя с друзьями, с другими участниками сообщества, поучаствовать в специальных мероприятиях типа соревнований по переводу. Это некоторая жизнь сообщества, которую мы тоже хотим всячески активировать.
С. И.: Организационный момент: а как вы выбираете переводчиков? Я понимаю, как сама система проекта отбирает переводчиков, но есть какие-то критерии, есть фильтр какой-то? Как это все устроено?
А. В.: Нет, фильтров никаких нет.
С. И.: Фильтров нет. Может прийти человек с ненулевым, однопроцентным знанием английского языка — и как он выбывает? Понятно, что он некомпетентен.
А. В.: Он не выбывает, он вкладывает свою часть в проект. На самом деле одним из интересных моментов является то, что человек может, если он пришел все-таки с некоторым знанием языка, его там совершенствовать. Работая с переводом, он будет так или иначе прогрессировать. Он участвует в жизни сообщества, он смотрит на комментарии, на наилучшие варианты, потихонечку прогрессирует. В целом это одна из важных составляющих краудсорсинга — учитывать вклад и энергию каждого.
Ю. Л.: Человек, который перевел предложение, сразу видит, как отреагировали остальные участники сообщества, возможно имеющие другой уровень знания языка.
С. И.: Больший опыт.
Ю. Л.: Да. И человек видит, что, например, его перевод пока не дотягивает. И в то же самое время он может посмотреть на варианты своих коллег, других ребят, которые перевели чуть лучше, и сравнить свой вариант с тем, которые платформа выбрала как идеал.
А. В.: Наконец, он может «пошарить» информацию в социальных сетях и пригласить своих друзей. Любой вклад важен.
С. И.: Давайте как раз рассмотрим конфликтную ситуацию — противоречие между человеческим фактором и собственно организацией процесса. Итак, я, пятиклассник или человек с уровнем знаний английского языка на уровне пятого или шестого класса средней школы, пришел и перевел совершенно безобразно целый абзац курсов. Я, соответственно, вижу замечания моих коллег, но, предположим, я не намерен исправлять. Как происходит? Мы же видим, что кусок некачественный.
А. В.: По поводу процесса несколько слов. Процесс и качество, определяемое процессом, — это не только про краудсорсинг, это вообще свойственно переводу. Даже в профессиональном переводе есть несколько этапов. Классический процесс включает в себя перевод, редактуру и корректуру.
С. И.: Совершенно верно, да.
А. В.: Соответственно, здесь есть некая аналогия. И то, что будет финальным результатом, определяется тем процессом, который мы выстраиваем. В данный момент у нас есть трехступенчатый процесс. Первое — это непосредственно перевод. Второе — это голосование, когда люди выбирают варианты среди тех, которые предложены, и определяют определенные варианты по мнению сообщества.
С. И.: Это голосование идет с какой-то периодичностью или нон-стоп?
А. В.: Оно идет непрерывно. Люди частично переводят, частично голосуют. И вклад в перевод и в то, чтобы отбирать, что совсем плохо, а что может претендовать на финальную версию. И третьим этапом является процесс — так называемый review, когда некоторый профессиональный редактор или человек, разбирающийся хорошо в тематике… Это сильно зависит от курса: где-то язык достаточно общий, где-то надо понимать именно, про что курс. В общем, он проходит, и из трех лучших вариантов действительно выбирается один, который идет в финальную версию курса, плюс он может внести еще какие-то правки, если все-таки из трех вариантов он не может с ходу выбрать один.
С. И.: А редактор выбирает в случае трех вариантов? А если один вариант, предположим, безоговорочно, редактор приходит в таком случае?
А. В.: Если нет вариантов других?
С. И.: Да.
А. В.: Он приходит, конечно.
С. И.: Получается, что при очень большом массиве волонтеров есть некое узкое место в виде профессионального редактора, ведь на него ложится гигантский объем?
А. В.: Нет, как раз суть процесса в том, чтобы на него не ложился гигантский объем.
С. И.: Ведь он должен весь курс прочесть и посмотреть?
А. В.: Да, весь курс ему, конечно же, нужно пройти, но это не такой гигантский объем, как посмотреть все варианты. 10-15 вариантов перевода сегмента может сгенерировать сообщество. Три из них оно отберет самостоятельно, а вот финальный редактор отсмотрит только эти три варианта и выберет из них действительно лучший. Действительно можно сказать, что это достаточно узкое место, но оно, конечно же, необходимо, чтобы финальное качество было действительно… Особенно в сложных курсах это очень важно.
С. И.: Еще в проекте, насколько я знаю, есть система рейтинга переводчиков, которые могут повышаться, понижаться в зависимости от голосования пользователей. Как оно устроено?
А. В.: Это многофакторная система. Она учитывает количество добавленных переводов, голоса за другие сегменты, количество вариантов, количество сегментов, которые попали в финальное review. Имеются в виду варианты, которые были сначала отобраны…
С. И.: …редактором последним, да?
А. В.: …сначала сообществом, попали в число трех лучших, а потом финальным редактором, попав в окончательную версию курса. Это не окончательно зафиксированная формула. Мы с ней, конечно, активно экспериментируем и настраиваем ее непрерывно. Она содержит порядка пять-шесть факторов.
С. И.: У меня возник вопрос: если у человека очень хороший рейтинг, но на самом деле за него проголосовало три человека, это, в общем, не совсем отражающее действительность голосование???А. В.: Конечно, конечно. И веса людей с различным рейтингом, когда они участвуют в голосовании, тоже должны давать разные…
С. И.: Авторитетность голоса оценщика тоже учитывается, да?
А. В.: Обязательно.
С. И.: То есть десять начинающих проголосовали за, а, предположим, опытный рейтинговый переводчик против, его голос может перевесить?
А. В.: Да, это не совсем одно и то же, конечно.
С. И.: Ага.
А. В.: Еще раз, качество, как в любой переводческой истории, — это процесс. И, конечно, этот процесс мы, прежде всего, контролируем, настраиваем, непрерывно следим за ним. Это как раз то, что позволит получить на выходе то, что нужно, а не вклад тех, кто совсем уж плохо знает английский язык.
С. И.: А кто отбирает непосредственно курсы, которые именно сейчас идут для перевода? Тематика медицинская, биологическая, какая угодно, геймификация бизнеса и т. д.?
А. В.: Здесь на самом деле два аспекта. Первый связан с готовностью самих курсов.

Coursera публикует курсы, они постоянно изменяются. Люди учатся по курсам, потом преподаватели их закрывают, переделывают. В общем, это сложный процесс, и они сами нам рекомендовали порядка 30-50 курсов, которые находятся в достаточно стабильном состоянии и которые можно в ближайшее время перевести, и мы не столкнемся с ситуацией, что через месяц половина курса будет изменена и снова потребуется перевод.

Это то, что касается готовности.
Ю. Л.: Мы, наверное, не привязываемся здесь к тематике, потому что наша задача — не перевести курсы определенной области. Потому что есть у нас сейчас, например, и такие проекты в зародыше, когда определенная организация приходит и говорит, что ей было бы интересно поддержать перевод курсов, который относится к ее тематике, к профилю, к нише, которую развивает та или иная компания. В таком случае, да, мы можем как-то отбирать и уже действовать соответствующе. Здесь наша задача — перевести всю Coursera.
А. В.: Скромно.
С. И.: Мы не ставим перед собой маленьких целей, да?
Ю. Л.: Поэтому да, сейчас мы действуем в каких-то…
А. В.: Сейчас на первом этапе приходится смотреть на готовность курсов, на то, насколько они будут изменяться. В будущем мы планируем, что это будет более тесная интеграция. Мы сейчас с Coursera в этом направлении активно работаем.
Ю. Л.: Да, это очень важная деталь.
А. В.: Как только какое-то изменение в курсе происходит…
С. И.: То есть можно заменить какой-то участок, какой-то кусочек?
А. В.: Да, да. Это в любом случае постоянно происходит, преподаватели всегда меняют курсы. Мы сейчас простраиваем такую технологическую связь, чтобы, как только изменения там происходят, это сразу же попадало в систему перевода, курс снова открывался на платформе, был доступен тем людям, которые готовы участвовать в его переводе, и проходил все наши стадии, и потом так же автоматически возвращался на платформу. Если эти задачи пытаться делать вручную, это реально самое узкое место.
С. И.: А как раз эту интеграцию технически обеспечивает ABBYY Language Services?
А. В.: Да, это как раз одна из основных…
С. И.: И насколько я видел, там же все переводы сейчас сдаются в расширении .srt, то есть это сразу идет готовыми субтитрами к видеокурсам, правильно я понимаю?
А. В.: Да, конечно.
С. И.: Для пользователя, даже неподготовленного, сложностей нет: он набивает что-то в окошке, а все конвертится сразу в .srt?
А. В.: Да, это как раз то, про что я говорил. Мало того, система еще и показывает ему тут же это в контексте. На платформе есть возможность около каждого сегмента нажать кнопочку Play, и посмотреть, как тот с исходными субтитрами выглядит, и тут же посмотреть, как он выглядит с тем вариантом, который ты набиваешь просто в текстовом окошечке.
С. И.: Мой перевод из-за большей длины русских слов может же не попасть?..
А. В.: Может.
С. И.: Есть коррекция?
А. В.: Я просто настолько в подробности не углублялся.
С. И.: Это уже курсеровские технологии?
А. В.: Нет, они тоже наши. Мы там вставляем теги, которые управляют переносом субтитров на следующий кадр. Это все тоже может двигать либо пользователь, либо финальный ревьюер.
Ю. Л.: Роботы помогают здесь.
А. В.: Роботы, конечно, всячески помогают. Но в целом и общем мы делаем механизмы, чтобы все это было управляемым, доступным прямо в контексте. Это все направлено на то, чтобы снижать барьер, чтобы кто угодно мог поучаствовать и действительно чтобы было понятно, что человек делает, и любой вклад вносился в общее дело.
Ю. Л.: А вообще на самом деле платформа очень удобная, потому что я в силу профессионального интереса смотрела разные платформы. И, я помню, Coursera она очень понравилась тоже. Действительно все интуитивно понятно, вы сами сможете убедиться, зайдя туда.
С. И.: Я даже хочу поучаствовать прямо, если честно.
А. В.: Обязательно. Нам важен вклад каждого.
С. И.: Замечательно. Вот такой вопрос: я-то хочу поучаствовать, но я действительно не профессионал в этой сфере. А используются ли как-то в проекте собственные ресурсы ABBYY Language Services, такие как Interpret.Me или Perevedem.ru? Они же поставщики профессиональных кадров.
А. В.: Да. Конечно, используются, но в основном как раз в режиме закрытого бета-тестирования, то есть мы переводчиков оповещали. Профессиональные переводчики — это отдельная история, и она с краудсорсингом иногда не очень хорошо взаимодействует.
С. И.: В любом случае большая база переводчиков, чем у вас, не знаю, мало у кого, наверное, есть. Некий костяк проекта.
А. В.: Это да. Но, конечно, основное участие в краудсорсинге должны принимать не профессиональные переводчики как раз — это очень важно, — а как раз сообщество, которое знает язык и готово в процессе участвовать и делать большое доброе дело.
Ю. Л.: Для кого это не является основной деятельностью, наверное. И мне еще кажется, очень важный момент, почему я всячески поддерживаю и считаю просто потрясающей инициативой «Кубок Lingvo»... В прошлом году ребята «Войну и мир» переводили. А в этом году, как Антон сказал, материалы кубка будут основываться на Coursera.
А. В.: Даже не «Войну и мир», там были тестовые задания. Некоторая проблема с этими заданиями была в том, что они после перевода никак нигде не использовались. В нынешнем году мы вносим в процесс очень много смысла, и ребята будут не только соревноваться в переводе контента, они еще и будут попутно делать то, что будет способствовать развитию образования, их труд не будет пропадать даром. Это будет гораздо более важная, интересная и красивая история.
Ю. Л.: Да, это здорово! И причем знаешь, Антон, мне кажется, очень важно то, что «Кубком Lingvo» можно дать очень хороший задел факультетам иностранных языков романо-германской филологии по всем вузам нашей страны, чтобы использовать… И я всячески буду этому содействовать. Надеюсь, ты присоединишься.
С. И.: Смотрите, уважаемые телезрители, у нас сейчас идет рождение нового проекта — сотрудничества Digital October и ABBYY Language Services. Не упустите!
Ю. Л.: Так вот, чтобы мы могли мотивировать педагогов использовать эту платформу и интегрировать такого рода переводы в образовательный процесс. Это же здорово!
А. В.: Я тебя поддерживаю и надеюсь, что я не испорчу интригу, если расскажу, что мы в РГГУ эту историю уже пилотировали в прошедшем семестре. И ребята прослушали наш курс по современным технологиям перевода, а практическую часть они выполняли прямо на платформе в режиме закрытого бета-тестирования «Переводим Coursera».
С. И.: Занавес, немая сцена! Давайте продолжим. У нас еще осталось буквально два вопроса. Конечно, мы не можем никак обойти финансовую сторону, точнее, скорее даже бизнес-сторону процесса. Я, наверное, догадываюсь, зачем проект нужен Digital October и Юле, потому что она известна на этой ниве. Но зачем проект нужен ABBYY Language Services? Правильно ли я догадываюсь, что материалы проекта могут служить в том числе для совершенствования инструментов самого ABBYY, например базы Translation Memory для SmartCAT?
А. В.: Я бы не сказал, что именно мы смотрим…
С. И.: Но не можете вы просто так все делать, правильно?
А. В.: Конечно, конечно, я расскажу. Но именно в плане получения каких-то высококачественных лингвистических активов скорее мы это не рассматриваем. У нас реально есть две основные мотивации. Самая большая — участие в действительно важной истории, которая позволяет принести профессиональные технологии перевода людям, готовым способствовать развитию образования, переводу курсов… Это нам кажется очень важным, правда. Это один из очень важных шоу-кейсов для наших технологий. И кроме того, что это шоу-кейс, мы можем их протестировать в том числе на нагрузке на конфигурируемость под разные сложные процессы. Для нас это определенный технологический челлендж, и нам это очень нравится. Ну а во-вторых, более прагматическая цель — это, конечно, некоторый маркетинг и пиар наших технологий как основы для таких достаточно сложных продуктов, что, естественно, способствует их последующим успешным бизнес-показателям, стартам в разных странах и т. д.
С. И.: Ну что ж, я надеюсь, что проект действительно даст хороший импульс развитию переводческих технологий ABBYY, ну и, может быть, всему миру, другим компаниям. Вскоре на платформе онлайн-образования Coursera, где до недавнего времени в общем доступе были представлены курсы зарубежных университетов, появятся программы МФТИ, Высшей школы экономики и Санкт-Петербургского университета. Получив образование, можно будет получить сертификат — тот самый, за 50$. А у меня сразу возникает вопрос: а нет ли у вас здесь, прямо сейчас, а может быть, чуть раньше планов по обратному переводу наших отечественных курсов на иностранные языки?
А. В.: Есть.
С. И.: То есть проект еще имеет обратную сторону?
А. В.: Это не совсем составляющая проекта. Я думаю, что многие из наших зрителей слышали про историю с тем, что сейчас топовые российские вузы, в том числе и на государственном уровне, замотивированы на попадание в мировые рейтинги университетов, в том числе на это выделяется некоторое финансирование. И есть активности, есть запросы со стороны вузов, которые, видя, что мы совместно с Digital October делаем, интересуются вопросом сейчас. Потому что экспорт образования этих вузов тоже существенно влияет на их позиции в рейтинге. Но это пока совсем предварительная история. Мы сейчас общаемся с некоторыми площадками и вузами, но пока еще практически не о чем рассказать. Однако процесс идет.
С. И.: Да, Антон, я ожидал какого-то такого смущенного молчания, полузадумчивого. А у вас опять все есть. Причем у меня такое ощущение, что сегодня не только наши зрители и я, а, по-моему, все получили много новой информации. Я думаю, если мы еще продолжим передачу на час или два, на каждый мой вопрос будет что-то готовое от ABBYY Language Services. Но это, наверное, шутка. Большое вам спасибо за очень интересный рассказ! Я лично очень ждал этой передачи, потому что мне проект очень интересен. Я считаю, за ним большое будущее. Я надеюсь, нашим телезрителям тоже было интересно и многие из них примут участие даже с минимальным знанием английского языка, получив сразу и тренинг. Заодно, может быть, сразу какой-то курс выучат, сразу Стэнфордский университет окончат. Спасибо вам болшое!
А. В.: Спасибо вам!
Ю. Л.: Спасибо!
С. И.: На этом я прощаюсь с вами, уважаемые телезрители! Это была программа «Точка зрения». Участвуйте в наших передачах, задавайте вопросы, предлагайте темы. Всего вам доброго, пока!

Развернуть текстовую версию
Комментарии
Похожие видео
Еще видео