Обалдевший
Поэтому я против внедрения ИИ в переводческую деятельность.
Я бы на этот счёт сильно не переживал пока что, особенно если речь не о переводе с английского. Сейчас все наиболее применяемые системы построены по принципу чёрного ящика (т.е., по сути, наугад, статистическими методами с учётом некоторых контекстуальных маркеров), а осмысление структуры человеческих языков, даже хорошо изученных, в качестве glass-box - задача, окончательно не решенная пока даже теоретически. Ну то есть можно сделать систему, которая будет выдавать вменяемый по смыслу перевод, особенно если сильно ограничить область её применения и построить для неё хорошую онтологию, но редактура эксперта будет требоваться ещё очень долго (если, конечно, нужен какой-то фиксированный результат перевода, а не просто понимание человеком общей сути - с этим уже и гугл транслейт неплохо справляется).
ivanov
Не совсем так... робот неплохо переводит тексты с четкой, формализованной структурой предложений. Чуть где порядок слов непривычный или синоним необщепринятый - все, приплыли.
Совершенно верно. Это как раз прямое следствие применения статистических подходов - тот же "необщепринятый" синоним системе в обучающем корпусе скорее всего тупо ни разу не попадётся. С порядком слов вообще всё грустно, поскольку вся современная теория языка, лежащая в основе синтаксических анализаторов, изначально англоцентрична. В английском порядок слов (а следовательно и синтаксическая структура предложения) достаточно жёстко фиксирован, а вот для языков типа русского бинарные синтаксические деревья уже далеко не всегда легко строятся, да и неоднозначность возникает куда чаще.
Про понимание метафор и ассоциативные ряды
С этим по идее в какой-то степени могут справляться системы, основанные на онтологиях, но их создание слишком трудоёмко. Тем не менее, попытки научить машину "понимать" подобные вещи есть.
D-Lain
Более того, я тут немного порву шаблон, но североамериканские индейцы так называли бизонов (а перед нами натуральный робобизон, да, да я в юношестве любил почитать про культуру разных племен). Т.е. они натурально называли бизонов "широколобами" не "быками"
В Северной Америке вообще полисинтетические языки в основном - там всё предложение целиком (т.е. глагол, его дополнения, их модификаторы и т.д.) зачастую выражается одним длинным словом. Тут правильно говорят о том, что надо учитывать структуру языка, на который переводишь. Я считаю здравой мысль morotopitek о наличии традиции перевода всех этих составных индейских названий на русский словосочетанием, правда вспоминаются только прозвища людей типа "Чингачгук-Большой Змей" в этой связи.
Dronich
Кстати, иногда пользую бывший Бабельфиш для перевода с немецкого. Так вот машинный перевод нем-рус практически всегда дурь по моей теме выдает, а нем-анг вполне адекватные варианты. Что значит одна группа.
Скорее "что значит англоцентричность современных систем NLP".
P.S. Если что, на знание переводческого ремесла я не претендую, это просто лингвистический взгляд чуть сбоку.
Поэтому я против внедрения ИИ в переводческую деятельность.
Я бы на этот счёт сильно не переживал пока что, особенно если речь не о переводе с английского. Сейчас все наиболее применяемые системы построены по принципу чёрного ящика (т.е., по сути, наугад, статистическими методами с учётом некоторых контекстуальных маркеров), а осмысление структуры человеческих языков, даже хорошо изученных, в качестве glass-box - задача, окончательно не решенная пока даже теоретически. Ну то есть можно сделать систему, которая будет выдавать вменяемый по смыслу перевод, особенно если сильно ограничить область её применения и построить для неё хорошую онтологию, но редактура эксперта будет требоваться ещё очень долго (если, конечно, нужен какой-то фиксированный результат перевода, а не просто понимание человеком общей сути - с этим уже и гугл транслейт неплохо справляется).
ivanov
Не совсем так... робот неплохо переводит тексты с четкой, формализованной структурой предложений. Чуть где порядок слов непривычный или синоним необщепринятый - все, приплыли.
Совершенно верно. Это как раз прямое следствие применения статистических подходов - тот же "необщепринятый" синоним системе в обучающем корпусе скорее всего тупо ни разу не попадётся. С порядком слов вообще всё грустно, поскольку вся современная теория языка, лежащая в основе синтаксических анализаторов, изначально англоцентрична. В английском порядок слов (а следовательно и синтаксическая структура предложения) достаточно жёстко фиксирован, а вот для языков типа русского бинарные синтаксические деревья уже далеко не всегда легко строятся, да и неоднозначность возникает куда чаще.
Про понимание метафор и ассоциативные ряды
С этим по идее в какой-то степени могут справляться системы, основанные на онтологиях, но их создание слишком трудоёмко. Тем не менее, попытки научить машину "понимать" подобные вещи есть.
D-Lain
Более того, я тут немного порву шаблон, но североамериканские индейцы так называли бизонов (а перед нами натуральный робобизон, да, да я в юношестве любил почитать про культуру разных племен). Т.е. они натурально называли бизонов "широколобами" не "быками"
В Северной Америке вообще полисинтетические языки в основном - там всё предложение целиком (т.е. глагол, его дополнения, их модификаторы и т.д.) зачастую выражается одним длинным словом. Тут правильно говорят о том, что надо учитывать структуру языка, на который переводишь. Я считаю здравой мысль morotopitek о наличии традиции перевода всех этих составных индейских названий на русский словосочетанием, правда вспоминаются только прозвища людей типа "Чингачгук-Большой Змей" в этой связи.
Dronich
Кстати, иногда пользую бывший Бабельфиш для перевода с немецкого. Так вот машинный перевод нем-рус практически всегда дурь по моей теме выдает, а нем-анг вполне адекватные варианты. Что значит одна группа.
Скорее "что значит англоцентричность современных систем NLP".
P.S. Если что, на знание переводческого ремесла я не претендую, это просто лингвистический взгляд чуть сбоку.