机器翻译的提高是AI自己学的还是人给设计的?
2058
83
[55 楼] 大底
[泡菜]
24-5-20 17:21
主流认知认为深度学习的AI本质是压缩算法。
你问问题,AI给答案。问题无穷多,AI不可能记录所有问题答案。通过对海量但是有限数量的问题和答案提取特征,再对新提出的问题通过已经提取的特征给出概率最大的答案。AI好坏取决于算法的效率和喂给数据的数量和质量。 |
[54 楼] Bohnenkaffee
[陈年泡菜]
24-5-20 15:35
采药应该容易翻译,理论上大词典上都有。
发布自 安卓客户端 |
[53 楼] washu
[泡菜]
24-5-20 11:51
metaldz 发表于 2024-05-20 04:29 不容易,终于知道这里的 藥(药) 是 herbs 而不是 medicine 了 ![]() ![]() alchen 发表于 2024-05-20 11:30 |
[52 楼] alchen
[老坛泡菜]
24-5-20 11:30
翻译为英文 松下问童子,言师采药去。
ChatGPT The lines "松下问童子,言师采药去" are from a poem by the Chinese poet Jia Dao. A possible English translation of these lines is: "Under the pine tree, I asked the boy, He said the master had gone to gather herbs." |
[51 楼] Trompette
[泡菜]
24-5-20 11:02
秒杀普通人没问题,内容质量(速度可以)秒杀专家很难
以司/后母戊鼎为例,现今专家觉得模糊的东西,换 AI 一样无能为力 瓶中AI 需要借助人类完成实践,并依赖实践结果做迭代,既不是闷头学习,也不是人类设计 机翻《寻隐者不遇》需要一些隐含能力 - 能够正确识别文体(诗词,唐诗,五言),根据特殊文体适应特殊语法(主语省略,动宾倒置) - 需要外部提供文体的背景信息(唐代诗人作品),了解不同时期词汇的不同意义(古今异义词) 和小学生学诗词的过程没什么两样 |
[50 楼] metaldz
[泡菜]
24-5-20 04:29
时隔两年多,现在ai翻译已经绝对完美了,连作曲都小意思了
各位有何感想? 用gpt4o把之前的诗句翻译了一下 松下问童子,言师采药去。只在此山中,云深不知处。 The Inquiry Upon the mountain path, I asked a boy I met,“Where is the master, sage and wise?” “He’s gone to gather herbs,” the child replied, “But in these deep clouds, his place hides.” 懂英文诗歌的高手给评价评价这个翻译有英文诗的意境和韵味嘛? @珂2019 @tianman metaldz 编辑于 2024-05-20 04:30 |
[49 楼] galenlaw
[泡菜]
23-5-24 14:12
metaldz 发表于 2022-03-15 18:40 版本2翻译正确。 |
[48 楼] 静静的马夹
[泡菜]
23-5-22 11:05
metaldz 发表于 2022-03-15 15:50 这就好比抖音给你推你停留时间长的视频一回事。 |
[47 楼] arondes
[陈年泡菜]
23-5-22 10:12
现在的机器翻译,确实可以理解为他自学的。
比如meta开发了一个No Language Left Behind大语言模型,里面几百种语言,很多都是非常罕见,开发者自己也并不懂的语言。只是靠收集的素材(可能是很少的素材),直接交给机器去学习。 |
[46 楼] 珂2019
[泡菜]
23-5-22 01:21
metaldz 发表于 2023-05-21 17:54 这个其实是两难。优秀的翻译人员是最好的翻译,但你不一定遇的到,其次就是好的机器翻译。 差的机器翻译、和差的翻译人员哪个更好,这个根本无法知道。 |
[45 楼] 珂2019
[泡菜]
23-5-22 01:19
wildgun 发表于 2022-03-18 15:15 上下文是重要的。你举的那些例子,读完诗的人,没有一个人会理解错。机器,就不好说了。 |
[44 楼] 含笑出刀
[资深泡菜]
23-5-21 22:46
珂2019 发表于 2022-03-18 10:29 |
[43 楼] metaldz
[泡菜]
23-5-21 17:54
这个帖子过去一年多了,现在gpt满大街,我发现通过这个帖子我学到的翻译利器deepl翻译的比gpt还差一点点,现在翻译字幕我喜欢用gpt翻译,那个效果真的是相当满意,而且防止那些自我感觉良好的真人瞎发挥的翻译,现在看gpt翻译的字幕,可以准确了解意思,这个严谨准确,又不浮夸的风格是非常好的。
|
[42 楼] wildgun
[泡菜]
22-3-18 15:15
珂2019 发表于 2022-3-18 14:27 首先,Google的翻译工具并不是针对古诗词特别优化的工具,我想它应该是一个帮助不懂得另一门语言的人去理解该语言日常会话翻译的工具。 其次,我想问下, 如果是「司马问童子」,是翻译成「一个姓司马的人正在询问一个童子」好呢,还是翻译成「作者一边驾驭着自己的马儿,一边询问童子」? 再比如「南宫问童子」,是翻译成「一个姓南宫的人正在询问一个童子」还是「在南面的宫殿中询问童子」好呢? 又比如「公孙问童子」,是「一个姓公孙的人正在询问一个童子」好呢,还是「公公的孙子正在询问一位童子」好? 显然,我觉得以汉语中最常见的「主谓宾」结构来看,主=松下,谓=问,宾=童子,这是最通常的理解。而如果将松下视为一个主语,那么应该理解为人名(matsushita)。 |
[41 楼] wildgun
[泡菜]
22-3-18 15:15
珂2019 发表于 2022-3-18 14:27 首先,Google的翻译工具并不是针对古诗词特别优化的工具,我想它应该是一个帮助不懂得另一门语言的人去理解该语言日常会话翻译的工具。 其次,我想问下, 如果是「司马问童子」,是翻译成「一个姓司马的人正在询问一个童子」好呢,还是翻译成「作者一边驾驭着自己的马儿,一边询问童子」? 再比如「南宫问童子」,是翻译成「一个姓南宫的人正在询问一个童子」还是「在南面的宫殿中询问童子」好呢? 又比如「公孙问童子」,是「一个姓公孙的人正在询问一个童子」好呢,还是「公公的孙子正在询问一位童子」好? 显然,我觉得以汉语中最常见的「主谓宾」结构来看,主=松下,谓=问,宾=童子,这是最通常的理解。而如果将松下视为一个主语,那么应该理解为人名(matsushita)。 |
[40 楼] tianman
[泡菜]
22-3-18 14:32
wildgun 发表于 2022-3-18 13:52 是这样的。。。 作为翻译工具,是假设被翻译对象是日常的语言表达。。。 而诗词并不是日常的语言表达,而是特殊的艺术表达,中外都是如此。 在汉语常规表达时,人们是不会用、也不可能用“松下问童子”这样的表达方式的,所以也不能指望机器翻译能够理解这样的诗句。 “问童子”前面加上“松下”,是格律和韵律以及诗意的综合考虑,是艺术的结晶,而不是常规的语句。 “在松树下面问孩子”这只是对句子字面意义的注释,其实已经和诗词毫不相干了。 很多著名的诗词翻译过来就变得味同嚼蜡,其实也是因为失去了诗词原本的意趣。。。 |
[39 楼] 珂2019
[泡菜]
22-3-18 14:27
这个不对。
首先,原文是中文,不是日文。 其次,读者可能不知道这是古文,但翻译必须知道,即使它是翻译机器,要不然要翻译干嘛。 第三,即使中国也有姓松下、叫松下的,也不能把“姓名”排在优先地位,而要看上下文。想想看,读过这首诗的人,没有一个人会认为“松下”是个人。 wildgun 发表于 2022-3-18 13:52 |
[38 楼] 夏日微风
[资深泡菜]
22-3-18 14:23
意思是能看懂了
![]() |
[37 楼] 夏日微风
[资深泡菜]
22-3-18 14:17
主要还是算力的问题吧,还有因为网速的提升,可以通过服务器端的巨大算力来提升“库”容。
|
[36 楼] tianman
[泡菜]
22-3-18 14:13
|
[35 楼] wildgun
[泡菜]
22-3-18 13:52
关于楼下那个「松下问童子」的翻译,我觉得不应该预设从一个理解古诗词的立场来评价这句话的翻译结果。而应该站在一个非汉语母语者的立场来评价这个翻译结果。
之所以需要用到翻译工具,显然是因为用工具的人本身并不懂待翻译的语言,因此需要借助翻译工具来帮助自己理解。 那么,对于一个非汉语母语的人,或者一个根本不懂汉语的人来说,应该是把「松下」翻译成matsu shita(日语的「松下」假名发音呢?还是应该按照古诗词翻译成「松树的下面」的英文意思呢? 最佳的结果应该是给出2个不同的结果;但是在只能给出一个结果的前提下,我觉得显然应该是前者——Matsushita——的翻译更为合适。 因为汉字「松下」这两个汉字作为一个日文姓氏,是一个很常见的姓氏,可能就是翻译工具的使用者其日常生活、工作需要联络的人;而古诗词中的「于松树下」的那个「松下」则是一个特例,是一个非固定搭配词组,同样的还可以有「枣下」「梧桐下」「无花果树下」等等。 前者按照姓氏来翻,是一个日本普遍的姓氏,而且中文翻译中在处理日本汉字姓名时,也往往会采用直接照搬日本姓名汉字的翻译法,因此可以说在中文里,「松下」也是一个外国人常用汉字名。而后者「松树之下」这一层意思,是一个极其特殊的特例。 由此可见,翻译工具选择一个普遍常见的姓氏,将松下翻译成「Matsushita」是合适的,「松下问童子」则被理解为在描述一个人(松下)在问另一个人(童子)的通用场景。 反之,如果是先入为主地预设了「古诗词中的『松下问童子』」,而且认为这一语境理解应该优先于其他更为日常语境的理解,并以古诗词的语境来评价翻译结果,那倒是偏僻的。 |
[34 楼] 珂2019
[泡菜]
22-3-18 10:29
tianman 发表于 2022-3-17 17:49 在199X年,国内搞了电脑围棋软件的比赛,后来国际上也搞过。做电脑围棋软件很强的,在那个时候有欧洲和日本,国内有些也做的很强,但比欧日要晚。 广州有一个大学教授,陈志行,好象是第一届比赛的第一名。他的软件后来在商店卖,叫《手谈》。 做的很强。 参赛的选手们交流如何做围棋软件的话,也看到一些。 说AI,是唬普罗大众的。 |
[33 楼] tianman
[泡菜]
22-3-17 18:28
|
[32 楼] metaldz
[泡菜]
22-3-17 18:00
|
[31 楼] metaldz
[泡菜]
22-3-17 17:58
|
[29 楼] 珂2019
[泡菜]
22-3-17 17:54
metaldz 发表于 2022-3-17 15:54 你应该想一想围棋和诗有什么不同. 无数人都是这样被忽悠的. 人跟AI学围棋,方法上和人跟人学围棋没有什么本质上的不同.但是,人跟围棋高手学围棋,可能越学越聪明,而跟AI学围棋,越学越聪明的可能性很小. 不明白的话,说了你也不明白,不说了. 自己多想想围棋和诗的不同. |
[28 楼] tianman
[泡菜]
22-3-17 17:49
metaldz 发表于 2022-3-17 15:54 首先纠正一下: “设计ai围棋那个人根本不会下围棋,现学现做ai,瞎逼做一个ai,一试验 结果出人意料了” 事实并非如此。。。 我们知道,AlphaGo的开发团队并不是一个人,也不是“根本不会下围棋”。 事实上,Demis Hassabis本人在大学里就开始学围棋了。。。 “现在的顶级职业围棋选手 都是跟ai学下棋 进步飞速 眼界大开的” ---- 其实,AlphaGo在2017以后就不再下围棋,改探索医疗领域了。 象棋、围棋都是是基于规则的游戏 但是,文学(包括诗歌)、艺术、人文哲学并非如此。 至少到目前为止,“ai可以给你玩没了”还只是梦想。。。 |
[27 楼] tianman
[泡菜]
22-3-17 17:46
metaldz 发表于 2022-3-17 14:12 估计阁下并不知道:诗词并不一定都要押韵,押韵的也未必算是诗词。。。 看来,阁下还真的没有“深得其中奥妙”呀。。。 是否押韵是要看诗体的,押韵并不是所有诗词的要求。这并不是为了和谁“划清界限”。 阁下的说法真的很奇特。 “说白了押韵不能明显让你看出来的 才是比较高级的诗人” 押韵就是符合韵律,不符合韵律的就是不押韵。哪儿来的“押韵不能明显让你看出来”? 阁下知道什么是“押韵”么? |
[26 楼] metaldz
[泡菜]
22-3-17 15:54
珂2019 发表于 2022-3-17 14:56 你误解ai了,ai是人类给它设计一个思维模式,剩下的东西是它自己去学习的,后边这些东西不是人类教会它的,ai自己去搞科研自己选题自己研究 然后ai自己研究出人类研究不出来的高档东西 让人类受益 这是目的 现在的顶级职业围棋选手 都是跟ai学下棋 进步飞速 眼界大开的 围棋还能这样下,过去我学的都是s,a套路,换到诗词戏剧就是文学还可以这么写,故事还可以这样编,过去我学的都是s a 设计ai围棋那个人根本不会下围棋,现学现做ai,瞎逼做一个ai,一试验 结果出人意料了 这就是ai的路数 s a人类 建一个基础思维模式的ai,ai发明出高级东西,让s a人类受益 诗歌这种冲冲动壮壮a自我陶醉的伎俩,困不住ai,我认为人文哲学 ai可以给你玩没了 几十年几百年之后 不可想象 所以有必要现在教育孙子,往前看,一定要往前看 未来大不一样,有必要留下家训刻在石头上:“把你生下来是为了让你向前看的” 本帖最后由 metaldz 于 2022-3-17 15:59 编辑 |
[25 楼] 珂2019
[泡菜]
22-3-17 14:56
珂2019 发表于 2022-3-17 14:44 换个例子,源氏物语,有不同译文。丰子恺译的最有文采,尤其是译其中的诗。这个是中文版,大家都可去看一下。 如果AI能译到这种程度,那他不是AI,他是人类中的绝顶才子,一百年不出几个的。只有神才能做出这样的AI吧。 |