手机浏览器扫描二维码访问
林燃一副理所当然的样子:“当然,我都和科罗廖夫见了两面,我不会俄语怎么和他交流的?
我同时会俄语、德语、英语和汉语。”
多语言大师的身份,给林燃的理论增添了几分可信度。
在这个时代,科学家们会几门语言并不奇怪。
当然一些敏感部门会提高对你的怀疑。
以前面提到的约翰·麦卡锡为例,他就精通俄语,从小接受俄语教育长大,尽管他出生在阿美莉卡。
“另外翻译过程,应该是模块化设计,而不是简单的映射关系。
它应该分成预处理、翻译、后处理三部分。
预处理包括了分词和词形还原,翻译才是词典的映射,后处理是对语序进行调整。
这样来降低单次计算的复杂度,提高规则的复用率!”
林燃的话给了在座研究团队的成员们非常多的灵感。
就好像之前一直陷在百越的丛林里找不到出路,而现在天上出现一道光指引他们怎么样才能走出丛林迷宫。
大家都有点迫不及待去尝试了。
所有研究人员都疯狂在笔记本上记录下林燃所说的。
虽然不确定教授的方法是否管用,但有路总比之前没有好。
再者,如果你不好好记下来,到时候被开除只是教授一句话的事。
“好了刚才我们讲了一些简单的内容,现在才是最难的。
因为IBM的机器不是那么强大,我们只能引入一些比较简单的统计学方法来提高我们翻译的准确度。
我把它叫做基于频率的词对齐。
这也是我们引入统计模型的核。
我们先要手动分析平行句子,标注俄语词或短语与英语翻译的对应关系。
俄语句子Мыговоримомире
英语翻译:“Wespeakaboutpeace
对齐结果:“мы”
对应“we”
“говорим”
对应“speak”
“о”
对应“about”
“мире”
对应“peace”
然后我们需要对这种对齐的频率进行统计。
统计每个俄语词或短语在英语中的对应翻译出现的频率。
例如,在语料中,“говорим”
在80%的句子中翻译为“speak”
,20%翻译为“talk”
。
这样对于我们就可以构建概率表了。
将这些概率整理成表格,供机器进行查询。
出宫第四年,清冷摄政王夜夜求复合 第四天灾:人在高武,游戏成神 反贼之路:开局抢了和亲公主! 蓄谋已久,强扭的白月光他又酸又涩 农门悍媳有空间,嫁猎户被宠不停 团宠小福星,扛着粮仓去逃荒 娶了棺中女帝,我在都市修仙 海贼:从捡到红发断臂开始 怪她太乖 重生的我只想追小姨子 三年婚姻守空房,我独美你发疯 请天下赴死 四合院:开局何大清要跑路 亡国公主娇又软,糙汉可汗夜夜宠 平步亲芸 奥特曼:开门啊,是我,老人迦! 换亲后!带火婆家! 重燃青葱时代 女儿喜欢后爸,我成全他们一家三口 怪猎:这条火龙有特性
为了生活,我被逼做起了一名奶娘,我所做的奶娘,除了给小孩喂奶,还给那些有需要的大人...
佣兵王者回归都市,只为保护兄弟的妹妹。从此上班和女神调情,下班有女房东暧昧,真是乐此不彼但是,只要是金子,无论在哪里都会发光,且看超强兵王如何打造自己的宏图霸业。...
突然有一天,美女师姐裸死在了少年的床头,少年的人生风中凌乱了。背井离乡,混迹在天下最阴毒的化盅宗,拼搏在天下最淫乱的合欢宗,常震注定会成为让天下仙妖闻风色变的一代蛊皇!本文化异兽,也化形,略邪恶。卫道士莫入,未满十八岁禁止阅读,谢谢合作!十年妹控无人问,一朝御姐天下闻。小虎的书,看过的书友都知道,节操满满,没有槽点!...
虽然学姐发过来的照片很诱人,但坐在学姐旁边瞪着两个血窟窿的大头娃娃是什么鬼?它怎么头顶着尖牙利齿的大嘴,还对着学姐留口水?学姐,你要被断头了啊喂!一觉睡醒,路诚发现精灵宝可梦入侵了自己的生活,可...
午夜时分,夜栈之门为你打开,你不敢走的路她会陪你走...
高冷女总裁,绝色女明星,女神校花,冰冷女杀手,应有尽有哭着喊着要为他生小猴子,从此开启巅峰人生。...