在国际自由港——澳门,30平方公里上居住着65万人口,它是世界人口密度最高的地区之一。当然,它最为人们熟悉的是作为世界四大赌城之一这个身份,其著名的轻工业、旅游业、酒店业和娱乐场使澳门长盛不衰,每年人均GDP达到7万美元,成为全球最发达、富裕的地区之一。在“语言·大数据开放2016”大会上,来自澳门理工学院的副院长严肇基先生为大家介绍了智慧澳门与语言大数据相关的内容。
在互联网时代,大数据是很热门的话题。借助互联网的不断发展、智能手机的普及,在海量的数据里面找到有用的分析,进行数据挖掘,把这些数据用在社会发展上,智慧城市就是其一。
智能电网、智能交通、智能家居、智能建筑物、互联网金融等等,都跟我们的生活息息相关。如何构建大数据的平台,还有智能城市?
严院长就微博大数据、实时公共汽车报站系统、智慧电表、电动车充电站地面网络举出了实例。以微博大数据为例,通过数据挖掘在微博平台找到在澳门旅游及消费的人士喜好以及顾客满意度,用数据分析的方法找到原居地分布及相关语言大数据,将这些来自不同地方的旅客的相关数据分析成结果,供给政府参考做社会决策。
作为海外之子存在多年的澳门,中西方文化交流长达500年,以“三文四语”作为日常交流。“三文”是中文、英文、葡文;“四语”是广东话粤语、普通话、英语、葡萄牙语。
今天的澳门,葡语跟中文是日常主要交流用语。虽然澳门说葡语的人比例不高,可能几千人都没有,但是目前大部分的法律文件都以葡语为基础,如果不懂葡语会非常麻烦。针对这近70万的人口的葡语翻译,还要响应国家推动中国与葡语国家商贸服务平台这类需求,人工翻译肯定无从下手,势必要借用机器翻译。
澳门有两个地方一直在做机器翻译。一个是一个研究所在2000年研发出首个通过计算机提供双向中葡翻译的单机软件“中葡通”(版本1.0),2004年推出“中葡通”3.0版本,但是因准确率不高无法普及,所以这个研究所因为经费的原因,两年前关门了,但是主要的翻译和开发人员都在澳门理工学院继续他们的工作。还有一个是澳门理工学院计算机系,做了一个“CLICK”软件,供葡萄牙人和懂葡语的人用,还有提供给像巴西、葡萄牙、非洲的一些国家学习普通话,这个在回归之前的澳门已经做出来了。