您所在的位置:首页 >> 联盟资讯
【聚焦开放2016】 当语言遇上大数据——时间问题
来源: 日期:2016-04-22 14:43:01 【字号: 】 阅览次数:3

       大数据时代的到来,给教学研究、社会活动、经济活动等提供了便利,对于做语言研究的人来说,它的到来更是一种动力,同时也是一次巨大的挑战。201648日“语言大数据开放2016”发布会上,香港中文大学(深圳)人文社科院院长顾阳教授就此表达了自己的观点。

 

 

 

勇于挑战,大数据时代求发展

 


“深圳市大数据研究院”于20163月在香港中文大学(深圳)揭牌,大数据研究院主要从事数据的处理及应用,目前主要有三个发展方向:通信领域和网络资源分配;城市管理,通过挖掘有用的数据信息帮助政府作出科学的决策,例如智慧城市、智慧交通;智慧医疗,通过对众多医院提供的数据进行分析作出精准医疗。研究院不仅研究大数据,还要开发大数据,将大数据产业化,使大数据服务社会,服务政府,服务那些需要大数据的支持的行业。

 

 

语言的多样性:语言变化

 


人类每一秒钟都会产生出大量的数据,这个数据绝大部分都是语言,其次是数字。语言中某些基本范畴不具有物化的表现形式 (如所谓的空范畴或隐性形态或零形态),但这些范畴在说话者和听话者的心理语言中是存在的,所以它们是语言的结构成分。例如:这个句子大家非常熟悉,AIt seems that John isunhappy BJohn  seems  to be  unhappyJohn应该是unhappy的角色,而到了B句中,John的位置发生了变化,我们一看第一句是that的从句,而第二句是动词的不定式,是表示时间的一个功能词。我们知道that的从句在英语里面一定是带出有时制的从句。而to be后面是时间不定,叫不定式。一旦我们说同样的be  unhappy而的角色在哪里,不能带在to be的角色里面,这个地方就是时态在发生改变,引得这个句子在做调整。

  

 

时间与句子的时间结构

 


一个句子所描述的事件发生的时间随说话者说话时间的变化而变化。语法机制中一定有这样的结构,使说话者能将一个场景置于时空,通过说话者的表述使听话者明白场景的真实内容(句子的真值)即场景、说话者赖以聚焦的参照点(背景)以及说话时间之间构成一个直证(deictic)关系。比方说很多语言学家说“小强高”是单独不成立的,可是“小强高、小明矮”就成立了,因为有高矮这两个参照点,说话时间加上参照时间这个场景就建立起来了。


 

大数据时代的语言大数据联盟

 


每一个说话的人,实际上是有非常丰富的语言知识的,尤其是自己的母语,基于这样的认识,在目前大数据的平台下,怎样能够使我们机器翻译更加智慧化?人类翻译精准但需要时间,机器速度快但不精准,如何将二者更加完美的结合在一起?希望通过语言大数据联盟能够带来这一问题的答案。为人工智能化机器翻译的发展贡献力量。

 

【语言大数据开放2016】

2016年4月8日,“语言·大数据开放2016”大会在青岛隆重召开,全国百余所外语院校负责人、科研院所专家、互联网企业代表、大数据分析师等两百多位现场嘉宾出席现场会议,近五千观众收看会议直播。本次大会以“开放”为主题,从“新元素”“新动力”“新平台”等不同纬度探讨基于语言大数据下的翻译教学、自然语言处理、智能大数据分析、在线协同、语言工具和云端实验室等核心话题。

 

打印】 【关闭
语言大数据联盟 版权所有
Copyright © 2012-2018 www.lbdalliance.com All rights reserved.京ICP备13002826号-12