您所在的位置:首页 >> 联盟资讯
【聚焦开放2016】语言•大数据•开放
来源: 日期:2016-04-22 15:04:26 【字号: 】 阅览次数:7

 在大数据时代,每秒钟人类都会产生数以TB计的数据,各种语言、各种格式、各种渠道无所不在,这是人类从未企及的庞大数据。面对如此量级的大数据,我们应当如何面对?在201648日“语言大数据开放2016“发布会上,中译语通科技(北京)有限公司CEO于洋表达了自己的观点。




机器翻译门前的野蛮人?


一个月之前的人机智能大战,阿尔法狗完胜,这一次机器学习、大数据、人工智能技术完全战胜了人类。阿尔法狗运用复杂的计算策略进行运算,达到了前所未有的深度、速度和准确度。但“老司机还是老司机”,创造人工智能的是人类,制定策略网络和价值网络的是人类。从手工翻译到计算机辅助翻译,从人工翻译到机器翻译,从人工处理数据到算法处理大数据,看起来是机器在进步,实际上是人的进步,是人在工作分配、工作方式上的进步。


存在解释未来,毫秒累积价值


对当下的数据进行归纳,去总结庞大数据中存在的规律,可以帮助我们预测未来的数据,这是数据给我们带来的一种颠覆。对实时的数据进行检索和分析,可以帮助人看到事物发展的“横截面”,从每一秒的数据中累积出价值。


我们需要在时间、空间和社会之间跨越,将所有的能力整合在一起,所以今天提出“跨语言大数据”,大数据本身就是一个巨大的整体,机器翻译又进一步放大了大数据的量级和价值。对于机器来说,语言不再是障碍。当我们用搜索引擎搜索中文时,应该出现更多语种的资料。在今天,我们需要在大数据基础上深度挖掘跨语言大数据之美。


没有风,依然要飞翔


2015年互联网市场经历了跌宕起伏,有人说到了“资本寒冬”。但是该做的事情还是要做,2016,没有风,也依然要飞翔,要继续向前进。互联网带给各行各业很多冲击,最典型的是上到国家总理,下到平民百姓,无人不谈大数据和互联网思维,人人都在创业。在这个行业诞生了很多平台。对于平台来说,用户、流量、交易是核心,没有用户、流量、交易的平台顶多称得上是网站。


用“30亿”语料提供一个支点,这个语料库本身就是一个庞大的数据,机器翻译作为支点又可以进一步撬动各个领域的大数据,这是今天非常重要的一个主题。作为语言服务行业,机器翻译的进步是靠着存在的数据去发展,在大数据领域,机器翻译推动了新的数据融合和增长。


从一个词到整个世界


为了更好的发挥大数据全方位价值,于总呼吁“我们需要构建起来一个开放、共赢的包含高校、科研院所、企业、跨国院校等在内的语言大数据的生态系统,实现从一个词到整个世界的共享,从而建立更为庞大的大数据,为专业和人才的腾飞以及政产学研等各方面的不断发展添加动力。语言大数据联盟便是这样一个生态系统,让我们一起给未来带来一个完全不一样的思路。

【语言大数据开放2016

201648日,“语言·大数据开放2016”大会在青岛隆重召开,全国百余所外语院校负责人、科研院所专家、互联网企业代表、大数据分析师等两百多位现场嘉宾出席现场会议,近五千观众收看会议直播。本次大会以“开放”为主题,从“新元素”“新动力”“新平台”等不同纬度探讨基于语言大数据下的翻译教学、自然语言处理、智能大数据分析、在线协同、语言工具和云端实验室等核心话题。


打印】 【关闭
语言大数据联盟 版权所有
Copyright © 2012-2018 www.lbdalliance.com All rights reserved.京ICP备13002826号-12