科学怪人 记AI英雄风云榜先锋奖获得者:实践者颜水成

科学怪人 2019-02-01200未知admin

  记AI英雄风云榜先锋奖获得者:颜水成(来源:网易科技频道)

  文/丁广胜

  颜水成教授的办公室不大,摆满了各式各样的工程样机。

  我先行一步来到办公室,门口的智能门铃已发现了我的到访,颜水成教授赶忙前来,这是360目前主打的一款智能硬件产品,由颜水成领衔的360人工智能研究院提供技术支撑。目前360在售智能硬件产品达到数十件之多,这也是颜水成来到360的初衷和使命。

  “不以结婚为目的的恋爱都是耍流氓”他以此幽默的比喻人工智能落地实践的重要性,他认为学术界研究人工智能像谈恋爱,而在工业界做人工智能更像婚后生活。

  三年以来,颜水成担纲的360人工智能研究院发力视觉、语音、语义和大数据四大方向,向业务部门提供技术支持,重点推出了运动、交互、视觉、决策四大AI引擎。

  三年过去,颜水成作为横跨学界和工业界的AI实践者,如何理解二者的“爱恨情仇”,又如何一步步成为大师?用他自己的话说,“我们那代人运气不错,现在很多计算机视觉领域的大家熟知的科学家都出生于76年前后,李飞飞、吴恩达、孙剑等等”

  那运气之外呢?

  学术界追求极限

  念旧的颜水成在北京大学数学科学学院呆了9年,学习计算数学(Computational Mathematics)和应用数学,虽然身在数学系,但跟随导师程乾生教授主要研究模式识别和机器学习相关的课题。

  而真正与人工智能结缘,则是在2001年进入微软亚洲研究院实习,启蒙师从李子青(Stan Z. Li),李子青是人脸识别和智能视频监控专家,在2000年辞去新加坡南洋大学终身教职,加盟微软亚洲研究院,并在微软研发了人脸识别系统EyeCU。

  颜水成的整个PHD期间,几乎都是在微软亚洲研究院渡过的,后来主要师从张宏江博士,张宏江是世界多媒体研究领域一流的科学家,被称为计算机视频检索研究领域的“开山鼻祖”,他也是微软亚洲研究院的创始人之一。

  周志华、颜水成、梅涛等如今活跃的科学家都曾是张宏江的门徒,图为张宏江

  “微软的氛围非常好,非常自由同时方向非常多,以至于我当时在计算机视觉和机器学习两个方向都有非常广的涉猎”。期间与何晓飞(前滴滴研究院院长,现飞步科技CEO)一起将Subspace Learning与Manifold Learning两个非常火爆的领域巧妙而简单地串联起来,两人后来一共发表了4篇单篇引用过千的论文,在这个领域产生了广泛的影响。

  但到了不得不作出选择的时候,如果选择留着微软,颜水成觉得可以一眼看到三年、五年之后的样子,还是应该去海外走一走,他首先来到了香港中文大学汤晓鸥教授的实验室,继续从事人脸识别相关的研究工作。因为汤晓鸥教授当时往返北京和香港两地,在这期间颜水成就带领大家一起推进项目研究,他的领导能力得以培养和锻炼,为日后奠定了基础。

  在短短的一年多时间之后,颜水成又继续前往伊利诺伊大学香槟分校(UIUC),师从美国工程院院士、计算机视觉华人鼻祖黄煦涛(Thomas Huang)教授,在这里他见到了一群算法和编程能力能都超级棒的学生,其中包括大家后来熟知的周曦、韩旭以及JianchaoYang,见证了与这群人一起投9篇CVPR中7篇,剩余的2篇又快速中其他会议的完美经历。

  绕了一圈,尘埃落定。

  颜水成返回亚洲,进入新加坡国立大学,开启了最高产的八年学术生涯,他认为这里比美国和中国都具有优势,在美国一个教授需要花大量的时间写项目申请,并且命中率非常低,而在中国,年富力强的教授可能需要花太多的时间应付学术之外的事情,无法最大化利用宝贵的时间。

  在新加坡则没有这些顾虑,颜水成约一年写一个项目申请,“在新加坡的八年是我做学术最专注的八年,而且产出非常大”,其团队多次是CVPR和ACM MM两个会议论文全球最多的团队。他的团队是最早参加计算视觉核心竞赛PASCAL VOC并获冠军的亚洲团队,2010-2012连续三年获得物体识别子项的冠军。同时其团队也多次参加ImageNet竞赛并获冠军,期间提出的Network-in-Network模型中的1x1卷积成为后续几乎所有计算机视觉CNN变种模型的基础模块。

  新加坡国立大学

  在颜水成看来,在学术界就是追求极致,更多的是对技术和产品的憧憬,或者不停的进行技术升华,大多数时候并不需要真正把产品落地。

  就这样,颜水成萌生了投身工业界的想法。

  工业界在商言商

  后来的故事想必大家就熟知了,颜水成在来360公司交流时与360一拍即合,一边是深入学术研究十余年的技术大拿,一边是求贤若渴希望筹建AI研究院的企业,2015年颜水成选择北上,投身工业研究的序幕就此拉开。

  在工业界,颜水成开始“在商言商”,他把多年的技术积淀回归商业,产品落地成为工作的核心。他认为这时候最重要的是学术思维向工业思维的转变。

  他幽默的将这种转变比喻为两个人谈恋爱,两个人谈恋爱是必修课,但婚后的生活才是本质,“不以结婚为目的的恋爱都是耍流氓”,在工业界必须以产品落地为自己的指导思想。

  独特之处在于,颜水成还身兼新加坡国立大学副教授,这样跨领域的背景让他的研发工作更加从容,2016年,人体分割技术(Human Segmentation)在手机上展现可商用的可能性,欧洲的一支研究团队开始展示,颜水成团队感兴趣但无奈对方要价太高,这个时候他联合了自己的NUS实验室,得益于此前的技术积累,只花了一个月的时间就取得了成功,开始在手机上应用人体分割技术。

  他将学术研究和工业实践结合在一起,撞出了火花。

  他还建议身处学术界的教授在选择课题时,应该多拥抱工业界的需求,真真正正的瞄准社会价值,对于学生而言,大部分人最终都将进入工业界,真正有用的课题也对学生的长远发展颇有益处。天马行空的秀demo,很难产生价值,但他也承认,这个时代需要有人探寻科学的边界,很多实验室经常会探索出令人惊喜的东西。

  对于李飞飞、李佳、张潼等AI专家重返学界,颜水成提到,学界和工业界的区别有目共睹,关键是能否和自己的价值观和追求所契合,如果有偏差选择离开是必然,但他相信这些科学家的理念已经渗透进所在的企业,未来肯定会产生积极的作用。

  “人工智能行业会朝着更理性和更垂直的方向走”。

  颜水成坦言,在火热的自动驾驶赛道,去年的时候大家普遍面向L4/L5,今年我们可以明显的感知到,大家回归理性,更多的人选择专注在受限场景,港口、高速、公园等。

  而另一方面,计算机视觉公司会变得更加重视场景,成为一个整体的方案提供商,而不只是一家“纯粹”的只提供SDK输出或者技术的提供商,大家需要长远考虑。

  变得更理性更专注是颜水成对行业趋势的总结,“2016年的时候,只要是一家人工智能公司,大家就疯狂的投,2017年的时候,大家会看这家公司有没有落地潜力,但是到了2018年和2019年,大家开始真正的重视一家人工智能公司赚钱的能力。”

  从技术的维度,颜水成期待2019年AI芯片和5G的真正爆发,过去两年,大家只是尝试和探索,2019年我们希望看到AI芯片和5G快速的产品化推进。

  移动通信网络技术演进

  我们注意到,2019年将是5G应用元年逐渐达成行业共识,今年在全球范围内将有30多款5G手机上市,5G网络作为第五代移动通信网络,其峰值理论传输速度可达每秒数十Gb,这比4G网络的传输速度快数百倍,整部超高画质电影可在1秒之内下载完成,随着5G技术的诞生,用智能终端分享3D电影、游戏以及超高画质节目的时代已经向我们走来。

  颜水成指出,AI芯片的规模应用将使得计算机视觉行业再次迎来机遇,有了AI芯片和5G这两剂“强心针”的加持,在资本寒冬到来的当下,尽管充满挑战,但他依然看好人工智能行业的发展,“大家投了那么多年,该考虑商业回报了”。

  不过,对于那些进展缓慢的人工智能项目,未来一年将会相当难熬。

  后记:

  一个有趣的观点

  “现在很多计算机视觉领域的大家熟知的科学家都出生于76年前后,李飞飞、吴恩达、孙剑等等。”

  这让作者想到了马尔科姆·格拉德威尔在《异类》中谈到,“比尔·盖茨和史蒂夫·乔布斯都出生在1955年,1955年前后正是计算机革命的时期,如果你出生太早,就无法拥有个人电脑,如果出生太晚,计算机革命的好机会又被别人占去了,那些奇才异类,他们之所以神奇,得感谢机遇的眷顾。”

  一个评语

  “「网易2018中国AI英雄风云榜」商业创新人物先锋奖的获得者是周曦和朱珑,我非常看好这两位年轻的科学家,他们能够抛去学术光环,在商业领域脚踏实地一步一个脚印的往前走,他们的公司可能不是发展最快的,但未来一定会取得非凡的成就。”

Copyright © 2002-2013 中华科学网 版权所有  

联系QQ:1352848661