周以真(Jeannette M. Wing)是一位美籍华人计算机科学,也是哥大首位华裔女副校长。她的主要研究领域是形式化方法、可信计算、分布式系统、编程语言等。1993 年她与图灵奖得主芭芭拉·利斯科夫(Barbara Liskov)合作,提出了著名的 Liskov 代换原则,是面向对象基本原则之一。
周以真从微软公司离职后来到哥伦比亚大学,她曾担任微软研究院的全球业务副总裁,管理着全球的微软研究实验室。而在加入微软之前,她曾在卡内基梅隆大学任教,并担任计算机科学系主任和计算机科学学院学术事务副院长。
(来源:《麻省理工科技评论》)
2006 年,时任卡内基梅隆大学计算机科学系主任的周以真发表了一篇名为《计算思维》的文章,她在文章中指出,使用计算机科学的概念工具来解决人类致力于的所有领域的问题,每个人都将从中受益。
早年,周以真并没有打算学习计算机科学。20 世纪 70 年代中期,她受父亲的启发,进入麻省理工学院学习电气工程专业。
当她发现自己对计算机科学感兴趣时,她打电话给父亲,问计算机会不会是昙花一现。毕竟在当时,这个领域甚至都没有像样的教科书。父亲向她保证不是这样的,于是她义无反顾地换了专业。
就其目前正在推进的“可信人工智能”计划,《麻省理工科技评论》的记者安尼尔·安纳塔斯瓦米(Anil Ananthaswamy)和她进行了对话,以下为交流内容:
问:你是否认为现有的计算方式将会出现转变?
答:肯定的。摩尔定律使我们走了很长一段路。我们将达到摩尔定律的上限,所以并行计算变得非常重要,但阶段性突破在于云计算。
原始的分布式文件系统是一种云计算雏形,在这种系统中,你的文件并不仅仅存在于机器本地;它们还存在于在服务器上的其他地方。云计算采纳了这一思想并且发扬光大,在这一计算架构下,你的数据和计算设备都不在你身边。
下一个变革是关于数据的。在很长一段时间里,我们专注于计算速度,致力于使计算机运转得更快——处理器、CPU、GPU 和更多的并行服务器。我们忽略了数据部分。而现在我们必须密切关注数据方面。
问:这是数据科学领域,你会如何定义这个领域?使用数据存在哪些挑战?
答:我有一个非常简洁的定义。数据科学是一种从数据中提取价值的研究。你不能给我一堆原始数据而指望我按一个按钮就能计算数据的价值。这一过程从收集数据、处理、存储、管理、分析和可视化数据就开始了,最后才是解释结果。我称之为数据生命周期。在这个周期中的每一步都需要做大量的工作。
问:当使用大数据时,经常会出现对隐私、安全、公平和偏见的担忧。如何解决这些问题,尤其是在人工智能中?
答:我正在推动这个新的研究议题。我称之为可信赖的人工智能,这是受到我们近几十年在可信计算方面取得进步的启发。我们所说的可信赖,通常是指安全、可靠性、可用性、隐私性和易用性。
在过去的二十年里,我们取得了很大的进步。我们有一些规范的方法,可以确保一段代码的正确性;也有安全协议来提高特定系统的安全性;还有一些关于隐私的规范化概念。
可信人工智能在两方面提高了要求。如今,我们都在探讨鲁棒性和公平性——鲁棒性意味着如果你扰动输入,输出就不会受到很大的干扰。
我们也探讨可解释性。这些都是我们过去在谈论计算机时从未谈论过的事情。
此外,人工智能系统在本质上是概率性的。过去的计算系统基本上都是确定性的机器:它们是开或关,真或假,是或否,0 或 1。而我们的人工智能系统的输出基本上是概率。
如果我告诉你,你的 X 光片显示你得了癌症,我会说我看到的那个小白点有 75% 的可能性是恶性的。
所以现在我们必须生活在这个充满概率的世界里。从数学的角度来看,它使用了概率思维,并引入了大量的统计学概念和随机推理等。
作为一名计算机科学家,你接受过的训练不是这样思考问题的。所以人工智能系统真的让我们对这些系统的形式推理变得复杂。
问:可信人工智能是你为数据科学家提出的 10 个研究挑战之一,因果关系似乎是另一个大问题?
答:我认为,因果关系是人工智能和机器学习的下一个前沿领域。目前,机器学习算法和模型很擅长于寻找模式、相关性和关联。但它们不能告诉我们:是这个因素导致了那个结果吗?或者如果我做这些事,那么将会发生什么?
所以在计算机科学中还有一整个关于因果推理和推断的领域。几十年来,统计学界一直在研究因果关系。
他们有时会对计算机科学界感到有点恼火,因为我们会认为“哇,因果推理一个全新的想法”,而实际并不是。
所以我确实想赞扬统计界对因果关系的基本贡献,(因为)大数据和因果推理的结合可以真正推动这个领域向前发展。
问:你对数据科学能取得什么成就感到兴奋吗?
答:很多人都狂热于数据科学,因为他们看到,通过在生成、产出、收集数据等环节使用数据科学中的方法,他们的研究领域正在发生重大变化。这是一个非常激动人心的时刻。
支持:王贝贝
参考资料:
https://www.technologyreview.com/2021/10/27/1037134/data-science-challenges-trustworthy-ai/